ASIC이란 무엇인가? 응용 분야별 집적 회로와 GPU의 차이점

ASIC이란 무엇인가? 응용 분야별 집적 회로와 GPU의 차이점

비트코인 채굴기를 열어 내부 칩을 살펴보면, 딱 한 가지 일만 하는 실리콘 칩을 볼 수 있습니다. 바로 해싱입니다. 그게 전부입니다. 웹 브라우저를 실행할 수도 없고, 넷플릭스 스트리밍을 디코딩할 수도 없으며, AI 모델을 학습시킬 수도 없습니다. 하지만 이 한 가지 일, 즉 해싱 작업은 시중에 나와 있는 어떤 범용 칩보다 약 1,000배 더 효율적으로 수행합니다. 이런 종류의 실리콘 칩을 ASIC(Application-Specific Integrated Circuit)이라고 합니다. ASIC은 암호화폐 분야뿐만 아니라 다양한 곳에서 사용됩니다. 구글의 데이터 센터, 스마트폰의 무선 모뎀, 테슬라의 오토파일럿 컴퓨터, 사무실의 모든 이더넷 스위치 등이 그 예입니다. 이 글에서는 ASIC이 무엇인지, 어떻게 설계되는지, CPU, GPU, FPGA와 어떤 차이점이 있는지, 2013년경 비트코인 채굴에 ASIC이 정착하게 된 이유, 그리고 최신 GPU와 비교했을 때 ASIC의 성능은 어떤지 자세히 살펴보겠습니다.

ASIC이란 무엇인가를 한 단락으로 설명

ASIC는 최고의 에너지 효율로 특정 작업을 수행하도록 설계된 칩입니다. 약자는 Application-Specific Integrated Circuit이며, 하이픈 없이 Application Specific Integrated Circuit으로 표기하기도 합니다. TSMC나 삼성 같은 파운드리에서 실리콘에 설계가 새겨지면, 그 로직은 재프로그래밍할 수 없습니다. 모든 트랜지스터는 ASIC 설계팀이 지정한 정확한 위치에 자리 잡습니다. 극도의 유연성을 희생하는 대신 극도의 최적화를 추구하는 것입니다. Antminer S21 Pro와 같은 최신 비트코인 ASIC는 초당 234조 개의 SHA-256 해시를 테라해시당 15줄의 에너지로 처리하는데, 이는 CPU, GPU 또는 다른 어떤 프로세싱 장치도 따라올 수 없는 수준입니다. 구글의 TPU도 ASIC이며, 휴대폰의 라디오 모뎀도 마찬가지입니다. 최신 가전제품에 탑재된 AI 및 머신러닝 가속 디지털 신호 블록 또한 ASIC입니다.

ASIC과 CPU, GPU, FPGA의 범용성 비교: 장단점 비교

ASIC의 차이점을 가장 쉽게 파악하는 방법은 다른 대안들과 비교해 보는 것입니다. 현대 컴퓨팅에서 대부분의 작업은 네 가지 유형의 칩이 수행하며, 각 유형은 유연성과 효율성 사이의 균형을 서로 다른 비율로 유지합니다.

CPU(중앙 처리 장치)는 노트북에 들어가는 칩입니다. 어떤 프로그램이든 실행할 수 있지만, 전력 효율이 뛰어나 단일 작업을 빠르게 처리하지 못한다는 단점이 있습니다. GPU(그래픽 처리 장치)는 병렬 연산에 특화되어 있습니다. 동일한 연산이 수천 개의 작은 코어에서 동시에 실행됩니다. 이는 그래픽, 머신 러닝, ASIC에 대한 내성을 갖춘 암호화폐 채굴에 매우 효과적입니다. FPGA(필드 프로그래머블 게이트 어레이)는 제조 후에도 Verilog나 VHDL 같은 하드웨어 기술 언어(HDL)를 사용하여 논리 게이트를 재프로그래밍할 수 있는 칩입니다. FPGA는 에너지 효율 측면에서 GPU와 ASIC의 중간에 위치하며, 재구성이 가능하다는 장점이 있습니다. ASIC는 대량 생산 시 칩당 비용이 훨씬 저렴하지만, 초기 개발 비용(NRE)이 매우 높습니다. ASIC는 최종 단계의 칩입니다. 고정된 논리 회로를 사용하며, 전력 효율을 극대화하지만 유연성은 전혀 없습니다. 설계자는 특정 작업 부하에 맞춰 실리콘을 최적화하고 개발을 완료합니다.

칩 종류 유연성 고정 작업에 대한 성능/와트 일반적인 사용
CPU 모든 소프트웨어를 실행합니다. 최저 운영 체제, 일반 코드 인텔 제온, AMD 라이젠
GPU SIMD 병렬, 프로그래밍 가능 중간 그래픽, 머신러닝 학습, ASIC 저항성 채굴 NVIDIA RTX 4090
FPGA 재프로그래밍 가능한 논리 높은 프로토타이핑, 통신, 고빈도 거래(HFT), 소량 맞춤형 생산 자일링스 버살, 인텔 아길렉스
ASIC 고정 기능 실리콘 제일 높은 비트코인 채굴, 구글 TPU, 네트워크 스위치 앤트마이너 S21, 구글 TPU v5

위 표를 이해하고 나면, 이 글의 나머지 부분은 응용에 관한 내용입니다. ASIC은 워크로드가 고정되어 있고, 처리량이 방대하며, 테이프아웃을 정당화할 만큼 오랫동안 동일한 상태를 유지했을 때 유리합니다. 하지만 워크로드가 변경되는 순간 ASIC은 불리해집니다.

ASIC

ASIC 개발: RTL부터 실리콘 웨이퍼까지

ASIC 설계는 느리고 비용이 많이 들며 거의 전적으로 단방향적인 과정입니다. 크게 여섯 단계로 이루어진 파이프라인에서 어느 한 단계라도 문제가 생기면 몇 달간의 작업과 수천만 달러에 달하는 마스크 제작 비용을 날려버릴 수 있습니다.

1단계는 사양 및 아키텍처 설계입니다. 엔지니어는 칩이 수행해야 할 기능, 성능 목표, 전력 예산, 다이 면적 등을 명확히 정의합니다. 2단계는 RTL 설계 단계로, 엔지니어는 하드웨어 기술 언어(HDL)를 사용하여 레지스터 전송 레벨(RTL)에서 로직을 프로그래밍합니다. Verilog와 VHDL이 여전히 주를 이루며, SystemVerilog는 검증 분야에서 중요한 역할을 합니다. 3단계는 기능 검증 단계로, 테스트벤치 시뮬레이션과 형식적 속성 검증을 병행합니다. 이 단계에서 발견된 버그는 수천 달러의 손실을 초래하지만, 칩에 그대로 남아있는 버그는 수백만 달러의 손실을 가져옵니다. 모든 것이 이 단계에 달려 있습니다.

4단계는 논리 합성입니다. 컴파일러가 RTL을 표준 셀의 게이트 레벨 넷리스트로 변환합니다. 5단계는 물리적 설계입니다. 플로어 플래닝, 배치, 라우팅, 클록 트리 합성, 타이밍 클로저 작업이 포함됩니다. 최종 결과물은 칩의 모든 레이어를 설명하는 GDSII 파일입니다. 6단계는 테이프 아웃으로, GDSII 파일이 파운드리로 전송됩니다. 이후 포토리소그래피 공정을 통해 설계가 마스크 세트로 변환됩니다. 마스크는 실리콘 웨이퍼에 레이어별로 패턴을 형성합니다. 마지막으로 웨이퍼가 개별 칩으로 절단되어 패키징됩니다. 이 규모의 트랜지스터 간 상호 연결조차도 그 자체로 하나의 연구 분야이며, 매년 이 분야에 대한 박사 학위 논문이 발표되고 있습니다.

이제 비용 문제를 살펴보겠습니다. 5nm 노드에서 마스크 세트 하나 가격은 500만 달러에서 1,000만 달러입니다. Semianalysis와 IBS에 따르면 3nm에서는 1,000만 달러에서 1,500만 달러 이상이 소요됩니다. 여기에 인건비, IP 라이선스, 검증 비용을 더하면 최첨단 ASIC 개발에 필요한 NRE(신규 개발 비용)는 쉽게 5억 달러를 넘어섭니다. 사양서 작성부터 첫 번째 실리콘 생산까지의 소요 기간은 12개월에서 24개월입니다. 주요 툴 공급업체는 Synopsys(VCS, PrimeTime), Cadence(Virtuoso), Siemens EDA입니다. Verilog와 VHDL은 40년이 넘도록 여전히 업계를 주도하고 있으며, 아직까지 이들을 대체할 만한 언어는 없습니다.

설계된 ASIC 유형: 풀커스텀, 게이트어레이 등

ASIC이라는 큰 범주 아래에는 여러 가지 설계 방법론이 있습니다. 이러한 방법론은 세심한 맞춤형 설계부터 빠르고 간편한 사전 제작 방식까지 다양합니다.

완전 맞춤형 ASIC는 모든 트랜지스터를 수작업으로 설계합니다. 최고의 성능과 집적도를 구현하지만 설계 시간이 가장 오래 걸립니다. 표준 셀 또는 반맞춤형 ASIC는 미리 특성화된 논리 게이트, 레지스터 및 메모리 블록 라이브러리를 사용합니다. 이를 통해 개발 시간을 획기적으로 단축하면서도 대부분의 디지털 워크로드에서 거의 최적의 결과를 얻을 수 있습니다. 게이트 어레이 ASIC는 한 단계 더 나아가, 트랜지스터가 연결되지 않은 상태로 미리 제작된 웨이퍼를 사용하며, 트랜지스터를 연결하는 금속층만 고객 맞춤형으로 설계합니다. 비용과 개발 기간이 모두 절감됩니다. 구조화된 ASIC는 게이트 어레이와 표준 셀의 중간 형태로, 소량 생산 고성능 설계에 적합합니다.

간략한 역사를 살펴보겠습니다. 바이폴라 게이트 어레이(BGA)는 1967년 페란티(Ferranti)와 인터디자인(Interdesign)에서 처음 등장했으며, 페어차일드(Fairchild)의 마이크로매트릭스(Micromatrix) 제품군도 같은 해에 출시되었습니다. 1981년 싱클레어(Sinclair) ZX81 가정용 컴퓨터에 탑재된 페란티 ULA는 최초의 대중적인 소비자용 ASIC으로 널리 알려져 있습니다. CMOS 게이트 어레이는 1974년에 등장했고, 표준 셀 ASIC은 1980년대에 걸쳐 확산되었습니다. 오늘날 최첨단 ASIC 또한 이러한 계보의 후손이라고 할 수 있습니다.

현재 ASIC이 사용되는 분야: TPU, 네트워킹, AI 추론

ASIC은 사람들이 눈여겨보지 않는 모든 곳에 존재합니다. 어떤 스마트폰을 열어보더라도, 기술적으로는 ASIC 제품군에 속하는 맞춤형 애플리케이션 프로세서가 들어 있습니다. 애플의 A 시리즈와 M 시리즈, 퀄컴 스냅드래곤, 삼성 엑시노스가 그 예입니다. 클라우드 데이터 센터에 들어가 보면 브로드컴, 시스코, 마벨 등의 맞춤형 네트워킹 ASIC이 수 테라비트/초의 트래픽을 처리하는 모습을 볼 수 있는데, 만약 누군가 소프트웨어로 같은 작업을 시도한다면 스위치는 녹아버릴 것입니다.

가장 많이 인용되는 현대 비암호화 ASIC는 구글의 텐서 처리 장치(TPU)입니다. TPU 프로젝트는 개념 구상부터 실제 칩 구현까지 약 15개월밖에 걸리지 않았습니다. TPU v1은 2015년 구글 데이터센터에서 가동되었고, 2016년 5월 구글 I/O에서 공개되었습니다. 2017년 노름 주피(Norm Jouppi) 연구팀의 ISCA 논문에 따르면, TPU v1은 당시 CPU와 GPU보다 추론 속도가 15~30배 빠르고, 전력 효율은 30~80배 뛰어났습니다. 구글은 현재 에이전트형 AI 시대를 겨냥한 8세대 TPU인 아이언우드(Ironwood)를 개발 중입니다. 2018년 7월에는 엣지 컴퓨팅 환경에서 저전력 추론을 구현하는 엣지 TPU가 출시되었습니다.

자동차용 ASIC도 어디에나 있습니다. 테슬라의 Dojo 트레이닝 칩과 차량에 탑재된 FSD 추론 칩은 모두 맞춤형 ASIC입니다. 모빌아이와 엔비디아는 ADAS 시스템의 이미지 처리 및 디지털 신호 처리를 위한 ASIC 가속기를 공급합니다. 통신, 자율주행차, AI 추론. 이 세 분야는 ASIC이 널리 사용되고 있으며 향후 10년 동안 계속해서 주도적인 역할을 할 것으로 예상됩니다. ASIC은 제조 후 재프로그래밍이 불가능하기 때문에 작업 부하가 고정된 곳에 배치됩니다. 네 번째는 이 글에서 줄곧 언급해 온 암호화폐 채굴입니다.

ASIC 채굴기: Avalon1이 들려주는 비트코인 집적 회로 이야기

비트코인 채굴은 ASIC이 왜 중요한지를 보여주는 가장 명확한 사례 연구입니다. 비트코인 네트워크는 채굴자에게 SHA-256 해시값을 계산하는 대가로 보상을 지급합니다. SHA-256은 고정된 해시값으로, 2009년 이후로 변경되지 않았습니다. 따라서 ASIC 채굴에 매우 적합한 대상입니다.

초창기 채굴은 집에 있는 하드웨어라면 무엇이든 활용했습니다. CPU 채굴은 2009년과 2010년에 정점을 찍었고, 2010년부터 2012년까지는 그래픽 카드가 코어 i7보다 훨씬 빠른 해시 속도를 낼 수 있다는 사실이 알려지면서 GPU가 주도권을 잡았습니다. 2011년과 2012년에는 열정적인 채굴자들을 위해 FPGA 채굴이 잠시 활성화되기도 했습니다. 그리고 2013년 1월 19일, 캐넌 크리에이티브(Canaan Creative)가 최초의 상용 비트코인 ASIC인 아발론1(Avalon1)을 출시했습니다. 첫 번째 제품은 110nm 공정으로 제작되었으며 600와트에서 60GH/s의 해시 속도를 기록했습니다. 당시 전 세계 비트코인 네트워크의 해시 속도는 약 20TH/s였는데, 이는 아발론1 하나로 하루에 약 15~20 BTC를 채굴할 수 있다는 것을 의미했습니다. 우리가 알고 있는 비트코인 채굴 사업은 바로 이 날부터 시작되었다고 할 수 있습니다.

비트메인은 같은 해 베이징에서 우지한과 미크리 잔에 의해 설립되었습니다. 마이크로BT(왓츠마이너 브랜드)는 2016년 전 비트메인 엔지니어였던 양쭤싱에 의해 분사되었습니다. 2013년 하반기에 이미 GPU를 이용한 비트코인 채굴은 수익성이 떨어졌고, CPU 채굴은 2년 전에 이미 사장되었습니다. 그 이후로 비트코인을 채굴하는 유일하게 경제적으로 합리적인 방법은 ASIC 채굴기뿐입니다.

시장 통합이 급격하게 진행되었습니다. 비트메인은 현재 전 세계 ASIC 채굴기 시장의 약 82%를 점유하고 있습니다. 2024년 미국은 중국산 ASIC 채굴 장비에 25%의 관세(섹션 301)를 부과했는데, 이로 인해 채굴 장비 배치 위치와 ASIC 칩 제조 장소가 크게 바뀌었습니다. 이제 암호화폐 관련 반도체 사업은 미·중 무역 갈등의 한 축을 이루게 되었습니다.

ASIC

2026에서 ASIC vs GPU 마이닝: 해시레이트, 와트, ROI 비교

2026에서 비트코인 채굴에 있어 ASIC 채굴기와 GPU를 비교하는 것은 경쟁이 아니라 범주 설정 오류입니다. 그 이유는 수치로 설명됩니다.

5월 3일 현재, 포춘의 일일 가격 추적기에 따르면 비트코인은 코인당 약 77,347달러에 거래되고 있습니다. 해시레이트 인덱스에 따르면 네트워크 해시레이트는 7일 평균 약 1,012 EH/s입니다. 난이도는 약 136.61 T입니다. 블록 보상은 2024년 4월 19일 반감기 이후 3.125 BTC로 유지되고 있습니다. 해시 가격(채굴자가 해시 파워 단위당 얻는 수익)은 PH/s/일당 약 39.04달러이며, 이는 TH/일당 약 0.039달러에 해당합니다.

모델 해시레이트 능률 냉각 일일 수익은 TH당 0.039달러입니다.
앤트마이너 S21 프로 234 TH/s 15 J/TH 3,510와트 공기 약 9.13달러
앤트마이너 S21 XP 하이드로 473 TH/s 12 J/TH 5,676 W 하이드로 약 18.45달러
왓츠마이너 M60S++ 226 TH/s 15.93 J/TH 3,600와트 공기 약 8.81달러
왓츠마이너 M63S+ 450 TH/s 17 J/TH 7,650와트 하이드로 약 17.55달러

일반적인 대규모 해시팜 요금인 kWh당 0.07달러를 적용하면 S21 Pro는 하루에 약 84kWh를 소비하며, 비용은 약 5.88달러입니다. 에너지 비용을 제외하면 하루에 몇 달러 정도만 드는 셈입니다. 현재 해시 가격을 기준으로 S21 Pro의 손익분기점 전기 요금은 kWh당 약 0.108달러입니다. 캠브리지 대안금융센터(Cambridge Centre for Alternative Finance)에 따르면 전체 네트워크는 연간 약 170~180TWh의 전력을 소비하며, 이는 전 세계 전력 소비량의 약 0.7~0.8%에 해당합니다.

이제 GPU 쪽을 살펴보겠습니다. 지난 세대 최고 사양 소비자용 그래픽 카드인 NVIDIA RTX 4090은 비트코인 SHA-256 연산을 약 1~2 GH/s(0.001~0.002 TH/s) 속도로 처리합니다. 반면 S21 Pro는 234,000 GH/s의 속도를 자랑합니다. S21 Pro는 1,600달러짜리 그래픽 카드보다 10만 배 이상 빠릅니다. 또한 소음 수준은 75dB로, 길가에 있는 진공청소기 정도이며, 수랭식 모델은 50dB까지 떨어집니다. SHA-256 연산에는 일반적인 그래픽 카드가 더 이상 필요하지 않습니다.

2026에서 GPU로 채굴 가능한 코인: GPU가 여전히 ASIC보다 우위에 있는 곳

2026에서 GPU가 여전히 경쟁력을 유지하는 데에는 소수의 작업증명 코인이 중요한 역할을 하는데, 이는 주로 해당 코인의 알고리즘이 ASIC 실리콘에 불리하게 설계되었기 때문입니다.

Ergo는 처음부터 GPU 전용으로 유지되어 온 메모리 집약적인 알고리즘인 Autolykos2를 사용합니다. Ravencoin은 KawPow를 사용하며, RTX 4090으로 약 120MH/s의 해시레이트를 기록합니다. Alephium은 Blake3를 사용하며, 실제로 GPU 전용으로 운영됩니다. Monero는 의도적으로 CPU 전용으로 설계되었고 무작위 프로그램 생성에 중점을 둔 RandomX를 사용하므로 ASIC 채굴의 이점을 상쇄합니다. Kaspa는 IceRiver와 Bitmain이 kHeavyHash 전용 ASIC를 출시한 2023년에 ASIC 채굴 저항력을 잃었습니다. Ethereum Classic의 Ethash는 2018년부터 ASIC 채굴이 가능해졌고, Zcash의 Equihash는 그보다 훨씬 이전에 ASIC 채굴에 취약해졌습니다.

패턴은 일관적입니다. 메모리 사용량이 많거나 자주 변경되는 알고리즘은 수년간 ASIC 칩에 의해 처리되지 않고 버텨냅니다. 반면, 고정된 연산량을 요구하는 알고리즘은 항상 밀려납니다. 이것이 바로 실리콘 경제학의 본질입니다.

질문이 있으십니까?

특수 목적용 하드웨어. 하나 이상의 ASIC 칩이 연결되어 단일 채굴 알고리즘을 실행합니다. 대표적인 예로는 Bitmain의 Antminer S21 Pro, MicroBT의 Whatsminer M63S+ 등이 있습니다. 일반 컴퓨터와는 달리 오직 한 가지 작업만을 위해 설계되었으며, 그 외에는 아무것도 하지 않습니다.

채굴자들은 SHA-256 해시값을 통해 계산했을 때 네트워크 목표값보다 낮은 값을 갖는 입력값을 찾기 위해 경쟁합니다. 가장 먼저 목표값에 도달한 채굴자가 블록 보상(현재 3.125 BTC)과 수수료를 가져갑니다. ASIC는 일반 칩보다 훨씬 효율적으로 해시값을 계산하기 때문에 유리합니다. 결국 모든 것은 에너지 요금에 달려 있습니다.

불가능합니다. 제조된 실리콘 칩은 로직이 고정되어 있습니다. 칩의 기능을 바꾸려면 새로운 칩을 설계하고 처음부터 다시 제작해야 하는데, 12개월에서 24개월이 걸리고 수천만 달러의 비용이 소요됩니다. 유연성이 필요하다면 FPGA나 GPU를 선택하세요.

기술적으로는 맞지만 문화적으로는 아닙니다. 엄밀히 말하면 현대 CPU는 맞춤형으로 설계된 집적 회로입니다. 하지만 ASIC이라는 용어는 특정 용도에 특화된 칩에만 사용됩니다. CPU는 범용 코드 실행을 목표로 합니다. 같은 스펙트럼이지만 양극단에 있는 셈입니다.

유연성 곡선상의 서로 다른 지점. ASIC은 파운드리를 떠나는 순간 고정된 실리콘으로 만들어집니다. FPGA는 HDL(Verilog, VHDL)을 통해 현장에서 재구성될 수 있습니다. ASIC의 장점은 대규모 생산 시 전력 효율성이 높다는 것이지만 유연성이 부족하다는 것입니다. FPGA의 장점은 그 반대입니다.

응용 분야별 집적 회로(Application-Specific Integrated Circuit, ASIC)는 특정 기능만을 수행하도록 설계된 칩입니다. 이 약어는 1970년대 후반에 등장하여 1980년대에 최초의 상용 게이트 어레이 제품군을 앞세워 널리 보급되었습니다.

Ready to Get Started?

Create an account and start accepting payments – no contracts or KYC required. Or, contact us to design a custom package for your business.

Make first step

Always know what you pay

Integrated per-transaction pricing with no hidden fees

Start your integration

Set up Plisio swiftly in just 10 minutes.