[이뉴스투데이 김진영 기자] GPU 중심의 기존 질서가 구글·아마존·마이크로소프트(MS) 등 빅테크의 주문형 반도체(ASIC) 확산으로 흔들리기 시작한 가운데 AI 반도체 시장이 3년 만에 큰 변곡점을 맞고 있다. 구글 TPU(Tensor Processing Unit)로 개발된 ‘제미나이3’가 예상보다 높은 성능을 내면서 GPU 일변도 구조가 더는 절대적이지 않다는 평가가 나온다. 전력비와 운영비 부담이 커진 대규모 데이터센터에서 효율성이 높은 ASIC의 비중이 빠르게 커지고 있다는 분석이다.
‘ASIC’이 주목받는 이유는 구조적 특성에 있다. ASIC은 특정 연산에 맞춰 회로를 고정해 설계하는 방식으로 불필요한 계산을 줄여 전력 소모를 크게 낮춘다. GPU가 다양한 모델과 작업을 처리하는 ‘범용 처리기’라면, ASIC은 특정 모델·서비스 수행에 필요한 기능만 남긴 ‘맞춤형 칩’에 가깝다. 이 차이는 대규모 AI 추론에서 운영비와 속도를 좌우하는 핵심 변수가 된다.
성능 경쟁이 단순한 속도에서 전력 효율과 총소유비용(TCO)으로 이동, ASIC 우위가 주목받는 양상이다. TPU는 칩당 전력 소모량이 GPU의 4분의 1 수준에 그친다. 테크인사이츠는 2026년 ASIC 기반 메모리 수요 증가율을 62.5%로 예측, 42.8%로 관측한 GPU보다 월등히 빠른 성장 속도를 보일 것으로 전망했다.
ASIC 확산은 제조 생태계의 병목도 동시에 드러내고 있다. 맞춤형 AI 칩 수요가 급증하면서 GPU·TPU·트레이니엄 등 대부분의 AI 칩이 대만 TSMC 공정에 몰리고 있기 때문이다. 특히 핵심 패키징 공정(CoWoS)의 생산능력이 ASIC 증가 속도를 따라가지 못하면서 전체 공급망을 제약하는 요인으로 작용하고 있다는 시각이 지배적이다.
엔비디아가 CoWoS 물량의 상당 부분을 선점한 탓에 구글·메타 같은 후발 수요기업은 일정 확보조차 쉽지 않은 상황이다. 이에 패키징 경쟁이 칩 경쟁 못지않게 중요한 변수로 부각, 일부 빅테크는 인텔 EMIB나 삼성 X-Cube 등 대체 패키징 기술을 검토하며 위험 분산에 나서고 있다.
시장은 기술 경쟁 2단계로 진입하는 중이다. 초기 ASIC 경쟁이 회로 최적화와 전력 효율을 중심으로 전개됐다면, 다음 단계는 데이터 이동 속도와 발열을 줄이는 신(新) 인터커넥트 기술이 좌우한다. 대표적인 해법이 ‘실리콘 포토닉스’다.
전기 대신 빛을 이용해 칩 내부·칩 간 데이터를 전달하는 구조로, 발열이 적고 전송지연이 거의 없어 대규모 AI 추론에서 병목을 획기적으로 줄일 수 있다. 마벨은 실리콘 포토닉스 기업 셀레스티얼AI를 4조8000억원에 인수하며 광(光) 신호 기반 ASIC 개발에 속도를 내고 있다. 엔비디아·AMD·인텔 등 기존 반도체 강자들도 투자에 나선 상태다.
전선은 메모리 시장으로도 확장되고 있다. GPU뿐 아니라 ASIC에서도 고대역폭메모리(HBM)는 핵심 구성 요소로 작용한다. 구글 TPU 한 개에 HBM이 6~8개 탑재되는 구조다. 삼성전자·SK하이닉스·마이크론은 HBM 수요 급증에 대응해 조직과 생산 전략을 재정비하고 있다.
경쟁이 HBM3E에서 HBM4·HBM4E 시대로 넘어가고 있다는 해석도 나온다. SK하이닉스는 미국에 HBM 전담 조직을 신설했고, 삼성전자는 HBM4 내부 평가를 마치고 양산 준비에 돌입했다. 마이크론도 소비자용 메모리 사업을 접고 AI용 메모리에 전면 집중하고 있다.
차세대 HBM 시장에서는 ‘커스텀 HBM’이 새로운 변수로 떠오르고 있다. 고객별 칩 설계 요구가 세분되면서 메모리도 맞춤형 구조가 필요해졌기 때문이다. SK하이닉스는 GPU·ASIC 일부 기능을 메모리 칩 내부로 통합해 전력 효율과 성능을 끌어올리는 방향을 제시, 삼성전자도 자체 파운드리 기반 미세 공정으로 고객 수요에 대응하고 있다. 반면 마이크론은 DRAM 공정 활용, 비용을 낮추고 있지만 성능 최적화 경쟁에서는 뒤처질 수 있다는 관측이 제기된다.
GPU 중심 구조의 흔들림은 엔비디아에도 직접적인 압박으로 이어지고 있다는 의견도 제기된다. 구글 제미나이3 발표 직후 엔비디아 주가는 하루 만에 7% 넘게 급락, 시가총액이 1500억달러 줄었다. 엔비디아는 GPU 생태계와 소프트웨어 플랫폼(CUDA)의 우위를 강조하며 “여전히 업계보다 한 세대 앞서 있다”고 반박하고 있다.
특정 모델에 최적화된 ASIC보다 범용성과 개발 생태계 측면에서 경쟁 우위가 유지될 것이라는 논리로 풀이된다. 다만, 시장에서는 빅테크가 추론 효율을 이유로 자체 칩을 확대한 만큼, AI 칩 수요가 GPU 단일 체제에서 점진적 다극화로 이동할 것이란 전망이 설득력을 얻고 있다.
업계 한 관계자는 “이번 변화는 지난해 ‘딥시크 충격’ 이후 또 한 번의 질서 재편에 가깝다”며 “GPU가 시장을 주도하는 구조는 당분간 유지되겠지만, 빅테크가 자체 ASIC로 추론 효율을 끌어올리기 시작하면서 칩 생태계가 단일 축에서 복수 축으로 이동하고 있다”고 말했다. 이어 “이제 중요한 건 어떤 기업이 전체 AI 시스템을 가장 효율적으로 설계하느냐의 문제”라며 “GPU와 ASIC의 공존은 피할 수 없는 흐름”이라고 덧붙였다.
Copyright ⓒ 이뉴스투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.