이 같은 변화는 AI 산업의 무게중심이 대규모 학습에서 실제 서비스 단계인 ‘추론(inference)’과 에이전트 운영으로 이동하는 흐름과 맞물린다. 학습에서는 GPU가 강점을 보이지만, 서비스 단계에서는 효율성과 확장성이 중요해지면서 NPU가 대안으로 부상하고 있다.
|
◇“GPU에서 NPU로”…SKT·Arm·리벨리온 ‘원팀’
국내에서는 SK텔레콤이 Arm, 리벨리온과 함께 ‘CPU+NPU’ 기반 AI 서버 구축에 나서며 변화를 주도하고 있다. Arm CPU가 시스템을 총괄하고, 리벨리온 NPU가 AI 추론을 담당하는 구조다.
이번 협력은 단순 기술 제휴를 넘어 투자와 인프라까지 결합된 ‘원팀 전략’으로 평가된다. SK그룹과 Arm이 리벨리온에 전략적 투자를 단행한 만큼, 설계부터 서비스까지 이어지는 수직 통합 구조가 형성되고 있다는 분석이다. 핵심은 GPU 의존도를 낮추고, 추론 특화 NPU로 효율을 극대화하는 데 있다.
글로벌 시장에서도 유사한 흐름이 감지된다. Arm, AMD, 인텔이 AI 칩 시장 주도권을 두고 직접 경쟁에 나서면서, 기존의 ‘설계-제조’ 분업 구조가 빠르게 해체되고 있다. Arm은 자체 AI CPU 전략을 강화하고 있고, AMD는 GPU와 서버 CPU를 앞세워 점유율 확대에 나섰다. 인텔 역시 차세대 공정과 AI PC 플랫폼을 기반으로 반격을 모색 중이다.
◇삼성SDS·퓨리오사AI, NPU 클라우드 확산
국내 클라우드 시장에서도 변화가 감지된다. 삼성SDS는 퓨리오사AI와 협력해 NPU 기반 클라우드 서비스(NPUaaS)를 7월 쯤 출시할 예정이다.
2세대 NPU ‘RNGD(레니게이드)’를 삼성 클라우드 플랫폼(SCP)을 통해 구독형으로 제공하는 방식으로, 고객은 별도 장비 없이 AI 인프라를 활용할 수 있다.
양사는 SCP 환경에 최적화된 NPU 서비스 구현을 위해 협력을 이어왔으며, 기존 GPU 중심 클라우드에 국산 NPU 선택지를 추가한다는 점에서 의미가 크다. 서비스가 상용화되면 1장부터 8장 단위까지 유연한 자원 활용이 가능하고, 스토리지·네트워크 등 기존 클라우드 서비스와의 연계도 지원된다.
이미 시장에서는 변화 조짐이 나타나고 있다. 리벨리온 NPU가 KT클라우드를 통해 서비스된 데 이어 가비아도 관련 서비스를 선보이며 시장 참여가 확대되는 추세다. 업계에서는 이를 GPU 중심 구조에서 NPU 기반으로 전환되는 신호로 해석한다.
성능과 비용 측면에서도 경쟁력이 강조된다. 퓨리오사AI는 “해외 고객사 벤치마크 기준 동일 전력 조건에서 엔비디아 RTX PRO 6000 대비 최대 7배 이상의 효율을 보였고, 총소유비용(TCO)을 약 40% 절감할 수 있다”고 밝혔다.
|
◇데이터센터 넘어 ‘엣지 AI’로 확산
AI 인프라 혁신은 데이터센터를 넘어 산업 현장으로 확산되고 있다.
딥엑스는 현대자동차그룹과 올해 CES 기간중에서 올해 양산하는 로봇에 탑재를 확정하였고, 최근에는 2세대 피지컬 AI 칩 ‘DX-M2’에 대해 VLA 및 VLM등 피지컬 AI 핵심 알고리즘 기반 로봇 핵심 기술에 대한 협업을 추진 중이다. 이는 데이터센터 도움 없이 기기 자체에서 생성형 AI을 구동하도록 설계된 제품이다. 또한 바이두와는 로봇, 드론을 비롯해 AI 제조와 같은 공장 자동화를 위한 AI 및 피지컬 AI 시스템 기술에 대해 협력중이며, 글로벌 8개국 8개 피지컬 AI 핵심 산업에서 30여개 구매주문을 받는 등 글로벌 비지니스를 성공적으로 확산하고 있다.
모빌린트도 포스코DX와 협력해 제조·물류 환경 중심 AI 인프라 구축에 나섰다. 포스코DX는 모빌린트에 약 30억 원을 투자하며 협력을 강화했다.
딥엑스 김녹원 대표는 “엔비디아 GPU는 프로토타입 단계에서는 적합하지만, 전력 소모와 가격 측면에서 대량 양산에는 한계가 있다”며 “피지컬 AI 확산을 위해서는 초저전력 NPU가 필수적”이라고 강조했다. 이어 “엔비디아 로보틱스 플랫폼인 아이작(Isaac) 기반 코드에서 API 일부만 변경하면 호환 가능한 소프트웨어 프레임워크를 개발 중이며, 5년 내 피지컬 AI 인프라 기업으로 도약하겠다”고 밝혔다.
◇칩 최적화‘ 경쟁…한국형 생태계 구축
화웨이, 캠브리콘 등 중국 AI반도체 회사들과 협업하는 딥시크 사례가 보여주듯 AI 경쟁의 핵심은 모델 자체를 넘어 ’칩 최적화‘로 이동하고 있다. 특정 반도체에 맞춰 소프트웨어를 설계하는 전략이 성능과 비용을 좌우하는 핵심 변수로 떠오른 것이다.
국내에서도 ▲NPU 최적화 소프트웨어 ▲NPU 기반 클라우드 ▲산업 현장 중심 AI로 이어지는 ’한국형 AI 생태계‘ 구축이 속도를 내고 있다.
업계 관계자는 “AI 인프라는 단순한 GPU 대체가 아니라 설계 철학 자체가 바뀌는 단계”라며 “어떤 칩에 최적화된 생태계를 구축하느냐가 경쟁력을 좌우할 것”이라고 말했다.
GPU 중심 시대에서 NPU가 새로운 축으로 자리 잡을 수 있을지 주목된다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

