|
[이데일리 정다슬 기자] 화웨이가 인공지능(AI) 추론 과정에서 고성능 메모리(HBM)에 대한 의존도를 낮출 수 있는 신기술 ‘UCM(추론 메모리 데이터 관리자, Unified Cache Manager)’을 공개했다. 화웨이는 해당 기술을 내달부터 오픈소스로 개방하고, 업계 전반에 공유할 방침이다.
12일 증시일보에 따르면, 화웨이는 이날 열린 ‘2025 금융 AI 추론 애플리케이션 실증 및 발전 포럼’에서 UCM 기술을 공식 발표했다. UCM은 추론과정에서 발생하는 KV 캐시(Key-Value Cache)를 효과적으로 관리하는 기술이다. 이로써 AI는 더 긴 문장이나 많은 정보를 빠르게 처리할 수 있고, 토큰당 추론 비용도 절감된다. HBM과 같은 고성능 메모리에 대한 의존도를 줄일 수 있는 이유도 여기에 있다.
그동안 HBM은 고성능 AI칩을 만들기 위한 핵심 부품으로 여겨졌다. D램 칩을 여러 층으로 쌓아올린 후 고속 인터페이스로 연결해 대역폭을 비약적으로 높려 한꺼번에 많은 양의 데이터를 처리할 수 있게 해준다. 현재는 한국의 SK하이닉스가 HBM 시장에서 1위를 차지하고 있으며 이어 삼성전자, 미국의 마이크론테크놀로지이 글로벌 HBM 시장 점유율 2, 3위를 뒤따르고 있다. 중국 역시 양쯔메모리(YMTC)나 창신메모리(CXMT)가 HBM 기술 개발에 박차를 가하고 있으나 생산 능력과 기술 정교함 측면에서는 이들 3사보다는 뒤처져 있다는 평가다. 이런 상황에서 화웨이는 HBM에 대한 물리적 기술부족을 메모리 사용 효율을 극대화하는 소프트웨어 기술로 보완하겠다는 전략이다.
화웨이의 UCM 기술은 이미 중국 유니온페이의 ‘고객의 소리’, ‘마케팅 기획’, ‘사무지원 도우미’ 등 세 가지 핵심 업무에 시범 적용돼 실질적인 성과를 거둔 것으로 전해졌다.
인민재경은 화웨이가 오는 9월부터 해당 기술을 자사 커뮤니티 ‘모칭(魔擎)’을 통해 우선 공개하고, 이후에는 UCM기술을 주요 AI 추론 엔진들에서도 활용될 수 있도록 기술적 연동 및 지원을 확대할 계획이라고 보도했다.
이와 별개로, 중국은 경쟁력 있는 HBM 기술 개발에도 박차를 가하고 있다. 업계에 따르면 CXMT는 ‘HBM3’ 제품을 샘플 수준으로 업계에 공급하기 시작한 것으로 알려졌다. 시장에서는 CXMT가 올해 말까지 고객사에 HBM3 샘플을 제공할 것으로 내다봤는데 이보다 이른 시간 샘플 공급을 시작한 것이다. CXMT는 화웨이의 양산 승인도 기다리고 있으며, 최종 승인이 이뤄지면 화웨이는 CXMT로부터 HBM3 제품을 받아 AI 반도체를 완성할 계획이다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
