[엠투데이 이정근기자] 엔비디아가 미국 라스베이거스에서 열린 세계 최대 IT·가전 전시회 CES 2026에서 엔비디아 블루필드-4(NVIDIA BlueField®-4) 데이터 프로세서를 기반으로 한 ‘엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼(Inference Context Memory Storage Platform)’을 공개했다. 이는 차세대 AI를 위한 새로운 등급의 AI 네이티브 스토리지 인프라로, 블루필드-4는 풀스택 엔비디아 블루필드 플랫폼의 핵심 구성 요소다.
대규모 언어 모델과 에이전틱 AI가 확산되면서 AI 모델은 수조 개의 파라미터와 다단계 추론 구조로 진화하고 있다. 이 과정에서 생성되는 방대한 컨텍스트 데이터는 정확성과 사용자 경험, 연속성을 좌우하는 KV 캐시(key-value cache) 형태로 관리된다. 그러나 KV 캐시는 다중 에이전트 시스템에서 실시간 추론 병목을 유발해 GPU 메모리에 장기간 저장하기 어렵다는 한계를 안고 있다.
엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼은 이러한 문제를 해결하기 위해 GPU 메모리 용량을 확장하고, 랙 스케일 AI 시스템 전반에서 컨텍스트를 고속으로 공유할 수 있도록 설계됐다. 이를 통해 초당 토큰 처리량을 최대 5배까지 끌어올리고, 기존 스토리지 대비 최대 5배 높은 전력 효율을 제공한다.
젠슨 황 엔비디아 CEO는 “AI는 이제 스토리지까지 재정의하고 있다”며 “AI는 단순한 챗봇을 넘어 물리적 세계를 이해하고 장·단기 메모리를 유지하며 실제 업무를 수행하는 지능형 협업자로 진화하고 있다”고 강조했다. 이어 “블루필드-4는 차세대 AI를 위한 스토리지 스택을 새롭게 정의하는 핵심 기술”이라고 밝혔다.
이 플랫폼은 멀티턴 AI 에이전트를 위한 지속적인 컨텍스트 유지로 반응성을 개선하고, AI 팩토리의 전체 처리량을 높이는 동시에 장문 컨텍스트 기반 다중 에이전트 추론의 확장성을 지원한다. 엔비디아 루빈(Rubin) 클러스터 수준의 KV 캐시 용량을 제공하며, 엔비디아 DOCA 프레임워크와 NIXL 라이브러리, 다이나모 소프트웨어와 긴밀히 통합돼 AI 노드 간 고속 공유를 구현한다.
또한 블루필드-4가 하드웨어 가속 방식으로 KV 캐시 배치를 관리해 메타데이터 오버헤드를 줄이고 데이터 이동을 최소화하며, RDMA 기반의 엔비디아 스펙트럼-X 이더넷을 활용해 효율적인 데이터 공유와 검색을 지원한다.
엔비디아는 AIC, 클라우디안, DDN, 델 테크놀로지스, 휴렛팩커드 엔터프라이즈, 히타치 밴타라, IBM, 뉴타닉스, 퓨어스토리지, 슈퍼마이크로, 바스트 데이터, 웨카 등과 협력해 블루필드-4 기반 차세대 AI 스토리지 플랫폼을 조기에 구축하고 있다. 블루필드-4는 2026년 하반기 출시될 예정이다.
Copyright ⓒ M투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.