엔비디아, AI 추론 가속화 가능한 '블랙웰 울트라' 공개

엔비디아, AI 추론 시대 가속화 ‘블랙웰 울트라 AI 팩토리 플랫폼’ 공개

[엠투데이 이정근기자] AI 컴퓨팅 기술 선두주자인 엔비디아(NVIDIA)가 미국 새너제이에서 열린 GTC에서 AI 추론을 혁신할 ‘엔비디아 블랙웰 울트라(NVIDIA Blackwell Ultra)’를 공개했다. 이는 기존 ‘블랙웰 AI 팩토리 플랫폼’의 차세대 버전으로, AI 추론, 에이전틱 AI, 물리 AI 애플리케이션을 더욱 빠르고 정밀하게 처리할 수 있도록 설계됐다.

블랙웰 울트라는 AI 모델의 정확도를 높이는 ‘테스트 타임 스케일링(Test-Time Scaling, TTS)’ 기법을 강화해 추가 계산을 할당하는 방식으로 AI 추론 성능을 향상시킨다. 이를 통해 복잡한 요청을 세분화하고, 보다 고품질의 AI 응답을 제공할 수 있도록 한다.

블랙웰 울트라 플랫폼은 GB300 NVL72 랙 스케일 솔루션, HGX B300 NVL16 시스템을 포함하며, 기존 GB200 NVL72 대비 1.5배 향상된 AI 성능을 제공한다. 또한, 엔비디아 호퍼(Hopper™) 아키텍처 대비 AI 팩토리의 수익 기회를 50배 증가시킬 것으로 예상된다.

고성능 AI 인프라, 블랙웰 울트라의 핵심 기술

GB300 NVL72는 72개의 블랙웰 울트라 GPU와 36개의 네오버스(Neoverse) 기반 엔비디아 그레이스(Grace™) CPU를 연결한 랙 스케일 디자인을 채택했다. 이를 통해 AI 모델이 문제를 보다 정교하게 분석하고, 다양한 솔루션을 탐색할 수 있도록 지원한다.

또한, 엔비디아 HGX B300 NVL16은 거대 언어 모델(LLM)에서 11배 빠른 추론 성능, 7배 향상된 컴퓨팅 성능, 4배 증가한 메모리를 제공해 AI 기반 워크로드에서도 최적의 성능을 보장한다.

블랙웰 울트라 시스템은 엔비디아 DGX 클라우드(DGX™ Cloud) 에서도 활용 가능하며, DGX GB300 시스템을 탑재한 DGX SuperPOD™ 은 AI 팩토리 구축을 위한 턴키 솔루션을 제공한다.

AI 산업 전반에 적용될 블랙웰 울트라

블랙웰 울트라는 에이전틱 AI(Agentic AI), 물리 AI(Physical AI) 분야에서 강력한 성능을 발휘한다.

이를 위해 엔비디아는 블랙웰 울트라 시스템을 스펙트럼-X 이더넷(Spectrum-X™ Ethernet) 및 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 와 통합해, GPU당 800Gb/s의 데이터 처리 속도를 제공하는 인프라를 구축했다.

2025년 하반기부터 글로벌 IT 기업 및 클라우드 서비스 도입 예정

블랙웰 울트라는 2025년 하반기부터 시스코(Cisco), 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo), 슈퍼마이크로(Supermicro) 등 주요 IT 기업을 통해 출시될 예정이다.

또한, AWS, 구글 클라우드, 마이크로소프트 애저, 오라클 클라우드 등 글로벌 클라우드 서비스 업체들도 블랙웰 울트라 기반 인스턴스를 제공할 계획이다.

엔비디아 AI 소프트웨어로 병목 현상 해결

엔비디아는 AI 추론 성능을 극대화하기 위해 엔비디아 다이나모(Dynamo) 를 도입했다. 다이나모는 수천 개의 GPU를 최적화하고, 추론 모델을 효율적으로 분배해 AI 응답 속도를 향상시키는 소프트웨어 플랫폼이다.

또한, 블랙웰 울트라는 엔비디아 AI 엔터프라이즈(AI Enterprise) 및 NIM™ 마이크로서비스를 지원하며, 기업이 클라우드와 데이터센터에서 AI 프레임워크와 도구를 손쉽게 활용할 수 있도록 한다.

엔비디아, AI 컴퓨팅 패러다임 변화 예고

엔비디아의 블랙웰 울트라는 AI 컴퓨팅 성능을 획기적으로 끌어올려, AI 팩토리 및 클라우드 데이터센터의 병목 현상을 해소할 것으로 기대된다. 이번 발표를 통해 엔비디아는 AI 추론 기술의 미래를 다시 한번 주도하며, 글로벌 AI 컴퓨팅 시장에서의 입지를 더욱 강화할 전망이다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드