차세대 자율형 인공지능 시스템 구축을 위한 새로운 인프라 협력이 발표됐다. 타이베이에서 열린 엔비디아 GTC 2026 행사를 계기로, AI 네이티브 클라우드 전문기업 GMI 클라우드가 엔비디아의 베라 루빈 플랫폼 비전에 맞춰 에이전틱 AI 팩토리 지원 계획을 공식화한 것이다.
연합뉴스에 따르면, 단일 모델 기반의 단순 프롬프트 방식에서 벗어나 멀티모달·장기 실행·자율형 체계로 AI 워크로드가 급격히 진화하고 있다. 이에 따라 실시간 추론 처리, 보안 오케스트레이션, 대용량 처리, 대규모 운영을 뒷받침할 인프라에 대한 수요가 기업과 개발자 사이에서 급증하는 상황이다.
추론 중심 클라우드 플랫폼 구축에 나선 GMI 클라우드는 모델 개발 단계부터 애플리케이션 운영까지 전 주기에 걸쳐 성능·유연성·보안을 갖춘 AI 워크로드 배포 환경을 제공한다는 방침이다. 인공지능이 단순 대화형 인터페이스를 넘어 추론·행동·복잡한 워크플로 조율·멀티모달 컨텍스트 학습이 가능한 지능형 운영 계층으로 발전하고 있기 때문이다.
이러한 변화에 대응하기 위해 필요한 인프라 요건도 한층 복잡해지고 있다. 인터랙티브 앱을 위한 고처리량·저지연 추론, 텍스트·이미지·비디오·오디오 등 멀티모달 모델의 원활한 배포, 장문 컨텍스트 추론 및 메모리 관리 기능이 핵심으로 꼽힌다. 기업 환경에서는 안전한 멀티테넌트 구조, 동적 확장성, 토큰 비용 절감과 리소스 효율 극대화를 위한 최적화된 오케스트레이션이 필수 조건으로 부상했다.
이에 GMI 클라우드는 대규모 추론과 에이전틱 워크로드, 프로덕션 AI 배포에 최적화된 엔비디아의 엔드투엔드 풀스택 AI 팩토리 플랫폼을 전면 채택했다. 동사의 플랫폼은 고성능 AI 인프라, 저지연 모델 서빙 플랫폼, 상용·오픈소스 모델 통합 접근이 가능한 MaaS API, 엔터프라이즈급 전용 엔드포인트, AI 인프라 오케스트레이션 계층, 에이전틱 워크플로 인프라, 멀티모달 네이티브 배포 환경 등으로 구성된다.
GMI 클라우드 창립자 겸 CEO 알렉스 예는 "컴퓨트 오케스트레이션 최적화와 프로덕션 추론 서비스, 개발자 친화적 API의 결합을 통해 프로토타입에서 프로덕션으로의 전환 속도를 높이는 동시에 실제 AI 시스템 운영에 필요한 성능과 안정성을 확보할 수 있다"고 설명했다. 그는 또한 "AI 팩토리가 기업의 독점 데이터, 규제 대상 콘텐츠, 모델 컨텍스트, AI 에이전트 메모리를 처리하는 비중이 커지면서 보안이 인프라 스택의 핵심 계층으로 자리잡고 있다"고 강조했다.
보안 강화 측면에서 GMI 클라우드는 엔비디아 컨피덴셜 컴퓨팅을 도입해 신뢰 실행 환경(TEE)을 제공하고 기업 고객의 보안 요구사항을 충족시킬 예정이다. 내부 파일럿 프로젝트 수준을 넘어 프로덕션급 시스템으로 AI 활용이 확대되는 추세에서, 안전한 인프라가 광범위한 AI 도입의 핵심 기반이 될 것으로 전망된다.
엔비디아 베라 루빈은 차세대 컴퓨팅·네트워킹·보안·랙 스케일 시스템 설계를 통합해 에이전틱 AI 요구사항을 충족하는 AI 팩토리 인프라 진화의 중요한 이정표로 평가받고 있다. 알렉스 예 CEO는 "높은 전력 효율, 낮은 토큰 비용, 강력한 수요 기반, 긴 인프라 수명주기 덕분에 공급자와 고객 모두에게 뛰어난 경제성을 제공할 수 있어 엔비디아 에코시스템과의 협력을 지속 확대하고 있다"며 "멀티모달 추론부터 모델 API, 전용 엔드포인트, 에이전틱 AI 인프라까지 개발자와 기업이 첨단 AI 워크로드를 전 세계에 배포할 수 있도록 지원할 것"이라고 밝혔다.
Copyright ⓒ 나남뉴스 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.