NHN클라우드는 크래프톤의 초거대 GPU 클러스터 사업자로 선정됐다고 19일 밝혔다.
이번 사업은 크래프톤이 지난해 10월 'AI 퍼스트'를 경영 핵심 전략으로 선언한 이후, AI 활용을 본격 확대하는 과정에서 증가하는 AI 연산 수요에 대응하기 위해 추진됐다.
GPU 클러스터는 AI 플랫폼과 데이터 통합·자동화 기반 고도화 등 크래프톤의 중장기 AI 전략을 안정적으로 실행하기 위한 핵심 기반이다. NHN클라우드가 제공하는 GPUaaS(서비스형 GPU)를 활용해 인프라를 유연하게 확장하고 운영 효율을 높이는 데 초점을 맞춘다.
NHN클라우드는 광주 국가 AI 센터를 자체 설계·구축하고 2021년부터 현재까지 GPUaaS 서비스를 안정적으로 제공해 온 기술력을 보유한 점과 수년간 다수의 공공·민간 고객을 대상으로 AI 인프라 서비스를 운영해 온 경험이 이번 사업 파트너로 선정된 배경으로 꼽힌다.
NHN클라우드는 이번 사업에서 엔비디아의 최신 GPU인 '블랙웰 울트라' 1000여 장으로 구성된 GPU 팜을 멀티 클러스터 구조의 대규모 AI 연산 환경으로 설계한다. XDR-800G급 초고속 인피니밴드 네트워크를 적용해 GPU 간 대용량 데이터를 저지연·고속으로 전송한다.
NHN클라우드는 GPU를 여러 작업이 함께 사용할 수 있도록 동적 관리 구조를 적용한다. ▲AI 개발 ▲학습 ▲추론 등 다양한 작업이 동시에 진행되더라도 GPU 자원을 필요에 따라 유연하게 나눠 쓰고 조정할 수 있어 유휴 자원을 최소화하고 전체 클러스터 활용 효율을 높일 계획이다. 소규모 AI 개발 환경부터 대규모 LLM 학습까지 GPU 활용도를 탄력적으로 조정할 수 있다.
또 맞춤형 GPUaaS로 AI 개발과 운영 전반에 유연한 환경을 제공한다. 대규모 AI 학습과 연산 특성에 맞춰 쿠버네티스와 HPC 환경에 적합한 슬럼 기반 자원 관리 솔루션을 도입해 다양한 AI 작업이 동시에 진행되는 환경에서도 안정적인 운영을 뒷받침한다.
블랙웰 울트라 GPU 인프라는 NHN클라우드 판교 NCC에 자리잡는다. 판교 NCC는 고집적 연산을 원활히 운영할 수 있는 전력·냉각 인프라와 우수한 네트워크 연결성을 갖춰 대규모 AI 워크로드 처리에 적합한 시설이다. 해당 인프라는 오는 7월 중 구축을 완료하고 본격 가동될 예정이다.
NHN클라우드 관계자는 "이번 프로젝트는 대규모 GPU 클러스터를 GPUaaS 형태로 구축·운영할 수 있는 NHN클라우드의 기술력과 운영 역량을 입증한 사례"라며 "7월 가동을 시작으로 크래프톤의 AI 퍼스트 전략을 실질적으로 뒷받침할 수 있도록 안정적인 클러스터 제공과 운영 기술 지원에 집중하겠다"고 말했다.
Copyright ⓒ 일간스포츠 무단 전재 및 재배포 금지