엔비디아(NVIDIA)가 차세대 물리 AI 개발을 위한 대규모 오픈 소스 데이터세트를 공개했다.
이번에 공개된 데이터세트는 연구자와 개발자가 AI 모델을 보다 정교하게 훈련할 수 있도록 지원하며, 특히 AI 모델의 사전 훈련, 테스트, 검증 과정에서 활용될 수 있다.
엔비디아는 이러한 대규모 데이터를 처리하기 위해 네모 큐레이터(NeMo Curator) 툴을 제공하며, 이를 활용하면 CPU 환경에서 3.4년이 걸리던 2,000만 시간 분량의 영상 데이터 처리 작업을 엔비디아 블랙웰(Blackwell) GPU에서는 단 2주 만에 수행할 수 있다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “M투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.