AI 작곡 전문 포자랩스가 차세대 3D 오디오 규격인 ‘IAMF’(Immersive Audio Model and Formats)기술이 적용된 데이터 확보에 성공하여, 이를 기반으로 AI 3D 오디오 생성 기술 개발에 본격 착수하겠다고 9일 밝혔다.
이는 최근 삼성리서치가 개발한 IAMF 기술이 적용될 3D 오디오 시장을 선점하기 위한 행보로, 크리에이터가 MIDI 음악을 활용해 손쉽게 3D 오디오 콘텐츠를 제작할 수 있는 환경을 제공할 수 있을 것으로 기대된다.
IAMF는 오픈 소스 기반의 3D 오디오 기술로, 삼성전자를 포함한 구글, 애플, 넷플릭스, 아마존, 메타 등 다양한 글로벌 기업이 속한 오픈미디어 연합(AOM)에서 최초로 채택한 오디오 기술 규격이다. 특히 유튜브가 ‘2025년 IAMF 기술 기반 3D 오디오 서비스 도입 계획’을 발표하면서, VR, AR, 스트리밍, 게임, 방송 등 다양한 분야에서의 활용 가능성에 이목이 집중되고 있다.
포자랩스는 이러한 시장 변화에 발맞춰 AI 작곡의 글로벌 표준으로 거듭나게 위해, IAMF 기술이 적용된 데이터 확보 및 자동화된 3D 오디오 생성 모델 구축 계획을 발표한 것으로 해석된다.
3D 오디오 기술은 하나의 곡을 이루는 수십 개의 트랙 각각에 공간 오디오 정보를 적용할 수 있어, 청취자가 어떤 환경에서 음악을 듣더라도 최적의 공간감을 경험할 수 있도록 한다. 이러한 기술 구현을 위해서는 음악을 구성하는 트랙 별로 분리된 데이터 셋을 구축해야 하며, 동시에 트랙 단위의 음원 생성이 가능해야 한다.
포자랩스는 창업 초기부터 저작권 문제 해결을 위해 전문 작곡가를 고용하여 트랙 단위의 작곡 데이터를 직접 제작하고 있다. 또한, '뉴립스(NeurIPS)'와 'AAAI(Association for the Advancement of Artificial Intelligence)'와 같은 세계 최고 권위의 AI 학회를 통해 트랙 기반 MIDI 생성 기술을 인정받은 바 있다.
이번 3D 오디오 데이터 셋 역시 포자랩스 소속 전문 사운드 엔지니어와 공간 음향 스튜디오를 활용하여 자체 구축하고 있으며, 기존에 확보한 작곡 데이터에 공간 오디오 정보가 추가되어 확장되는 개념이라고 밝혔다.
포자랩스는 삼성과 구글의 IAMF 기술 발표 이후 다양한 상황에서 활용될 수 있는 10여 가지 장르의 3D 오디오 콘텐츠를 개발해왔다. 이러한 과정에서 공간감을 구성하는 수십 가지 메타 정보에 대해 정의하였고, 이를 AI가 학습할 수 있는 형태의 데이터 셋으로 구축하는데 성공한 바 있다.
이러한 기술적 성과를 바탕으로 대규모 데이터 셋 구축 및 상용화된 3D 오디오 자동화 모델 개발에 박차를 가할 예정이다.
한편 글로벌 AI 음악 생성 서비스 '수노(Suno)', '유디오(Udio)'는 전체 음원을 한 번에 생성하는 방식을 취하고 있어 트랙별로 음원을 수정하거나 공간 음향 기술을 적용하는 것이 사실상 불가능한 상황이다.
포자랩스의 김태현 CSO는 “IAMF 기술이 오픈 소스로 개방된 만큼 누구나 3D 오디오 콘텐츠를 쉽게 만들고 활용할 수 있는 시대가 올 것으로 기대한다.”며, “세계 최초로 AI 기술을 활용해 3D 오디오 콘텐츠가 전 세계적으로 확산될 수 있도록 지원함과 동시에 글로벌 파트너들과 협력해 관련 생태계를 구축하고 기술을 더욱 발전시키는 데 주력할 것”이라고 밝혔다.
보도자료 제공: 포자랩스(pozalabs.com)
Copyright ⓒ 비석세스 beSUCCESS 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
지금 쿠팡 방문하고
2시간동안 광고 제거하기!