NC AI는 세계 최대 음성·언어 기술 학회 인터스피치 2025(INTERSPEECH 2025)에서 몬스터 사운드 생성·변환 인공지능(AI) 기술을 공개한다고 17일 밝혔다.
뉴시스 보도에 따르면, 인터스피치는 국제음성커뮤니케이션협회(ISCA)가 주최하며, 매년 전 세계 음성 연구자와 산업 관계자가 모여 최신 연구 결과와 혁신 기술을 공유한다.
이날부터 21일까지 네덜란드에서 개최되는 이번 학회는 '공정하고 포용적인 음성 과학과 기술'을 주제로 개인과 언어간 다양한 음성 특성을 존중하고 이를 기반으로 한 맞춤형 음성 기술 발전에 초점을 맞춘다.
NC AI는 이 자리에서 몬스터 사운드에 특화된 고품질 음색 변환 모델 구조와 학습 기법을 상세히 다룬 논문과 이를 웹 기반 실시간 변환 시스템으로 구현한 데모 구축 사례 논문 등 총 2편을 발표한다.
현장에서는 방문자가 마이크로 말하거나 사운드를 업로드하면 즉각 특정 몬스터 울음이나 포효 같은 음색으로 변환되는 체험형 데모가 제공된다. 온라인 데모 페이지도 공개해 현장에 오지 못한 이들도 체험 가능하다.
NC AI가 이번에 선보이는 기술은 대규모 MMORPG 게임에서 몬스터 사운드 제작 방식을 혁신적으로 바꾸는 도약이라는 평가를 받는다. CD 수준(44.1kHz)으로 음성을 분석, 캐릭터 고유의 거친 숨소리나 날카로운 포효까지 놓치지 않고 담아낸 뒤 원래 음성 내용은 유지하면서도 원하는 스타일만 정확하게 덧입히는 게 특징이다.
웃음, 숨소리 같은 비언어적 요소도 자연스럽게 변환이 이뤄진다. 금속성 울림 같은 질감을 주파수별로 정밀 복원하고 0.005초마다 강약 변화를 반영, 마치 몬스터가 플레이어 눈 앞에 울부짖는 듯한 생생함을 전달한다는 게 회사 설명이다.
NC AI는 사운드 디자이너들이 각 몬스터와 상황별 변주음을 일일이 수작업으로 제작하느라 필요했던 막대한 시간과 비용 부담을 낮출 수 있을 것으로 보고 있다. 이번 음색 변환 기술은 NC AI가 개발한 생성형 사운드 이펙트(SFX) 저작 툴인 사운드 팔레트(Sound Palette) 핵심 엔진으로도 활용된다.
이 서비스는 게임뿐만 아니라 영화, 광고, 확장현실(XR), 메타버스 등 다양한 디지털 콘텐츠 제작 영역으로 확장할 수 있다.
조남현 NC AI 오디오 AI 팀장은 "NC AI는 방대한 게임 오디오 데이터와 첨단 AI 모델링 기술, 뛰어난 사운드 디자인 전문성을 융합해 이번 몬스터 사운드 변환 기술을 완성했다"며 "앞으로도 AI를 활용해 창작자의 상상력을 현실로 구현하고 디지털 콘텐츠 산업 전반에 혁신적인 오디오 경험을 제공하는 데 기여할 것"이라고 말했다.
Copyright ⓒ 모두서치 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.