IT 솔루션 및 AI 전문 기업 베이직인터내셔널이 한국적 정서와 최첨단 보이스 기술을 결합한 고성능 AI 가창 합성 서비스 ‘아우라보이스(Aura Voice)’의 핵심 파이프라인 구축을 완료하고 본격적인 서비스 전개에 나선다고 밝혔다.
‘아우라보이스’는 단순한 음성 합성을 넘어 K-Pop과 국악 등 한국 특화 데이터를 학습한 MuLM(Music Language Model) 엔진을 기반으로 한다. 특히 가사와 음원을 밀리초(ms) 단위로 일치시키는 ‘정밀 정렬’ 기술과 한국어 발음 기호 변환(G2P) 기술을 통합해 실제 가수가 부르는 듯한 명료하고 감정 풍부한 가창력을 구현한 것이 특징이다.
‘아우라보이스’는 사용자의 실제 목소리를 단 몇 분의 샘플링만으로 학습해 AI가 생성한 고품질 음원에 자연스럽게 믹싱하는 ‘자기 음성 가창 합성 서비스’다. 이는 기존 TTS(Text-to-Speech)를 넘어 가수의 창법과 감정 표현까지 재현하는 고난도 기술로, K-스타일 특유의 섬세한 보컬 표현력을 완벽히 구현했다는 평가를 받는다.
‘아우라보이스’는 단순한 감상을 넘어 사용자가 직접 비즈니스와 일상에 활용할 수 있는 실무형 기능을 대폭 강화했다. 기업 담당자나 개인이 자신의 목소리를 AI 가창 모델과 합성해 세상에 하나뿐인 ‘맞춤형 노래 비즈링’을 제작할 수 있다.
선생님이나 부모님의 목소리로 학습 내용을 노래로 만들어 들려주는 등 교육 현장에서의 몰입도를 극대화한다. 베이직인터내셔널은 ‘아우라보이스’를 통해 이동통신, 에듀테크 두 가지의 핵심 비즈니스 모델을 추진한다.
‘AI 비즈링(Business Ringing)’과 개인화된 ‘컬러링’ 서비스를 제공한다. 단 30초의 목소리 샘플만으로 본인의 목소리를 클로닝해 기념일 축하송을 제작하거나 상황(회의, 운전 등)에 맞는 BGM과 음성을 실시간 합성해 송출하는 혁신적인 오디오 부가서비스다.
공교육 현장의 ‘AI 디지털 교과서’와 연동한다. 수학 공식이나 역사 연표를 노래로 변환하는 ‘텍스트 기반 자동 암기송’, 교과서 속 인물의 페르소나를 반영한 ‘입체 낭독 콘텐츠’를 통해 학생들의 학습 몰입도를 극대화할 계획이다.
‘아우라보이스’는 생성된 모든 콘텐츠에 저작권 보호를 위한 비가청 디지털 워터마킹을 삽입하고, 유해 콘텐츠 차단을 위한 세이프티 가드레일(Guardrail)을 적용해 ‘신뢰할 수 있는 AI(Trust AI)’ 환경을 구축했다.
베이직인터내셔널은 아우라보이스는 전통적인 음원 제작 대비 비용을 90% 이상 절감하면서도 고품질의 K-스타일 음원을 무한 생성할 수 있는 독보적인 솔루션이라며, 기술성숙도(TRL) 8~9단계 달성을 통해 정부 주도 디지털 뉴딜 사업 참여는 물론 통신사 대상 보급을 통해 K-AI 기술의 위상을 높이겠다고 포부를 밝혔다.
Copyright ⓒ AI포스트 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.