ㅣ데일리포스트=곽민구 기자ㅣAI 오디오 기업 수퍼톤이 자사의 여러 기술들을 외부 서비스에서도 구현하도록 지원하는 ‘수퍼톤(Supertone) API’를 클로즈드 베타 테스트(CBT) 형식으로 지난 23일 공식 웹사이트에 공개했다.
API(Application Programming Interface)는 서로 다른 소프트웨어 간 데이터를 주고받고 기능을 공유할 수 있는 일종의 디지털 연결고리로, 개발자들이 다른 서비스에서 제공하는 데이터나 기능을 가져와 자사 서비스에 내재화하는데 사용된다.
가장 먼저 API로 제공될 AI 음성 기술은 텍스트를 음성으로 변환하는 ‘Text-to-Speech’(TTS) 기술이다. 수퍼톤이 자체 개발한 파운데이션 모델 낸시(NANSY, Neural Analysis & Synthesis)가 적용된 수퍼톤의 TTS 기술은 자연스럽고 풍부한 감정까지 가능한 음성을 만들어낼 수 있다. 낸시를 통해 목소리를 음색∙발음∙음고∙강세 등 4개의 구성 요소로 분석, 이를 개별적으로 제어해 실제 사람의 발화에 가까운 목소리를 구현한다.
TTS API는 대화형 게임 캐릭터 제작이나 오디오북, 애니메이션, 채팅 서비스 등에 이용할 수 있다. 특히 수퍼톤은 기존 낸시 모델을 개선해 텍스트가 음성으로 출력되는 시간을 줄여 챗봇 같이 즉각적인 음성 피드백이 필요한 서비스 개발이 용이하도록 했다.
이번 API 공개에 앞서 수퍼톤은 인터랙티브 AI 콘텐츠 플랫폼 ‘제타(zeta)’를 운영하는 스캐터랩과 협업해 TTS 기술을 API로 제공해온 바 있다. 지난달 초 ‘제타’는 이용자가 직접 AI 챗봇 캐릭터를 제작하고, 목소리를 부여할 수 있는 기능을 선보였는데 이때 수퍼톤의 TTS 기술을 연동해 서비스 이용 만족도를 높였다.
앞으로 ‘수퍼톤 API’에는 TTS 기술뿐만 아니라 가창 합성 음성 기술(Singing Voice Synthesis)이나 음성 변환 기술(Voice Conversion) 등도 추가될 예정이다.
이교구 수퍼톤 대표는 " ‘수퍼톤 API’는 수퍼톤 AI 음성 기술들의 활용도를 넓히고 상용화하는 계기가 될 것"이라며 "비즈니스 파트너사 뿐만 아니라 1인 또는 소규모 콘텐츠 크리에이터들도 수퍼톤 AI 음성 기술들을 인터랙티브 콘텐츠 등에 폭넓게 적용할 수 있을 것"이라고 말했다.
Copyright ⓒ 데일리 포스트 무단 전재 및 재배포 금지