3줄 요약

에이아이트릭스, ICASSP 2025서 음성 AI 기술 관련 논문 2편 채택

의료 현장에서의 활용 가능성 기대 의료 인공지능(AI) 기업 에이아이트릭스(AITRICS, 대표 김광준)가 지난 6일부터 11일까지 인도 하이데라바드에서 열린 음성·신호처리 학술대회 ‘ICASSP 2025(International Conference on Acoustics, Speech and Signal Processing)’에서 음성 합성 기술 관련 논문 2편이 채택됐다고 15일 밝혔다.

이번에 채택된 논문은 소량의 음성 데이터로 특정 화자의 말투와 억양을 재현하는 음성 합성 모델과 얼굴 이미지에서 화자의 음성 스타일을 추론해 자연스러운 음성을 생성하는 제로샷 TTS(text-to-speech) 기법에 관한 것으로 포스터 세션에 소개됐다.

▲ 운율 프롬프팅을 통한 안정적인 화자 적응형 텍스트-음성 합성(Stable-TTS: Stable Speaker-Adaptive Text-to-Speech Synthesis via Prosody Prompting) /이미지 제공=에이아이트릭스 첫 번째 논문은 음성 합성 모델 ‘Stable-TTS’를 다뤘다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “디지틀조선일보” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

디지틀조선일보 콘텐츠 더보기 해당 콘텐츠 제공사로 이동합니다. 플러스 친구친구추가

3줄 요약

에이아이트릭스, ICASSP 2025서 음성 AI 기술 관련 논문 2편 채택

이 콘텐츠를 공유하세요.

이 콘텐츠를 공유하세요.