엔비디아, 텍스트만으로 오디오 만드는 AI 모델 ‘푸가토’ 공개
뒤로가기

3줄 요약

본문전체읽기

엔비디아, 텍스트만으로 오디오 만드는 AI 모델 ‘푸가토’ 공개

엔비디아는 텍스트만으로 오디오 출력을 제어할 수 있는 생성형 AI 모델 ‘푸가토(Fugatto)’를 개발했다고 27일밝혔다.

푸가토는 텍스트와 오디오 파일의 조합을 사용해 프롬프트에 설명된 음악, 음성, 사운드의 모든 조합을 생성하거나 변형할 수 있으며, 추론하는 동안 컴포저블아트(ComposableART)라는 기술을 사용해 훈련 중에 개별적으로만 보였던 명령어를 결합해준다.

모델의 명령어 간 보간 기능을 통해 사용자는 억양의 강약이나 슬픔의 정도 등과 같은 텍스트 명령어를 세밀하게 제어할 수 있다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “이뉴스투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>