“말투·억양까지 알아듣는다”···카카오, 사람처럼 소통하는 AI로 승부수
뒤로가기

3줄 요약

본문전체읽기

“말투·억양까지 알아듣는다”···카카오, 사람처럼 소통하는 AI로 승부수

카카오는 공식 테크블로그를 통해 통합 멀티모달 언어모델 ‘카나나-o(Kanana-o)’와 오디오 언어모델 ‘카나나-a(Kanana-a)’의 성능과 개발 후기를 공개했다고 1일 밝혔다.

‘Kanana-o’는 텍스트·음성·이미지 등 다양한 입력을 동시에 이해하고, 응답할 수 있는 국내 최초의 통합형 멀티모달 모델이다.

이미지 처리 특화 모델 ‘카나나-v(Kanana-v)’와 오디오 모델 ‘Kanana-a’를 병합한 뒤, 세 가지 데이터를 동시에 학습하는 방식으로 개발됐다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “이뉴스투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.