대화 상대방 억양·호흡으로 감정까지 읽는다…달라진 카카오 멀티모달 AI
뒤로가기

3줄 요약

본문전체읽기

대화 상대방 억양·호흡으로 감정까지 읽는다…달라진 카카오 멀티모달 AI

카카오는 12일 테크블로그를 통해 ▲한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 '카나나-o(Kanana-o)'와 ▲멀티모달 임베딩(Embedding) 모델 '카나나-v-임베딩'의 개발 과정과 성능을 공개하며, 자체 개발 AI 모델의 기술적 완성도를 다시 한 번 입증했다.

먼저 '카나나-o'는 텍스트와 음성, 이미지를 동시에 이해하고 실시간으로 답변하는 통합 멀티모달 언어모델이다.

카카오는 기존 멀티모달 모델들이 텍스트 입력 시에는 강점을 보이지만, 음성 대화 시에는 답변이 다소 단순해지고 추론 능력이 떨어진다는 한계에 주목했다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “모두서치” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.