3줄 요약

카카오는 공식 테크블로그를 통해 통합 멀티모달 언어모델 ‘카나나-o(Kanana-o)’와 오디오 언어모델 ‘카나나-a(Kanana-a)’의 성능과 개발 후기를 공개했다고 1일 밝혔다.

‘Kanana-o’는 텍스트·음성·이미지 등 다양한 입력을 동시에 이해하고, 응답할 수 있는 국내 최초의 통합형 멀티모달 모델이다.

이미지 처리 특화 모델 ‘카나나-v(Kanana-v)’와 오디오 모델 ‘Kanana-a’를 병합한 뒤, 세 가지 데이터를 동시에 학습하는 방식으로 개발됐다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “이뉴스투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이뉴스투데이 콘텐츠 더보기 해당 콘텐츠 제공사로 이동합니다. 페이스북구독하기

이 콘텐츠를 공유하세요.