한국어와 한국 문화에 특화된 멀티모달 언어모델(MLLM) 카나나-v'(Kanana-v)가 공개됐다.
텍스트와 이미지, 오디오 등 다양한 데이터를 통합 처리하며 한국어 OCR(광학 문자 인식)과 문서 이해 등에서 글로벌 모델을 능가하는 성능을 입증해 주목된다.
카카오는 5일 공식 테크블로그를 통해 카나나-v의 성능과 특징을 공개했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “머니S” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.