카카오, 국내 AI 기술 새 지평 연다…초경량 멀티모달 모델·MoE 모델 전격 공개

[폴리뉴스 이상명 기자] 카카오가 국내 인공지능(AI) 기술 경쟁력에 또 한 번 의미 있는 족적을 남겼다. 지난 5월에 이어 두 달 만에 자체 개발한 고성능 경량 멀티모달 언어모델과 국내 최초의 MoE(Mixture of Experts) 구조 모델을 연이어 오픈소스로 공개하며 독자적 AI 모델 기술 역량을 대외적으로 입증했다.

25일 카카오에 따르면 지난 24일 글로벌 오픈소스 플랫폼 허깅페이스를 통해 △멀티모달 언어모델 'Kanana-1.5-v-3b' △MoE 구조의 'Kanana-1.5-15.7b-a3b'를 정식 오픈소스로 공개했다. 이는 국내외 AI 생태계에 기술적, 구조적 다양성을 더하고 국산 LLM(Language Model)의 실용성과 확장성을 동시에 확보하려는 전략의 일환이다.

'Kanana-1.5-v-3b'는 단순한 텍스트 기반 언어 모델을 넘어 이미지 이해와 자연어 응답이 가능한 멀티모달 모델로 사용자 지시를 이해하고 상황에 맞는 답변을 제공하는 능력이 뛰어나다. 특히 한국어 및 영어 기반 이미지 인식 정확도는 GPT-4o와 견줄 만하다는 평가도 받는다.

기술적으로 주목할 부분은 이 모델이 카카오가 '프롬 스크래치' 방식으로 처음부터 끝까지 독자 설계해 개발한 Kanana 1.5 LLM을 기반으로 한다는 점이다. 단순히 기존 모델을 튜닝하거나 가져온 것이 아니라 구조 설계에서부터 학습에 이르기까지 전 과정을 자체 기술로 수행해 완성도를 높였다.

카카오는 인간의 의도와 선호를 반영한 학습(Human Preference Alignment Training)과 지식 증류(Knowledge Distillation) 기법을 통해 경량 구조임에도 대형 모델 못지않은 성능을 끌어냈다. 한국어 벤치마크 테스트에서 국내 유사 모델 대비 최고 점수를 기록했고, 영어 데이터셋에서도 오픈소스 대형 모델들과 비슷한 수준의 응답 능력을 보였다. 지시 이행 능력 평가에서는 국내 모델 중 동급 대비 128%의 성능 우위를 나타냈다.

실제 활용도 면에서도 기대가 크다. 이미지 기반 정보 탐색, 문화유산 해설, 도표 이해, 창작 분야까지 다양한 활용처가 예상되며, 특히 "이 장소는 어디인가요?" 같은 질문에도 높은 인식 정확도로 답변을 제공할 수 있어 콘텐츠 및 관광, 교육 분야에서의 응용 가능성이 높다.

이날 함께 공개된 'Kanana-1.5-15.7b-a3b'는 국내 최초로 오픈소스로 제공되는 MoE 구조의 언어모델로 주목을 끈다. MoE는 AI 모델이 특정 작업에 적합한 '전문가'만 골라 활성화하는 방식으로 전체 연산 자원 중 일부만 활용하면서도 높은 성능을 유지할 수 있는 것이 특징이다.

이 모델은 총 15.7B(억 단위) 파라미터 중 단 3B 정도만 추론 시 동작하는 구조로 설계돼 기존 밀집(Dense) 모델 대비 최대 수십 배 수준의 자원 효율성과 비용 절감을 가능케 한다. 특히 카카오는 이 모델을 개발함에 있어 기존 3B 모델을 재활용하는 '업사이클링' 기법을 적용했다. 즉 이미 구축된 MLP 구조를 복제·변형해 다양한 전문가 레이어로 전환함으로써 학습 자원 소모를 줄였다.

이처럼 컴퓨팅 자원을 아끼는 경량 구조임에도 성능은 'Kanana-1.5-8B' 수준과 맞먹거나 오히려 상회하는 결과를 기록했다. 이는 제한된 자원으로도 고성능 AI 서비스를 구현하고자 하는 기업 및 스타트업, 연구 기관에 실질적인 솔루션을 제시한 셈이다.

카카오는 이번 모델 공개를 통해 단순히 기술력을 과시하는 데 그치지 않고, 국내 AI 생태계의 자립성과 기술 확산에도 직접 기여하고 있다. 특히 두 모델 모두 아파치 2.0(Apache 2.0) 라이선스를 적용, 상업적 활용까지 허용된 형태로 공개돼 스타트업, 연구자, 공공기관 등이 국산 기술 기반의 LLM을 자유롭게 실험·배포할 수 있는 환경을 마련했다.

카카오는 이미 2023년부터 '카나나(Kanana)' 라인업을 중심으로 다양한 LLM과 관련 기술들을 지속 공개해 왔다. 올해 5월에는 성능이 향상된 Kanana-1.5 언어모델 4종을 선보이며, 독자 모델의 안정성과 범용성을 검증받은 바 있다. 향후에는 멀티모달을 넘어 에이전트형 AI, 추론 특화 모델 등 고차원적인 영역으로의 확장도 예고하고 있다.

김병학 카카오 AI 총괄(카나나 성과리더)은 "이번 모델 공개는 비용 효율성과 고성능이라는 상반된 가치의 균형을 이룬 결과물로, 서비스 현장 적용성과 기술 자립이라는 두 축의 목표를 모두 고려했다"며 "앞으로도 국산 AI 기술의 경쟁력을 글로벌 수준으로 끌어올리기 위해 지속적으로 연구·개발과 생태계 개방을 이어갈 것"이라고 말했다.

카카오는 이번 모델을 비롯해 자체 기술력 기반의 지속적인 공개를 통해 정부가 주도하는 'AI 파운데이션 모델 프로젝트'에도 적극 참여 중이다. 카카오톡을 비롯한 대규모 서비스 운영 경험과 자체 기술력을 융합해 국민 모두가 손쉽게 활용할 수 있는 고성능 AI 모델 생태계 조성에 힘을 보태고 있다.

향후 공개될 카카오의 추론형 AI 모델은 에이전트 구현의 기반이 되는 핵심 요소로 검색·상담·업무 자동화 등 다양한 산업 분야에 실질적인 도움을 줄 것으로 전망된다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드