한국어·문화 맥락 결합해 국내 최적화된 AI 구현
다수 벤치마크에서 GPT-4o 능가
주요 고객사 대상 산업 현장 검증 완료
[포인트경제] KT가 마이크로소프트와 협력해 GPT-4o 기반의 한국적 AI 모델 ‘SOTA K’를 9월 29일 공개했다. SOTA K는 글로벌 최고 수준 성능의 GPT-4o에 한국어와 한국 사회·문화적 맥락을 정교하게 접목한 협업형 모델이다. 국내 AI 생태계에 새로운 기준을 제시한다.
KT 기술혁신부문 연구원들이 SOTA K를 테스트하는 모습 /KT 제공
기존 대형 언어모델(LLM)은 영어권 중심 데이터로 학습돼 한국어와 한국 고유의 사회·문화적 특성을 반영하는 데 한계가 있었다. KT는 고품질 한국 특화 데이터를 대규모로 확보하고, 마이크로소프트와 협력해 GPT-4o를 한국 사회에 최적화된 모델로 발전시켰다. 이 과정에서 KT의 데이터 품질 관리, 모델 학습 기술, 모델 평가 및 책임 있는 AI(Responsible AI) 역량과 마이크로소프트의 글로벌 기술력이 시너지를 냈다.
SOTA K는 한국적 AI의 4대 핵심 철학인 △데이터 주권 보호 △한국 문화 이해 △모델 선택권 보장(독자모델과 협력·오픈모델 병행) △안전하고 책임감 있는 AI를 모두 구현했다. 한국어 경어법과 방언은 물론 법률, 금융, 역사 등 국내 특정 산업군 내 전문 용어까지 자연스럽게 이해하고 생성할 수 있어 한국 비즈니스 환경에서 실용성을 크게 높였다.
KT는 한국적 AI 지표를 새롭게 정의하고 자체 데이터셋을 구축해 정량 및 정성 평가를 진행했다. SOTA K는 한국어 이해, 생성, 추론, 사회·문화, 한국 전문지식 등 주요 지표에서 GPT-4o 대비 우위를 보였다. 특히 한국사, 한국어, 한국 법령 등 고난이도 한국적 지식을 요구하는 대한민국 공무원 시험과 귀화 시험에서 GPT-4o 모델을 능가하는 성과를 냈다. 이는 한국 사회와 문화에 특화된 AI로서 탁월한 실용성을 입증한다.
실제 산업 현장 검증 결과도 긍정적이다. 메리츠화재는 보험 업계 특화 약관의 자동 요약 리포트 생성과 상담원 스크립트 생성에서 SOTA K가 우수한 결과를 냈다. EBS와 협력해 초중고 난이도별 교과 문항을 생성, 맞춤형 학습 제공에 활용하는 등 높은 활용 가능성을 확인했다. 연세의료원은 영어와 한국어가 혼합된 의료 데이터를 한국적인 표현으로 자연스럽게 안내해 환자 이해도를 높였고, 날짜 표기법 등 세밀한 영역에서도 한국인의 생활 방식과 문화를 깊이 이해하는 점을 평가했다. 한국전력공사는 질의에 간결하고 명확한 답변을 신속히 제공받았으며, 내부 시스템과 연동 시 활용 범위가 확대될 것으로 봤다.
SOTA K는 한국 사회의 가치와 규범을 준수하는 책임감 있는 AI로서도 평가받았다. 한국적 AI 평가의 Responsible AI 항목에서 AI 응답 및 법률·권리 준수, 사회·경제 영향도의 안전성, AI 모델 강건성 등에서 우수성을 입증했다. 악의적 사용자에 의한 AI 모델 탈옥 공격에 대해서도 강력한 방어 능력을 갖췄다.
서울 종로구 KT 광화문 사옥의 모습 /사진=뉴시스
KT는 SOTA K를 대한민국 내 클라우드 리전에서 운영하며, 자체 개발한 벡터 모델 기반 한국적 검색증강생성(RAG) 기술과 결합해 기업별 맞춤형 지식 기반 구축 서비스를 제공한다. 이를 통해 고객사는 고유 데이터를 활용해 더욱 정확하고 특화된 AI 서비스를 경험할 수 있다.
KT는 우선 자사 B2C 사업에 SOTA K를 적용해 자체 및 협업 모델 라인업을 검증한 뒤 파트너사에 서비스를 확대 제공할 계획이다. 이를 통해 국내 AI 생태계의 안정적 성장과 건전한 발전을 도모한다.
KT Agentic AI Lab 장 윤경아 상무는 “SOTA K는 글로벌 수준의 기술력과 한국적 AI 특화를 동시에 실현한 혁신적 모델로, 마이크로소프트와의 협업을 통해 축적한 기술적 노하우는 향후 KT의 다양한 AI 모델 개발에 확산 적용될 것”이라며 “국내 AI 생태계 활성화는 물론 공공과 민간 전반에서 AI를 활용한 혁신을 주도하며 국가 AI 경쟁력 제고에 기여할 것”이라고 밝혔다.
KT와 마이크로소프트의 협업은 KT가 추진 중인 AICT 기업 전환 전략과 맞닿아 있다. KT는 독자 개발 모델 ‘믿:음’을 통해 쌓아온 자체 AI 기술력을 기반으로 글로벌 톱 플레이어와의 기술 격차를 빠르게 좁히고 있다. 이번 SOTA K 출시는 독자 모델과 협업 모델을 아우르는 Two Track 전략을 구체화한 성과로, 고객이 목적과 환경에 맞는 최적의 AI 모델을 선택할 수 있는 토대를 마련했다.
SOTA K는 독자 기술과 글로벌 협력을 조화롭게 발전시킬 수 있음을 보여주며, 한국적 AI 생태계 확산의 중요한 전환점이 될 것으로 기대된다.
Copyright ⓒ 포인트경제 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.