최근 경기도 성남시 본사에서 만난 박근태 S2W 최고기술책임자(CTO)는 이번 성과에 대해 “AI 모델의 기초 언어 단위인 ‘토크나이저’에서 발생하는 비영어권 언어의 구조적 불평등을 입증한 것”이라며 “결국 신뢰할 수 있는 AI를 만들기 위해서는 ‘설명 가능하고 통제 가능한 기술’이 필수적임을 시사한다”고 강조했다.
◇‘설명·통제 가능한 AI’ 필요성…온톨로지 기술 대두 이 문제는 결국 각국이 자국 데이터와 언어를 주권적으로 다루는 ‘소버린(Sovereign) AI’의 필요성을 역설적으로 증명한다.
박 CTO는 “이러한 불완전 토큰 문제를 해소하려면 단순히 자국 언어 데이터를 많이 학습시키는 것을 넘어, 언어 처리의 메커니즘 단계에서부터 기술적 보완이 필수적”이라며 “해당 언어의 특성을 가장 예민하게 이해하는 주체는 그 언어를 쓰는 국가와 기업인 만큼, 토크나이저 설계나 전처리 등 기술적 밑단에서부터 우리 언어에 맞는 해법을 찾는 것이 소버린 AI의 역할”이라고 강조했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “이데일리” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.