SK텔레콤은 정예 개발팀이 매개변수 519B(5190억 개) 규모의 초거대 인공지능 모델 ‘A.X K1(에이닷엑스 케이원)’ 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다.
학습 기간과 GPU 규모를 바탕으로 가능한 총 학습량을 추산하고, 투입 자원에 비례해 모델 성능이 향상된다는 스케일링 이론에 근거해 최대 모델 크기를 설계했다.
보고서에 따르면 A.X K1은 매개변수 685B의 딥시크-V3.1과 357B의 GLM-4.6 오픈소스 모델과 비교해 규모 대비 성능을 평가했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “아주경제” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.