SKT, 자체 LLM 기반 멀티모달·범용 문서해석 기술 공개

실시간 키워드

2022.08.01 00:00 기준

SKT, 자체 LLM 기반 멀티모달·범용 문서해석 기술 공개

한스경제 2025-07-29 16:22:14 신고

3줄요약
SKT 로고.
SKT 로고.

| 한스경제=박정현 기자 | SK텔레콤은 자사의 거대언어모델(LLM) A.X(에이닷 엑스)를 기반으로 한 시각언어모델(VLM)과 LLM 학습을 위한 범용 문서 해석 기술을 선보였다고 29일 밝혔다.

SKT가 오픈소스 커뮤니티 허깅페이스에 공개한 모델은 ‘A.X 인코더’와 ‘A.X 4.0 비전 랭귀지 라이트’ 2종이다. 해당 모델들은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.

이달 SKT는 총 6개의 LLM 모델을 발표했다. SKT는 프롬 스크래치 방식의 LLM 개발을 꾸준히 이어가는 한편 향후 발표할 A.X 4.0 추론형 모델 등 지속적으로 개발 중인 LLM의 활용도와 성능을 높여갈 계획이다. 

자연어처리 기술에서 인코더란 입력된 문장을 문맥으로 변환하고 이를 바탕으로 다양한 자연어 처리 작업을 수행하도록 돕는 핵심 구성요소다. 문장의 모든 단어들의 상호 관계를 파악해 전체 의미와 맥락을 이해하는 역할을 한다.

SKT는 A.X 모델에 필요한 데이터의 전 과정 처리 프로세스에 적용하기 위해 ‘A.X 인코더’를 개발했다. ‘A.X인코더’는 긴 문서도 빠르고 효율적으로 처리 가능해 대규모 LLM 학습에 적합하다.

‘A.X 인코더’는 1억4900만개(149M)의 매개변수를 바탕으로 작동한다. 자연어 이해 성능지표 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했다. 1만6384개의 토큰까지 처리가 가능해 기존 모델들보다 최대 3배의 추론속도와 2배의 학습속도를 구현할 수 있다.

이러한 대규모, 고속 문서 처리 기술은 LLM 학습 외에도 AI 기반의 다양한 문서 처리에 효율적으로 적용할 수 있을 것으로 기대된다.

‘A.X 4.0 VL 라이트’는 대규모 멀티모달 한국어 데이터셋이 학습된 시각-언어모델(VLM)이다. 한국어와 관련된 시각정보 및 언어 이해뿐만 아니라 표·그래프 이해, 제조 도면 이해와 같은 기업용 애플리케이션에서 탁월한 성능을 제공한다.

70억개(7B) 매개변수의 A.X 4.0 라이트 모델을 기반으로 개발돼 사용자 시스템에 쉽게 적용 가능하면서도 중형 모델 수준의 강력한 성능을 자랑한다. 한국어 시각 벤치마크에서 평균 79.4점을 기록하며 큐원2.5-VL32B(73.4점)보다 훨씬 작은 모델 크기에도 불구하고 더 우수한 성능을 보였다. 

‘A.X 4.0 VL 라이트’는 동일한 한국어 데이터입력 시 큐원2.5-VL32B 대비 약 41% 적은 텍스트 토큰을 사용해 기업들의 비용을 낮추는데 기여할 수 있다.

김태윤 SK텔레콤 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 밝혔다.

Copyright ⓒ 한스경제 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기