中 AI의 질주…알리바바, 1조 파라미터 추론 AI 공개

실시간 키워드

2022.08.01 00:00 기준

中 AI의 질주…알리바바, 1조 파라미터 추론 AI 공개

이데일리 2026-01-28 10:19:04 신고

3줄요약
[이데일리 김현아 기자] 알리바바 그룹이 1조 개 이상의 파라미터(매개변수)를 갖춘 최신 추론 인공지능 모델 ‘Qwen3-Max-Thinking(큐웬3-맥스-띵킹)’을 공개하며 차세대 추론 AI 경쟁에 본격적으로 뛰어들었다. 단순한 모델 크기 확대를 넘어, 추론 효율과 도구 활용 능력을 결합한 점이 특징이다.

28일 알리바바에 따르면 Qwen3-Max-Thinking은 강화학습을 위해 모델 규모를 대폭 확장해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다. 과학·수학·코딩 문제는 물론 검색 도구를 활용한 전문가급 질의 응답 평가에서도 경쟁력 있는 결과를 보였다는 설명이다.



AI의 ‘두뇌 크기’를 뜻하는 파라미터

생성형 AI에서 말하는 파라미터는 모델이 학습 과정에서 획득한 수많은 조정값이다. AI가 문맥을 이해하고 다음 행동이나 답변을 결정할 때 사용하는 판단 기준이 숫자 형태로 저장된 것이다.

사람이 경험을 통해 판단 감각을 쌓듯, AI 역시 데이터를 보며 이 기준을 조금씩 수정해 나가는데, 그 축적된 결과가 파라미터다.

따라서 파라미터 수가 많다는 것은 AI가 보유한 판단 기준의 폭이 넓다는 의미에 가깝다. 대형언어모델(LLM)이전의 인공지능이 단순 패턴 인식에 머물렀다면, 수천억 개 이상의 파라미터를 활용하는 모델은 긴 문맥 이해와 복합 추론이 가능해졌다.

다만 최근에는 파라미터 수 자체보다 이를 어떻게 활용하느냐가 더 중요해지고 있다. 파라미터는 기억의 양에 가깝고, 실제 성능은 구조 설계와 활용 방식에 따라 크게 달라진다.

[이데일리 김정훈 기자]


‘자동 도구 선택’과 추론 효율에 방점

Qwen3-Max-Thinking의 차별점은 적응형 도구 활용 기능이다. 모델이 대화 맥락에 따라 검색, 메모리, 코드 인터프리터를 스스로 선택해 호출하도록 설계됐다. 사용자가 직접 도구를 지정하지 않아도 필요한 정보 탐색이나 계산 기반 추론을 수행할 수 있다.

알리바바는 여기에 경험 누적형 다회차 테스트 단계 확장 기법을 결합했다. 이전 상호작용에서 얻은 핵심 정보를 정제해 재활용함으로써, 이미 도출된 결론을 반복하지 않고 남은 불확실성 해결에 집중하도록 했다. 같은 비용 조건에서 추론 효율을 높이는 데 초점을 맞춘 접근이다.

빅테크의 ‘조 단위’ 경쟁, 국내는 효율 전략

글로벌 빅테크 기업들 역시 조 단위 파라미터 모델을 중심으로 경쟁하고 있다. 구글 제미나이나 오픈AI의 GPT는 수조 개의 파라미터를 쓰는 것으로 전해졌지만, 정확한 수치는 대부분 공개되지 않았다.

다만, 최근에는 전문가 혼합 방식처럼 전체 파라미터 중 일부만 선택적으로 활성화하는 구조가 확산되고 있다. 모델의 ‘총량’보다 추론 시 실제로 사용하는 파라미터의 효율이 핵심 지표로 떠오른 셈이다.

[이데일리 김일환 기자]


국내에서는 ‘독자 AI 파운데이션 모델’ 1차 통과사 중 SKT가 최대

정부가 ‘AI 주권 확보’를 위해 추진 중인 ‘독자 AI 파운데이션 모델’(국가대표 AI) 선발전에서 1차 평가를 통과한 3개 회사 중 SK텔레콤의 모델 크기가 가장 크다.

SK텔레콤(017670) ‘A.X K1’은 파라미터 수가 5,190억 개, LG AI연구원 ‘K-엑사원’은 236억 개, 업스테이지 ‘솔라 오픈’은 100억 개다.

A.X K1은 5천억 개 이상 파라미터를 갖춘 국내 최대 규모 모델로, 전문가 혼합 구조를 채택해 추론 시 일부 파라미터만 활성화함으로써 효율을 높인 것이 특징이다. SK텔레콤은 이를 기반으로 글로벌 수준의 추론 AI 경쟁력을 확보하고, 장기적으로는 조 단위 모델로의 확장도 염두에 두고 있다.

‘얼마나 크냐’에서 ‘얼마나 잘 쓰느냐’로

한때 파라미터 수는 AI 기술력을 가늠하는 상징적 지표였다. 그러나 최근 추론 AI 경쟁은 모델 크기 자체보다 구조 설계, 학습 방식, 테스트 단계 최적화로 이동하고 있다. 알리바바의 Qwen3-Max-Thinking은 이러한 변화 속에서 ‘조 단위 파라미터를 어떻게 효율적으로 활용할 것인가’라는 질문에 대한 하나의 답을 제시한 사례로 평가된다.

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 제공되고 있으며, API는 알리바바의 생성형 AI 개발 플랫폼인 모델 스튜디오에서 사용할 수 있다.

Copyright ⓒ 이데일리 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기