[이뉴스투데이 김진영 기자] 구글이 추론 능력을 대폭 강화한 최신 인공지능(AI) 모델 제미나이 3.1 프로를 공개하며 글로벌 AI 성능 경쟁의 선두로 올라섰다. 공신력 있는 외부 평가에서 주요 경쟁 모델을 제치고 세계 1위를 기록하면서, 구글이 ‘추론형 AI’ 주도권을 본격적으로 확보했다는 평가가 나온다.
구글은 고급 추론 기능을 탑재한 제미나이 3.1 프로를 공개했다고 21일 밝혔다. 구글은 “핵심 추론 성능을 한 단계 끌어올려 가장 복잡한 문제까지 해결할 수 있도록 설계했다”며 단순 문답을 넘어, 모델이 스스로 판단·실행하는 ‘에이전틱 워크플로우’ 환경에 최적화했다고 설명했다.
새로운 논리 패턴 해결 능력을 평가하는 벤치마크 ARC-AGI-2에서 제미나이 3.1 프로는 77.1%를 기록했다. 전작(제미나이 3 프로, 31.1%) 대비 두 배 이상 향상된 수치로, 오픈AI의 GPT-5.2(52.9%)와 앤트로픽의 오퍼스 4.6(68.8%)를 모두 앞섰다.
코딩 성능을 평가하는 ‘SWE-벤치 베리파이드’에서는 80.6%를 기록해 오퍼스 4.6(80.8%)와 비슷한 최상위권 성능을 보였고, 초고난도 평가로 불리는 ‘인류의 마지막 시험(HLE)’에서는 도구 미사용 기준 44.4%로 GPT-5.2(34.5%)와 오퍼스 4.6(40%)를 웃돌았다.
프리뷰 공개 직후 글로벌 AI 평가 기관 아티피셜 애널리시스의 ‘인텔리전스 인덱스’에서도 57점을 받아 현재 전 세계 AI 모델 가운데 1위에 올랐다.
이번 버전이 실무 환경에서도 즉각적인 생산성 향상을 제공한다고 강조했다. 프롬프트 입력만으로 웹사이트에 적용 가능한 애니메이션을 생성하거나, 복잡한 개념을 시각적으로 구현하고, 대규모 데이터를 한 화면에 통합하는 등 고도화된 추론 기반 자동화 작업을 지원한다는 설명이다.
제미나이 3.1 프로는 개발자·기업·일반 이용자를 대상으로 순차 배포된다. 유료 구독자는 제미나이 앱과 노트북LM에서 상향된 사용 한도로 이용할 수 있으며, 기업 고객과 개발자 프로그램을 통해서도 프리뷰 버전을 제공한다.
구글은 “이미 의미 있는 진전을 이뤘지만, 더 야심 찬 에이전트 워크플로우 환경에서 모델 성능을 지속적으로 끌어올릴 것”이라며 “코딩과 확장된 자동화 시나리오 전반에서 3.1 프로의 활용도를 빠르게 높이겠다”고 강조했다.
Copyright ⓒ 이뉴스투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.