MS는 최근 코파일럿 내 심층 연구 에이전트 ‘리서처’를 업데이트하고 서로 다른 AI 모델이 역할을 나눠 작업하는 ‘멀티모델’ 방식을 적용했다고 밝혔다. 기존처럼 하나의 모델이 답변 생성부터 검증까지 수행하는 구조에서 벗어나 생성과 평가를 분리한 것이 특징이다.
|
핵심은 ‘크리틱(Critique)’ 기능이다. 오픈AI GPT 계열 모델이 초안을 작성하면 앤트로픽 클로드가 이를 검토·보완하는 방식이다. MS는 이 과정을 통해 응답 품질을 사전에 개선하고 사실 오류나 논리적 결함을 줄일 수 있다고 설명했다.
여러 모델 답변을 동시에 비교할 수 있는 ‘모델 카운슬’ 기능도 함께 도입됐다. 사용자는 동일한 질문에 대해 각기 다른 모델이 생성한 결과를 한 화면에서 확인하고 최적의 답을 선택할 수 있다.
이번 업데이트는 ‘프론티어(Frontier) 프로그램’을 통해 일부 기업 고객에게 우선 제공된다. MS는 이를 통해 장시간·다단계 업무를 수행하는 ‘코파일럿 코워크(Copilot Cowork)’ 환경을 구현한다는 계획이다.
성능 개선도 수치로 확인됐다. 크리틱 기능이 적용된 리서처는 심층 연구 평가 지표인 드라코(DRACO) 벤치마크에서 기존 단일 모델 기반 시스템을 크게 앞섰다. 총 10개 분야 100개 과제를 평가한 결과, 종합 점수가 약 7포인트 상승했으며 기존 최고 성능 모델 대비 13% 이상 높은 수준을 기록했다.
업계에서는 이번 시도를 기업용 AI가 ‘단일 모델 경쟁’에서 ‘멀티모델 협업’으로 전환하는 신호로 보고 있다. 개별 모델의 성능 개선에 의존하던 방식에서 벗어나, 서로 다른 AI의 강점을 결합해 결과 품질을 끌어올리는 구조가 확산될 수 있다는 분석이다.
특히 MS가 자체 모델 개발과 함께 외부 AI를 적극 통합하는 전략을 택하면서 향후 기업용 AI 시장에서도 플랫폼 경쟁이 한층 치열해질 것으로 전망된다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
