알리바바 "검색엔진 사용 않는 AI훈련 개발…비용 88% 절감"

실시간 키워드

2022.08.01 00:00 기준

알리바바 "검색엔진 사용 않는 AI훈련 개발…비용 88% 절감"

연합뉴스 2025-05-12 11:27:46 신고

3줄요약

"구글에 API 비용 안 내지만 검색엔진 기반 모델보다 성능 앞서"

알리바바 AI 큐원 알리바바 AI 큐원

[로이터 연합뉴스 자료사진. 재판매 및 DB 금지]

(서울=연합뉴스) 김준억 기자 = 중국 빅테크(거대 정보기술기업) 알리바바가 외부 검색엔진을 사용하지 않는 새로운 인공지능(AI) 훈련 방법을 개발했다고 홍콩 사우스차이나모닝포스트(SCMP)가 12일 알리바바의 최신 논문을 인용해 보도했다.

논문 공개 사이트 아카이브(arXiv) 등에 발표된 이 논문에 따르면 구글 등에 고가의 API(응용 프로그램 인터페이스) 비용을 지불하지 않고도 정보검색 능력을 훈련할 수 있는 '제로서치'라는 새로운 강화학습 방식으로 훈련비용을 90% 정도 절감할 수 있는 것으로 나타났다.

알리바바 연구진은 논문에서 "효과적인 정보 검색은 대규모언어모델(LLM)의 추론과 생성 기능을 향상하는 데 필수적이지만, 검색엔진의 문서 품질을 예측할 수 없어 강화학습(RL) 과정에 불안정성을 초래하고 수십만 건의 검색 요청 등이 필요해 상당한 API 비용을 발생시킨다"고 지적했다.

연구진은 "이런 문제를 해결하기 위해 실제 검색엔진과 상호작용하지 않고도 LLM의 검색 능력을 훈련할 수 있는 '제로서치'를 도입했다"고 밝혔다.

알리바바 검색엔진 없는 AI 훈련 개념 알리바바 검색엔진 없는 AI 훈련 개념

[알리바바 논문 캡처. 재판매 및 DB 금지]

'제로서치' 방식은 간단한 지도미세조정(supervised fine-tuning)을 통해 LLM을 검색 모듈로 변환해 쿼리(질의)에 대한 응답으로 관련성 있는 문서와 노이즈 문서를 모두 생성하도록 한다.

이후 강화학습 훈련 중에는 전략적으로 문서의 품질을 점진적으로 낮추고 더 까다로운 검색 시나리오에 노출시켜 추론 능력을 향상시켰다.

연구진은 '제로서치' 실험을 통해 70억 매개변수(파라미터) 검색 모듈은 실제 검색엔진 기반 모델과 비슷한 성능을 달성했고, 14억 매개변수 모듈은 성능이 더 뛰어났다고 주장했다.

알리바바 제로서치 비용 분석 알리바바 제로서치 비용 분석

[알리바바 논문 캡처. 재판매 및 DB 금지]

특히 구글 검색 API를 활용해 6만4천건의 질의를 처리하려면 586.7달러(약 82만1천원)의 비용이 들지만, 엔비디아의 A100 그래픽처리장치(GPU) 4개로 구성된 14B 모델에서 훈련하는 비용은 70.8달러로 88%의 비용 절감 효과를 얻을 수 있다고 강조했다.

SCMP는 이런 연구 결과는 AI 검색을 발전시키려는 알리바바의 노력과 궤를 같이한다고 밝혔다.

알리바바는 지난 9일 중국에서 가장 많이 사용되는 AI 앱인 '쿼크'의 향상된 AI 검색 기능을 공개한 바 있다.

쿼크 팀은 "이 기능은 알리바바의 AI 모델 큐원의 추론 능력을 온라인 검색과 통합해 복잡한 질의에 정확한 응답을 제공한다"고 설명했다.

justdust@yna.co.kr

Copyright ⓒ 연합뉴스 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기