픽시1.0은 항공우주·위성·국방 등 전문 기술 문서를 대상으로 의미 기반 검색을 하도록 설계된 항공우주 도메인 특화 정보 검색 모델이다. 위성 설계 문서, 기술 규격서, 운용 매뉴얼 등 항공우주 기술 문서를 자연어 질의로 보다 쉽게 검색하도록 설계됐다. 위성용 에이전트 AI 솔루션 샛챗(SatCHAT)의 성능 고도화를 위해 개발됐으며, 앞서 공개한 픽시 프리뷰(PIXIE-Preview)에 이어 이번 1.0에서는 도메인 특화 검색 성능을 정량적으로 검증하는 데 중점을 뒀다.
|
이번 모델은 최근 허깅페이스 플랫폼을 통해 공개된 글로벌 검색 벤치마크 RTEB(검색 임베딩 성능 평가 지표)의 매개변수 10억개 이하 모델 부문에서 세계 2위를 기록했다.
RTEB는 기존 임베딩 모델 평가 표준으로 활용돼 온 MTEB(대량 텍스트 임베딩 벤치마크 리더보드)를 확장한 차세대 검색 벤치마크로, 테스트 데이터 위주의 점수 경쟁이 아닌 실제 산업 환경에서의 AI 모델 정보 검색 성능을 평가한다.
상위권을 차지한 대부분의 모델은 법률·금융·의료·코드 등 여러 도메인을 포괄하는 범용 모델인 반면, 텔레픽스의 픽시1.0은 항공우주 도메인과 한·영 기술 문서에 집중했음에도 글로벌 상위권 성과를 냈다.
회사 측은 이번 결과가 모델 규모 확장이 아닌 도메인 특화 데이터 정제와 학습 품질 개선만으로도 높은 검색 성능을 달성할 수 있음을 보여준 사례라고 평가했다.
특히 RTEB에서 직접적으로 다루지 않는 한국어를 포함한 다국어 항공우주 도메인 검색 성능을 검증하기 위해 자체 구축한 검색 벤치마크 ‘스텔라(STELLA)’를 활용한 추가 평가 결과에서도 우수한 성능을 나타냈다. 픽시1.0은 파라미터 규모 대비 우수한 검색 정확도를 보였으며, 언어·도메인 특화 검색 역량을 확보한 것으로 확인됐다.
텔레픽스는 픽시1.0을 오픈소스로 공개했으며, RAG 기반 AI 시스템에서 전문 기술 문서 검색을 위한 핵심 모델로 활용될 수 있을 것으로 기대하고 있다.
권다롱새 텔레픽스 데이터사이언스 부문장은 “이번에 공개한 픽시1.0은 프리뷰 단계에서 제시한 방향성을 유지하되, 항공우주 도메인 검색 성능을 보다 안정적으로 고도화하는 데 집중했다”며 “픽시와 스텔라가 향후 도메인 특화 정보 검색 연구와 실제 응용을 위한 기초 자료로 활용되기를 기대한다”고 전했다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
