올인원 커머스AI 구독서비스 ‘에이플러스 AI’를 운영하고 있는 버즈니(대표 남상협·김성국)가 다음 달 미국에서 열릴 세계 최고 권위 자연어처리 학회 ‘EMNLP 2024’에서 영상 검색 기술 관련 연구 논문을 발표할 예정이라고 26일 밝혔다.
11월 12~16일까지 미국 플로리다에서 진행될 EMNLP는 자연어처리 분야 글로벌 최고 AI 학회 중 하나로, 버즈니는 ‘대규모 언어 모델을 활용한 텍스트 비디오 검색 및 재정렬 파이프라인을 위한 반복적 피드백 학습 기반 다중 모달 임베딩 정제 기법’에 대한 연구를 발표할 예정이다.
이 연구는 멀티미디어 콘텐츠의 급속한 증가로 인해 대규모 영상 데이터에서 관련된 영상을 정확하게 검색하는 어려움에 주목했고, 이를 해결하기 위해 MERLIN (Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline)이라는 새로운 검색 시스템을 제안했다.
MERLIN은 대규모 언어 모델(LLM)을 활용해 반복적인 피드백 학습 과정을 거쳐 사용자의 검색어와 검색된 영상 간의 불일치를 해결하고, 검색 정확도를 크게 향상시킨다.
이 기술은 버즈니의 올인원 커머스AI 구독서비스 ‘에이플러스AI’에서 제공하고 있는 기술 중 하나인 ‘숏폼 AI’에 우선 적용해 성능을 높이는데 기여할 예정이다. ‘숏폼 AI’는 AI가 자동으로 영상의 핵심을 추출해 1분 이하의 숏폼 콘텐츠를 자동 생성하는 기술로 현재 CJ온스타일과 신세계라이브쇼핑 등에 제공하고 있다.
버즈니 남상협 대표는 “이번 성과는 지난 10년 넘는 기간 커머스AI 연구 개발에 적극 투자해 온 버즈니의 기술력이 세계 무대에서도 인정받은 것”이라며 “앞으로도 에이플러스AI 기술을 도입한 고객사의 업무 효율성 향상 및 매출 극대화를 위해 커머스AI 기술에 대한 연구·개발(R&D) 투자를 지속해 나갈 계획”이라고 말했다.
Copyright ⓒ 스타트업엔 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.