|
이재성 트웰브랩스 대표는 최근 이데일리와 만나 “영상을 가장 잘 이해하는 멀티모달 AI 기술력을 통해 한국이 ‘AI 빅3 국가’가 되는데 보탬이 되겠다”고 수상 소감을 밝혔다.
트웰브랩스는 텍스트 중심의 기존 AI와 달리, AI가 영상 자체를 학습해 시공간적 맥락을 이해하도록 설계된 기업이다. 언어로 세상을 해석하는 기존 모델과 달리, 트웰브랩스는 영상을 통해 ‘보는 AI’를 구현했다. 이 회사의 강점은 영상을 멀티모달 임베딩(숫자 벡터)으로 변환해, 영상과 텍스트를 자연스럽게 매칭시키는 비디오-랭기지 얼라인먼트 기술이다. 덕분에 장면 속 인물·사물·행동·상황까지 종합적으로 파악하고 설명할 수 있다.
이 기술의 핵심 엔진은 ‘마렝고’와 ‘페가수스’다. 마렝고는 시공간 정보를 인코딩해 영상을 분석하는 ‘두뇌’ 역할을, 페가수스는 그 결과를 언어로 설명하는 ‘입’ 역할을 담당한다. 두 엔진이 유기적으로 결합해 AI가 보다 사람에 가깝게 영상을 이해하는 수준의 기술을 구현하고 있다.
이 대표는 “저희 모델은 시각적 세상을 텍스트로 묘사하는 빅테크 모델에 비해 빠르고 효율적”이라며 “특히 영상 길면 길수록 그 차이가 명확하게 드러난다”고 자신했다.
이 기술은 이미 산업 현장에서 가치를 증명했다. 트웰브랩스의 모델은 북미 프로스포츠리그(NFL·MLS)의 선수별 하이라이트 자동 편집 시스템에 활용되고 있으며, 파라마운트 등 방송사와 협업해 콘텐츠 검색 및 메타데이터 생성에도 쓰인다. 국방 분야에서는 실시간 스트리밍 영상 분석과 드론 영상 인식 기술을 적용하는 방안을 논의 중이다.
트웰브랩스는 글로벌 시장에서 먼저 이름을 알렸다. 아마존웹서비스(AWS)의 완전관리형 AI 서비스 ‘아마존 베드록’에 입점한 유일한 영상 이해 모델 기업이며, 엔비디아·데이터브릭스·스노우플레이크·인텔 등 글로벌 빅테크와 전략적 투자 관계를 맺고 있다. 국내에서는 네이버클라우드, SK텔레콤, 삼성전자와 협업하며 생태계를 확장 중이다.
|
트웰브랩스는 현재 네이버클라우드와 함께 정부의 ‘K-AI 프로젝트’에 참여하고 있다. 이 대표는 “영상 이해 분야의 전문성을 바탕으로 한국형 멀티모달 AI 구축에 기여하고 있다”며 “국가 AI 생태계에서 실질적인 기술 자립 모델이 되고 싶다”고 말했다.
그는 이어 “트웰브랩스는 전 세계 영상 데이터의 대부분을 처리하고, 모든 언어 모델의 눈과 귀가 되는 날을 목표로 하고 있다”며 “지금은 기존 영상 데이터를 검색·분석하는 데 집중하고 있지만, 앞으로 2년 내에 실시간 스트리밍과 온디바이스 영역까지 확장해 차세대 멀티모달 AI 시장을 선도하겠다”고 포부를 밝혔다.
|
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.


