텍스트·이미지·오디오 자유롭게 변환, 파나소닉, 차세대 AI ‘OmniFlow’ 공개
뒤로가기

3줄 요약

본문전체읽기

텍스트·이미지·오디오 자유롭게 변환, 파나소닉, 차세대 AI ‘OmniFlow’ 공개

파나소닉홀딩스(Panasonic Holdings Co., Ltd.)와 파나소닉 R&D 아메리카(Panasonic R&D Company of America, PRDCA)가 미국 UCLA(캘리포니아대학교 로스앤젤레스 캠퍼스)와 공동으로 차세대 멀티모달 생성형 인공지능(AI) 기술 ‘옴니플로우(OmniFlow)’를 개발했다고 4일 밝혔다.

OmniFlow는 텍스트, 이미지, 오디오 등 서로 다른 데이터 형식을 자유롭게 상호 변환(Any-to-Any)할 수 있는 고정밀 멀티모달 생성 AI로, 기존 대비 최대 1/60 수준의 학습 데이터만으로도 우수한 성능을 구현할 수 있는 것이 특징이다.

기존의 멀티모달 생성 AI는 다양한 조합의 데이터 쌍(text ↔ image, image ↔ audio 등)을 모두 갖춘 학습 데이터를 필요로 해, 처리 가능한 모달 수가 증가할수록 학습 비용도 기하급수적으로 증가하는 한계가 있었다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “M투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.