“텍스트·이미지·영상·음성 한 번에”…서울대, ‘옴니모달 AI’ 벽 넘었다
뒤로가기

3줄 요약

본문전체읽기

“텍스트·이미지·영상·음성 한 번에”…서울대, ‘옴니모달 AI’ 벽 넘었다

연구팀이 개발한 모델은 텍스트·이미지·비디오·오디오를 하나로 통합해 이해하고 생성하는 ‘옴니모달’ 디퓨전 AI, ‘다이닌-옴니(Dynin-Omni)’다.

Dynin-Omni의 옴니모달 이해 및 생성 성능 평가(사진=서울대) 도재영 교수의 시선은 연구실을 넘어 실제 산업 현장으로 향하고 있다.

이를 위해 연구팀은 차세대 옴니모달 모델 고도화와 함께 피지컬 AI 분야인 ‘다이닌-로보틱스’ 개발에도 속도를 내고 있다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “이데일리” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.