추가 학습 없이 무한히 긴 영상을 생성하는 추론 알고리즘을 개발한 한보형 서울대학교 전기·정보공학부 교수가 10월의 과학기술인으로 선정됐다. 가장 고난도에 속하는 AI 영상 생성과 관련한 한보형 교수의 연구 성과는 우리나라 인공지능(AI) 기술의 세계적 위상을 높이는데 기여한 것으로 평가됐다.
뉴시스 보도에 따르면, 과학기술정보통신부와 한국연구재단은 이달의 과학기술인상 10월 수상자로 한보형 교수를 선정했다고 밝혔다.
이달의 과학기술인상은 최근 3년간 독보적인 연구개발 성과로 과학기술 발전에 공헌한 연구개발자를 매월 1명씩 선정해 과기정통부 장관상과 상금 1000만원을 수여하는 상이다.
과기정통부와 연구재단은 '2025년 인공지능 주간(9.30.~10.2.)'을 맞아 추가 학습 없이 무한히 긴 영상을 생성하는 추론 알고리즘을 개발하는 등 컴퓨터 비전 분야에서 선도적인 연구를 수행해 우리나라 AI 기술의 세계적 위상을 높인 한보형 교수를 수상자로 선정했다.
최근 AI 연구에서 생성형 모델은 텍스트, 이미지, 오디오 등 다양한 영역에서 빠르게 발전해 왔으며, 그중에서도 영상 생성은 가장 고난도의 기술적 도전 과제로 주목받고 있다.
기존의 확산(diffusion) 모델은 원하는 설명에 맞는 영상을 생성하는 데 널리 활용되고 있으나, 생성하는 영상 길이에 비례해 메모리 사용량이 기하급수적으로 증가하여 산업적 활용은 물론 학문적 연구에서도 한계가 있었다.
한보형 교수는 사전 학습된 확산 모델을 그대로 활용하면서도 사실상 무한히 긴 영상을 생성할 수 있는 피포 디퓨전(FIFO-Diffusion·First-In-First-Out)이라는 추론 알고리즘을 개발해 이 문제를 해결했다.
피포 디퓨전의 핵심은 대각선 디노이징으로 컨베이어 벨트처럼 순차적으로 프레임을 배치해 앞쪽부터 단계적으로 영상을 생성(노이즈 제거)하는 방식이다. 이 방식은 비디오 길이가 늘어나더라도 메모리 사용량이 고정 기존 모델의 메모리 한계를 극복할 수 있다.
또한 한보형 교수는 긴 시퀀스를 작은 구간으로 나눠 안정성을 높이는 '잠재 구간 분할'과 상대적으로 깨끗한 프레임을 활용해 품질을 개선하는 '미래 참조 디노이징' 기법을 더해 장시간 영상에서도 높은 화질과 시간적 일관성을 확보했다.
해당 연구 성과는 지난해 12월 신경정보처리시스템학회(NeurIPS)에서 발표되었으며, 연구팀이 공개한 소스코드는 현재 깃허브(GitHub)에서 450개 이상의 별을 받으며 전 세계 연구자와 개발자들에게 활용되고 있다.
한보형 교수는 "이번 연구는 기존 비디오 생성 모델이 가진 고정 길이 및 메모리 병목 문제를 새로운 추론 알고리즘으로 해결한 데 의의가 있다"며 "향후 영화·게임·광고 등 다양한 응용 분야에서 콘텐츠 제작 비용 및 제작 시간을 획기적으로 단축할 수 있을 것"이라고 기대를 표했다.
Copyright ⓒ 모두서치 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.