[이슈메이커=임성희 기자]
범용적, 효율적, 실용적인 컴퓨터 비전 연구하는 신진 연구그룹
영상 복원, 디노이징(Denoising), 압축 왜곡 개선 기술 눈에 띄어
실생활에서도 안정적, 효율적으로 동작하는 기술 확보 위해 노력
컴퓨터 비전(Computer Vision)은 기계의 시각으로, 인간의 시각 시스템을 기계적으로 자동화하는 것이고, 인간의 시각을 능가하는 경우도 많다. 컴퓨터 비전도 인공지능과 만나며 기술의 발전이 빠르게 진행되고 있다. 이제는 단순히 본다는 개념을 넘어 시각적 이미지나 영상에서 정보를 추출하거나 새로운 정보를 생성하는 수준까지 다다랐다. 최신 컴퓨터 과학기술인만큼 주목받는 신진 연구그룹이 많은데, 고효율, 고성능의 컴퓨터 비전 기술을 보유하고 있는 광주과학기술원 소재웅 교수에게 관심이 갔다. 적은 데이터로도 대규모 데이터 못지않은 성능을 발휘할 수 있는 그의 기술력이 궁금하다.
스마트폰, TV 등에 적용돼 사용자 경험 향상할 수 있는 영상 기술 개발
소재웅 교수는 서울대 전기정보공학부에서 학부과정을 거치며 회로, 반도체 등 현재 유행하는 다양한 분야를 경험할 수 있었는데, 특히 신호처리에 관심이 많이 갔다고 밝혔다. “학부 과정 중에 신호처리 관련 수업을 들으면서, 이러한 지식이 광범위한 분야에 활용된다는 것을 알게 되었습니다. 그래서 신호를 처리하고 분석하는 분야에 관심을 가지게 되었고, 특히 눈에 보이는 영상 신호와 직접적으로 맞닿아 있는 컴퓨터 비전에 큰 관심이 갔고 전문성을 갖추기 위해 노력했습니다” 그는 학위과정 동안 영상 복원 연구에 집중했다고 말했다. 영상 복원 분야 중에 영상 해상도를 개선하는 초해상도(Super-Resolution), 영상의 노이즈를 제거하는 디노이징(Denoising), 영상 압축으로 인한 압축 왜곡 개선(Compression Artifacts Reduction) 등의 문제를 AI 기반 모델을 활용해 해결하는 연구를 진행하며 자신만의 기술력을 갖춘 그는 산업체를 거쳐 광주과학기술원(GIST)까지 부임할 수 있었다. “탑티어 비전 학회인 CVPR에서 2019년에 발표한 Natural and Realistic Super-Resolution 관련 논문, 2020년 CVPR에서 발표한 메타전이학습 기반의 Zero-Shot Super-Resolution 논문, 2022년 IEEE TIP 저널에 게재된 변분추론 기반의 영상 복원 논문 등 학위과정 중에 쌓은 영상 복원 분야의 점진적인 연구성과들과 산업계에서의 실무 경험이 시너지 효과를 내어, 연구자로서 성장할 수 있는 원동력이 되었고, 이러한 점들이 GIST 부임으로 이어졌다고 생각합니다” 소재웅 교수의 영상 복원 기술은 스마트폰의 사진 자동보정 기능, TV에서 화질을 좋게 만드는 디스플레이 등에 적용될 수 있다. 그는 자기 기술은 디바이스에서 사용자 경험을 향상하는 것이며 더 나아가 객체 인식이나 자율주행에도 활용될 수 있는 기술개발을 위해 노력하고 있다고 설명했다.
-선별된 소량의 데이터만으로 대규모 데이터에 준하는 성능 달성
-온디바이스 환경에서 동작할 수 있는 AI 모델 개발
소재웅 교수는 자신의 연구 지향점을 범용적이면서도 효율적이고 실용적인 연구라고 소개했다. 이런 관점을 토대로 그는 GIST에서 컴퓨터 비전 분야 중에 특히 영상 복원과 3D 비전 영역에 집중해 연구와 인력양성을 진행하고 있다. 그는 “우리 연구그룹은 실용적인 AI 기반 영상 복원 기술을 핵심 기술력으로 보유하고 있습니다”라며 덧붙여 “일반적으로 AI 영상 복원 모델은 실제 영상에 그대로 적용하는 경우, 성능이 저하되는 문제가 있습니다. 이에 저희는 영상의 열화(Degradation) 특성을 고려한 학습 기법을 통하여 효율적으로 영상을 복원하고 개선할 수 있는 기술을 확보하였습니다. 또한, 영상 복원 AI 모델의 효율화 기술을 중점적으로 연구하고 있습니다. 합성곱 신경망(Convolutional Neural Network)과 Transformer 기반 모델의 구조를 분석하고 연구하여, 적은 연산량으로도 우수한 성능을 유지할 수 있는 경량화 모델 설계 기술을 개발하였습니다. 이를 통해 성능 저하가 크지 않은 범위에서 모델의 연산 효율을 극대화할 수 있습니다”라고 설명했다. 그의 고효율 전략은 비용 측면에서 큰 장점이 있어 상용화 가능성이 더 커진다. “최근에는 학습 데이터 확보에 큰 비용이 드는 현실적인 문제를 해결하기 위한 연구에 집중하고 있습니다. 초해상도(Super-Resolution)를 위한 데이터 증류(Data Distillation) 기법을 연구하여 효율적으로 선별된 소량의 데이터만으로도 대규모 데이터로 학습한 모델에 준하는 성능을 달성하였습니다. 또한, 현재 대부분의 AI 모델이 서버 기반의 연산이 필요하지만, 저희의 효율적인 AI 모델은 온디바이스 환경에서 동작할 수 있는 가능성을 가집니다. 이는 보안 문제뿐만 아니라 속도 및 비용 측면에서도 모두 이점을 가지며, 다양하게 비전 시스템에 활용될 수 있는 잠재력이 있는 기술입니다”
“3D 분야와 생성형 모델로 연구 확장할 것”
컴퓨터 비전은 기술의 흐름이 빠른 최첨단 학문이다. 그만큼 경쟁이 심하지만, 미개척 분야가 많아 기회의 학문이기도 하다. 영상 복원 분야 관련 학생들의 문의가 많다는 소재웅 교수는 “컴퓨터 비전 분야가 경쟁이 치열함을 학생들에게 설명합니다. 따라서 비전 연구자로서 전문성과 경쟁력을 가지기 위해 좋은 연구성과와 탑티어 학회 발표가 중요하다고 강조합니다”라고 말했다. 덧붙여 그는 현재의 영상 복원 연구를 기반으로, 비전 분야 내의 다양한 연구 분야로 확장하고 싶다고 밝혔다. “비디오로 확장한 연구들과 3D 복원 및 시점 합성, 얼굴 재현 및 생성과 같은 주제들로의 확장을 계획하고 있습니다. 특히나 생성형 모델에 큰 관심이 있어, 연구실 규모와 컴퓨팅 인프라가 충분하게 확보되면 관련된 연구를 진행할 생각입니다. 중장기적으로는 이러한 연구를 통합하여, 실제 환경에서도 안정적이고 효율적으로 동작하는 AI 기반 비전 기술을 확보하는 것이 연구실의 목표입니다”
빠른 연구 경쟁 속에서 스트레스 관리법을 묻는 기자의 질문에 그는 다른 활동을 하기보다 논문을 읽으며 쉼을 가진다고 했다. 일로 스트레스를 받지만 결국은 일로 풀고 있다며, 학문 특성상 수없이 발표되는 논문 중 옥석을 가려 참고하는 것도 큰 도움이 된다고 밝혔다. 그의 기술은 사용자 경험을 향상할 수 있는 기술이기에 상용화와 동전의 앞뒷면처럼 붙어 있다. 자신의 기술이 실현되는 걸 목도할 수 있다는 장점을 연구의 원동력으로 삼길 바라며, 컴퓨터 비전 분야에서 항상 언급되는 주요 연구그룹으로 성장하길 기대해본다.
Copyright ⓒ 이슈메이커 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.