한양대 융합전자공학과 최정욱 교수 연구팀은 복잡한 제어 과제를 수행하는 인공지능 모델의 효율성을 개선하는 새로운 학습 기법 '주목 기반 양자화 모방학습(SQIL, Saliency-Aware Quantized Imitation Learning)'을 개발했다고 22일 밝혔다.
뉴시스 보도에 따르면, 이번 연구는 실제 환경에서 대규모 비전-언어-행동(VLA) 모델을 빠르고 저전력으로 실행하면서 정밀도를 유지하는 데 중점을 뒀다.
기존의 대규모 VLA 모델은 시각·언어 정보를 통합해 복잡한 조작 과제를 수행할 수 있으나 수십억 개의 파라미터로 인해 연산 비용과 메모리 사용량이 매우 크다.
이를 줄이기 위해 활용되는 양자화(Quantization) 기법은 모델의 숫자 표현을 줄여 효율성을 높이지만, 임무 성공 여부를 좌우하는 특정 상태(mission-critical states)에서 성능이 저하된다는 한계가 있었다.
이에 최 교수 연구팀은 두 가지 핵심 아이디어를 제안했다. '상태 중요도 점수(State Importance Score, SIS)'로 로봇 제어 과정에서 임무 성공에 결정적인 상태를 자동 식별하고, '양자화-강건 행동 증류(Quantization-Robust Action Distillation, QRD)' 기법으로 중요한 상태에서 양자화 모델이 정밀 모델과 동일한 결정을 내리도록 했다.
그 결과, SQIL은 4비트로 양자화된 로봇 제어 모델(OpenVLA)에서 기존 방법 대비 최대 2.5배 빠른 속도와 2.5배 에너지 절감을 달성하고 원래 정밀도 모델과 동일한 성공률을 회복했다. 자율주행 모델(CILRS)에서도 3.7배 속도 향상과 3.1배 에너지 절감을 기록했다.
특히 SQIL은 시뮬레이션 환경뿐 아니라 실제 로봇 실험(UR5 로봇, BridgeData V2 재현)에서도 성능을 보장했다.
이번 연구는 다음달 19일 세계적 컴퓨터 비전 학회인 'ICCV 2025(International Conference on Computer Vision, 국제 컴퓨터 비전 콘퍼런스)'에 채택돼 발표될 예정이다.
Copyright ⓒ 모두서치 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.