NPU 실행 환경 맞춘 연산 그래프 최적화로 '피지컬 AI 핵심' 동작 생성 시간 86% 감소
VLA 데모 화면. ⓒ 노타
[프라임경제] 인공지능(AI) 모델 경량화 및 최적화 기술 기업 노타(486990)가 피지컬 AI 구현에 필요한 비전·언어·행동 모델(VLA)을 엣지 AI 디바이스에서 효율적으로 구동하기 위한 최적화 성과를 입증했다고 29일 밝혔다.
이번 성과는 피지컬 AI 구현에 필요한 VLA 모델을 엣지 디바이스에서 구동하고 성능 개선까지 입증한 사례로, 노타의 온디바이스 AI 최적화 기술이 로봇과 피지컬 AI 영역으로 확장되고 있음을 보여준다.
피지컬 AI는 AI가 카메라 등 센서를 통해 실제 환경을 인식하고, 사람의 명령이나 주변 상황을 이해한 뒤, 이를 행동으로 연결하는 기술 영역이다. 로봇·제조·물류 등 다양한 산업에서 피지컬 AI 활용 가능성이 커지면서 시각 정보와 언어 명령을 함께 이해하고 실제 동작을 생성하는 VLA 모델의 중요성도 높아지고 있다.
다만 VLA 모델은 이미지 인식, 언어 이해, 행동 생성 과정을 함께 처리해야 하는 고연산량 모델이다. 일반적으로 그래픽처리장치(GPU) 서버 기반 환경에서 구동되는 경우가 많으며, 임베디드 디바이스 단독 환경에서 실시간 수준으로 안정적으로 실행하는 사례는 아직 제한적이다.
특히 로봇이나 산업 현장처럼 빠른 반응이 필요한 환경에서는 클라우드 의존도를 낮추고, 디바이스 자체에서 AI 모델을 빠르고 안정적으로 구동하는 최적화 기술이 중요하다.
노타는 퀄컴 최신 엣지 AI 디바이스인 Dragonwing™ IQ-9075 환경에서 VLA 모델인 SmolVLA 0.45B가 작동할 수 있도록 구현하고, 실시간성 향상을 위한 최적화를 적용했다.
특히 SmolVLA 0.45B는 현재 퀄컴에서 공식 지원되지 않는 모델임에도, 노타가 모델 구조와 디바이스 실행 환경을 고려해 자체적으로 구동 환경을 마련했다는 점에서 의미가 크다.
이번 최적화의 핵심은 모델 전체를 무리하게 줄이지 않고, 속도 개선 효과가 크면서도 정확도에 미치는 영향을 줄일 수 있는 부분을 선별했다는 점이다. VLA 모델은 카메라로 본 장면을 이해하고, 사람의 명령을 해석한 뒤, 로봇 동작을 만들어내는 여러 단계로 구성된다.
노타는 이 중 앞단의 인식·이해 단계는 유지하고, 실제 로봇 동작을 생성하는 마지막 단계 중심으로 최적화를 적용했다.
이를 위해 노타는 로봇 동작을 생성하는 단계의 반복 연산을 줄이는 실시간 추론 최적화(Real-time Inference Optimization)와 퀄컴 엣지 AI 디바이스의 실행 환경에 맞춰 연산 흐름을 효율화하는 NPU 기반 그래프 최적화(NPU-aware Graph Optimization)를 적용했다.
그 결과 로봇 동작 생성 단계인 Action Head의 처리 시간은 218ms에서 31ms로 줄어 약 85.8% 감소했으며, 최대 7배 수준의 속도 개선을 달성했다. 전체 추론 시간 역시 505ms에서 310ms로 단축됐다.
반면 작업 성공률은 기존 86%에서 85%로 유사한 수준을 유지해, 속도는 크게 높이면서도 로봇 동작의 안정성은 기존과 비슷한 수준으로 유지했다. 이는 피지컬 AI 구현에 필요한 VLA 모델을 엣지 AI 디바이스에서 더 빠르게 실행할 수 있도록 했다는 점에서 의미가 있다.
노타는 해당 성과를 미국 산타클라라에서 열린 임베디드 비전 서밋 2026에서 공개했다. 현장에서는 시뮬레이터 기반으로 관람객이 직접 물품을 선택하면, 최적화된 VLA 모델이 이를 인식하고 로봇팔 동작을 생성해 선택한 물품을 집어 바구니에 넣는 과정을 실시간으로 체험할 수 있도록 구성했다.
이번 시연은 단순한 영상 재생이 아니라 관람객의 선택에 따라 AI가 상황을 이해하고 행동을 생성하는 방식으로 진행됐다. 이를 통해 노타는 피지컬 AI 구현에 필요한 VLA 모델이 엣지 AI 디바이스에서 어떻게 동작할 수 있는지 직관적으로 선보였으며, 현장 관람객들의 높은 관심을 받았다.
이번 성과는 노타의 AI 최적화 기술이 기존 온디바이스 AI 영역을 넘어 피지컬 AI 분야로 확장되고 있음을 보여준다.
특히 로봇, 산업 자동화, 스마트 제조, 물류, 지능형 공간 등 실제 환경에서 AI가 즉각적으로 판단하고 행동해야 하는 분야에서는 하드웨어 특성과 모델 구조를 함께 고려한 최적화 기술이 필수적이다.
노타는 앞으로도 다양한 엣지 AI 및 임베디드 디바이스 환경에서 고성능 AI 모델을 효율적으로 구동할 수 있는 최적화 기술을 고도화해 나갈 계획이다.
또한 퀄컴을 비롯한 글로벌 반도체 및 디바이스 생태계에 대한 최적화 역량을 바탕으로 피지컬 AI 시대에 필요한 온디바이스 AI 최적화 경쟁력을 지속 강화할 방침이다.
채명수 노타 대표는 "피지컬 AI가 산업 현장으로 확산되기 위해서는 AI가 실제 환경을 보고, 이해하고, 행동으로 연결하는 과정을 엣지 AI 디바이스에서 빠르고 안정적으로 처리할 수 있어야 한다"며 "이번 VLA 최적화 성과는 노타의 AI 최적화 기술이 피지컬 AI 시대의 핵심 기반 기술로 확장될 수 있음을 보여준 의미 있는 사례"라고 말했다.
Copyright ⓒ 프라임경제 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.