노타, 퀄컴 최신 엣지 AI서 ‘피지컬 AI’ 속도 7배 높였다… 로봇 추론 시간 85% 단축

AI 모델 경량화·최적화 기업 노타가 로봇과 산업 자동화 시장의 핵심 기술로 주목받는 ‘피지컬 AI(Physical AI)’ 분야에서 의미 있는 기술 성과를 공개했다. 고성능 GPU 서버 중심으로 구동되던 비전-언어-행동(VLA) 모델을 퀄컴 최신 엣지 AI 디바이스에서 최적화해, 로봇 동작 생성 속도를 최대 7배 높이는 데 성공했다는 설명이다.

최근 글로벌 AI 산업은 생성형 AI를 넘어 현실 세계를 인식하고 행동하는 ‘피지컬 AI’ 경쟁으로 무게 중심이 이동하는 분위기다. 사람이 명령하면 AI가 주변 환경을 파악하고 실제 기계를 움직이는 방식이다. 제조업, 물류, 로봇, 스마트팩토리 시장이 성장하면서 관련 AI 기술의 상용화 가능성에도 관심이 커지고 있다.

노타가 이번에 공개한 기술은 로봇의 ‘눈과 두뇌, 손’을 동시에 연결하는 역할을 하는 VLA 모델 최적화다. VLA는 시각 정보 이해, 언어 명령 해석, 행동 생성 과정을 하나의 AI 모델 안에서 처리하는 구조다. 반면 연산량이 크고 복잡해 일반적으로 GPU 서버 환경에서 실행되는 경우가 많았다. 실시간 반응이 필요한 산업 현장에서 임베디드 디바이스 단독으로 안정적인 구동 사례는 많지 않았다.

회사는 퀄컴 최신 엣지 AI 플랫폼인 Dragonwing™ IQ-9075에서 VLA 모델 ‘SmolVLA 0.45B’를 실행하고 성능 개선까지 구현했다고 밝혔다. 눈길을 끄는 대목은 해당 모델이 현재 퀄컴 공식 지원 대상이 아니라는 점이다. 노타는 모델 구조와 디바이스 실행 환경을 분석해 자체 구동 환경을 구축했다고 설명했다.

속도 개선 방식도 무작정 모델 크기를 줄이는 전통적 경량화 접근과는 결이 다르다. 회사는 시각 인식과 언어 이해 단계는 유지한 채, 실제 로봇 움직임을 만들어내는 마지막 단계(Action Head)를 중심으로 최적화를 적용했다. 속도 향상 효과는 크면서 정확도 저하를 최소화하는 데 초점을 맞춘 셈이다.

기술적으로는 반복 연산량을 줄이는 ‘실시간 추론 최적화(Real-time Inference Optimization)’와 퀄컴 엣지 AI 환경에 맞춘 ‘NPU 기반 그래프 최적화(NPU-aware Graph Optimization)’가 적용됐다. 결과적으로 Action Head 처리 시간은 기존 218ms에서 31ms로 줄었다. 약 85.8% 감소한 수치다. 전체 추론 시간도 505ms에서 310ms 수준으로 단축됐다.

주목할 부분은 속도 개선과 함께 정확도 손실을 일정 수준 안에서 관리했다는 점이다. 회사에 따르면 작업 성공률은 기존 86%에서 85% 수준으로 유지됐다. 성능 향상 과정에서 안정성을 일정 수준 확보했다는 평가가 가능하지만, 실제 산업 현장 적용 단계에서는 다양한 환경에서 추가 검증이 필요하다는 시각도 존재한다. 로봇 AI는 예측하지 못한 변수와 안전성이 중요한 영역이기 때문이다.

노타는 해당 기술을 미국 산타클라라에서 열린 임베디드 비전 서밋 2026 현장에서 시연했다. 관람객이 화면에서 물품을 선택하면 AI가 상황을 인식하고 로봇팔이 바구니에 물건을 담는 과정을 실시간으로 구현했다. 단순 영상 재생이 아닌, 사용자 선택에 따라 AI가 행동을 생성하는 방식으로 구성했다는 설명이다.

업계에서는 이번 사례를 ‘온디바이스 AI(On-device AI)’가 스마트폰과 CCTV를 넘어 로봇과 산업 자동화 영역으로 확장되는 신호로 보는 분위기도 감지된다. 클라우드 서버 의존도를 낮추고 디바이스 내부에서 AI가 직접 판단하는 구조는 지연시간 감소, 개인정보 보호, 네트워크 비용 절감 측면에서 경쟁력을 가질 수 있다.

다만 피지컬 AI 상용화가 본격화되기 위해선 넘어야 할 과제도 남아 있다. 고성능 모델을 작은 디바이스에서 안정적으로 운영하는 문제뿐 아니라 산업 현장의 복잡한 변수 대응, 안전성 검증, 비용 효율성 확보가 병행돼야 한다. 기술 시연과 실제 상용 환경 사이의 간극을 얼마나 줄이느냐가 향후 경쟁력의 기준이 될 가능성이 크다.

채명수 대표는 “피지컬 AI가 산업 현장으로 확산되기 위해서는 AI가 환경을 인식하고 이해한 뒤 행동으로 연결하는 과정이 엣지 AI 디바이스에서 빠르고 안정적으로 처리돼야 한다”며 “이번 VLA 최적화는 노타 기술이 피지컬 AI 시대 핵심 기반 기술로 확장될 가능성을 보여준 사례”라고 밝혔다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드