|
네이버랩스 유럽은 산업과 일상 환경에서 자율주행 로봇의 작업 수행을 돕는 범용 인코더 ‘디바인’을 공개했다고 23일 밝혔다.
인코더는 로봇이 카메라, 라이다 등 센서로 수집한 데이터를 AI 모델이 처리할 수 있는 형태로 변환하는 장치다.
자율주행 로봇은 주변 환경을 인식하고 다양한 작업을 처리하기 위해 여러 개의 AI 인코더를 함께 사용해왔다. 디바인은 이들 인코더를 하나로 통합한 범용 인코더다. 이미지 이해부터 3D 공간 재구성, 사람 인식까지 다양한 시각 AI 기능을 하나의 인코더로 처리할 수 있도록 설계됐다.
기존에는 위치 추정, 깊이 계산, 공간 이해, 사람 인식 등 작업마다 각각의 AI 모델이 별도 인코더를 활용했다. 같은 입력 데이터를 여러 번 중복 처리해야 해 메모리 사용량과 연산량이 커지는 문제가 있었다.
네이버랩스 유럽은 ‘다중 교사 증류’ 방식을 활용해 이 문제를 해결했다. 다중 교사 증류는 이미지, 공간, 사람 인식 등 각 분야에 특화된 전문가 모델에서 핵심 지식을 추출해 하나의 학생 모델에 이식하는 방식이다. 여러 개의 대형 전문가 모델을 두지 않아도 하나의 모델이 다양한 분야를 처리할 수 있도록 만드는 기술이다.
|
디바인은 2D 이미지 이해, 3D 공간 재구성, 사람 인식 등을 전문적으로 처리하는 여러 인코더의 기능을 하나로 응축했다. 이에 따라 로봇은 여러 개의 서로 다른 인코더를 탑재하지 않아도 디바인 하나로 다양한 AI 작업을 수행할 수 있다.
사람과 로봇이 공존하는 환경에서는 주변 상황을 빠르게 인식하고 즉각 대응하는 능력이 중요하다. 디바인은 제한된 컴퓨팅 자원으로도 로봇이 주변 환경을 빠르게 이해할 수 있도록 돕는다.
실험 결과 디바인은 연산 부담을 줄이면서도 성능을 높인 것으로 나타났다. 여러 개의 인코더를 탑재했을 때와 비교해 인코더 메모리 사용량은 약 90% 줄었다. 인코딩 처리 속도는 최대 12배 향상됐다. 로봇의 전반적인 메모리 사용량은 약 62% 감소했고, 시스템 처리 속도는 최대 4배 빨라졌다.
기존 로봇용 AI 모델은 방대한 연산량 때문에 주로 서버 환경이나 고성능 컴퓨팅 장비에서 구동됐다. 반면 디바인은 적은 메모리와 연산량으로도 AI 기능을 실행할 수 있어 로봇 내부에서 직접 처리하는 온보드 환경 활용성을 높인다.
|
네이버랩스 유럽은 이를 통해 더 다양한 형태의 로봇에 고성능 AI를 적용할 수 있을 것으로 기대하고 있다. 고가의 무거운 연산 장치를 탑재한 대형 하드웨어가 아니어도 디바인을 활용하면 스스로 상황을 파악하고 다양한 작업을 수행하는 자율주행 AI 로봇을 운용할 수 있다는 설명이다.
새로운 AI 기능을 쉽게 추가할 수 있도록 설계된 점도 특징이다. AI 모델이 업그레이드될 때마다 새 로봇을 도입하지 않아도 기존 로봇에 탑재된 디바인을 업데이트해 성능을 높일 수 있다.
이동환 네이버랩스 비전그룹 리더는 “전 세계적으로 피지컬 AI의 상용화를 위해 로봇 두뇌 경량화가 주요 화두로 떠오르고 있다”며 “디바인은 일상과 산업 현장 전반에서 AI 로봇 도입 장벽을 낮추는 데 기여할 것”이라고 말했다.
네이버랩스 유럽의 디바인 관련 연구 2건은 각각 2024 유럽컴퓨터비전학회와 2025 컴퓨터비전 및 패턴 인식 컨퍼런스에 채택됐다. 네이버랩스는 이를 기반으로 피지컬 AI의 핵심으로 꼽히는 로봇 파운데이션 모델 연구를 이어간다는 계획이다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.


