[이뉴스투데이 김진영 기자] 구글이 로봇용 인공지능(AI)의 차세대 표준 모델 선점에 속도를 내고 있다. 챗봇·에이전트 경쟁을 넘어 실제 물리 세계를 이해하고 대응할 수 있는 ‘피지컬 AI’ 구현에 공을 들이는 모습이다.
구글 AI 조직 딥마인드는 로봇 추론 능력을 대폭 발전시킨 ‘제미나이 로보틱스 1.5’와 ‘제미나이 로보틱스-ER 1.5’를 공개했다고 26일 밝혔다. 지난 3월 첫선을 보인 ‘제미나이 로보틱스 1.0’ 이후 반년 만의 업그레이드다.
새 모델은 시각·언어·행동(VLA)을 결합한 구조로, 단순히 명령을 수행하는 수준을 넘어 실제 환경을 이해하고 복잡한 과제를 해결할 수 있다. 예컨대 옷을 색깔별로 정리할 때 색상뿐 아니라 재질·무게·쌓인 형태까지 고려하거나, 사용자의 위치를 기반으로 지역별 재활용 규정을 검색해 쓰레기를 분류하는 식이다. 로봇이 행동하기 전 ‘사고’하는 과정을 거쳐 다단계 작업을 계획할 수 있게 설계됐다.
이번 버전에 구글은 ‘모션 트랜스퍼’ 기능도 도입했다. 한 로봇이 학습한 동작을 구조가 다른 로봇에도 적용할 수 있도록 해 범용성을 크게 높였다. 기존에는 로봇 형태에 따라 별도 코딩과 훈련이 필요했으나, 이제는 동일 모델을 다양한 기종에 이식할 수 있어 향후 휴머노이드 로봇 확산에도 호환성이 보장된다.
실제 시연에서는 “여행 가방에 모자를 넣어 달라”는 요구에 로봇이 날씨 정보를 검색해 우산까지 챙겼고, 샌프란시스코 지역 쓰레기 분리 지침을 찾아 재활용품을 분류하는 장면도 공개됐다. 단순 지시 수행이 아닌 ‘계획·추론·도구 활용’을 통한 문제 해결 능력을 보여준 사례다.
딥마인드는 “단순히 명령에 반응하는 수준을 넘어 물리적 환경을 능동적으로 이해하는 다재다능한 로봇 AI를 목표로 하고 있다”며 “이번 모델은 15개 벤치마크에서 동종 모델 대비 최고 성능을 기록했다”고 밝혔다. ER 1.5는 개발자용 API로 공개, 1.5는 여러 파트너사와 공동 연구개발이 진행 중이다.
다만, 딥마인드는 로봇이 실제 인간 환경에서 상용화되기까지는 정교한 움직임·신뢰성·안전성 확보라는 과제가 남아 있다고 강조했다.
Copyright ⓒ 이뉴스투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.