물리 세계를 이해하고 행동하는 인공지능 개발을 위해 두 기업이 손을 잡았다. 실세계 지능 구현을 목표로 하는 Reka가 Moonvalley와의 합병을 통해 연구 역량을 대폭 강화한다. 연합뉴스에 따르면, 이번 통합으로 구글 딥마인드 출신의 마테우시 말리노프스키 박사와 미코와이 빈코프스키 박사를 비롯해 메타, 아마존, 마이크로소프트, 웨이브, 런웨이 등 글로벌 빅테크 출신 연구진이 대거 Reka에 합류하게 됐다.
말리노프스키 박사는 구글 딥마인드에서 스태프 리서치 사이언티스트로, 빈코프스키 박사는 시니어 리서치 사이언티스트로 재직하며 구글의 영상 생성 모델 Veo 개발에 핵심적 역할을 담당한 바 있다. 이들은 Reka의 연구 리더십에 합류해 물리 AI 시대를 위한 모델 및 인프라 개발을 이끌 예정이다.
Reka의 다니 요가타마 CEO는 "물리 AI는 본질적으로 연구 문제"라며 "영상 생성과 멀티모달 모델 분야에서 세계 최고 수준의 전문성을 갖춘 팀이 합류했다"고 밝혔다. 시뮬레이션부터 로봇공학, 실시간 의사결정까지 물리 세계를 이해하고 행동하는 AI 시스템 구축에 역량을 집중하겠다는 포부도 전했다.
말리노프스키 박사는 단순한 영상 생성을 넘어선 목표를 강조했다. 물리 법칙과 시간적 역학, 움직임을 시뮬레이션함으로써 로봇이 행동 전 결과를 추론할 수 있게 하는 것이 핵심이라는 설명이다. 이를 통해 더 안전하고 책임감 있는 AI 구현이 가능해진다는 것이 그의 견해다.
통합된 연구팀의 주력 과제는 'WLAM(World Language Action Model)'이다. 1인칭 시점 데이터와 물리 세계 데이터로 훈련되는 이 옴니 모델은 현실적인 시뮬레이션을 통해 계획을 수립하고, 실제 세계를 인식하며 행동할 수 있도록 설계됐다. 고품질 멀티모달 출력 생성 능력과 함께 뛰어난 공간·시간 인식력을 바탕으로 멀티모달 인식을 로봇 실행으로 전환하며, 장시간 영상 및 스트리밍 영상에 대한 정교한 추론도 수행한다.
Reka는 현재 4개 사업 축을 운영 중이다. Reka Labs는 물리 세계를 위한 기초 지능 연구개발을, Reka Infer는 멀티모달 AI용 추론 인프라와 API를 담당한다. Reka Vision은 대용량 영상 데이터의 태깅·추론·검색·편집을 위한 영상 처리 인프라 플랫폼이며, Reka Claru는 1인칭 영상, 로봇 궤적, 월드모델 영상, 대규모 전문가 판단 데이터 등 물리 AI용 학습 데이터를 제공한다.
연구·엔지니어링·제품 전 분야에서 적극적인 채용이 진행되고 있으며, Reka 플랫폼 조기 접근을 원하는 기업 파트너는 직접 연락이 가능하다.
Copyright ⓒ 나남뉴스 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.