시스템은 변화하는 환경에서 로봇이 행동하도록 돕습니다.
로봇 시스템은 주변을 관찰하고 다음에 무슨 일이 일어날지 예측하며 실시간으로 동작을 변경하여 움직이는 물체와 변화하는 작업 조건을 처리합니다.
로봇공학 스타트업 Rhoda AI는 통제된 실험실 설정이 아닌 변화하는 실제 환경에서 로봇이 작동할 수 있도록 설계된 로봇공학 시스템을 공개했습니다.FutureVision이라는 시스템은 물리적 세계가 어떻게 변할지 예측하고 이러한 예측을 로봇 동작으로 변환합니다.환경을 관찰하고 다음에 일어날 일에 대한 짧은 비디오 예측을 생성하고 이러한 예측에 따라 작동하며 수백 밀리초마다 주기를 반복합니다.
회사는 이 접근 방식이 로봇이 기존 시스템에서 종종 오류를 일으키는 상황을 처리하는 데 도움이 된다고 말합니다.많은 산업용 로봇은 여전히 고정되고 사전 프로그래밍된 경로에 의존하며 구조화된 환경에서 가장 잘 작동합니다.비전-언어-행동 모델을 기반으로 하는 최신 AI 시스템이라도 객체가 이동하거나 레이아웃이 변경되거나 워크플로가 다양할 때 어려움을 겪을 수 있습니다.
Rhoda는 먼저 대규모 비디오 데이터 컬렉션을 사용하여 모델을 훈련한 다음 나중에 로봇별 학습을 통해 모델을 개선합니다.초기 교육에서는 수억 개의 온라인 비디오를 사용하므로 시스템은 로봇을 제어하기 전에 동작 패턴, 물리학 및 물리적 상호 작용을 배울 수 있습니다.
해당 단계 이후에는 더 작은 규모의 실제 로봇 데이터 세트를 사용하여 모델이 미세 조정됩니다.이 단계에서는 시각적 예측을 물리적 동작으로 변환하는 방법을 시스템에 가르칩니다.
Rhoda는 이 아키텍처를 Direct Video Action 모델이라고 부릅니다.한 번 계획을 세우고 피드백 없이 실행하는 대신, 시스템은 환경에서 새로운 정보를 관찰하면서 작업을 계속 업데이트합니다.
회사에 따르면 이 폐쇄 루프 프로세스를 통해 로봇은 정확성을 유지하면서 변화에 적응할 수 있습니다.또한 필요한 로봇 훈련 데이터의 양도 줄어듭니다.Rhoda는 약 10시간의 원격조작 데이터를 사용하여 몇 가지 새로운 작업을 학습할 수 있다고 말합니다.
이 기술은 로봇이 변화하는 재료와 작업 흐름을 처리해야 하는 제조 환경에서 이미 테스트되었습니다.한 대량 생산 평가에서 이 시스템을 사용하는 로봇은 사람의 개입 없이 2분 이내에 부품 처리 주기를 완료했습니다.
Rhoda는 FutureVision을 로봇 하드웨어 및 소프트웨어 플랫폼을 구축하는 회사에 라이선스를 부여할 수 있는 기반 모델로 개발할 계획입니다.
Rhoda의 공동 창업자이자 CEO인 Jagdeep Singh은 "차세대 로봇 공학에는 세상이 어떻게 보이는지, 언어로 어떻게 설명되는지뿐만 아니라 세상이 어떻게 움직이는지 이해하는 모델이 필요하다고 믿습니다."라고 말했습니다.