AI 로봇 공중 슬램 덩크

Mar 29, 2025 메시지를 남겨주세요

A robot equipped with a Gemini Robotics AI model can throw a basketball into the hoop.

Gemini Robotics AI 모델이 장착 된 로봇은 농구를 후프에 던질 수 있습니다.

며칠 전, Google의 Deepmind는 LLM (Lange Language Model) Gemini를 로봇에 적용했습니다. 이 모델과 함께 로봇은 다른 로봇의 움직임을 관찰하지 않고도 특정 작업을 수행 할 수 있다고 말했다. 예를 들어, "덩크"는 테이블의 후프에 미니 농구를 넣습니다.

 

DeepMind는 챗봇 기술을 사용하여 일반 목적 봇을 개발하려는 회사 중 하나입니다. 그러나 이러한 모델이 오류와 유해한 결과를 생성하기 쉽다는 점을 고려할 때이 기술 경로에는 보안에 영향을 미칩니다.

 

연구팀은 운영에 직관적 인 기계를 개발하고 인간의 감독이나 사전 프로그램없이 다양한 물리적 작업을 수행 할 수있는 기계를 개발하기를 희망합니다. DeepMind의 로봇 공학 팀 책임자 인 Carolina Parada는 Gemini 모델을 연결함으로써 개발자는 "자연 언어를 이해하고 물리적 세계를 더 훌륭한 수준으로 인식 할 수있는 로봇의 능력을 향상시킬 수 있다고 지적했습니다.

 

Gemini Robotics라고 불리는이 모델은 3 월 12 일에 발표되었습니다. 미국 인공 지능 (AI) 회사 인 Collectedai의 공동 창립자이자 AI 연구원 인 Alexander Khazatsky는 이것이 Universal Robots의 목표를 향한 "작고 실질적인 단계"라고 언급했습니다.

 

DeepMind 팀은 최첨단 비전 및 언어 모델 인 Gemini 2. 0를 기반으로하며, 이는 대량의 데이터로 패턴을 분석하여 교육을받습니다.

 

이 팀은 객체의 궤적을 예측하거나 다른 각도에서 가져온 이미지에서 객체의 동일한 부분을 식별하는 등 3D 물리학 및 공간 추론과 관련된 작업의 기능을 향상시키기 위해 전용 버전의 Gemini를 개발했습니다.

 

또한 연구원들은 수천 시간의 실습으로 운영되는 로봇 데모 데이터로 모델을 교육했습니다. 이를 통해 로봇의 "뇌"는 LLM이 학습을 통해 문장에서 다음 단어를 연관시키는 방법과 유사하게 실제 작업을 수행 할 수 있습니다.

 

연구원들은 고조파 감속기를 사용하는 휴머노이드 로봇과 로봇 암에 대한 쌍둥이 자리 로봇 공학을 테스트했으며, 훈련에 나오는 작업과 그들에게 노출되지 않은 새로운 작업을 다루었습니다. 그들은 모델이있는 로봇이 조정 된 세부 사항으로 친숙하고 새로운 작업에서 경쟁 업체보다 우수하다고 말합니다.

 

종이 접기 또는 배낭을 지키는 것과 같은 섬세한 조작이 필요한 작업에서 로봇은 100 개 미만의 데모를 본 후 70% 이상의 성공률을 보입니다. 다른 모델을 사용하는 로봇은 거의 모두 실패했습니다.

 

Khazatsky는 Google 팀이 로봇의 "뇌"에 상식을 이식하는 데 큰 도움이되었다고 생각하지만, 실제 도약은 실험실 환경보다는 "혼란스러운 실제 세계"에서 수집 된 데이터로부터 학습에서 비롯 될 것이라고 지적합니다.

 

그러한 모델을 적용 할 때 보안이 중대한 도전이됩니다. 미국 뉴욕의 DeepMind의 로봇 겸 AI 연구원 인 Vikas Sindhwani는 다음과 같이 말했습니다 : "처음에는 로봇이 인간과 안전한 거리를 유지할 것입니다. 향후 우리는 점차 대화식과 협업 작업을 점차적으로 구현할 것입니다."