제미나이 로보틱스 1.5가 적용된
페이지 정보
카테고리 1주차 mission | 작성 25-09-26 18:07 작성자 : sans339본문
통화종료콜백
제미나이 로보틱스 1.5가 적용된 로봇 아폴로가 연구자의 명령에 따라 짐을 싸기 전 생각하는 모습. 사진=구글 동영상 캡처 구글이 인간처럼 계획하고 추론하는 로봇 AI(인공지능) 모델을 공개했다. 단순히 사람 명령을 따르는 수준을 넘어 알아서 상황을 이해하고 행동하는 능력을 갖췄다. 다양한 상황에 대한 적응력이 높아지면서 로봇의 일상화·상용화에 한발 다가섰다는 평가다. 무슨 일이야 구글의 AI 조직 딥마인드는 24일(현지시간) 스스로 사고하고 행동하는 로봇 AI 모델 ‘제미나이 로보틱스 1.5’를 공개했다. 모델은 크게 두 종류로 나뉜다. ‘로보틱스 1.5’는 물체를 인식하고(시각) 지시를 이해해(언어) 이를 물리적 동작(행동)으로 옮기는 VLA(시각·언어·행동) 모델이고, ‘로보틱스 ER 1.5’는 계획과 추론을 통해 명령을 완수하는 모델이다. 두 모델은 모두 제미나이 기반으로 구축됐고, 각자 역할에 특화되도록 서로 다른 데이터셋으로 학습됐다. “두 모델이 결합했을 때 다양한 환경에서 로봇의 적응력이 크게 향상된다”는 것이 구글 측의 설명이다. 무슨 의미야 지난 3월 ‘제미나이 로보틱스 1.0’ 첫 공개 후 반년 만에 이뤄진 업데이트다. 구글은 이번 모델이 15개 벤치마크에서 동종 모델 대비 최고 성능을 기록했다고 밝혔다. 벤치마크 테스트 점수를 더한 종합 점수에서 제미나이 로보틱스 ER 1.5는 62.8점을 받았는데, 오픈AI의 챗GPT-5(60.6점) GPT-5미니(57.3점)보다 높았다. 6개월 전 공개한 1.0 버전과 비교했을 때, 8.6점 올랐다. 이전 버전은 한 번의 명령에 단일 작업만 가능했다면, 이제는 다단계 작업을 스스로 처리할 수 있는 수준으로 진화했다. 캐롤리나 파라다 구글 딥마인드 수석 디렉터는 “지금까지는 한 번에 하나의 지시를 수행했다면 이제는 물리적 과제에 대한 이해와 복잡한 다단계 문제를 해결하는 단계로 나아가는 중”이라고 설명했다. 추론 모델 ‘제미나이 로보틱스-ER 1.5’와 VLA 모델 ‘제미나이 로보틱스 1.5’가 어떻게 상호 보완적으로 작동하고 실제 물리적 세계에서 복잡한 작업을 수행하는지를 보여주는 다이어그램. 사진 구글 뭘 할 수 있어? 이날 구글이 공개한 영상에서 시연자가 런던 여행을 위해 모자를 가방에 넣어달라 요청하자, 로봇은 비 예보를 확인해 우산을 함께 챙겨 넣었다. 또 책상 위 과 제미나이 로보틱스 1.5가 적용된 로봇 아폴로가 연구자의 명령에 따라 짐을 싸기 전 생각하는 모습. 사진=구글 동영상 캡처 구글이 인간처럼 계획하고 추론하는 로봇 AI(인공지능) 모델을 공개했다. 단순히 사람 명령을 따르는 수준을 넘어 알아서 상황을 이해하고 행동하는 능력을 갖췄다. 다양한 상황에 대한 적응력이 높아지면서 로봇의 일상화·상용화에 한발 다가섰다는 평가다. 무슨 일이야 구글의 AI 조직 딥마인드는 24일(현지시간) 스스로 사고하고 행동하는 로봇 AI 모델 ‘제미나이 로보틱스 1.5’를 공개했다. 모델은 크게 두 종류로 나뉜다. ‘로보틱스 1.5’는 물체를 인식하고(시각) 지시를 이해해(언어) 이를 물리적 동작(행동)으로 옮기는 VLA(시각·언어·행동) 모델이고, ‘로보틱스 ER 1.5’는 계획과 추론을 통해 명령을 완수하는 모델이다. 두 모델은 모두 제미나이 기반으로 구축됐고, 각자 역할에 특화되도록 서로 다른 데이터셋으로 학습됐다. “두 모델이 결합했을 때 다양한 환경에서 로봇의 적응력이 크게 향상된다”는 것이 구글 측의 설명이다. 무슨 의미야 지난 3월 ‘제미나이 로보틱스 1.0’ 첫 공개 후 반년 만에 이뤄진 업데이트다. 구글은 이번 모델이 15개 벤치마크에서 동종 모델 대비 최고 성능을 기록했다고 밝혔다. 벤치마크 테스트 점수를 더한 종합 점수에서 제미나이 로보틱스 ER 1.5는 62.8점을 받았는데, 오픈AI의 챗GPT-5(60.6점) GPT-5미니(57.3점)보다 높았다. 6개월 전 공개한 1.0 버전과 비교했을 때, 8.6점 올랐다. 이전 버전은 한 번의 명령에 단일 작업만 가능했다면, 이제는 다단계 작업을 스스로 처리할 수 있는 수준으로 진화했다. 캐롤리나 파라다 구글 딥마인드 수석 디렉터는 “지금까지는 한 번에 하나의 지시를 수행했다면 이제는 물리적 과제에 대한 이해와 복잡한 다단계 문제를 해결하는 단계로 나아가는 중”이라고 설명했다. 추론 모델 ‘제미나이 로보틱스-ER 1.5’와 VLA 모델 ‘제미나이 로보틱스 1.5’가 어떻게 상호 보완적으로 작동하고
통화종료콜백