谷歌DeepMind发布Gemini机器人,助力实体AI

谷歌DeepMind推出Gemini Robotics,实现物理世界人工智能

谷歌DeepMind推出了Gemini Robotics,这是一个基于Gemini 2.0的新型人工智能模型,专为机器人技术设计。这标志着将人工智能能力带入物理世界的重要一步,侧重于“具身”推理,即人工智能理解和响应周围环境并安全采取行动的能力。

推出了两个关键模型:Gemini Robotics,一个用于直接机器人控制的视觉-语言-动作(VLA)模型,以及Gemini Robotics-ER,增强了机器人工程师的空间理解能力。这些模型旨在使机器人能够执行更广泛的现实世界任务。Gemini Robotics在通用性、交互性和灵活性方面表现出色。Gemini Robotics-ER增强了Gemini的空间推理能力,改进了物体检测和抓取能力,目标是将它们集成到实际应用中。

谷歌正在与Apptronik合作,构建下一代人形机器人,并与包括Agile Robots、Agility Robots、Boston Dynamics和Enchanted Tools在内的值得信赖的测试人员合作。该计划还强调安全性,采用分层方法来解决安全问题,包括用于评估语义安全性和负责任的人工智能开发的新数据集。

https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/