谷歌重磅发布！全球首个本地运行具身Gemini机器人模型问世，50次演示即可泛化新任务

日期：2025-06-25 13:57:49 / 人气：137

一、革命性突破：Gemini Robotics On-Device开启本地智能机器人时代
谷歌DeepMind今日正式推出Gemini Robotics On-Device，这是全球首个可直接部署在机器人本地的视觉-语言-动作（VLA）模型。该模型基于Gemini 2.0多模态推理能力打造，无需持续联网即可在机器人机体上高效运行，标志着具身智能领域迈出关键一步。

核心优势：

零网络依赖：彻底解决延迟敏感型应用痛点，确保断网环境下稳定运行；
超强泛化能力：仅需50-100次演示即可适应新任务，远超同类本地模型表现；
跨机器人兼容：从ALOHA到Franka FR3人形机器人，实现"一次训练，多机部署"。
二、技术解析：如何实现"小身材大智慧"？
1. 模型设计：为机器人量身定制
轻量化架构：针对双臂机器人优化计算资源需求，实现本地低延迟推理；
动态任务适应：通过微调快速掌握拉开袋子拉链、折叠衣物等精细操作；
多模态融合：结合视觉感知与自然语言指令，完成"打开未见过的抽屉"等复杂任务。
2. 实验验证：超越基准的泛化性能
DeepMind在七项灵巧操作任务中测试显示：

在分布外任务中成功率比现有本地模型提升37%；
多步骤指令执行准确率达92%，接近云端模型的表现水平。
三、开发者生态：降低具身AI门槛
谷歌同步推出Gemini Robotics SDK，提供三大开发利器：

MuJoCo模拟器集成：50次演示即可完成新场景适配；
跨平台测试工具：支持从虚拟环境到真实机器人的无缝迁移；
模型微调框架：开发者可针对特定任务优化性能。
注：该SDK已开源，开发者社区可快速验证模型潜力。

四、行业影响：具身智能的"iPhone时刻"？
工业领域：人形机器人可快速适应产线变化，降低部署成本；
家庭服务：无需云端交互的隐私保护型家政机器人成为可能；
科研突破：为"离线自主决策"研究提供标杆级解决方案。
五、其他更新：Gemini生态最新动态
免费额度调整：Gemini 2.5 Flash每日请求上限降至250次（原500次）；
AI生成升级：Imagen 4 Ultra模型上线，可创作猫+机器人+外星人等奇幻主题画作。
结语
Gemini Robotics On-Device的发布，让机器人首次具备了"离线思考-本地执行"的完整智能闭环。随着微调技术的成熟，我们或将看到更多行业级具身智能应用落地。谷歌此次技术开放，无疑加速了"机器人即服务"时代的到来。

作者：汇丰娱乐

谷歌重磅发布！全球首个本地运行具身Gemini机器人模型问世，50次演示即可泛化新任务

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →