Hugging Face 表示,其新的机器人模型非常高效,可以在 MacBook 上运行
在家中构建复杂的机器人项目变得越来越容易。 本周早些时候,AI 开发平台 Hugging Face 发布了一个名为 SmolVLA 的开放式机器人 AI 模型。 Hugging Face 声称,SmolVLA 在“兼容许可”社区共享的数据集上进行训练,在虚拟和现实世界环境中的表现都优于更大的机器人模型。 “SmolVLA 旨在使视觉-语言-行动 [VLA] 模型的访问民主化,并加速对通才机器人的研究代理人,“Hugging Face 在一篇博客文章中写道。 “SmolVLA 不仅是一种轻量级但功能强大的模型,而且还是一种训练和评估通才机器人 [技术] 的方法。” SmolVLA 是 Hugging Face 快速扩张的努力的一部分,旨在建立低成本机器人硬件和软件生态系统。 去年,该公司推出了 LeRobot,这是一组以机器人为重点的模型、数据集和工具。 最近,Hugging Face 收购了 Pollen Robotics,这是一家基于机器人的初创公司在法国,并推出了几个廉价的机器人系统,包括 Humanoids,供购买。 SmolVLA 的大小为 4.5 亿个参数,使用来自 LeRobot 社区数据集的数据进行训练,LeRobot 社区数据集是在 Hugging Face 的 AI 开发平台上共享的专门标记的机器人数据集。 参数(有时称为“权重”)是模型的内部组件,用于指导其行为。 Hugging Face 声称 SmolVLA 足够小,可以在单个消费类 GPU 上运行——甚至是MacBook 的 - 并且可以在“负担得起的”硬件上进行测试和部署,包括公司自己的机器人系统。 有趣的是,SmolVLA 还支持“异步推理堆栈”,Hugging Face 表示,它允许模型将机器人动作的处理与所见所闻的处理分开。 正如该公司在其博客文章中解释的那样,“由于这种分离,机器人可以在快速变化的环境中更快地做出反应。 SmolVLA 可用从 Hugging Face 下载。 已经有 X 上的用户声称已经使用该模型来控制第三方机械臂: 🚀 SmolVLA — 感觉就像是机器人技术的 🤖BERT 时刻 我在 Koch Arm 上尝试了它:RTX 2050 (4GB) 上的推理,仅通过 31 个演示进行了微调,并且匹配/优于单任务基线 🔥非常感谢to@RemiCadene@danaubakirova @mustash97 🙌@francesco__capu pic.twitter.com/TiBkAZGwkM— 左兴东 (@XingdongZ)2025 年 6 月 4 日 值得注意的是,Hugging Face 远非如此新生的 Open Robotics 竞赛中唯一的参与者。 Nvidia 拥有一系列用于开放机器人的工具,初创公司 K-Scale Labs 正在为其所谓的“开源类人机器人”构建组件。 该领域其他强大的公司包括 Dyna Robotics、Jeff Bezos 支持的 Physical Intelligence 和 RLWRLD。