Meta 的 V-JEPA 2 模型教 AI 了解周围环境

Meta 周三推出了其新的 V-JEPA 2AI 模型，这是一个“世界模型”，旨在帮助 AI 代理了解他们周围的世界。

V-JEPA 2 是 Meta 去年发布的 V-JEPA 模型的扩展，该模型经过超过 100 万小时的视频训练。这些训练数据应该帮助机器人或其他 AI 代理在物理世界中运行，理解和预测重力等概念将如何影响序列中接下来发生的事情。

这些是常见的类型感知小孩和动物在大脑发育过程中建立的联系——例如，当你和狗玩接球时，狗会（希望）理解球在地上弹跳将如何导致它向上反弹，或者它应该如何跑向它认为球会落下的地方，而不是球所在的位置那个精确的时刻。

Meta 描述了机器人可能面临的例子，例如，拿着盘子和抹刀走向炉子的视角配上煮熟的鸡蛋。 AI 可以预测下一个很有可能的动作是使用抹刀将鸡蛋移动到盘子中。

根据 Meta 的说法，V-JEPA 2 的速度比 Nvidia 的 Cosmosmodel 快 30 倍，后者还试图增强与物理世界相关的智能。但是，Meta 可能会根据与 Nvidia 不同的基准来评估自己的模型。

“我们相信世界模型将开创机器人技术的新时代，使现实世界的 AI 代理能够帮助完成家务和体力劳动任务，而不需要天文数字的机器人训练数据，“Meta 的首席人工智能科学家 Yann LeCun 在一段视频中解释说。

网站 Banner