Meta 的 V-JEPA 2 模型教 AI 了解周围环境
        Meta 周三推出了其新的 V-JEPA 2AI 模型,这是一个“世界模型”,旨在帮助 AI 代理了解他们周围的世界。

         V-JEPA 2 是 Meta 去年发布的 V-JEPA 模型的扩展,该模型经过超过 100 万小时的视频训练。 这些训练数据应该帮助机器人或其他 AI 代理在物理世界中运行,理解和预测重力等概念将如何影响序列中接下来发生的事情。

         这些是常见的类型感知小孩和动物在大脑发育过程中建立的联系——例如,当你和狗玩接球时,狗会(希望)理解球在地上弹跳将如何导致它向上反弹,或者它应该如何跑向它认为球会落下的地方,而不是球所在的位置 那个精确的时刻。

         Meta 描述了机器人可能面临的例子,例如,拿着盘子和抹刀走向炉子的视角配上煮熟的鸡蛋。 AI 可以预测下一个很有可能的动作是使用抹刀将鸡蛋移动到盘子中。

         根据 Meta 的说法,V-JEPA 2 的速度比 Nvidia 的 Cosmosmodel 快 30 倍,后者还试图增强与物理世界相关的智能。 但是,Meta 可能会根据与 Nvidia 不同的基准来评估自己的模型。

         “我们相信世界模型将开创机器人技术的新时代,使现实世界的 AI 代理能够帮助完成家务和体力劳动任务,而不需要天文数字的机器人训练数据,“Meta 的首席人工智能科学家 Yann LeCun 在一段视频中解释说。