基准分数图片来源:谷歌
Gemini 2.5 Deep Think 自动与以下工具配合使用代码执行和谷歌搜索,该公司表示它能够产生比传统人工智能模型“更长的响应”。 在谷歌的测试中,与其他人工智能模型相比,该模型产生了更详细、更美观的 Web 开发任务。 该公司声称该模型可以帮助研究人员并“有可能加速发现之路”。 
谷歌人工智能制作的艺术场景图片来源:谷歌 似乎几个领先的人工智能实验室正在围绕多智能体方法。 埃隆·马斯克 (Elon Musk) 的 xAI 最近发布了自己的多智能体系统,Grok 4 Heavy,据称该系统能够在多个基准测试中实现行业领先的性能。 OpenAI研究员诺姆·布朗(Noam Brown)在播客上表示,该公司在今年国际数学奥林匹克竞赛上获得金牌时使用的未发布的AI模型也是一个多智能体系统。 同时,Anthropic 的研究代理生成详尽的研究简报,也由多代理提供支持系统。 尽管性能强劲,但多智能体系统的服务成本似乎甚至比传统的 AI 模型还要高。 这意味着科技公司可能会将这些系统限制在他们最昂贵的订阅计划之后,而 xAI 和现在的谷歌已经选择这样做。 谷歌表示,在未来几周内,它计划通过 Gemini API 与一组选定的测试人员共享 Gemini 2.5 Deep Think。 该公司表示,它希望更好地了解开发人员和企业如何使用它的多智能体系统。