Mistral 发布一对 AI 推理模型
法国 AI 实验室 Mistral 正在涉足推理 AI 模型游戏。 周二上午,Mistral 宣布推出 Magistral,这是其第一个推理模型系列。 与其他推理模型一样 — 例如 OpenAI'so3 和 Google 的 Gemini 2.5 Pro — Magistral 逐步解决问题,以提高数学和物理等主题的一致性和可靠性。 Magistral 有两种口味:Magistral Small 和 Magistral Medium。 Magistral Small 的大小为 240 亿个参数,并且可用在 AI 开发平台 Hugging Face 下,在宽松的 Apache 2.0 许可证下下载。 (参数是指导模型行为的内部组件。 Magistral Medium 是一种功能更强大的模型,已在 Mistral 的 Le Chat 聊天机器人平台和该公司的 API 以及第三方合作伙伴云上预览。 “[Magistral] 适用于广泛的企业用例,从结构化计算和编程逻辑到决策树和基于规则的系统,”写道Mistral 在博客文章中。 “[这些模型] 针对多步骤逻辑进行了微调,提高了可解释性,并以用户的语言提供了可追溯的思维过程。” Mistral成立于 2023 年,是一个前沿模型实验室,构建了一系列人工智能驱动的服务,包括前面提到的 Le Chat 和移动应用程序。 它得到了 General Catalyst 等风险投资者的支持,迄今为止已筹集超过 11 亿欧元(约合 12.4 亿美元)。 尽管资源丰富,但 Mistral 拥有在某些领域落后于其他领先的 AI 实验室,例如开发推理模型。 从 Mistral 自己的基准来看,Magistral 似乎也不是一个特别有竞争力的版本。 在 GPQA Diamond 和 AIME 上,评估模型的物理、数学和科学技能的测试,Magistral Medium 的表现逊于 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。 Magistral Medium 也未能在流行的编程基准测试 LiveCodeBench 上超越 Gemini 2.5 Pro。 :也许是这样为什么 Mistral 在其博客文章中吹捧 Magistral 的其他优势。 Mistral 声称,Magistral 以 “10 倍” 的速度提供 Le Chat 中竞争对手的答案,并支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。 “Magistral 以我们的旗舰模型为基础,专为研究、战略规划、运营优化和数据驱动的决策而设计,”该公司在其帖子中写道,“无论是执行风险评估和建模多个因素,或者在约束下计算最佳交付窗口。 Magistral 的发布是在 Mistral 首次推出“氛围编码”客户端 Mistral Code 之后发布的。 在此之前几周,Mistral 推出了几个以编码为重点的模型,并推出了 Le Chat Enterprise,这是一项以企业为中心的聊天机器人服务,提供 AI 代理构建器等工具,并将 Mistral 的模型与 Gmail 和 SharePoint 等第三方服务集成。