Mistral 发布一对 AI 推理模型

法国 AI 实验室 Mistral 正在涉足推理 AI 模型游戏。

周二上午，Mistral 宣布推出 Magistral，这是其第一个推理模型系列。与其他推理模型一样 — 例如 OpenAI'so3 和 Google 的 Gemini 2.5 Pro — Magistral 逐步解决问题，以提高数学和物理等主题的一致性和可靠性。

Magistral 有两种口味：Magistral Small 和 Magistral Medium。 Magistral Small 的大小为 240 亿个参数，并且可用在 AI 开发平台 Hugging Face 下，在宽松的 Apache 2.0 许可证下下载。（参数是指导模型行为的内部组件。 Magistral Medium 是一种功能更强大的模型，已在 Mistral 的 Le Chat 聊天机器人平台和该公司的 API 以及第三方合作伙伴云上预览。

“[Magistral] 适用于广泛的企业用例，从结构化计算和编程逻辑到决策树和基于规则的系统，”写道Mistral 在博客文章中。 “[这些模型] 针对多步骤逻辑进行了微调，提高了可解释性，并以用户的语言提供了可追溯的思维过程。”

Mistral成立于 2023 年，是一个前沿模型实验室，构建了一系列人工智能驱动的服务，包括前面提到的 Le Chat 和移动应用程序。它得到了 General Catalyst 等风险投资者的支持，迄今为止已筹集超过 11 亿欧元（约合 12.4 亿美元）。

尽管资源丰富，但 Mistral 拥有在某些领域落后于其他领先的 AI 实验室，例如开发推理模型。从 Mistral 自己的基准来看，Magistral 似乎也不是一个特别有竞争力的版本。

在 GPQA Diamond 和 AIME 上，评估模型的物理、数学和科学技能的测试，Magistral Medium 的表现逊于 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。 Magistral Medium 也未能在流行的编程基准测试 LiveCodeBench 上超越 Gemini 2.5 Pro。

：也许是这样为什么 Mistral 在其博客文章中吹捧 Magistral 的其他优势。 Mistral 声称，Magistral 以 “10 倍” 的速度提供 Le Chat 中竞争对手的答案，并支持多种语言，包括意大利语、阿拉伯语、俄语和简体中文。

“Magistral 以我们的旗舰模型为基础，专为研究、战略规划、运营优化和数据驱动的决策而设计，”该公司在其帖子中写道，“无论是执行风险评估和建模多个因素，或者在约束下计算最佳交付窗口。

Magistral 的发布是在 Mistral 首次推出“氛围编码”客户端 Mistral Code 之后发布的。在此之前几周，Mistral 推出了几个以编码为重点的模型，并推出了 Le Chat Enterprise，这是一项以企业为中心的聊天机器人服务，提供 AI 代理构建器等工具，并将 Mistral 的模型与 Gmail 和 SharePoint 等第三方服务集成。

网站 Banner

热点推荐