OpenAI 发布 o3-pro,这是其 o3 AI 推理模型的增强版
        OpenAI 推出了 o3-pro,该公司声称这是其迄今为止最强大的 AI 模型。

         O3-pro 是 OpenAI'so3 的一个版本,OpenAI'so3 是这家初创公司今年早些时候推出的推理模型。 与传统的 AI 模型不同,推理模型可以逐步解决问题,使它们能够在物理、数学和编码等领域更可靠地执行。

         O3-pro 从周二开始可供 ChatGPT Pro 和 Team 用户使用,取代 theo1-promodel。 Enterprise 和 Edu 用户将获得访问,OpenAI 说。 截至今天下午,O3-pro 也在 OpenAI 的开发者 API 中上线。

         O3-pro 在 API 中的定价为每百万个输入令牌 20 美元和每百万个输出令牌 80 美元。 输入令牌是馈送到模型中的令牌,而输出令牌是模型根据输入令牌生成的令牌。

         一百万个输入令牌相当于大约 750,000 个单词,比“War and Peace”长一点。

         OpenAI o3-pro 在 Pro 的模型选择器中可用,并且从今天开始的团队用户,取代 OpenAI o1-pro。Enterprise 和 Edu 用户将在一周后获得访问权限。由于 o3-pro 使用与 o3 相同的底层模型,因此可以在 o3 系统卡中找到完整的安全详细信息....— OpenAI (@OpenAI)2025 年 6 月 10 日

         “在专家评估中,评论者在每个测试类别中始终更喜欢 o3-pro 而不是 o3,尤其是在科学、教育、编程、商业和写作帮助等关键领域,”OpenAI 写入 changelog 中。 “评论者还将 o3-pro 评为在清晰度、全面性、指令遵循和准确性方面始终较高。 据 OpenAI 称,

         O3-pro 可以使用各种工具,使其能够搜索网络、分析文件、推理视觉输入、使用 Python、利用内存个性化其响应等等。 根据 OpenAI 的说法,作为一个缺点,该模型的响应通常需要比 o1-pro 更长的时间才能完成。

         O3-pro 还有其他限制。 在 ChatGPT 中与模型的临时聊天暂时被禁用,而OpenAI 解决了一个 “技术问题”。 O3-pro 无法生成图像。 而 OpenAI 的 AI 驱动的工作区功能 Canvas 不受 o3-pro 支持。

         从好的方面来说,根据 OpenAI 的内部测试,o3-pro 在流行的 AI 基准测试中取得了令人印象深刻的分数。 在评估模型数学技能的 AIME 2024 上,o3-pro 的得分高于 Google 表现最好的 AI 模型 Gemini 2.5 Pro。 O3-pro 还击败了 Anthropic 最近发布的 Claude 4 Opuson GPQA Diamond,这是博士级别的测试科学知识。