Sam Altman 谈到了 GPT-5 的“坎坷”推出、带回 4o 和“图表犯罪”
        在周五的 Redditask-me-anythingsession 上,OpenAI 首席执行官 Sam Altman 和 GPT-5 团队的主要成员收到了有关新模型的问题,并要求恢复其之前的模型 GPT-4o。

         他们还向奥特曼询问了演讲中最尴尬——也许也是最有趣的——的错误,即“图表犯罪”。

         GPT-5推出的新功能之一是实时路由器它决定对特定提示使用哪个模型,要么快速响应,要么花额外的时间“思考”答案。

         但是 AMA 中的多人在 r/ChatGPT RedditcomplainedGPT-5 对他们来说效果不如 4o。 奥特曼表示,GPT-5 看起来“笨拙”的原因是路由器在周四推出时无法正常工作。

         “从今天开始,GPT-5 看起来会更聪明。 昨天,我们有一个 sev,自动切换器在一天中的大部分时间都无法使用,结果是 GPT-5 似乎更愚蠢。 此外,我们正在制作一些对决策边界如何工作的干预措施应该有助于您更频繁地获得正确的模型。 我们将使哪个模型在回答给定查询更加透明,“Altman 承诺。

         尽管如此,AMA 的人们还是努力游说将 4o 带回 Plus 订阅者,以至于 Altman 承诺至少会对此进行调查。 “我们正在考虑让 Plus 用户继续使用 4o。 我们正试图收集更多关于权衡的数据,“他写道。

         和 Altman 还承诺,“我们是随着我们完成推出,将对 Plus 用户的速率限制提高一倍。 这应该让人们有机会玩和学习新模型,将其采用到他们的用例中,而不必担心每月提示用完。

         不出所料,他还被问及团队在现场演示中展示的极其不准确的图表,这很快成为许多“图表犯罪”笑话的焦点。 该图表显示的基准分数较低,条形要高得多。

        

OpenAI 的 GPT-5“图表犯罪”。图像学分:OpenAI

        奥特曼在 AMA 期间没有回答有关该图表的问题,但周四他确实称该图表是 X 上的“大型图表搞砸”。 其他人则指出已发表的博客文章中的图表是正确的。

         但损害已经造成。 随之而来的是关于在公司演示中使用 GPT 制作图表的笑话。 GPT-5 审稿人 Simon Willison 拥有抢先体验经验,总体上喜欢该模型的性能,他也指出,将数据转换为表格是“GPT-5 失败的好例子”。

         无论如何,奥特曼承诺修复人们似乎最关心的项目。 他在 AMA 结束时承诺:“我们将继续努力让事情稳定下来,并将继续听取反馈。