Robinhood 首席执行官的人工智能数学初创公司 Harmonic 推出人工智能聊天机器人应用程序
        由 Robinhood 首席执行官 Vlad Tenev 共同创立的人工智能初创公司 Harmonic 周一宣布推出 iOS 和 Android 聊天机器人应用程序的测试版,用户可以在其中访问其人工智能模型亚里士多德。

         通过此次发布,该公司旨在扩大对亚里士多德的访问,Harmonic 声称亚里士多德可以为涉及数学推理的问题提供“无幻觉”的答案——考虑到当今人工智能模型的可靠性问题,这是一个大胆的主张。 Harmonic 专注于创造“数学超级智能”或 MSI;这家初创公司最终希望帮助所有依赖数学领域的用户,包括物理学、统计学和计算机科学。

         “[亚里士多德] 是人们可以使用的第一款进行推理并正式验证输出的产品,”Harmonic 首席执行官兼联合创始人 Tudor Achim 在接受 TechCrunch 采访时说。 “在亚里士多德支持的领域,即定量推理领域,我们实际上保证不存在幻觉。”

         最终,Harmonic 说它还计划发布一个 API,让企业访问亚里士多德,以及一个面向消费者的 Web 应用程序。

         Harmonic 表示,亚里士多德通过正式测试(意味着问题被翻译成机器可读格式)在 2025 年国际数学奥林匹克竞赛 (IMO) 上获得了金牌。 谷歌和OpenAI也开发了人工智能模型,在今年的IMO上取得了金牌表现,但通过了自然语言进行的非正式测试。

         Harmonic 表示不会发布此时亚里士多德的其他基准。

         亚里士多德的测试版发布距离 Harmonic 在 Kleiner Perkins 领投的 B 轮融资中以 8.75 亿美元的估值筹集了 1 亿美元仅几周。 Achim 声称 Harmonic 正在“非常迅速地推进”其实现 MSI 的道路,考虑到他的初创公司的雄心壮志,投资者认为这是一个公平的估值。

         几家领先的科技公司专注于训练他们的人工智能模型来解决数学问题。 人工智能能做数学本身就很有价值,但数学也被认为是一个独特的可验证领域,需要核心推理技能。 开发这些功能的系统也可能在其他领域有用。

         Achim 表示,Harmonic 通过让亚里士多德用开源编程语言 Lean 生成响应来实现其超精确的解决方案。 亚里士多德说,在给用户答案之前,模型会通过以下方式仔细检查解决方案是否正确不涉及人工智能的算法过程。 Harmonic 的首席执行官指出,类似的技术用于验证医疗设备和航空等高风险领域的输出。

         即使在狭窄的领域,从 AI 模型实现无幻觉的性能也是一项极其艰巨的任务。 研究发现,即使是领先的人工智能模型也会出现很多幻觉,而且问题似乎并没有好转。OpenAI 最新的人工智能推理模型比旧模型更产生幻觉。