苹果AI研究团队发现了大型语言模型推理能力的重大弱点

根据一项新发表的研究,苹果的人工智能研究团队发现了大型语言模型推理能力的重大弱点。

image

这项研究发表在 arXiv 上,概述了苹果对一系列领先语言模型的评估,包括来自 OpenAI、Meta 和其他知名开发商的模型,以确定这些模型处理数学推理任务的能力。研究结果表明,即使问题措辞的细微变化也会导致模型性能出现重大差异,从而削弱其在需要逻辑一致性的场景中的可靠性。

苹果提醒人们注意语言模型中的一个长期存在的问题:它们依赖模式匹配而不是真正的逻辑推理。在几项测试中,研究人员证明,在问题中添加不相关的信息(不应影响数学结果的细节)会导致与模型截然不同的答案。

根据这项研究,所有测试的模型,从较小的开源版本(如 Llama)到专有模型(如 OpenAI 的 GPT-4o),在面对输入数据中看似无关紧要的变化时,性能都显著下降。 苹果建议人工智能可能需要将神经网络与传统的基于符号的推理(称为神经符号人工智能)相结合,以获得更准确的决策和解决问题的能力。

上一篇

苹果向开发者提供 iOS 18.1 和 iPadOS 18.1 第七个测试版

下一篇

在这个10月:苹果将会有四款主要产品亮相
相关推荐
苹果官宣:WWDC 2024主题发布会将于6月11日举行
iQOO Neo 9 Pro现身跑分平台 搭载联发科天玑9300
爆料:iPhone 16 Pro Max有类似于“古铜色调”的配色
新的机模图片流出 展示iPhone 16 Pro的3个配色
四款iPhone 17都将配备升级后的2400万像素前置摄像头
苹果在iOS 18中重新设计TestFlight应用
评论(0)
游客的头像
表情
全部评论 只看作者
最新热门
  1. 暂时还没有评论哦