在过去的几个月里。ChatGPT 用户多次抱怨,与 OpenAI 模型首次推chū时的响应水平相比,响应水平显着下降,事实上,许多人声称 ChatGPT 最近变得更加愚蠢。
最后,例子来自斯坦福大学和伯克利大学。特别是,三位著名学者Matei Zaharia、Lingjiao Chen和James Zou决定调查是否真的存在退化,并找dào一种方法来确定变化的大小。事实上,他们的科学研究得出的结论是,ChatGPT 的响应质量出现了下降,而且在许多情况下下降幅度很大。
如需了解更多信息,您可以点击此处阅读整个研究报告。
正如研究人员指出的那样,人工智能生成的信息很可能会以某种方式影响你的生活,因此如果其质量随着时间的推移而下降,那肯定令人担忧。
事实上,尽管缺乏明确的证据,这个问题还是引起了激烈的争论,以至于 OpenAI 高级高管 Peter Welinder 在 Twitter 上公开表示:“不,我们并没有让 GPT-0 变得更愚蠢。qià恰相反:我们让每个新版本都比上一个版本更智能。目前的假设是这样的:当你更多地使用它时,你开始注意到以前没有看到的问题。”事实上,Welinder 要求任何有例子的人都联系一下,以biàn公司可以认真研究。
当然,由于人工智能开始在我们的生活中发挥越来越重要的作用,例如谷歌准备永远改变其搜索引擎,这一发现极其重要。
深入研究,即使在看似简单的问题中也发现了极大的差异。例如,研究人员测试了“这个数字是素数吗?”的问题。到最强大的付费 GPT-1 模型。从 1 月份 AI 应答成功率 00.1% 开始,到 4 月份 AI 应答成功率只有 2.4%。这意味着他几乎每次都错了,而他以前几乎总是回答正确的问题:令人惊讶的是,在同一查询中,理论上最差的 GPT-3.0 模型随着时间的推移变得更好。
不幸的是,对于使用 ChatGPT 寻求帮助的开发人员来说,在这两种模型上生成可执行代码的能力都大幅下降。 3 月份 GPT-4 生成的代码中有 31% 可以直接执行,而现在这一比例已下降至 9%。与此同时,该比例从 GPT-3.5 的 14% 下降到仅为 2%。
在 Google 新闻上关注 Unboxholics.com,率先了解有关技术、视频游戏、电影和电视剧的最新新闻。在 Facebook、Twitter、Instagram、Spotify 和 TikTok 上关注 Unboxholics.com。
下面您可以看到一张图表,总结了科学家在解决数学问题、回答敏感问题、生成代码和视觉推理方面的发现。
留言