硬核观察 #1089 ChatGPT 的数学成绩更差了
创始人
2024-03-02 16:44:16
0

ChatGPT 的数学成绩更差了

研究人员给聊天机器人布置了一项基本任务:识别某个数字是否是质数。这种数学问题对人来说很复杂,但对电脑来说却很简单。研究人员向 ChatGPT 输送了 1000 个不同的数字。三月份,GPT-4 能正确识别 84% 的数字是否为质数。(坦率地说,对于一台计算机来说,这样的表现非常一般。)到了六月份,它的成功率下降到了 51%。在 8 项不同的任务中,GPT-4 有 6 项变得更糟。这种退化是人工智能开发人员所熟知的漂移现象的一个例子,即试图改进极其复杂的人工智能模型的一部分,却使模型的其他部分表现更差。

消息来源:华尔街日报

老王点评:GPT 这种人工智能的“思考”方式和我们人类是不同的,或许以后人工智能变聪明的方式是让它自己调整自己。

中国论文数高居第一背后可能的原因

日本文部科学省发布的最新排名显示,中国发表论文数再次高居第一,连续两年保持“三冠王”地位。中国的论文总数的全球份额为 24.6%,与第 2 位的美国相比高出 8.5 个百分点。引用数排名前 10% 的“受关注论文”的份额为 28.9%,排名前 1% 的“顶尖论文”的份额为 29.3%,均拉大了与美国的差距。有观点指出,中国的排名上升是因为本国研究人员相互引用了彼此的论文。这一比例美国为 29%,日本为 19%,而中国达到了 61%。值得注意的是,中国论文在英国《自然》和美国《科学》的论文数占比,中国仅为近 2 成,仍远低于美国的约 7 成,排名在英国和德国之后。

消息来源:日经社

老王点评:要客观认识中国在科技方面的进步。

CNET 删除旧文以改进搜索排名

科技新闻网站 CNET 从 7 月开始删除了数千篇文章,它在内部备忘录中称,此举以向谷歌展示其内容 “新鲜、相关,值得在搜索结果中排名高于竞争对手”。CNET 称,“在理想的情况下,我们会将所有内容永久保留在网站上。不幸的是,我们受到了现代互联网的惩罚”。CNET 表示,他们会根据“页面浏览量、反向链接以及自上次更新时间等”来删除“没有为有意义的受众提供服务”的页面。但谷歌建议不要采用这种做法,表示不会因为删除过时的文章而提升整个网站的印象。

消息来源:Gizmodo

老王点评:虽然谷歌是这样说的,但是 CNET 这样做想必是有数据支撑的。无论如何,删除旧页面才能提升网站排名,我认为事情本不应该是这样的。

相关内容

固德威与阿里云签署AI深入...
2026年1月20日,固德威与阿里云在杭州举行AI深入合作签约仪式...
2026-01-21 15:17:45
中信科智联申请AI模型对齐...
国家知识产权局信息显示,中信科智联科技有限公司申请一项名为“AI模...
2026-01-21 14:48:30
陈辉:AI家装业务仍是东易...
乐居财经 李兰1月20日,东易日盛于北京举办“穿越·共生”老友茶叙...
2026-01-21 14:47:29
阿里AI差旅,动了谁的蛋糕...
钉钉、高德、支付宝联手推出 AI 差旅,差旅圈一下子热闹起来。 阿...
2026-01-21 12:47:12
工信部谈AI抢饭碗:提升A...
南都讯 记者李玲 发自北京 AI+制造会优先支持哪些行业?如何平衡...
2026-01-21 12:18:32
开局震撼:MiniMax创...
2026-01-21 11:47:49

热门资讯

如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
Textual:为 Pytho... 快速入门使用 TextualPython 在 Linux 上有像 TkInter 这样的优秀 GUI...
硬核观察 #1245 Open... #1 OpenAI 悄然删除禁止将 ChatGPT 用于 “军事和战争” 的禁令在 1 月 10 日...
使用时间序列数据,用开源工具助... InfluxData 是一个开源的时间序列数据库平台。下面介绍了它是如何被用于边缘应用案例的。收集到...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
硬核观察 #1249 LG 洗... #1 LG 洗衣机每天上传近 4GB 的数据?一个名为 Johnie 的 LG 洗衣机用户发现,他的...
2024 年 Linux 和开... 让我们尝试预测未来吧!新的一年快乐,朋友们 ✨2024 年的钟声已经敲过,我们有必要去预见一下将塑造...