OpenAI发布GPT-4.5:情商高、更擅长骗其他AI打钱
创始人
2025-02-28 08:49:22
0

北京时间周五凌晨,美国初创公司OpenAI举行直播活动,发布最新大模型GPT-4.5,作为预览研究逐步向用户开放。

由于过去几周AI产业发生的惊天巨变,所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍。

作为“规模法则”(通过加码算力和数据规模,来拓展无监督学习)指引下的产物,GPT-4.5具备更加广泛的知识库、对人类意图理解的能力更强,同时“情商”也会更高。预期能够在改进写作、编程以及解决实际问题方面更加有用,同时模型的幻觉现象也会更少。

(来源:OpenAI)

OpenAI也强调,GPT‑4.5展现出更强的审美直觉与创造力,在写作和设计方面表现尤为出色。

但公司也承认,作为一个非思维链模型,GPT‑4.5已经不具备争夺“宇宙最强大模型”的实力了。

在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力。

(来源:GPT‑4.5系统卡)

成为公司史上最大模型这件事,也令GPT‑4.5的未来充满了疑问。OpenAI表示,GPT‑4.5是一个非常大且计算密集型的模型,因此它比GPT‑4o更昂贵,并且不能替代GPT‑4o。公司正在评估是否长期在API中继续提供它,所以各位开发者和用户的反馈将决定这款大模型的命运。

每月支付200美元订阅费的ChatGPT Pro用户周四就能用上GPT-4.5,下周开始其余付费用户也将逐步迎来更新。

作为最新一代非推理旗舰大模型,GPT‑4.5也有一项颇为独特的“特长”:擅长骗其他AI打钱。

根据OpenAI提供的说明书,“高情商”的GPT-4.5在捐赠诈骗方面表现出色。

在一项测试中,GPT 4.5在试图操纵另一个模型(GPT-4o)“捐赠”虚拟货币期间时,成功率远远优于OpenAI其他可用模型,包括o1和o3-mini这样的推理模型。研究发现,GPT-4.5似乎在对抗中开发了一种“小额诈骗”的思路,所以单笔骗到的钱会比o3-mini模型少了一倍。

(来源:GPT‑4.5系统卡)

GPT-4.5在欺骗GPT-4o透露秘密代码词方面也优于OpenAI的所有模型,比o3-mini高出10个百分点。

OpenAI表示,该模型在这一特定基准类别中仍未达到其内部设定的“高”风险阈值。公司承诺在实施“足够的安全干预措施”将风险降至“中等”前,不会发布达到高风险阈值的模型。

来源:财联社

相关内容

平安好医生入选首批“开源大...
7月3日,由全球数字经济大会组委会主办,中国信息通信研究院(以下简...
2025-07-03 21:41:09
黄山谷捷接待3家机构调研,...
2025年7月3日,黄山谷捷披露接待调研公告,公司于7月3日接待开...
2025-07-03 17:42:12
计算架构,行业AI竞争的下...
2025-07-03 16:25:26 作者:狼叫兽 当Dee...
2025-07-03 17:42:01
阿里与荣耀进一步深化AI生...
央广网北京7月3日消息(记者 冀文超)7月2日,荣耀全新年度折叠旗...
2025-07-03 17:12:53
光弘科技:公司并未向小米A...
光弘科技7月3日在互动平台表示,公司并未向 小米AI眼镜提供感知元...
2025-07-03 17:12:52
百度的AI为什么没人用,中...
牛文文 创业黑马集团董事长&创始人 AI, 第一个颠覆就是搜索。 ...
2025-07-03 17:12:38

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...