OpenAI的o1系列模型登场,将取代GPT-4成AI新宠?
创始人
2024-09-13 15:55:49
0

北京时间9月13日凌晨1点,OpenAI发布了其首款具备强大推理能力的大语言模型——o1系列模型。这一系列模型包括o1-preview预览版和o1-mini迷你版。

图片来源于OpenAI官网

o1系列模型的核心在于其创新的“思维链”(chain of thought)训练模式。这种训练方式要求模型在回答复杂问题前,先生成一个内部的思考过程,类似于人类在处理复杂问题时的一步步推理。通过这种方式,o1模型能够识别并纠正错误,将复杂问题分解成更简单的部分,并在必要时尝试不同的策略。

OpenAI的CEO Sam Altman在社交媒体上表示:“需要耐心等待的时刻结束了!”

图片来源于网络

o1-preview作为o1模型的预览版,每周限制使用30条消息,是OpenAI向付费用户和开发者推出的初步版本。而o1-mini则是o1系列中的小尺寸版,价格比o1-preview便宜80%,每周限制使用50条消息。尽管存在使用次数的限制,但这两款模型在编码任务等方面的能力均十分出色,尤其是o1-mini,在生成和调试复杂代码方面表现出色,特别适合开发人员使用。

o1模型在多个基准测试中展现了其强大的逻辑推理能力。在国际数学奥林匹克(IMO)资格考试中,o1模型解决了83%的问题,远超GPT-4的13%解决率。在OpenAI模拟的Codeforces主办的编程竞赛中,o1模型表现优于 93% 的竞争对手。此外,在物理、化学和生物等学科的基准测试(GPQA)中,o1模型的准确率甚至超越了人类博士水平的准确率。

图片来源于网络

与GPT-4相比,o1模型在逻辑推理能力上取得了显著进步。GPT-4虽然已在多个领域展现强大能力,但在处理复杂推理任务时仍有不足。o1模型通过“思维链”训练模式,显著提升了其逻辑推理能力,在多个基准测试中超越GPT-4,甚至达到或超越人类专家的水平。

然而,o1模型的使用并非没有成本。OpenAI表示,o1模型的使用成本至少是GPT-4的3倍,初始发送信息数也有限制。

对于开发者而言,访问o1模型的成本较高,API中o1-preview每100万个输入token收费15美元,是GPT-4成本的三倍;每100万个输出token收费60美元,是GPT-4成本的四倍。这种高昂的使用成本可能会限制o1模型在部分场景下的应用。

o1模型在功能上也有所局限,目前仅支持纯文本输入输出,无法浏览实时网页、上传文件和图片等。此外,OpenAI也承认o1模型在某些情况下可能产生“幻觉”问题。尽管如此,o1模型在逻辑推理方面的突破为未来AI应用提供了无限可能。OpenAI设想医疗研究人员可以使用o1注释细胞测序数据,物理学家可以生成量子光学所需的复杂数学公式,开发人员则可以构建和执行多步骤工作流程。

OpenAI计划在未来继续推出o1模型的更新版本,进一步提升其推理能力,并计划增加浏览网页、文件和图片上传等功能。此外,该公司还表示将继续开发和发布GPT系列中的模型。

相关内容

华为盘古团队否认开源模型抄...
智通财经获悉,近日,有消息指,华为盘古大模型涉嫌抄袭阿里巴巴通义千...
2025-07-07 16:14:44
逃离AI叙事陷阱,小鹏G7...
图片来源:小鹏G7 7月3日,小鹏G7正式上市,推出3款车型,起售...
2025-07-06 08:12:21
约翰斯·霍普金斯大学研发新...
IT之家 7 月 5 日消息,据新华社今日报道,美国约翰斯・霍普金...
2025-07-05 21:12:58
伊朗少壮派曲线救国,冒天下...
当地时间2025年7月1日,伊朗空军前军官,阿塔·巴赫拉米上尉接受...
2025-07-05 09:41:37
“AI搜索功能很强大,但我...
这要命的幻觉率! 听筒Tech(ID:tingtongtech)原...
2025-07-04 21:42:16
拥抱AI:开放与理性|如何...
7月4日,2025亚布力论坛第十一届创新年会在浙江杭州圆满举行。在...
2025-07-04 21:42:04

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...