应对AI提示注入攻击,OpenAI为ChatGPT推出锁定模式与风险标签
创始人
2026-02-14 11:20:36
0

IT之家 2 月 14 日消息,OpenAI 于 2026 年 2 月 13 日发布公告,宣布为 ChatGPT 新增高级安全设置。

OpenAI 表示,随着 AI 系统开始承担更复杂的任务,尤其是涉及网页与外部应用的场景,安全风险也随之激增,其中一种日益凸显的新型风险便是“提示注入”(prompt injection)。在此类攻击中,第三方会通过提示词误导 AI 以使其执行恶意指令,或诱导其泄露内部敏感信息。

为帮助用户与组织降低提示注入攻击风险,OpenAI 宣布推出两项新的防护措施,IT之家总结如下:

  • 其一是 ChatGPT 的“Lockdown Mode(锁定模式)”,这是一项面向高风险用户的可选高级安全设置;
  • 其二是针对部分可能引入额外风险的能力,在 ChatGPT、ChatGPT Atlas 与 Codex 中统一新增“Elevated Risk”风险标签。

OpenAI 称,这些新增措施建立在其现有的多层防护之上,包括沙箱机制、针对基于 URL 的数据外泄的防护、监测与执行机制,以及企业级控制功能,例如基于角色的访问控制与审计日志等。

据介绍,锁定模式是一项可选的高级安全设置,主要面向少量高度重视安全的用户群体,例如大型组织的高管或安全团队,用于提升对高级威胁的防护能力。

OpenAI 强调,大多数用户并不需要启用锁定模式。其核心目标是通过严格限制 ChatGPT 与外部系统的交互方式,降低提示注入等攻击导致的数据外泄风险。

OpenAI 表示,锁定模式会以确定性方式禁用 ChatGPT 中某些可能被攻击者利用的工具与能力,从而避免攻击者通过提示注入等手段,将用户对话或已连接应用中的敏感数据外传。

作为例子,OpenAI 提到,在锁定模式下,ChatGPT 的网页浏览功能将被限制为仅访问已缓存内容。该限制旨在防止敏感数据在浏览过程中被攻击者获取或外泄。对于某些无法提供强确定性数据安全保证的功能,锁定模式下则会直接完全禁用。

OpenAI 同时指出,ChatGPT 的商业订阅版本已提供企业级数据安全能力,而锁定模式是在此基础上的进一步增强。该模式目前适用于 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare 与 ChatGPT for Teachers。管理员可以在 Workspace Settings 中通过创建新角色来启用锁定模式。启用后,锁定模式会在现有管理员设置之上叠加额外限制。

由于部分关键工作内容仍依赖外部应用,OpenAI 表示 Workspace 管理员仍可获得更细粒度的控制能力:管理员可以精确选择哪些应用、以及这些应用内的哪些具体操作,可在锁定模式下提供给用户使用。

OpenAI 还提到,除锁定模式外,其 Compliance API Logs Platform 还可提供对应用使用情况、共享数据与连接来源的更详细可见性,帮助管理员保持监管与审计能力。OpenAI 表示,计划在未来几个月将锁定模式提供给消费者用户。

在风险标签方面,OpenAI 表示,AI 产品在连接应用与网页后往往更有帮助,公司也在保护连接数据安全方面投入大量工作。但与此同时,某些与网络相关的能力会引入新的风险,而这些风险尚未被行业现有的安全与防护措施完全解决。OpenAI 认为,一部分用户可能愿意承担这些风险,因此重要的是让用户能够自行决定是否、以及如何使用这些能力,尤其是在处理个人私密数据时。

OpenAI 表示,其做法是在产品内为可能引入额外风险的功能提供使用指引。为使这一指引更清晰、更一致,公司正在标准化对一小部分现有能力的标注方式。这些功能将以统一的“Elevated Risk”标签呈现在 ChatGPT、ChatGPT Atlas 与 Codex 中,使用户在不同产品中遇到同类能力时都能获得一致提示。

OpenAI 以 Codex 举例称,在其编程助手产品中,开发者可以授予 Codex 网络访问权限,使其能够在网页上执行诸如查阅文档等操作。但相关设置界面将显示“风险提升”标签,并提供明确说明,包括启用后会发生哪些变化、可能引入哪些风险、以及何时适合开启该访问权限。

相关内容

秀AI产业硬核实力 华强北...
5月14日,深圳会展中心(福田)1号馆化身“斗秀场”——2026全...
2026-05-16 16:34:43
世界数字教育创新十大案例来...
根据教育部消息,5月12日,《世界数字教育创新十大案例——场景驱动...
2026-05-16 16:29:35
蚂蚁百灵开源Ring-2....
钛媒体App 5月15日消息,蚂蚁百灵宣布开源旗舰推理模型Ring...
2026-05-15 22:20:22
豆包输入法macOS版正式...
爱思助手消息,5月12日,继安卓、iOS版本之后,豆包输入法苹果m...
2026-05-15 13:23:42
快手为何计划分拆可灵AI?
文|投资时间网 李路 当漫剧百强榜中AI仿真人短剧的占比从7%激...
2026-05-14 17:38:53
速递|Anthropic发...
图片来源:Anthropic 据知情人士透露,Anthropic ...
2026-05-14 17:28:33

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...