OpenAI推出开源工具助力开发者构建青少年安全应用
创始人
2026-03-26 01:33:50
0

OpenAI周二宣布发布一套提示词工具,帮助开发者构建对青少年更安全的应用程序。该AI实验室表示,这套青少年安全策略可与其开源安全模型gpt-oss-safeguard配合使用。

开发者无需从零开始思考如何让AI对青少年更安全,可以直接使用这些提示词来增强其构建的应用。这些提示词涵盖了图形暴力和性内容、有害身体理想和行为、危险活动和挑战、浪漫或暴力角色扮演以及年龄限制商品和服务等问题。

这些安全策略以提示词形式设计,使其能够轻松兼容除gpt-oss-safeguard之外的其他模型,尽管在OpenAI自身生态系统中可能最为有效。

在编写这些提示词时,OpenAI与AI安全监督机构Common Sense Media和everyone.ai合作。

Common Sense Media的AI与数字评估负责人Robbie Torney在声明中表示:"这些基于提示词的策略有助于为整个生态系统建立有意义的安全底线,由于它们以开源形式发布,可以随时间推移进行调整和改进。"

OpenAI在其博客中指出,包括经验丰富的团队在内的开发者,经常难以将安全目标转化为精确的操作规则。

公司写道:"这可能导致保护漏洞、执行不一致或过度宽泛的过滤。明确、范围清晰的策略是有效安全系统的关键基础。"

OpenAI承认这些策略并非AI安全复杂挑战的完整解决方案。但它建立在此前的努力基础上,包括产品级安全保障措施,如家长控制和年龄预测功能。去年,OpenAI更新了其大语言模型的指导原则,即Model Spec,以解决AI模型应如何与18岁以下用户互动的问题。

然而,OpenAI本身的记录并非完全清白。该公司正面临多起诉讼,涉及在极端使用ChatGPT后自杀身亡的用户家属。这些危险关系往往在用户绕过聊天机器人的安全保障后形成,而没有任何模型的防护措施是完全不可突破的。尽管如此,这些策略至少是向前迈进的一步,特别是因为它能帮助独立开发者。

Q&A

Q1:gpt-oss-safeguard是什么?它有什么作用?

A:gpt-oss-safeguard是OpenAI的开源安全模型,可以与新发布的青少年安全策略提示词配合使用,帮助开发者构建对青少年更安全的AI应用程序。

Q2:这些安全策略涵盖哪些问题?

A:这些安全策略主要解决图形暴力和性内容、有害身体理想和行为、危险活动和挑战、浪漫或暴力角色扮演以及年龄限制商品和服务等青少年安全相关问题。

Q3:开发者为什么需要这些安全提示词?

A:因为开发者,包括经验丰富的团队,经常难以将安全目标转化为精确的操作规则,这可能导致保护漏洞、执行不一致或过度宽泛的过滤问题。

相关内容

腾讯李强:加大与中国移动在...
2026移动云大会昨日圆满落幕。大会现场,腾讯集团副总裁、政企业务...
2026-05-10 17:08:41
让企业安全用好AI,中国移...
作者:闫滟 来源:科技最前线 (kejizqx) 大模型落地政企市...
2026-05-10 17:06:50
人工智能产业日报(05.0...
公司动态 百度文心5.1正式发布:搜索能力国内第一!预训练成...
2026-05-10 17:02:31
当AI学会了“删库跑路”,...
“一场Agent删库事故,意外揭开数据库体系的AI重构进程 202...
2026-05-09 19:47:42

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...