OpenAI推出开源工具助力开发者构建青少年安全应用
创始人
2026-03-26 01:33:50
0

OpenAI周二宣布发布一套提示词工具,帮助开发者构建对青少年更安全的应用程序。该AI实验室表示,这套青少年安全策略可与其开源安全模型gpt-oss-safeguard配合使用。

开发者无需从零开始思考如何让AI对青少年更安全,可以直接使用这些提示词来增强其构建的应用。这些提示词涵盖了图形暴力和性内容、有害身体理想和行为、危险活动和挑战、浪漫或暴力角色扮演以及年龄限制商品和服务等问题。

这些安全策略以提示词形式设计,使其能够轻松兼容除gpt-oss-safeguard之外的其他模型,尽管在OpenAI自身生态系统中可能最为有效。

在编写这些提示词时,OpenAI与AI安全监督机构Common Sense Media和everyone.ai合作。

Common Sense Media的AI与数字评估负责人Robbie Torney在声明中表示:"这些基于提示词的策略有助于为整个生态系统建立有意义的安全底线,由于它们以开源形式发布,可以随时间推移进行调整和改进。"

OpenAI在其博客中指出,包括经验丰富的团队在内的开发者,经常难以将安全目标转化为精确的操作规则。

公司写道:"这可能导致保护漏洞、执行不一致或过度宽泛的过滤。明确、范围清晰的策略是有效安全系统的关键基础。"

OpenAI承认这些策略并非AI安全复杂挑战的完整解决方案。但它建立在此前的努力基础上,包括产品级安全保障措施,如家长控制和年龄预测功能。去年,OpenAI更新了其大语言模型的指导原则,即Model Spec,以解决AI模型应如何与18岁以下用户互动的问题。

然而,OpenAI本身的记录并非完全清白。该公司正面临多起诉讼,涉及在极端使用ChatGPT后自杀身亡的用户家属。这些危险关系往往在用户绕过聊天机器人的安全保障后形成,而没有任何模型的防护措施是完全不可突破的。尽管如此,这些策略至少是向前迈进的一步,特别是因为它能帮助独立开发者。

Q&A

Q1:gpt-oss-safeguard是什么?它有什么作用?

A:gpt-oss-safeguard是OpenAI的开源安全模型,可以与新发布的青少年安全策略提示词配合使用,帮助开发者构建对青少年更安全的AI应用程序。

Q2:这些安全策略涵盖哪些问题?

A:这些安全策略主要解决图形暴力和性内容、有害身体理想和行为、危险活动和挑战、浪漫或暴力角色扮演以及年龄限制商品和服务等青少年安全相关问题。

Q3:开发者为什么需要这些安全提示词?

A:因为开发者,包括经验丰富的团队,经常难以将安全目标转化为精确的操作规则,这可能导致保护漏洞、执行不一致或过度宽泛的过滤问题。

相关内容

小微迫切需要AI
一个人、一台电脑、一套AI工具,能把仿真花卖往全球;几十人的外贸小...
2026-06-26 00:52:43
我国将加快推进开源体系建设
在今日(6月25日)北京举行的2026开放原子开源生态大会上,工业...
2026-06-26 00:49:39
从拼算力到拼电力:AI重塑...
来源:证券时报 每一届夏季达沃斯,“能源”都是绕不开的话题。但在2...
2026-06-25 09:32:00
微信生态AI持续上新
6月23日,腾讯公关总监张军在社交平台透露,企业微信即将推出名为“...
2026-06-25 09:25:58
搜狐AI健康 | 真人医生...
图说 / 蚂蚁旗下健康AI产品蚂蚁阿福近期正式推出“医生把关”功能...
2026-06-24 09:57:21

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...