AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
创始人
2024-07-24 22:36:03
0

智东西(公众号:zhidxcom

作者|香草

编辑|李水青

智东西7月24日报道,今日,中国人工智能产业发展联盟(AIIA)安全治理委员会举办了成果发布会。会上,中国信息通信研究院人工智能研究所安全与元宇宙部主任石霖,解读了成立半年来委员会形成的组织架构,安全、治理两大工作组的工作情况,并启动了AI安全守护计划,发布了三大类别的安全评测结果。

AIIA安全治理委员会成立于2023年12月底,经过半年运营,现有治理组、安全组两个工作组,近百家单位加入,主任单位由中国信通院牵头,副主任单位包括多家知名企业和高校。

其中,治理组工作围绕AI治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。

今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建立AI保险机制等。

一、成立半年近百家单位加入,形成安全、治理两大工作组

AIIA安全治理委员会成立于2023年12月底,经过半年的运营,组织架构现有治理组、安全组两个工作组,同时负责运营安全对齐伙伴计划、可信人脸应用守护计划、内容科技产业推进方阵等。

▲AIIA安全治理委员会整体情况

目前,AIIA安全治理委员会已有近百家单位加入,由主任单位、副主任单位、专家委和办公室,以及围绕业务方向设置的工作组和伙伴计划组成。

其中,主任单位由中国信通院牵头,副主任单位包括vivo、百度、腾讯、360、华为、中国移动、阿里、浙江大学以及蚂蚁集团。

专家委负责对AIIA安全治理委员会的总体工作进行把关,两个工作组及伙伴计划则负责开展AI相关研究,推动产业链各方的AI安全治理工作。

据石霖介绍,治理组目前的工作进展围绕三个方面展开,包括AI治理框架、AI合规治理以及AI赋能治理。

▲治理组工作进展

具体来说,治理工作组聚焦AI整体治理框架研究和起草工作,与国际对标,如针对ISO/IEC 42001等进行研讨对比,输入国际优秀风险管理经验。

同时,治理组围绕人脸识别等典型应用开展工作,支撑地方网信主管部门针对文旅行业开展合规实践,形成人脸识别相关治理研究报告。

此外,围绕AI赋能治理,治理组开展法律大模型相关技术标准规范研讨工作,相关规范正式定稿。

安全组则主要根据大模型安全、合规等热点方向,开展安全基准测试,推动多项AI原生安全规范的编写和技术交流。

▲安全组工作进展

目前,安全组围绕大模型的安全合规和技术研究开展文档编写等,已经开展了两个批次的AI安全Benchmark测试工作,其中二季度融入了更多常见攻击方法,包括诱导攻击、提示词注入攻击、内容泛化攻击等,能更全面直观反映国内外闭源模型的安全情况。

围绕AI原生安全、AI赋能安全等,安全组在今年上半年先后召开了线上/线下共20多场交流研讨,开展了标准制定、测试评估等工作,包括大模型安全、AI网络安全大模型规范、AIGC检测规范等。

二、启动AI安全守护计划,三大安全测评结果发布

石霖谈道,在两大工作组的实践当中委员会发现,单独的工作组各自围绕安全或治理,从规则或技术角度开展工作,在这个过程中技术和规则需要融合。因此,建立跨组安全防护能力至关重要。

今年6月,中国信通院依托AIIA发起“人工智能安全守护计划”,即AI Guard,目标是联合多方力量提升我国AI技术水平和治理能力,促进产业健康有序发展。

▲人工智能安全守护计划

首先,该计划将建立AI威胁信息共享机制,从AI芯片等基础设施,到数据、算法、应用等方面的漏洞,通过委员会层面的互助共治及时预警,提升安全防范能力,从而应对AI安全威胁除等问题。

其次,该计划将开展AIGC真实内容来源可信工作,通过建立统一内容标准平台,打造内容可溯源的能力。目前主要针对图片、音频和视频等多模态内容,采用隐式水印方法建立互认机制。文本内容上的实现仍有一定技术难度,后续将持续有针对性地突破。

此外,计划将通过AI保险机制,为相关人员和单位给予救济,提供赔偿兜底策略。

最后,石霖发布了大模型安全风险防范能力评测、多模态图文大模型内容安全防范能力评测、人脸识别安全专项评测以及代码大模型安全风险风险防范能力评测结果,vivo、蚂蚁、阿里云、百度、科大讯飞、商汤等作为代表获得了证书。

▲大模型安全风险防范能力评测、多模态图文大模型内容安全防范能力评测结果

▲人脸识别安全专项评测结果

▲代码大模型安全风险风险防范能力评测结果

结语:推动AI向安全可靠可控方向发展

大模型发展迅速,但AI安全问题的严重性和紧迫性不容忽视,安全挑战已从技术本身的传统安全问题向多方面扩展,各国和地区基本形成本土框架。例如,美国推出风险管理框架,欧盟构建风险分级治理方案,新加坡推出治理模型框架并提出9个维度,日本发布指南制定行为准则等。

而在国内,AIIA安全治理委员会正在积极推动精准化治理前沿技术治理工具的构建,目前已围绕治理框架、风险管理、卫生安全、安全应用取得一定成果。未来在各单位的共同努力下,期待我国能形成完整的安全风险机制,确保AI向安全可靠可控方向发展。

相关内容

平安好医生入选首批“开源大...
7月3日,由全球数字经济大会组委会主办,中国信息通信研究院(以下简...
2025-07-03 21:41:09
黄山谷捷接待3家机构调研,...
2025年7月3日,黄山谷捷披露接待调研公告,公司于7月3日接待开...
2025-07-03 17:42:12
计算架构,行业AI竞争的下...
2025-07-03 16:25:26 作者:狼叫兽 当Dee...
2025-07-03 17:42:01
阿里与荣耀进一步深化AI生...
央广网北京7月3日消息(记者 冀文超)7月2日,荣耀全新年度折叠旗...
2025-07-03 17:12:53
百度的AI为什么没人用,中...
牛文文 创业黑马集团董事长&创始人 AI, 第一个颠覆就是搜索。 ...
2025-07-03 17:12:38
画到哪,动到哪!字节跳动发...
Angtian Wang 是字节跳动的研究员,研究方向包括视频生成...
2025-07-03 13:13:17

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...