原创 开源AI并不透明?开源倡议组织给出新的定义
创始人
2024-08-27 19:16:43
0

长期以来,研究人员对开源人工智能(Open-source AI)的定义一直存在分歧。近期,自诩为开源仲裁者的开源倡议组织(OSI)日前发布开源AI的新定义,希望能帮助立法者制定法规,保护消费者免受AI风险的影响。

OSI邀请了70名研究人员、律师、政策制定者、活动家以及Meta、谷歌和亚马逊等大型科技公司的代表,共同为开源AI提可行的定义。

OSI声称,“一个开源AI系统可以用于任何目的,而无需获得许可,且研究人员应该能够检查该AI系统的组件并研究其工作原理。同时,研究人员还可以出于任何目的修改系统,包括更改其输出,并与他人共享,用于任何目的。”此外,该标准还试图为给定模型的训练数据、源代码和权重定义一个透明度级别。”

按此标准,OpenAI和Anthropic对它们的模型、数据集和算法保密,使它们成为明显的AI闭源系统。同时,Meta Llama和谷歌的免费访问模型也不是真正的开源AI模型,因为许可证限制了用户对模型的使用,而且训练数据集也没有公开。

AI模型构建和共享平台Hugging Face的应用政策研究员Avijit Ghosh说,“众所周知,企业在推广营销他们的模型时会滥用这个术语。”他表示,将模型描述为开源可能会使它们被认为更值得信赖,即使研究人员无法独立调查它们是否真的开源。

Mozilla高级顾问、OSI进程的参与者Ayah Bdeir表示,开源定义的某些部分相对容易达成一致,包括需要揭示模型权重(帮助确定AI模型如何产生输出的参数)。审议的其他部分争议更大,尤其是训练数据应该如何公开的问题。

训练数据的来源缺乏透明度,导致大型AI公司遭到大量诉讼。从OpenAI等大型语言模型提供商到Suno等音乐生成器,这些公司除了表示它们包含“可公开访问的信息”之外,没有透露太多关于训练集的信息。

一些开源支持者认为开源模型应该公开他们所有的训练集。Bdeir表示,由于版权和数据所有权等问题,这一标准很难执行。

最终,OSI主导的新的定义要求开源模型提供有关训练数据的信息,以达到“熟练人员可以使用相同或类似的数据重新创建实质上等同的系统”的程度。虽然这并不是一个全面共享所有训练数据集的笼统要求,但它也比当今许多专有模型甚至表面上的开源模型更进一步。

Bdeir说:“坚持一种在意识形态上原始的金本位制,而实际上这种制度任何人都无法有效实现,最终会适得其反。”她补充说,OSI正在计划制定某种执行机制,该机制将标记那些被描述为开源但不符合其定义的模型。

该组织还计划发布一份符合新定义的AI模型清单。虽然没有得到证实,但Bdeir预计,一些规模相对较小的模型将会出现在名单上,包括Eleuther的Pythia、Ai2的OLMo,以及开源团体LLM360的模型。

相关内容

聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
国泰海通:维持海外AI算力...
国泰海通维持海外AI 算力及应用产业链“增持”评级。其研报指出,O...
2026-06-01 00:54:38
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
鸿蒙生态设备超13亿台,开...
PChome 5月28日消息,2026开源鸿蒙开发者大会正式召开,...
2026-05-30 05:44:37
AI助丘陵岗坡地小麦亩产破...
5月27日,南京市江宁区溪田农场小麦田埂上,传来消息:镇麦18地块...
2026-05-28 21:16:25
仁宝电脑与GMI Clou...
(全球TMT2026年5月28日讯)5月28日,仁宝电脑宣布,与美...
2026-05-28 21:09:59

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...