哈佛大学、谷歌发布100万本公共领域书籍,为AI训练提供合法数据
创始人
2024-12-13 09:44:01
0

IT之家 12 月 13 日消息,据 TechCrunch 12 日报道,哈佛大学与谷歌宣布,联合发布 100 万本公共领域书籍作为 AI 训练数据集。

AI 训练所需的数据成本高昂,但却更适合资金充裕的科技公司。因此,哈佛大学计划发布一个包含约 100 万本公共领域书籍的数据集,这些书籍覆盖多种类型、语言和作者,包括已不再受版权保护的经典作家如狄更斯、但丁和莎士比亚等,因这些作品的版权已随时间过期。

图源 Pexels

虽然这个新数据集尚未公开,也不清楚具体的发布方式和时间,但它来源于谷歌的长期项目 —— 谷歌图书(Google Books)。因此,谷歌将参与这次“宝贵财富”的广泛发布。

据IT之家了解,早在今年 3 月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为 AI 提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和 OpenAI 的资金支持

IDI 的执行董事格雷格・莱佩特(Greg Leppert)表示,该数据集的目标是“让竞争环境更加公平”,通过向包括研究机构和 AI 初创公司在内的各类机构开放这一庞大的数据集,以帮助他们训练大型语言模型。

相关内容

交万元得到的炒股“内幕消息...
今天是3·15国际消费者权益日。近年来,在资本市场,虚假信息如暗流...
2025-03-15 22:42:55
315打假AI,蘑菇物联对...
随着DeepSeek等通用大模型技术的突破,AI在设备预测性维护、...
2025-03-15 20:42:16
佳士得举办全球首个AI艺术...
日前,由著名拍卖行佳士得举行的主题为“增强智能(Augmented...
2025-03-15 16:42:08
驯服AI,更懂物理!何恺明...
新智元报道 编辑:英智 【新智元导读】何恺明团队提出的去噪哈密顿...
2025-03-15 16:13:49
布局加速,小米计划 202...
【环球网科技综合报道】3月14日消息,据日本经济新闻报道,小米公司...
2025-03-15 09:14:29
创意信息新注册《AI能力感...
证券之星消息,近日创意信息(300366)新注册了4个项目的软件著...
2025-03-15 06:41:37

热门资讯

原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
吞噬星空维妮娜美图/高清壁纸/... 国漫女神|《吞噬星空》维妮娜美图/高清壁纸/AI手机壁纸/无水印 国漫女神|《吞噬星空》维妮娜美图...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 商... 最近,各家的AI 9笔记本开始陆续登场,其实大家并不一定非选AI 9 HX 370,主要是这颗CPU...
AI智能+高效清洁!萤石RS2... 目前扫拖机器人市场的竞争非常激烈,在上下水扫拖一体机市场也出现了很多所谓的创新产品。但是对于这些产品...
2024年度中国银行业发展报告... 21世纪经济报道 记者李愿 北京报道 10月19日,中国银行业协会在2024金融街论坛年会·金融街之...