号称可以成为 ChatGPT 平替的开源模型 “Dolly”
创始人
2024-03-02 14:58:22
0

你需要一款 ChatGPT 的平替?还得是开源的?看起来我们已经被卷入了与 ChatGPT 的开源大战。

open source model dolly

Databricks 这家软件公司,在各个领域都有所建树,尤其是在数据仓库和基于人工智能的解决方案方面。

最近,随着 ChatGPT 横空出世,Meta、谷歌甚至 Mozilla 都开始效仿 ChatGPT。

而现在,Databricks 开源了其 大型语言模型 large language model (LLM)“Dolly”,也正在以自己的方式进行尝试。

我们一起来看看它。

发生了什么? 在最近的公告中,Databricks 介绍了他们号称 “廉价构建” 的 LLM,使用 EleutherAI 的已经开源的参数 模型 提供功能。

他们在该模型基础上稍作调整,赋予了 Dolly 指令诸如头脑风暴和文本生成的能力。

当你拿它与 GPT-3 中的 1750 亿个参数 比较时,Dolly 的 60 亿个参数 就可能显得微不足道。

但是,当 Databricks 的人看到即使数据量与 GPT-3 相差这么多,Dolly 也能 展示很多与 ChatGPT 相同的能力 时,他们感到非常震惊。

下面是他们展示的其中一个例子:

a screenshot of how dolly performs in an open question and answer scenario

原始模型使用了 Alpaca 的数据,该模型由斯坦福大学以 Meta 的 LLaMA LLM 为基础建立。

但是,正如你所看到的,原始模型产生了一个非常杂乱无章的结果,而 Dolly,通过不同的模型和调整,能够产生一个更为可用的答案。

? 有趣的事实:“ 多莉 Dolly ” 名字取自世界上第一只克隆羊。

为什么是现在? 根据 Databricks 的说法,他们认为 **许多公司更愿意建立自己的模型,**而不是将数据发送给某个紧紧掌握模型只对外提供 API 的集中式供应商。

许多公司可能不愿意将他们最敏感的数据交给第三方,然后在模型质量、成本和所需行为方面进行各种权衡。

你想看看吗?

当然,但有一个问题。

你必须 使用他们的平台来使用 Dolly,他们已经开源了一个 Databricks 笔记本,可以帮助你在 Databricks 上构建它。

此外,如果你想获得训练好的权重,你必须联系他们。不过我不确定他们是否会免费提供使用权。

总而言之,这种开源其模型的举动应该对其他公司有好处,可以保护他们的数据、节省运营成本,其他公司也能使用它创建自己的模型。

你可以查看其 公告博客,以了解更多技术细节和其他计划。


via: https://news.itsfoss.com/open-source-model-dolly/

作者:Sourav Rudra 选题:lkxed 译者:lxbwolf 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

从康波周期,看AI进入大规...
01 我在最近一个月研究中,越来越确定一件事。 AI,已经不是实验...
2026-01-21 06:17:51
AI教父也折戟?李开复妥协...
文|数据猿 “与其说"AI教父失灵了",不如说零一万物选择了更适...
2026-01-21 06:16:49
IBM推出企业AI咨询服务...
IBM公司今日宣布,将把其内部人工智能驱动的交付平台向企业客户开放...
2026-01-20 23:18:16
“AI魔改”必须改“魔”归...
文 | 孙文静 图 | 张宇晴 弱不禁风的林黛玉倒拔垂杨柳、身居深...
2026-01-20 22:46:50
专家看“人工智能第一会”:...
当一个个机器人音乐家在中关村弹奏起乐曲,当海淀“原点社区”的蓝图徐...
2026-01-20 22:46:05
2025年终回顾 | AI...
The law is effectively a human sy...
2026-01-20 22:23:33

热门资讯

如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
Textual:为 Pytho... 快速入门使用 TextualPython 在 Linux 上有像 TkInter 这样的优秀 GUI...
硬核观察 #1245 Open... #1 OpenAI 悄然删除禁止将 ChatGPT 用于 “军事和战争” 的禁令在 1 月 10 日...
使用时间序列数据,用开源工具助... InfluxData 是一个开源的时间序列数据库平台。下面介绍了它是如何被用于边缘应用案例的。收集到...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
硬核观察 #1249 LG 洗... #1 LG 洗衣机每天上传近 4GB 的数据?一个名为 Johnie 的 LG 洗衣机用户发现,他的...
2024 年 Linux 和开... 让我们尝试预测未来吧!新的一年快乐,朋友们 ✨2024 年的钟声已经敲过,我们有必要去预见一下将塑造...