使用MongoDB构建AI:Jina AI将突破性开源嵌入模型变为现实
创始人
2024-08-01 18:12:58
0

2024-08-01 14:47:01作者:姚立伟

Jina AI创立于2020年,总部位于德国柏林,主要从事提示工程和嵌入模型业务,已迅速成长为多模态AI领导者。Jina AI积极推动开源和开放研究,致力于弥合先进AI理论与开发者及数据科学家构建的AI驱动型真实世界应用程序之间的差距。目前,Jina AI平台已拥有超过40万名注册用户。

Jina AI创始人兼CEO肖涵博士在阐述公司使命时表示:“我们希望能够为多模态AI未来的实现铺平道路。我们发现当前的机器学习和软件生态系统在处理多模态AI方面面临着一些挑战。鉴于此,我们鼎力研发开创性工具和平台,助力企业和开发者解决这些复杂问题。我们的愿景是发挥自身的关键作用,帮助全球用户充分利用多模态AI的巨大潜力并彻底改变信息的解读和互动方式。”

Jina AI在嵌入模型领域的研究引起了业界的广泛兴趣和关注。因为如今许多开发者都已认识到嵌入技术对于生成式AI的重要意义。嵌入模型是非常复杂的算法,可以将任意结构的数据转化并嵌入到多维数字编码(即向量)中。这些向量通过捕捉数据的模式和关系来赋予数据相应的语义信息。这意味着,我们可以使用与结构化业务数据相同的方式来分析和搜索非结构化数据。考虑到我们每天生成的数据中有80%以上是非结构化数据,我们开始对嵌入模型与MongoDB AtlasVector Search等先进解决方案相结合对生成式AI带来的变革性影响充满期待。

Jina AI推出的jina-embeddings-v2是目前首个开源8K文本嵌入模型。该模型的标记长度达到8K,这使其能够更深入地理解上下文,从而显著提高检索增强生成(RAG)语义搜索等任务的准确性和相关性。Jina AI的嵌入模型具有增强型数据索引和搜索能力,并支持双语环境。嵌入模型专注于单一语言和语言对,确保在特定语言基准测试中达到最先进的性能。Jina Embeddings v2目前已经发布了德语-英语和汉语-英语的双语模型,其他双语模型正在开发中。

Jina AI的嵌入模型在分类、重排、检索和摘要等方面均有优异表现,因此适用于各种应用场景,尤其是跨语言任务。近期,该嵌入模型在跨国企业客户中的部分应用案例包括: 销售序列自动化、人力资源技能匹配以及附带欺诈检测功能的付款对账等。

肖涵博士表示:“我们的嵌入API能够原生集成生成式AI开发者堆栈中的关键技术,包括MongoDB Atlas、LangChain、LlamaIndex、Dify和Haystack。MongoDB Atlas将应用程序数据和向量嵌入整合至一个统一的平台,使两者之间完全保持同步。每当数据库中加入新的数据或更新已有数据时,Atlas Triggers都会调用嵌入API,以确保嵌入始终保持最新状态。这种集成式方法使开发者能够更加高效地为企业构建全新的前沿AI驱动型应用程序。”

如需开始使用MongoDB和Jina AI,请注册MongoDB Atlas阅读操作指南。如果您的团队正在构建AI应用程序,欢迎报名参加AI创新者计划。报名成功的公司可以获得免费的Atlas学分和技术扶持,并与更广泛的AI生态系统建立联系。

相关内容

声网参编《移动AI愿景与发...
6月25日,2026上海世界移动通信大会(MWC上海)——移动AI...
2026-06-29 21:51:38
《中国开源发展深度报告(2...
IT之家 6 月 29 日消息,6 月 26 日,开放原子开源基金...
2026-06-29 16:22:34
世界杯32强出炉!12大A...
快科技6月28日消息,今日,2026年美加墨世界杯J组小组赛收官。...
2026-06-29 01:34:50
AI(人工智能)也有“人格...
作者 | 阿童木 人工智能(AI,Artificial Intel...
2026-06-29 01:28:54
从第一性原理看机器人AI:...
机器之心编译 过去几年,机器人行业最常见的高光时刻,几乎都发生在演...
2026-06-28 21:24:04
原创 ...
AI最大的问题,就是幻觉太多,还有会无底线地讨好你。 不管你...
2026-06-28 21:22:37

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
8月20日基金净值:前海开源中... 证券之星消息,8月20日,前海开源中国稀缺资产混合A最新单位净值为1.43元,累计净值为1.43元,...