Databricks 将开源 Unity Catalog
创始人
2024-07-22 23:13:54
0

在6月12日举行的数据与人工智能峰会(Data + AI Summit)上,Databricks 宣布将开源 Unity Catalog,即管理用户和计算引擎如何访问数据的元数据目录。继上周有关 Apache Iceberg 的新闻之后,此举标志着 Databricks 的重要转变,因为客户对开放式Lakehouse平台的需求日益增长,Databricks 正努力保持发展势头。

Databricks 早在 2021 年就推出了 Unity Catalog,用于管理和安全访问存储在 Delta 中的数据,Delta 是 Databricks 于 2017 年创建的表格格式,是其Lakehouse战略的关键。此后,它一直是 Databricks 的专有产品。

但近年来,一种与之竞争的表格式 Apache Iceberg 在大数据生态系统中势头强劲。为了应对 Iceberg 的崛起,Databricks 上周计划收购 Iceberg 背后商业公司 Tabular。Databricks 的战略是,随着时间的推移,逐渐将 Iceberg 和 Delta 的规范靠拢,从而消除它们之间的差异。

这样一来,简陋的元数据目录就成了阻挡客户实现真正开放数据Lakehouse的最后一块障碍。Databricks 的竞争对手 Snowflake 上周推出了基于 Iceberg REST API 的 Polaris,解决了元数据目录的潜在锁定问题。Snowflake 公司告诉 Datanami,它计划在 90 天内将 Polaris 项目捐赠给开源组织,可能是阿帕奇软件基金会。

这样一来,仍然专有的 Unity Catalog 就成了元数据目录层的异类,而开放Lakehouse的新时代却突然到来。为了应对市场的战略转变,Databricks 决定开源 Unity Catalog。

Databricks 首席执行官Ali Ghodsi在旧金山举行的 Databricks 数据与人工智能峰会上发表主题演讲时表示,此举为数据访问创造了“USB”。

“(打破)你以前所有孤岛,他们只需访问一份标准化USB格式的数据。”Ghodsi说,你的所有数据都要经过一个标准化的治理层,那就是 Unity Catalog。

Ghodsi 指出,Unity Catalog 以前支持 Delta 和 Iceberg,此外还通过 Databricks 的 Delta Lake UniForm 格式支持另一种开放表格式 Apache Hudi。事实上,Unity Catalog 还支持 Iceberg 基于 REST 的 API。

“我们基本上实现了数据层和安全层的标准化,这样你就拥有了自己的数据,一切都可以通过这些开放接口来实现。”他说,“我认为这对社区、对这里的每个人来说都将是一件好事。因为我们有了更多的用例。我们将能够进行更多的创新,我们将为每个人拓展这个市场。”

Databricks的客户对此举表示赞赏,其中包括AT&T和纳斯达克。

“随着 Unity Catalog 宣布开源,我们对 Databricks 通过开放标准实现Lakehouse治理和元数据管理的举措感到鼓舞。”AT&T 数据平台副总裁 Matt Dugan 表示,“灵活利用我们的数据和人工智能资产的互操作工具,并进行一致治理,是AT&T数据平台战略的核心。”

“Databricks决定开源Unity Catalog,提供了一个有助于消除数据孤岛的解决方案,我们期待着进一步扩展我们的平台,加强我们的治理,使我们的数据应用现代化,继续为我们的客户提供服务,”纳斯达克资本访问平台副总裁Lenny Rosenfeld说。

目前还不清楚 Databricks 将为 Unity Catalog OSS 选择何种开源基础,也不清楚时间表。此前,Databricks 曾选择 Linux 基金会开源各种内部开发的产品,包括 Delta 和 MLFlow。

相关内容

315打假AI,蘑菇物联对...
随着DeepSeek等通用大模型技术的突破,AI在设备预测性维护、...
2025-03-15 20:42:16
搭建AI+生命健康产业协同...
3月14日下午,2025“AI+生命健康”应用场景创新展示活动在珠...
2025-03-15 18:13:13
佳士得举办全球首个AI艺术...
日前,由著名拍卖行佳士得举行的主题为“增强智能(Augmented...
2025-03-15 16:42:08
创意信息新注册《AI能力感...
证券之星消息,近日创意信息(300366)新注册了4个项目的软件著...
2025-03-15 06:41:37
赛轮思推出车载AI语音助理...
3月13日,赛轮思AI宣布推出其代理式AI助理平台——Cerenc...
2025-03-14 22:12:37
继续破!《哪吒2》票房距全...
据网络平台数据,截至目前,电影《哪吒之魔童闹海》全球票房(含预售及...
2025-03-14 16:12:53

热门资讯

原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
吞噬星空维妮娜美图/高清壁纸/... 国漫女神|《吞噬星空》维妮娜美图/高清壁纸/AI手机壁纸/无水印 国漫女神|《吞噬星空》维妮娜美图...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 商... 最近,各家的AI 9笔记本开始陆续登场,其实大家并不一定非选AI 9 HX 370,主要是这颗CPU...
AI智能+高效清洁!萤石RS2... 目前扫拖机器人市场的竞争非常激烈,在上下水扫拖一体机市场也出现了很多所谓的创新产品。但是对于这些产品...
2024年度中国银行业发展报告... 21世纪经济报道 记者李愿 北京报道 10月19日,中国银行业协会在2024金融街论坛年会·金融街之...