开源无处不在,Kubernetes 生态系统中的 AI/ML 创新已广泛应用
创始人
2024-10-31 11:34:35
0

当开源遇上AI,将产生怎样的火花?

随着企业智能化升级步伐的加快,已经开始将人工智能和机器学习(AI/ML)工作负载投入持续开发和生产部署场景,这就需要考虑到如何具备与常规软件代码相当的可管理性、速度和责任性等相关问题。而在这些工作负载的部署中,Kubernetes 成为了主流选择,所以Kubeflow 和 KServe 项目被广泛关注。随着模型注册表、ModelCars 功能以及 TrustyAI 集成等最新创新的推出,依赖 AI/ML 的用户正迎来显著改进,这些改进使得开源 AI/ML 能够在生产中得以广泛应用,并且未来还将有更多进步。

更好的模型管理

AI/ML 使用机器学习模型分析数据并生成输出,这些模型由代码、数据和调整信息构成。2023年,Kubeflow 社区认识到跨大型 Kubernetes 集群分发优化后的模型的需求日益迫切。红帽 OpenShift AI 的工程师们积极响应,开始开发新的 Kubeflow 组件——模型注册表。

模型注册表为开发人员提供了一个集中化的目录,用于索引和管理模型及其版本,以及相关工件元数据。它填补了模型实验和生产活动之间的空白,为所有用户提供了一个统一的界面,便于在 ML 模型上进行高效协作。这一工具对于希望在大型 Kubernetes 集群上运行多个模型实例的研究人员来说至关重要。目前,该项目正处于 Alpha 阶段,并已包含在 Kubeflow 1.9 版本中。

更快的模型服务

Kubeflow 利用 KServe 项目在 Kubernetes 集群的服务器上运行模型。用户非常关注模型的延迟和开销,特别是在受监管行业中,许多组织都有针对响应时间的服务级别目标(SLO)。

为了优化性能,Red Hat 和 KServe 的工程师们开发了 ModelCars,这是一个保存 KServe 模型数据的被动“sidecar”容器。这样,模型只需在集群节点上存储一次,无论有多少副本正在访问它。利用 Kubernetes 在容器镜像处理方面的成熟技术,ModelCars 实现了更快的服务模型启动时间,并显著减少了集群节点的磁盘空间需求。目前,ModelCar 已在 KServe v0.12 及更高版本中可用。

更安全的模型使用

AI/ML 系统复杂且难以捉摸,但确保它们不会因意外偏见或逻辑错误而产生误导性结果至关重要。TrustyAI 是一个新的开源项目,旨在将“负责任的人工智能”引入 AI/ML 开发生命周期的所有阶段。

TrustyAI 通过将核心技术/算法(主要关注人工智能的可解释性、指标和护栏)集成到生命周期的不同阶段,实现了这一目标。例如,在模型实验阶段,可以使用 Python TrustyAI 库在 Jupyter Notebook 中识别偏差。通过将此工具合并为管道步骤,还可以在生产模型中进行连续偏差检测。目前,TrustyAI 已进入开发第二年,并得到了 KServe 的支持。

未来的人工智能/机器学习创新

借助这些功能和工具以及其他进步,AI/ML 模型的开发和部署变得更加一致、可靠、高效和可验证。这使得组织能够采用和定制自己的开源 AI/ML 堆栈,这在以前可能是困难或冒险的。

Kubeflow 和 KServe 社区正致力于下一代改进,包括 LLM 服务目录、推荐配置和模式探索等。同时,KServe 项目也在开发支持超大型模型的功能,如多主机/多节点支持、推测解码以及 LoRA 适配器支持等。此外,KServe 社区还在推动 GenAI 任务 API 的开放推理协议扩展,并与 Kubernetes Serving 工作组密切合作,推动各项工作的集成和发展。这些功能和其他功能都包含在 KServe 的路线图中,预示着未来 AI/ML 的更多创新和进步。

相关内容

声网参编《移动AI愿景与发...
6月25日,2026上海世界移动通信大会(MWC上海)——移动AI...
2026-06-29 21:51:38
苹果2027新品前瞻:Ai...
智能手机逐渐趋于成熟,行业焦点正从硬件迭代转向形态创新。在这样的背...
2026-06-29 16:33:19
大厂终于不再逼用户“用AI...
文|听筒Tech 陈柯 在C端争夺了几年后,大厂似乎终于明白用户...
2026-06-29 16:30:36
帆越信息取得基于开源鸿蒙的...
国家知识产权局信息显示,广州市帆越信息科技有限公司取得一项名为“一...
2026-06-29 16:23:28
《中国开源发展深度报告(2...
IT之家 6 月 29 日消息,6 月 26 日,开放原子开源基金...
2026-06-29 16:22:34
世界杯32强出炉!12大A...
快科技6月28日消息,今日,2026年美加墨世界杯J组小组赛收官。...
2026-06-29 01:34:50

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
8月20日基金净值:前海开源中... 证券之星消息,8月20日,前海开源中国稀缺资产混合A最新单位净值为1.43元,累计净值为1.43元,...