开源无处不在,Kubernetes 生态系统中的 AI/ML 创新已广泛应用
创始人
2024-10-31 11:34:35
0

当开源遇上AI,将产生怎样的火花?

随着企业智能化升级步伐的加快,已经开始将人工智能和机器学习(AI/ML)工作负载投入持续开发和生产部署场景,这就需要考虑到如何具备与常规软件代码相当的可管理性、速度和责任性等相关问题。而在这些工作负载的部署中,Kubernetes 成为了主流选择,所以Kubeflow 和 KServe 项目被广泛关注。随着模型注册表、ModelCars 功能以及 TrustyAI 集成等最新创新的推出,依赖 AI/ML 的用户正迎来显著改进,这些改进使得开源 AI/ML 能够在生产中得以广泛应用,并且未来还将有更多进步。

更好的模型管理

AI/ML 使用机器学习模型分析数据并生成输出,这些模型由代码、数据和调整信息构成。2023年,Kubeflow 社区认识到跨大型 Kubernetes 集群分发优化后的模型的需求日益迫切。红帽 OpenShift AI 的工程师们积极响应,开始开发新的 Kubeflow 组件——模型注册表。

模型注册表为开发人员提供了一个集中化的目录,用于索引和管理模型及其版本,以及相关工件元数据。它填补了模型实验和生产活动之间的空白,为所有用户提供了一个统一的界面,便于在 ML 模型上进行高效协作。这一工具对于希望在大型 Kubernetes 集群上运行多个模型实例的研究人员来说至关重要。目前,该项目正处于 Alpha 阶段,并已包含在 Kubeflow 1.9 版本中。

更快的模型服务

Kubeflow 利用 KServe 项目在 Kubernetes 集群的服务器上运行模型。用户非常关注模型的延迟和开销,特别是在受监管行业中,许多组织都有针对响应时间的服务级别目标(SLO)。

为了优化性能,Red Hat 和 KServe 的工程师们开发了 ModelCars,这是一个保存 KServe 模型数据的被动“sidecar”容器。这样,模型只需在集群节点上存储一次,无论有多少副本正在访问它。利用 Kubernetes 在容器镜像处理方面的成熟技术,ModelCars 实现了更快的服务模型启动时间,并显著减少了集群节点的磁盘空间需求。目前,ModelCar 已在 KServe v0.12 及更高版本中可用。

更安全的模型使用

AI/ML 系统复杂且难以捉摸,但确保它们不会因意外偏见或逻辑错误而产生误导性结果至关重要。TrustyAI 是一个新的开源项目,旨在将“负责任的人工智能”引入 AI/ML 开发生命周期的所有阶段。

TrustyAI 通过将核心技术/算法(主要关注人工智能的可解释性、指标和护栏)集成到生命周期的不同阶段,实现了这一目标。例如,在模型实验阶段,可以使用 Python TrustyAI 库在 Jupyter Notebook 中识别偏差。通过将此工具合并为管道步骤,还可以在生产模型中进行连续偏差检测。目前,TrustyAI 已进入开发第二年,并得到了 KServe 的支持。

未来的人工智能/机器学习创新

借助这些功能和工具以及其他进步,AI/ML 模型的开发和部署变得更加一致、可靠、高效和可验证。这使得组织能够采用和定制自己的开源 AI/ML 堆栈,这在以前可能是困难或冒险的。

Kubeflow 和 KServe 社区正致力于下一代改进,包括 LLM 服务目录、推荐配置和模式探索等。同时,KServe 项目也在开发支持超大型模型的功能,如多主机/多节点支持、推测解码以及 LoRA 适配器支持等。此外,KServe 社区还在推动 GenAI 任务 API 的开放推理协议扩展,并与 Kubernetes Serving 工作组密切合作,推动各项工作的集成和发展。这些功能和其他功能都包含在 KServe 的路线图中,预示着未来 AI/ML 的更多创新和进步。

相关内容

深圳前海面向全球招募AI创...
人民网深圳3月19日电 (刘森君)近日,深圳前海OPC(一人公司)...
2026-03-19 13:28:19
AI正撬动科学研究的革新
话题主持 本报记者 易蓉 实验室里,机器人的机械臂灵巧操作,实验数...
2026-03-19 13:24:38
小米深夜发布三大AI模型,...
【iMobile爱科技资讯】3月19日凌晨时分,小米正式推出MiM...
2026-03-19 13:20:14
猛攻超级智能!微软“大刀阔...
AI竞争日趋白热化,科技巨头微软试图通过重组AI部门“杀出”重围。...
2026-03-19 02:58:30
开源证券给予利通科技&qu...
每经AI快讯,开源证券3月18日发布研报称,给予利通科技(9202...
2026-03-19 02:56:41
德国计划大幅提升AI算力
每经AI快讯,根据德国政府17日公布的一项数据中心扩容战略规划,到...
2026-03-18 20:35:36

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...