《Kubeflow学习指南:生产级机器学习系统实现》特雷弗・格兰特 | PDF下载|ePub下载
Kubeflow学习指南:生产级机器学习系统实现 版权信息
- 出版社:机械工业出版社
- 出版时间:2022-02-01
- ISBN:9787111699378
- 条形码:9787111699378 ; 978-7-111-69937-8
Kubeflow学习指南:生产级机器学习系统实现 本书特色
如果你正在训练一个机器学习模型,但不确定如何将其投入生产,本书将协助你完成目标。Kubeflow为模型生命周期的不同阶段提供了一系列云原生工具,从数据探索和特征准备到模型训练和模型服务。本书可以帮助数据科学家用Kubeflow构建生产级机器学习实现,并向数据工程师展示了如何使模型具有可伸缩性和可靠性。作者使用书中的示例解释了如何使用Kubeflow在云端或者本地开发环境中的Kubernetes上训练机器学习模型并为模型提供服务。本书将帮助你: – 理解Kubeflow的设计、核心组件和所能解决的问题。 – 使用Kubeflow和流行的工具(包括Scikit-learn、TensorFlow和Apache Spark)训练模型。 – 使用Kubeflow 流水线使模型保持*新状态。 – 了解如何获取模型训练的元数据。 – 为超参调优进行训练。 – 了解如何在生产中为模型提供服务。 – 探索如何用其他开源工具扩展Kubeflow。
Kubeflow学习指南:生产级机器学习系统实现 内容简介
Kubeflow是基于K8S的机器学习工具包,是为数据科学家和数据工程师构建生产级别的机器学习实现而设计的。本书采用循序渐进的方式,从 Kubeflow 的安装、使用和设计开篇,随后从模型训练的整个周期展开,涵盖了数据探索、特征准备、模型训练/调优、模型服务、模型测试、模型监测和模型版本管理等各个环节,既有相关的理论知识也囊括了真实的使用案例,能够让读者在学习 Kubeflow 知识的同时全面了解机器学习的相关知识,是入门和深入学习Kubeflow以及机器学习的良好指南。
Kubeflow学习指南:生产级机器学习系统实现 目录
序言 1
前言 3
第1章 Kubeflow及其适用对象 13
1.1 模型开发生命周期 13
1.2 Kubeflow 适合什么场景 14
1.3 为什么需要容器化 14
1.4 为什么需要 Kubernetes 15
1.5 Kubeflow的设计和核心组件 15
1.6 Kubeflow的替代方案 19
1.7 案例研究 21
1.8 总结 22
第2章 你好,Kubeflow 24
2.1 搭建Kubeflow 24
2.2 训练和部署模型 30
2.3 超越本地部署 34
2.4 总结 34
第3章 Kubeflow设计:超越基础 35
3.1 中央仪表盘 36
3.2 支持组件 43
3.3 总结 50
第4章 Kubeflow Pipeline 51
4.1 Pipeline入门 51
4.2 Kubeflow Pipeline组件介绍 60
4.3 Pipeline高级主题 68
4.4 总结 72
第5章 数据准备和特征准备 73
5.1 选择正确的工具 74
5.2 本地数据准备和特征准备 74
5.3 分布式工具 78
5.4 将其整合到一个Pipeline中 92
5.5 将整个notebook作为数据准备Pipeline阶段使用 94
5.6 总结 95
第6章 制品和元数据存储 96
6.1 Kubeflow ML Metadata 97
6.2 基于Kubeflow的MLflow元数据工具 102
6.3 总结 110
第7章 训练机器学习模型 111
7.1 用TensorFlow构建推荐器 111
7.2 部署TensorFlow训练作业 117
7.3 分布式训练 120
7.4 使用scikit-learn训练模型 125
7.5 总结 132
第8章 模型推断 133
8.1 模型服务 133
8.2 模型监控 136
8.3 模型更新 137
8.4 推理要求概述 138
8.5 Kubeflow中的模型推理 138
8.6 TensorFlow Serving 139
8.7 Seldon Core 143
8.8 KFServing 158
8.9 总结 174
第9章 多工具使用案例 175
9.1 CT扫描去噪示例 175
9.2 共享Pipeline 186
9.3 总结 186
第10章 超参调优和自动化机器学习 187
10.1 AutoML概述 187
10.2 使用Kubeflow Katib进行超参调优 188
10.3 Katib概念 189
10.4 安装Katib 191
10.5 运行**个Katib实验 192
10.6 调优分布式训练作业 200
10.7 神经网络架构搜索 201
10.8 Katib的优势 204
10.9 总结 205
附录A Argo执行器配置和权衡 207
附录B 特定于云的工具和配置 208
附录C 在应用程序中使用模型服务 210
Kubeflow学习指南:生产级机器学习系统实现 作者简介
特雷弗・格兰特(Trevor Grant)是Apache Mahout的PMC主席。并积极参与Apache Mahout、Apache Streams和Community Development等项目。