《机器学习的产业实践之路》毕然 | PDF下载|ePub下载
机器学习的产业实践之路 版权信息
- 出版社:机械工业出版社
- 出版时间:2023-05-01
- ISBN:9787111726159
- 条形码:9787111726159 ; 978-7-111-72615-9
机器学习的产业实践之路 本书特色
以机器学习原理为基础,面向智能化转型企业, 探讨AI业务创新和商业布局 本书特色:内容深入浅出,系统介绍机器学习理论知识:本书从大数据与机器学习的关系入手,深入浅出地介绍了机器学习的建模思想和经典算法。 内容涉及从技术到商业,更具实践性:本书以电商平台促销、图像检索、知识图谱和对话机器人为例,深度剖析了AI技术与这些业务结合的方法,让读者身临其境地感知AI技术对产业智能化升级的影响。 理论结合实践,代码简单易用:本书实践案例采用飞桨动态图编程,代码简洁易用,适合新手用户入门。 配套免费的AI Studio在线课程:内容源自在线课程“机器学习的思考故事”,由作者本人授课,包括30小时的视频课程和可在线运行的实训项目,目前已有超过2万人在线学习。
机器学习的产业实践之路 内容简介
本书的内容章节分为四个部分,从技术原理到项目实践再到商业战略,逐层放开视野。内容涉及基于人工智能技术在产业中做创新业务的方法论,通过交流“思想”和“应用方法论”,使大家掌握机器学习的深层次思想,并理解商业、产品和技术的深层关系。
机器学习的产业实践之路 目录
前言
部分 原理与思考
第1章 机器学习与大数据 2
1.1 机器为何能学习 2
1.1.1 人类为何能学习 2
1.1.2 从个案学习到统计学习 3
1.1.3 统计学习是否可信 5
1.2 机器是怎样学习的 9
1.2.1 机器学习的框架:假设+目标+寻解 9
1.2.2 如何在机器学习场景中应用大数定律 14
1.2.3 大数据对机器学习的意义 17
1.2.4 小结 20
1.3 跨上人工智能的战车 20
1.3.1 大数据的概念及价值 20
1.3.2 企业为何要搭上人工智能的战车 24
1.3.3 企业如何搭上人工智能的战车 27
1.3.4 人工智能技术团队的建设 38
第2章 机器学习框架的深入探讨 40
2.1 机器为何能学习(续):故事结束了吗?我们需要更多的
模型吗 40
2.1.1 牛顿第二定律的遗留问题 40
2.1.2 新的需求场景 43
2.1.3 不同的目标 49
2.1.4 不同的寻解 54
2.1.5 小结与回顾 60
2.2 重要权衡与过拟合 62
2.2.1 重要权衡的四张“面孔” 62
2.2.2 过拟合的成因和防控 68
2.2.3 小结与回顾 77
第3章 从线性函数到非线性函数,如何构建强大的模型 78
3.1 从线性函数到非线性函数 78
3.1.1 线性模型的不足 78
3.1.2 怎样扩展假设空间 79
3.2 核函数方法 82
3.2.1 正则化的另一种理解与SVM模型 82
3.2.2 核函数的思路 86
3.3 多模型组合的方法 88
3.3.1 组合模型的两个好处 88
3.3.2 实现组合模型的两个步骤和方法 89
3.3.3 装袋方式 91
3.3.4 提升方式 92
3.3.5 切分方式 93
3.3.6 小结 96
3.4 神经网络与深度学习 97
3.4.1 神经网络和深度学习的模型思路 97
3.4.2 组建神经网络 98
3.4.3 神经网络模型的优化 99
3.4.4 非线性变换函数的选择 102
3.4.5 神经网络结构的选择 104
3.4.6 深度学习得到发展的前提及其具备的优势 107
3.4.7 深度学习的重要衍生功能 111
第4章 机器学习的建模实践 122
4.1 业务建模 122
4.1.1 如何做好业务建模 122
4.1.2 案例:两个不同的排序模型 124
4.2 特征工程 128
4.2.1 特征工程的定义 128
4.2.2 信息可以存储在特征中,也可以存储在模型中 129
4.2.3 特征工程案例 131
4.2.4 特征的类型和维度 135
4.2.5 特征存在缺失或错误值时怎么办 137
4.2.6 特征降维和选择 137
4.3 样本处理 140
4.3.1 训练样本的基本概念 140
4.3.2 训练样本的常见问题及其解决方案 141
4.4 模型评估 151
4.4.1 业务目标的评估 151
4.4.2 模型目标的评估 155
4.5 小结 170
第二部分 应用与方法
第5章 电商平台促销策略模型 174
5.1 业务背景 174
5.1.1 互联网的盈利模式 174
5.1.2 广告定价机制 175
5.2 传统的促销方案 176
5.2.1 问题1:如何选择促销时机 177
5.2.2 问题2:如何为店铺制定广告消费任务 179
5.2.3 问题3:如何设置优惠定价模型 182
5.3 基于竞争传播的颠覆创新 190
5.3.1 颠覆创新的思考 190
5.3.2 竞争传播模型 192
5.3.3 种子集合筛选算法 197
5.4 小结 198
第6章 计算机视觉及其应用产品的构建 199
6.1 计算机视觉产品的问题背景 199
6.2 图像的特征表示 200
6.2.1 SIFT特征 201
6.2.2 CNN模型与特征 205
6.2.3 实现高速计算的方法:特征降维 221
6.3 视觉产品的构建案例 223
6.3.1 如何在海量数据中寻找匹配的图像 223
6.3.2 如何识别和理解图像中的实体信息 223
6.3.3 其他计算机视觉领域常见任务 233
6.4 计算机视觉应用的产业分析 236
6.4.1 计算机视觉在互联网行业的应用 237
6.4.2 计算机视觉在传统行业的应用 243
6.5 小结 245
第7章 知识图谱和对话机器人 248
7.1 知识图谱技术 248
7.1.1 两类信息 248
7.1.2 人工智能技术的发展历程 248
7.1.3 什么是知识图谱 250
7.1.4 知识图谱的应用场景 251
7.2 基于知识的人机交互 253
7.2.1 基于领域知识优化人机交互策略 253
7.2.2 领域知识的挖掘 257
7.3 对话机器人的产业分析与技术方案 266
7.3.1 技术流派与实现方案 266
7.3.2 技术应用两大方向 268
7.3.3 技术实现 276
7.3.4 应用MDP和Q-learning算法的案例 283
第三部分 商业与战略
第8章 认知新技术:区块链 290
8.1 从创造者的视角理解技术 290
8.1.1 货币的本质是什么 292
8.1.2 如何记账 293
8.1.3 如何保证账本的真实性 294
8.1.4 如何保证账本的安全性 294
8.1.5 如何实现分布式存储的数据同步 295
8.1.6 如何解决记账的动力 297
8.2 用抽象逻辑梳理应用场景 298
8.2.1 “链圈”应用的内在逻辑 298
8.2.2 区块链技术应用的案例 299
8.2.3 区块链技术应用的三个阻碍 303
8.2.4 “链圈”应用的总结 306
8.3 “币圈”应用思想的精要 306
8.3.1 为什么要发币 306
8.3.2 为何币会值钱 307
8.3.3 如何设计发币 309
8.4 从商业本质来制定战略 310
第9章 医疗行业的技术布局和应用思考 314
9.1 谋划行业中的技术应用 314
9.2 互联网医疗平台 315
9.2.1 多种医药流通业态逐渐融合 315
9.2.2 互联网医疗平台与商业保险的合作模式 316
9.3 医疗行业的技术应用分析 317
9.3.1 互联网应用 318
9.3.2 区块链应用 321
9.3.3 IT软件和云计算应用 326
9.3.4 人工智能应用 330
9.3.5 科技企业进入传统行业落地AI技术 336
9.4 思考技术在行业应用的方法论 338
第10章 从技术到商业的思考 340
10.1 主题回顾 340
10.2 从技术到商业的思维模式转变 341
10.2.1 战略壁垒的重要性 341
10.2.2 常见的战略壁垒 342
10.3 新型壁垒:平台模式的解析 346
10.3.1 平台模式的典型案例:Steam游戏平台 346
10.3.2 互联网企业以整合C端平台供应链的
模式切入B端服务市场 348
10.3.3 互联网企业赋能生态伙伴的方法论 352
10.4 技术投资与采购的方法论 358
10.4.1 层面1:梳理业务所需的技术全景 358
10.4.2 层面2:梳理具体技术方向的内部逻辑 359
10.4.3 层面3:分析具备能力的候选企业 361
10.4.4 案例:短视频C端赛道的业务 362
10.5 人工智能的产业展望 364
10.5.1 人工智能未来的发展 364
10.5.2 人工智能应用的方法论 367
10.5.3 人工智能的企业市场分析 368
10.6 企业的组织能力: 《创新者的窘境》中的理论 370
10.7 人工智能应用领域的职业前景 372
第四部分 工具与实践
第11章 实践课 374
11.1 实践课1:基于深度学习框架飞桨完成房价
预测任务 374
11.1.1 深度学习框架 374
11.1.2 飞桨产业级深度学习开源开放平台 375
11.1.3 使用飞桨构建波士顿房价预测模型 383
11.2 实践课2:手写数字识别 384
11.3 实践课3:词向量和语义相似度 388
11.4 实践课4:毕业设计 395
11.4.1 毕业设计作业 395
11.4.2 往届学员优秀作品展示 396
部分 原理与思考
第1章 机器学习与大数据 2
1.1 机器为何能学习 2
1.1.1 人类为何能学习 2
1.1.2 从个案学习到统计学习 3
1.1.3 统计学习是否可信 5
1.2 机器是怎样学习的 9
1.2.1 机器学习的框架:假设+目标+寻解 9
1.2.2 如何在机器学习场景中应用大数定律 14
1.2.3 大数据对机器学习的意义 17
1.2.4 小结 20
1.3 跨上人工智能的战车 20
1.3.1 大数据的概念及价值 20
1.3.2 企业为何要搭上人工智能的战车 24
1.3.3 企业如何搭上人工智能的战车 27
1.3.4 人工智能技术团队的建设 38
第2章 机器学习框架的深入探讨 40
2.1 机器为何能学习(续):故事结束了吗?我们需要更多的
模型吗 40
2.1.1 牛顿第二定律的遗留问题 40
2.1.2 新的需求场景 43
2.1.3 不同的目标 49
2.1.4 不同的寻解 54
2.1.5 小结与回顾 60
2.2 重要权衡与过拟合 62
2.2.1 重要权衡的四张“面孔” 62
2.2.2 过拟合的成因和防控 68
2.2.3 小结与回顾 77
第3章 从线性函数到非线性函数,如何构建强大的模型 78
3.1 从线性函数到非线性函数 78
3.1.1 线性模型的不足 78
3.1.2 怎样扩展假设空间 79
3.2 核函数方法 82
3.2.1 正则化的另一种理解与SVM模型 82
3.2.2 核函数的思路 86
3.3 多模型组合的方法 88
3.3.1 组合模型的两个好处 88
3.3.2 实现组合模型的两个步骤和方法 89
3.3.3 装袋方式 91
3.3.4 提升方式 92
3.3.5 切分方式 93
3.3.6 小结 96
3.4 神经网络与深度学习 97
3.4.1 神经网络和深度学习的模型思路 97
3.4.2 组建神经网络 98
3.4.3 神经网络模型的优化 99
3.4.4 非线性变换函数的选择 102
3.4.5 神经网络结构的选择 104
3.4.6 深度学习得到发展的前提及其具备的优势 107
3.4.7 深度学习的重要衍生功能 111
第4章 机器学习的建模实践 122
4.1 业务建模 122
4.1.1 如何做好业务建模 122
4.1.2 案例:两个不同的排序模型 124
4.2 特征工程 128
4.2.1 特征工程的定义 128
4.2.2 信息可以存储在特征中,也可以存储在模型中 129
4.2.3 特征工程案例 131
4.2.4 特征的类型和维度 135
4.2.5 特征存在缺失或错误值时怎么办 137
4.2.6 特征降维和选择 137
4.3 样本处理 140
4.3.1 训练样本的基本概念 140
4.3.2 训练样本的常见问题及其解决方案 141
4.4 模型评估 151
4.4.1 业务目标的评估 151
4.4.2 模型目标的评估 155
4.5 小结 170
第二部分 应用与方法
第5章 电商平台促销策略模型 174
5.1 业务背景 174
5.1.1 互联网的盈利模式 174
5.1.2 广告定价机制 175
5.2 传统的促销方案 176
5.2.1 问题1:如何选择促销时机 177
5.2.2 问题2:如何为店铺制定广告消费任务 179
5.2.3 问题3:如何设置优惠定价模型 182
5.3 基于竞争传播的颠覆创新 190
5.3.1 颠覆创新的思考 190
5.3.2 竞争传播模型 192
5.3.3 种子集合筛选算法 197
5.4 小结 198
第6章 计算机视觉及其应用产品的构建 199
6.1 计算机视觉产品的问题背景 199
6.2 图像的特征表示 200
6.2.1 SIFT特征 201
6.2.2 CNN模型与特征 205
6.2.3 实现高速计算的方法:特征降维 221
6.3 视觉产品的构建案例 223
6.3.1 如何在海量数据中寻找匹配的图像 223
6.3.2 如何识别和理解图像中的实体信息 223
6.3.3 其他计算机视觉领域常见任务 233
6.4 计算机视觉应用的产业分析 236
6.4.1 计算机视觉在互联网行业的应用 237
6.4.2 计算机视觉在传统行业的应用 243
6.5 小结 245
第7章 知识图谱和对话机器人 248
7.1 知识图谱技术 248
7.1.1 两类信息 248
7.1.2 人工智能技术的发展历程 248
7.1.3 什么是知识图谱 250
7.1.4 知识图谱的应用场景 251
7.2 基于知识的人机交互 253
7.2.1 基于领域知识优化人机交互策略 253
7.2.2 领域知识的挖掘 257
7.3 对话机器人的产业分析与技术方案 266
7.3.1 技术流派与实现方案 266
7.3.2 技术应用两大方向 268
7.3.3 技术实现 276
7.3.4 应用MDP和Q-learning算法的案例 283
第三部分 商业与战略
第8章 认知新技术:区块链 290
8.1 从创造者的视角理解技术 290
8.1.1 货币的本质是什么 292
8.1.2 如何记账 293
8.1.3 如何保证账本的真实性 294
8.1.4 如何保证账本的安全性 294
8.1.5 如何实现分布式存储的数据同步 295
8.1.6 如何解决记账的动力 297
8.2 用抽象逻辑梳理应用场景 298
8.2.1 “链圈”应用的内在逻辑 298
8.2.2 区块链技术应用的案例 299
8.2.3 区块链技术应用的三个阻碍 303
8.2.4 “链圈”应用的总结 306
8.3 “币圈”应用思想的精要 306
8.3.1 为什么要发币 306
8.3.2 为何币会值钱 307
8.3.3 如何设计发币 309
8.4 从商业本质来制定战略 310
第9章 医疗行业的技术布局和应用思考 314
9.1 谋划行业中的技术应用 314
9.2 互联网医疗平台 315
9.2.1 多种医药流通业态逐渐融合 315
9.2.2 互联网医疗平台与商业保险的合作模式 316
9.3 医疗行业的技术应用分析 317
9.3.1 互联网应用 318
9.3.2 区块链应用 321
9.3.3 IT软件和云计算应用 326
9.3.4 人工智能应用 330
9.3.5 科技企业进入传统行业落地AI技术 336
9.4 思考技术在行业应用的方法论 338
第10章 从技术到商业的思考 340
10.1 主题回顾 340
10.2 从技术到商业的思维模式转变 341
10.2.1 战略壁垒的重要性 341
10.2.2 常见的战略壁垒 342
10.3 新型壁垒:平台模式的解析 346
10.3.1 平台模式的典型案例:Steam游戏平台 346
10.3.2 互联网企业以整合C端平台供应链的
模式切入B端服务市场 348
10.3.3 互联网企业赋能生态伙伴的方法论 352
10.4 技术投资与采购的方法论 358
10.4.1 层面1:梳理业务所需的技术全景 358
10.4.2 层面2:梳理具体技术方向的内部逻辑 359
10.4.3 层面3:分析具备能力的候选企业 361
10.4.4 案例:短视频C端赛道的业务 362
10.5 人工智能的产业展望 364
10.5.1 人工智能未来的发展 364
10.5.2 人工智能应用的方法论 367
10.5.3 人工智能的企业市场分析 368
10.6 企业的组织能力: 《创新者的窘境》中的理论 370
10.7 人工智能应用领域的职业前景 372
第四部分 工具与实践
第11章 实践课 374
11.1 实践课1:基于深度学习框架飞桨完成房价
预测任务 374
11.1.1 深度学习框架 374
11.1.2 飞桨产业级深度学习开源开放平台 375
11.1.3 使用飞桨构建波士顿房价预测模型 383
11.2 实践课2:手写数字识别 384
11.3 实践课3:词向量和语义相似度 388
11.4 实践课4:毕业设计 395
11.4.1 毕业设计作业 395
11.4.2 往届学员优秀作品展示 396
机器学习的产业实践之路 作者简介
毕然 专注于机器学习、人工智能、数据分析、商业战略等领域,出品过“大数据分析的道与术”“零基础实践深度学习”“机器学习的思考故事”“如何系统化地分析业务和战略”等系列课程,其中前2个课程著有同名书籍,本书为第3个课程的配套书籍。