《数据自助服务实践指南:数据开放与洞察提效》[美]桑迪普・乌坦坎达尼(Sandeep | PDF下载|ePub下载
数据自助服务实践指南:数据开放与洞察提效 版权信息
- 出版社:机械工业出版社
- 出版时间:2022-05-01
- ISBN:9787111703853
- 条形码:9787111703853 ; 978-7-111-70385-3
数据自助服务实践指南:数据开放与洞察提效 本书特色
适读人群 :数据工程师、数据平台开发人员数据驱动的洞察是当今所有行业的关键竞争优势。从原始数据中提取洞察往往需要几天或几周时间,大多数组织无法足够快地扩大数据科学团队以跟上需要转换的数据量的增长。那么如何解决这一问题呢?答案是实现数据自助服务。 通过本书,数据工程师、数据科学家和团队经理将学习如何构建自助数据平台,以帮助组织从数据中提取洞察。作者在书中提供了一个记分卡,用于跟踪并解决在数据发现、转换、处理和生产过程中增加洞察耗时的瓶颈问题。 本书弥合了数据科学家与数据工程师之间的鸿沟――数据科学家被工程现实所束缚,而数据工程师对自助服务的工作方式一无所知。 通过学习本书,你将能够: ? 构建自助服务门户以支持数据发现、数据质量、数据沿袭和数据治理。 ? 使用开源技术为每个自助服务功能选择佳方法。 ? 为数据的发现、准备、构建、实施定制自助服务。 ? 实现数据开放与洞察提效的功能。 ? 扩展自助服务门户以为组织内的大量用户提供支持。
数据自助服务实践指南:数据开放与洞察提效 内容简介
本书主要介绍数据洞察及其四个阶段,第1部分为自助服务数据发现,包括元数据目录服务、搜索服务、特征存储服务、数据迁移服务、点击流跟踪服务。第二部分 为自助服务数据准备包括数据湖管理服务、数据整理服务、数据权限治理服务。第三部分为自助服务数据构建,包括、数据虚拟化服务、模型训练服务、持续集成服务、A/B测试服务。第四部分为自助服务数据实施,包括查询优化服务、管道编排服务、模型部署服务、质量监控服务、成本管理服务。通过学习本书,数据工程师、数据科学家和团队经理将学习如何构建一个自助数据科学平台,帮助你的组织中的任何人从数据中提取见解。<br>
数据自助服务实践指南:数据开放与洞察提效 目录
第1章 数据介绍5
1.1 从原始数据到洞察6
1.2 定义洞察耗时记分卡13
1.3 建立数据自助服务路线图17
**部分 数据发现自助服务
第2章 元数据目录服务21
2.1 路线图22
2.2 *小化解释耗时23
2.3 定义需求26
2.4 实现模式28
2.5 总结32
第3章 搜索服务33
3.1 路线图33
3.2 *小化搜索耗时34
3.3 定义需求36
3.4 实现模式38
3.5 总结45
第4章 特征存储服务46
4.1 路线图47
4.2 *小化特征处理耗时48
4.3 定义需求49
4.4 实现模式51
4.5 总结55
第5章 数据迁移服务56
5.1 路线图56
5.2 *小化数据可用性耗时57
5.3 定义需求58
5.4 实现模式62
5.5 总结68
第6章 点击流跟踪服务69
6.1 路线图70
6.2 *小化点击指标耗时71
6.3 定义需求73
6.4 实现模式75
6.5 总结79
第二部分 数据准备自助服务
第7章 数据湖管理服务83
7.1 路线图84
7.2 *小化数据湖管理耗时86
7.3 实现模式91
7.4 总结94
第8章 数据整理服务95
8.1 路线图96
8.2 *小化数据整理耗时97
8.3 定义需求98
8.4 实现模式98
8.5总结100
第9章 数据权限治理服务101
9.1 路线图102
9.2 *小化合规耗时103
9.3 定义需求104
9.4 实现模式107
9.5总结111
第三部分 数据构建自助服务
第10章 数据虚拟化服务115
10.1 路线图116
10.2 *小化查询耗时116
10.3 定义需求117
10.4 实现模式119
10.5 总结124
第11章 数据转换服务125
11.1 路线图125
11.2 *小化转换耗时126
11.3 定义需求127
11.4 实现模式128
11.5总结133
第12章 模型训练服务134
12.1 路线图135
12.2 *小化训练耗时136
12.3 定义需求138
12.4实现模式140
12.5 总结144
第13章 持续集成服务145
13.1 路线图146
13.2 *小化集成耗时147
13.3 定义需求148
13.4 实现模式149
13.5 总结152
第14章 A/B测试服务153
14.1 路线图155
14.2 *小化A/B测试耗时156
14.3 实现模式158
14.4 总结160
第四部分 数据实施自助服务
第15章 查询优化服务163
15.1 路线图164
15.2 *小化优化耗时165
15.3 定义需求167
15.4 实现模式168
15.5 总结173
第16章 管道编排服务174
16.1 路线图175
16.2 *小化编排耗时176
16.3 定义需求177
16.4 实现模式179
16.5总结183
第17章 模型部署服务184
17.1 路线图184
17.2 *小化部署耗时185
17.3 定义需求186
17.4 实现模式189
17.5 总结193
第18章 质量可观测性服务194
18.1 路线图195
18.2 *小化洞察质量耗时196
18.3 定义需求198
18.4 实现模式199
18.5 总结204
第19章 成本管理服务205
19.1 路线图206
19.2 *小化优化成本耗时207
19.3 定义需求208
19.4 实现模式209
19.5 总结213
数据自助服务实践指南:数据开放与洞察提效 作者简介
桑迪普・乌坦坎达尼,Sandeep Uttamchandani博士是Unravel Data Systems的工程副总裁兼首席数据官。他在构建数据产品以及管理用于分析和机器学习的大型数据平台方面拥有近20年的经验。此前,他是Intult的QuickB00ks产品线的首席数据架构师和数据平台负责人。