《时间序列与机器学习》张戎 | PDF下载|ePub下载
类别: 科技
内容简介 · · · · · ·
本书分为8 章,内容包括时间序列分析的基础知识、时间序列预测的常用方法,以及神经网络在时间序列预测中的应用;时间序列异常检测算法的技术与框架,如何识别异常的时间点及多种异常检测方法;时间序列的相似性度量方法、聚类算法;多维时间序列在广告分析和业务运维领域的应用,利用OLAP 技术对多维时间序列进行有效处理,通过根因分析技术获得导致故障的维度和元素;智能运维领域(AIOps)和金融领域的两个应用场景。
本书适合数据科学家、机器学习工程师、金融领域从业者,以及对时间序列分析和机器学习感兴趣的读者阅读。本书可作为高等院校计算机、统计学、金融学等相关专业师生的教材和参考资料。
作者简介 · · · · · ·
张戎博士,新加坡国立大学数学博士,深圳孔雀计划高层次人才,数学和机器学习领域科普作家,数学、科研和深度学习等话题的优秀自媒体工作者, 曾多次担任行业技术大会讲师。博士期间从事动力系统的研究工作,博士论文中解决了非正则吸引子的存在性问题。毕业之后在工业界从事人工智能的研发工作,涉及业务包括推荐系统、安全大数据和智能运维等内容。
罗齐,硕士毕业于香港中文大学(深圳),现就职于某互联网公司,从事算法应用研究工作,研究方向为游戏数据挖掘和智能运维,曾参与多款热门游戏的数据挖掘和智能运维工作。
目录 · · · · · ·
第1 章时间序列概述 1
1.1 发展历程 1
1.2 应用现状 3
1.3 时间序列分类4
1.3.1 单维时间序列4
1.3.2 多维时间序列6
1.4 小结 8
第2 章时间序列的信息提取 9
2.1 特征工程的入门知识9
2.1.1 特征工程简介9
2.1.2 数值型特征 12
2.1.3 类别型特征 17
2.1.4 交叉特征 17
2.2 时间序列的预处理 18
2.2.1 时间序列的缺失值 18
2.2.2 时间序列的缩放 20
2.3 时间序列的特征工程24
2.4 时间序列的统计特征28
2.5 时间序列的熵特征 32
2.6 时间序列的降维特征38
2.6.1 分段聚合逼近38
2.6.2 分段线性逼近39
2.6.3 分段常数逼近41
2.6.4 符号逼近 42
2.6.5 最大三角形三桶算法43
2.6.6 用神经网络自动生成特征的算法 44
2.7 时间序列的单调性 53
2.7.1 线性拟合方法54
2.7.2 控制图方法 55
2.7.3 均线方法 60
2.8 小结 63
第3 章时间序列预测 64
3.1 时间序列预测的统计方法 65
3.1.1 自回归差分移动平均模型 65
3.1.2 指数平滑方法72
3.1.3 Prophet 75
3.2 时间序列预测的深度学习方法 83
3.2.1 循环神经网络83
3.2.2 长短期记忆网络 85
3.2.3 Transformer 90
3.2.4 Informer96
3.3 小结·100
第4 章时间序列异常检测 101
4.1 异常类型及检测方法分类 101
4.2 基于概率密度的方法 104
4.2.1 核密度估计原理 104
4.2.2 核密度估计方法 106
4.3 基于重构的方法 111
4.3.1 变分自编码器 111
4.3.2 Donut 115
4.4 基于距离的方法 117
4.4.1 孤立森林 118
4.4.2 RRCF 121
4.5 基于有监督的方法 125
4.6 基于弱监督的方法 127
4.7 小结 129
第5 章时间序列的相似度与聚类 130
5.1 相似度函数 130
5.1.1 经典的相似度函数 131
5.1.2 基于分段聚合逼近的相似度函数 134
5.1.3 基于时间序列平滑的相似度函数 135
5.1.4 基于神经网络的相似度算法 136
5.2 距离函数 137
5.2.1 欧氏距离 138
5.2.2 DTW 算法139
5.2.3 基于相似性的距离 140
5.2.4 基于符号特征的距离 141
5.2.5 基于自相关性的距离 142
5.2.6 基于周期性的距离 143
5.2.7 基于模型的距离 144
5.3 基于特征工程的聚类算法 145
5.4 基于距离和相似度的聚类算法 149
5.5 流式聚类算法 151
5.6 小结 154
第6 章多维时间序列 155
6.1 多维时间序列简介155
6.2 单维时间序列与多维时间序列 156
6.2.1 广告分析领域 156
6.2.2 业务运维领域 157
6.3 单维时间序列监控系统和多维时间序列监控系统的对比 159
6.4 根因分析 160
6.4.1 根因分析的基础概念 160
6.4.2 人工执行根因分析的难度 163
6.4.3 OLAP 技术和方法 164
6.5 基于时间序列异常检测算法的根因分析 165
6.5.1 时间序列异常检测 165
6.5.2 根因分析的列表结构 170
6.5.3 根因分析的树状结构 172
6.6 基于熵的根因分析 173
6.6.1 熵的概念和性质 173
6.6.2 概率之间的距离 174
6.6.3 基于熵的根因分析方法 177
6.7 基于树模型的根因分析 187
6.7.1 特征工程和样本 187
6.7.2 决策树算法 187
6.8 规则学习 188
6.8.1 根因分析的列表结构 188
6.8.2 根因分析的树状结构 189
6.8.3 列表结构与树状结构的对比 191
6.8.4 规则的排序 192
6.9 小结 193
第7 章智能运维的应用场景 194
7.1 智能运维 194
7.1.1 智能运维的主要方向 195
7.1.2 智能运维的实施路径 196
7.2 指标监控 197
7.2.1 硬件监控与软件监控 198
7.2.2 业务监控 198
7.2.3 节假日效应 201
7.2.4 持续异常的情况 205
7.2.5 存在基线的情况 205
7.2.6 寻找基线的方法 206
7.3 容量预估和弹性伸缩 208
7.3.1 容量预估 208
7.3.2 弹性伸缩 209
7.4 告警系统 210
7.4.1 告警系统的定义与评估指标 210
7.4.2 告警关联与收敛 212
7.4.3 基于相似性或聚类算法的告警关联与收敛 214
7.4.4 基于告警属性泛化层次的告警关联与收敛 219
7.4.5 基于根因分析的告警关联与收敛 224
7.5 小结 226
第8 章金融领域的应用场景 228
8.1 量化交易概述 229
8.1.1 数据230
8.1.2 因子 230
8.1.3 回测 231
8.2 因子特征工程 231
8.3 资产定价 234
8.4 资产配置 241
8.5 波动率预测 243
8.6 小结 245
参考文献 246
· · · · · ·
1.1 发展历程 1
1.2 应用现状 3
1.3 时间序列分类4
1.3.1 单维时间序列4
1.3.2 多维时间序列6
1.4 小结 8
第2 章时间序列的信息提取 9
2.1 特征工程的入门知识9
2.1.1 特征工程简介9
2.1.2 数值型特征 12
2.1.3 类别型特征 17
2.1.4 交叉特征 17
2.2 时间序列的预处理 18
2.2.1 时间序列的缺失值 18
2.2.2 时间序列的缩放 20
2.3 时间序列的特征工程24
2.4 时间序列的统计特征28
2.5 时间序列的熵特征 32
2.6 时间序列的降维特征38
2.6.1 分段聚合逼近38
2.6.2 分段线性逼近39
2.6.3 分段常数逼近41
2.6.4 符号逼近 42
2.6.5 最大三角形三桶算法43
2.6.6 用神经网络自动生成特征的算法 44
2.7 时间序列的单调性 53
2.7.1 线性拟合方法54
2.7.2 控制图方法 55
2.7.3 均线方法 60
2.8 小结 63
第3 章时间序列预测 64
3.1 时间序列预测的统计方法 65
3.1.1 自回归差分移动平均模型 65
3.1.2 指数平滑方法72
3.1.3 Prophet 75
3.2 时间序列预测的深度学习方法 83
3.2.1 循环神经网络83
3.2.2 长短期记忆网络 85
3.2.3 Transformer 90
3.2.4 Informer96
3.3 小结·100
第4 章时间序列异常检测 101
4.1 异常类型及检测方法分类 101
4.2 基于概率密度的方法 104
4.2.1 核密度估计原理 104
4.2.2 核密度估计方法 106
4.3 基于重构的方法 111
4.3.1 变分自编码器 111
4.3.2 Donut 115
4.4 基于距离的方法 117
4.4.1 孤立森林 118
4.4.2 RRCF 121
4.5 基于有监督的方法 125
4.6 基于弱监督的方法 127
4.7 小结 129
第5 章时间序列的相似度与聚类 130
5.1 相似度函数 130
5.1.1 经典的相似度函数 131
5.1.2 基于分段聚合逼近的相似度函数 134
5.1.3 基于时间序列平滑的相似度函数 135
5.1.4 基于神经网络的相似度算法 136
5.2 距离函数 137
5.2.1 欧氏距离 138
5.2.2 DTW 算法139
5.2.3 基于相似性的距离 140
5.2.4 基于符号特征的距离 141
5.2.5 基于自相关性的距离 142
5.2.6 基于周期性的距离 143
5.2.7 基于模型的距离 144
5.3 基于特征工程的聚类算法 145
5.4 基于距离和相似度的聚类算法 149
5.5 流式聚类算法 151
5.6 小结 154
第6 章多维时间序列 155
6.1 多维时间序列简介155
6.2 单维时间序列与多维时间序列 156
6.2.1 广告分析领域 156
6.2.2 业务运维领域 157
6.3 单维时间序列监控系统和多维时间序列监控系统的对比 159
6.4 根因分析 160
6.4.1 根因分析的基础概念 160
6.4.2 人工执行根因分析的难度 163
6.4.3 OLAP 技术和方法 164
6.5 基于时间序列异常检测算法的根因分析 165
6.5.1 时间序列异常检测 165
6.5.2 根因分析的列表结构 170
6.5.3 根因分析的树状结构 172
6.6 基于熵的根因分析 173
6.6.1 熵的概念和性质 173
6.6.2 概率之间的距离 174
6.6.3 基于熵的根因分析方法 177
6.7 基于树模型的根因分析 187
6.7.1 特征工程和样本 187
6.7.2 决策树算法 187
6.8 规则学习 188
6.8.1 根因分析的列表结构 188
6.8.2 根因分析的树状结构 189
6.8.3 列表结构与树状结构的对比 191
6.8.4 规则的排序 192
6.9 小结 193
第7 章智能运维的应用场景 194
7.1 智能运维 194
7.1.1 智能运维的主要方向 195
7.1.2 智能运维的实施路径 196
7.2 指标监控 197
7.2.1 硬件监控与软件监控 198
7.2.2 业务监控 198
7.2.3 节假日效应 201
7.2.4 持续异常的情况 205
7.2.5 存在基线的情况 205
7.2.6 寻找基线的方法 206
7.3 容量预估和弹性伸缩 208
7.3.1 容量预估 208
7.3.2 弹性伸缩 209
7.4 告警系统 210
7.4.1 告警系统的定义与评估指标 210
7.4.2 告警关联与收敛 212
7.4.3 基于相似性或聚类算法的告警关联与收敛 214
7.4.4 基于告警属性泛化层次的告警关联与收敛 219
7.4.5 基于根因分析的告警关联与收敛 224
7.5 小结 226
第8 章金融领域的应用场景 228
8.1 量化交易概述 229
8.1.1 数据230
8.1.2 因子 230
8.1.3 回测 231
8.2 因子特征工程 231
8.3 资产定价 234
8.4 资产配置 241
8.5 波动率预测 243
8.6 小结 245
参考文献 246
· · · · · ·
发表回复
要发表评论,您必须先登录。