零基础学Python数据分析(升级版)(全彩印刷) | PDF下载|ePub下载
类别: 计算机
作者:[美] Gayle Laakmann McDowell
出版社: 人民邮电出版社
原作名: Cracking the coding interview:150 programming questions and solutions,fifth edition
译者:李琳骁/漆犇
出版年: 2013-11
页数: 372
定价: 59.00元
装帧: 平装
ISBN: 9787115332912
出版社: 人民邮电出版社
原作名: Cracking the coding interview:150 programming questions and solutions,fifth edition
译者:李琳骁/漆犇
出版年: 2013-11
页数: 372
定价: 59.00元
装帧: 平装
ISBN: 9787115332912
内容简介 · · · · · ·
《零基础学 Python 数据分析》(升级版)以数据分析“三剑客”Pandas、Matplotlib 和 NumPy 为主线,从学习与应用的角度出发,全面介绍了数据分析必备入门知识,帮助读者快速掌握数据分析技能,拓宽职场道路。本书通过大量的示意图辅助讲解,力求使读者能够快速理解晦涩难懂的专业术语,同时通过快速示例将知识与应用相结合,并给出实际项目的数据分析案例,让读者能够轻松学习,从而将数据分析与预测知识应用到实际工作中。
全书共 10 章,包括数据分析基础、搭建 Python 数据分析环境、Pandas 入门、Pandas 进阶、可视化数据分析图表、图解数组计算模块 NumPy、数据统计分析案例、机器学习 Scikit-Learn、Python 股票数据分析(Jupyter Notebook 版)、京东电商销售数据分析与预测。本书提供丰富的资源,包含快速示例、案例、项目、视频讲解,力求为读者打造一本“知识讲解+ 快速示例 + 综合应用 + 实战项目”一体化的精彩的 Python 数据分析图书。
本书适合 Python 初学者、数据分析新入行人员、从事数据相关工作的人员、对数据分析感兴趣的人员,以及从事其他岗位的想掌握一定数据分析技能的职场人员。
作者简介 · · · · · ·
明日科技是一家专业从事软件开发、教育培训以及软件开发教育资源整合的高科技公司。其编写的教程既注重选取软件开发中的必需、常用内容,又注重内容的易学易用以及相关知识的拓展,深受读者喜爱。同时,其编写的教程多次荣获”全行业优秀畅销品种””中国大学出版社图书奖优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。
目录 · · · · · ·
第 1 章 数据分析基础 1
视频讲解:17 分钟 e 学码词条:7 个
1.1 什么是数据分析 2
1.2 数据分析的重要性 2
1.3 数据分析的基本流程 3
1.3.1 熟悉工具 4
1.3.2 明确目的 4
1.3.3 获取数据 4
1.3.4 数据处理 4
1.3.5 数据分析 5
1.3.6 验证结果 5
1.3.7 结果呈现 5
1.3.8 数据应用 5
1.4 数据分析的常用工具 5
1.4.1 Excel工具 6
1.4.2 Python语言 6
1.5 小结 6
第 2 章 搭建 Python 数据分析环境 7
视频讲解:24 分钟 e 学码词条:8 个
2.1 快速了解Python 8
2.1.1 Python简介 8
2.1.2 Python的版本 8
2.1.3 Python的应用领域 8
2.2 搭建Python开发环境 9
2.2.1 下载和安装Python 9
2.2.2 第一个Python程序“hello world” 12
2.3 集成开发环境PyCharm 13
2.3.1 下载PyCharm 14
2.3.2 安装PyCharm 15
2.3.3 运行PyCharm 17
2.3.4 在PyCharm中创建一组学生成绩数据 18
2.4 数据分析标准环境Anaconda 21
2.4.1 下载Anaconda 21
2.4.2 安装Anaconda 21
2.5 Jupyter Notebook开发工具 23
2.5.1 认识Jupyter Notebook 23
2.5.2 新建一个Jupyter Notebook文件 24
2.5.3 在Jupyter Notebook中绘制7日天气走势图 24
2.6 小结 26
第 3 章 Pandas 入门 27
视频讲解:4 小时 10 分钟 快速示例:48 个
e 学码词条:7 个
3.1 认识Pandas 28
3.1.1 什么是Pandas 28
3.1.2 Pandas的功能与优势 28
3.1.3 安装Pandas模块 28
3.1.4 牛刀小试——轻松导入Excel数据 30
3.2 Series对象 31
3.2.1 图解Series对象 31
3.2.2 创建一个Series对象 32
3.2.3 手动设置Series对象的索引 33
3.2.4 Series对象的索引 33
3.2.5 获取Series对象的索引和值 35
3.3 DataFrame对象 35
3.3.1 图解DataFrame对象 35
3.3.2 创建一个DataFrame对象 36
3.3.3 DataFrame对象的重要属性和函数 38
3.4 外部数据读取 39
3.4.1 读取Excel文件 39
3.4.2 读取CSV文件 43
3.4.3 读取文本文件 44
3.4.4 读取HTML网页数据 45
3.5 数据抽取 47
3.5.1 抽取一行数据 47
3.5.2 抽取多行数据 48
3.5.3 抽取指定列数据 49
3.5.4 抽取指定行列数据 50
3.5.5 按指定条件抽取数据 51
3.6 数据的增加、修改和删除 52
3.6.1 增加数据 52
3.6.2 修改数据 54
3.6.3 删除数据 55
3.7 数据清洗 56
3.7.1 缺失值查看与处理 56
3.7.2 重复值处理 59
3.7.3 异常值的检测与处理 59
3.8 索引设置 60
3.8.1 索引的作用 60
3.8.2 重新设置索引 61
3.8.3 设置某列为行索引 62
3.8.4 数据清洗后重新设置连续的行索引 63
3.9 数据排序与排名 64
3.9.1 数据排序 64
3.9.2 数据排名 65
3.10 小结 66
第 4 章 Pandas 进阶 67
视频讲解:3 小时 15 分钟 快速示例:54 个
e 学码词条:8 个
4.1 数据计算 68
4.1.1 求和(sum方法) 68
4.1.2 求均值(mean方法) 69
4.1.3 求最大值(max方法) 69
4.1.4 求最小值(min方法) 70
4.1.5 求中位数(median方法) 70
4.1.6 求众数(mode方法) 71
4.1.7 求方差(var方法) 72
4.1.8 求标准差(std方法) 74
4.1.9 求分位数(quantile方法) 74
4.2 数据格式化 76
4.2.1 设置小数位数 76
4.2.2 设置百分比 77
4.2.3 设置千位分隔符 78
4.3 数据分组统计 78
4.3.1 groupby方法 78
4.3.2 对分组数据进行迭代 80
4.3.3 对分组的某列或多列使用聚合函数 81
4.3.4 通过字典和Series对象进行分组统计 82
4.4 数据移位 84
4.5 数据转换 86
4.5.1 一列数据转换为多列数据 86
4.5.2 行列转换 88
4.5.3 DataFrame转换为字典 90
4.5.4 DataFrame转换为列表 91
4.5.5 Excel数据转换为HTML网页格式 91
4.6 数据合并 92
4.6.1 merge方法 92
4.6.2 concat方法 95
4.7 数据导出 97
4.7.1 导出数据到Excel文件 97
4.7.2 导出数据到CSV文件 98
4.7.3 导出数据到多个工作表 99
4.8 日期数据处理 99
4.8.1 DataFrame的日期数据转换 99
4.8.2 dt函数的使用 101
4.8.3 获取日期区间的数据 102
4.8.4 按不同时期统计并显示数据 103
4.9 时间序列 105
4.9.1 重采样处理 105
4.9.2 降采样处理 106
4.9.3 升采样处理 107
4.9.4 时间序列数据汇总(ohlc方法) 108
4.9.5 移动窗口数据计算(rolling方法) 109
4.10 小结 112
第 5 章 可视化数据分析图表 113
视频讲解:3 小时 1 分钟 快速示例:38 个
e 学码词条:6 个
5.1 数据分析图表的作用 114
5.2 图表的基本组成 114
5.3 Matplotlib概述 115
5.3.1 Matplotlib简介 115
5.3.2 安装Matplotlib 117
5.3.3 Matplotlib图表之初体验 118
5.4 图表的常用设置 118
5.4.1 基本绘图plot函数 119
5.4.2 设置画布 122
5.4.3 设置坐标轴 122
5.4.4 添加文本标签 124
5.4.5 设置标题和图例 125
5.4.6 添加注释 126
5.5 常用图表的绘制 128
5.5.1 绘制折线图 128
5.5.2 绘制柱形图 129
5.5.3 绘制直方图 132
5.5.4 绘制饼形图 133
5.5.5 绘制散点图 137
5.5.6 绘制面积图 139
5.5.7 绘制热力图 141
5.5.8 绘制箱形图 142
5.5.9 绘制3D图表 145
5.5.10 绘制多个子图表 147
5.6 小结 151
第 6 章 图解数组计算模块NumPy 152
视频讲解:4 小时 22 分钟 快速示例:69 个
e 学码词条:7 个
6.1 初识NumPy 153
6.1.1 NumPy概述 153
6.1.2 安装NumPy 153
6.1.3 数组相关概念 154
6.2 创建数组 155
6.2.1 创建简单的数组 155
6.2.2 不同方式创建数组 157
6.2.3 按照数值范围创建数组 158
6.2.4 生成随机数组 161
6.2.5 从已有的数组中创建数组 163
6.3 数组的基本操作 167
6.3.1 数据类型 167
6.3.2 数组运算 168
6.3.3 数组的索引和切片 170
6.3.4 数组重塑 174
6.3.5 数组的增、删、改、查 177
6.4 NumPy矩阵基本操作 179
6.4.1 创建矩阵 179
6.4.2 矩阵运算 182
6.4.3 矩阵转换 184
6.5 NumPy常用统计分析函数 184
6.5.1 数学运算函数 184
6.5.2 统计分析函数 189
6.5.3 数组的排序 192
6.6 小结 194
第 7 章 数据统计分析案例 195
视频讲解:1 小时 23 分钟 精彩案例:6 个
e 学码词条:4 个
7.1 对比分析 196
7.2 同比、定比和环比分析 196
7.3 贡献度分析 201
7.4 差异化分析 202
7.5 相关性分析 204
7.6 时间序列分析 206
7.7 小 结 207
第 8 章 机器学习 Scikit-Learn 208
视频讲解:54 分钟 快速示例:5 个 e 学码词条:9 个
8.1 Scikit-Learn简介 209
8.2 安装Scikit-Learn 209
8.3 线性模型 211
8.3.1 最小二乘法回归 211
8.3.2 岭回归 212
8.4 支持向量机 213
8.5 聚类 215
8.5.1 什么是聚类 215
8.5.2 聚类算法 215
8.5.3 聚类模块 216
8.5.4 聚类数据生成器 217
8.6 小结 218
第 9 章 Python 股票数据分析(Jupyter Notebook 版) 219
视频讲解:44 分钟
9.1 概述 220
9.2 项目效果预览 220
9.3 项目开发环境 221
9.4 前期准备 221
9.4.1 安装第三方模块 221
9.4.2 新建Jupyter Notebook文件 222
9.4.3 导入必要的库 223
9.4.4 获取股票历史数据 223
9.5 数据预处理 225
9.5.1 数据查看与缺失性分析 225
9.5.2 描述性统计分析 225
9.5.3 数据处理 226
9.5.4 异常值分析 226
9.5.5 数据归一化处理 227
9.6 数据统计分析 228
9.6.1 可视化股票走势图 228
9.6.2 股票收盘价格走势图 229
9.6.3 股票成交量时间序列图 229
9.6.4 股票涨跌情况分析图 230
9.6.5 股票k线走势图 231
9.7 关键技术 232
9.8 小结 234
第 10 章 京东电商销售数据分析与预测 235
视频讲解:49 分钟 精彩案例:4 个
10.1 概述 236
10.2 项目效果预览 236
10.3 项目开发环境 236
· · · · · ·
视频讲解:17 分钟 e 学码词条:7 个
1.1 什么是数据分析 2
1.2 数据分析的重要性 2
1.3 数据分析的基本流程 3
1.3.1 熟悉工具 4
1.3.2 明确目的 4
1.3.3 获取数据 4
1.3.4 数据处理 4
1.3.5 数据分析 5
1.3.6 验证结果 5
1.3.7 结果呈现 5
1.3.8 数据应用 5
1.4 数据分析的常用工具 5
1.4.1 Excel工具 6
1.4.2 Python语言 6
1.5 小结 6
第 2 章 搭建 Python 数据分析环境 7
视频讲解:24 分钟 e 学码词条:8 个
2.1 快速了解Python 8
2.1.1 Python简介 8
2.1.2 Python的版本 8
2.1.3 Python的应用领域 8
2.2 搭建Python开发环境 9
2.2.1 下载和安装Python 9
2.2.2 第一个Python程序“hello world” 12
2.3 集成开发环境PyCharm 13
2.3.1 下载PyCharm 14
2.3.2 安装PyCharm 15
2.3.3 运行PyCharm 17
2.3.4 在PyCharm中创建一组学生成绩数据 18
2.4 数据分析标准环境Anaconda 21
2.4.1 下载Anaconda 21
2.4.2 安装Anaconda 21
2.5 Jupyter Notebook开发工具 23
2.5.1 认识Jupyter Notebook 23
2.5.2 新建一个Jupyter Notebook文件 24
2.5.3 在Jupyter Notebook中绘制7日天气走势图 24
2.6 小结 26
第 3 章 Pandas 入门 27
视频讲解:4 小时 10 分钟 快速示例:48 个
e 学码词条:7 个
3.1 认识Pandas 28
3.1.1 什么是Pandas 28
3.1.2 Pandas的功能与优势 28
3.1.3 安装Pandas模块 28
3.1.4 牛刀小试——轻松导入Excel数据 30
3.2 Series对象 31
3.2.1 图解Series对象 31
3.2.2 创建一个Series对象 32
3.2.3 手动设置Series对象的索引 33
3.2.4 Series对象的索引 33
3.2.5 获取Series对象的索引和值 35
3.3 DataFrame对象 35
3.3.1 图解DataFrame对象 35
3.3.2 创建一个DataFrame对象 36
3.3.3 DataFrame对象的重要属性和函数 38
3.4 外部数据读取 39
3.4.1 读取Excel文件 39
3.4.2 读取CSV文件 43
3.4.3 读取文本文件 44
3.4.4 读取HTML网页数据 45
3.5 数据抽取 47
3.5.1 抽取一行数据 47
3.5.2 抽取多行数据 48
3.5.3 抽取指定列数据 49
3.5.4 抽取指定行列数据 50
3.5.5 按指定条件抽取数据 51
3.6 数据的增加、修改和删除 52
3.6.1 增加数据 52
3.6.2 修改数据 54
3.6.3 删除数据 55
3.7 数据清洗 56
3.7.1 缺失值查看与处理 56
3.7.2 重复值处理 59
3.7.3 异常值的检测与处理 59
3.8 索引设置 60
3.8.1 索引的作用 60
3.8.2 重新设置索引 61
3.8.3 设置某列为行索引 62
3.8.4 数据清洗后重新设置连续的行索引 63
3.9 数据排序与排名 64
3.9.1 数据排序 64
3.9.2 数据排名 65
3.10 小结 66
第 4 章 Pandas 进阶 67
视频讲解:3 小时 15 分钟 快速示例:54 个
e 学码词条:8 个
4.1 数据计算 68
4.1.1 求和(sum方法) 68
4.1.2 求均值(mean方法) 69
4.1.3 求最大值(max方法) 69
4.1.4 求最小值(min方法) 70
4.1.5 求中位数(median方法) 70
4.1.6 求众数(mode方法) 71
4.1.7 求方差(var方法) 72
4.1.8 求标准差(std方法) 74
4.1.9 求分位数(quantile方法) 74
4.2 数据格式化 76
4.2.1 设置小数位数 76
4.2.2 设置百分比 77
4.2.3 设置千位分隔符 78
4.3 数据分组统计 78
4.3.1 groupby方法 78
4.3.2 对分组数据进行迭代 80
4.3.3 对分组的某列或多列使用聚合函数 81
4.3.4 通过字典和Series对象进行分组统计 82
4.4 数据移位 84
4.5 数据转换 86
4.5.1 一列数据转换为多列数据 86
4.5.2 行列转换 88
4.5.3 DataFrame转换为字典 90
4.5.4 DataFrame转换为列表 91
4.5.5 Excel数据转换为HTML网页格式 91
4.6 数据合并 92
4.6.1 merge方法 92
4.6.2 concat方法 95
4.7 数据导出 97
4.7.1 导出数据到Excel文件 97
4.7.2 导出数据到CSV文件 98
4.7.3 导出数据到多个工作表 99
4.8 日期数据处理 99
4.8.1 DataFrame的日期数据转换 99
4.8.2 dt函数的使用 101
4.8.3 获取日期区间的数据 102
4.8.4 按不同时期统计并显示数据 103
4.9 时间序列 105
4.9.1 重采样处理 105
4.9.2 降采样处理 106
4.9.3 升采样处理 107
4.9.4 时间序列数据汇总(ohlc方法) 108
4.9.5 移动窗口数据计算(rolling方法) 109
4.10 小结 112
第 5 章 可视化数据分析图表 113
视频讲解:3 小时 1 分钟 快速示例:38 个
e 学码词条:6 个
5.1 数据分析图表的作用 114
5.2 图表的基本组成 114
5.3 Matplotlib概述 115
5.3.1 Matplotlib简介 115
5.3.2 安装Matplotlib 117
5.3.3 Matplotlib图表之初体验 118
5.4 图表的常用设置 118
5.4.1 基本绘图plot函数 119
5.4.2 设置画布 122
5.4.3 设置坐标轴 122
5.4.4 添加文本标签 124
5.4.5 设置标题和图例 125
5.4.6 添加注释 126
5.5 常用图表的绘制 128
5.5.1 绘制折线图 128
5.5.2 绘制柱形图 129
5.5.3 绘制直方图 132
5.5.4 绘制饼形图 133
5.5.5 绘制散点图 137
5.5.6 绘制面积图 139
5.5.7 绘制热力图 141
5.5.8 绘制箱形图 142
5.5.9 绘制3D图表 145
5.5.10 绘制多个子图表 147
5.6 小结 151
第 6 章 图解数组计算模块NumPy 152
视频讲解:4 小时 22 分钟 快速示例:69 个
e 学码词条:7 个
6.1 初识NumPy 153
6.1.1 NumPy概述 153
6.1.2 安装NumPy 153
6.1.3 数组相关概念 154
6.2 创建数组 155
6.2.1 创建简单的数组 155
6.2.2 不同方式创建数组 157
6.2.3 按照数值范围创建数组 158
6.2.4 生成随机数组 161
6.2.5 从已有的数组中创建数组 163
6.3 数组的基本操作 167
6.3.1 数据类型 167
6.3.2 数组运算 168
6.3.3 数组的索引和切片 170
6.3.4 数组重塑 174
6.3.5 数组的增、删、改、查 177
6.4 NumPy矩阵基本操作 179
6.4.1 创建矩阵 179
6.4.2 矩阵运算 182
6.4.3 矩阵转换 184
6.5 NumPy常用统计分析函数 184
6.5.1 数学运算函数 184
6.5.2 统计分析函数 189
6.5.3 数组的排序 192
6.6 小结 194
第 7 章 数据统计分析案例 195
视频讲解:1 小时 23 分钟 精彩案例:6 个
e 学码词条:4 个
7.1 对比分析 196
7.2 同比、定比和环比分析 196
7.3 贡献度分析 201
7.4 差异化分析 202
7.5 相关性分析 204
7.6 时间序列分析 206
7.7 小 结 207
第 8 章 机器学习 Scikit-Learn 208
视频讲解:54 分钟 快速示例:5 个 e 学码词条:9 个
8.1 Scikit-Learn简介 209
8.2 安装Scikit-Learn 209
8.3 线性模型 211
8.3.1 最小二乘法回归 211
8.3.2 岭回归 212
8.4 支持向量机 213
8.5 聚类 215
8.5.1 什么是聚类 215
8.5.2 聚类算法 215
8.5.3 聚类模块 216
8.5.4 聚类数据生成器 217
8.6 小结 218
第 9 章 Python 股票数据分析(Jupyter Notebook 版) 219
视频讲解:44 分钟
9.1 概述 220
9.2 项目效果预览 220
9.3 项目开发环境 221
9.4 前期准备 221
9.4.1 安装第三方模块 221
9.4.2 新建Jupyter Notebook文件 222
9.4.3 导入必要的库 223
9.4.4 获取股票历史数据 223
9.5 数据预处理 225
9.5.1 数据查看与缺失性分析 225
9.5.2 描述性统计分析 225
9.5.3 数据处理 226
9.5.4 异常值分析 226
9.5.5 数据归一化处理 227
9.6 数据统计分析 228
9.6.1 可视化股票走势图 228
9.6.2 股票收盘价格走势图 229
9.6.3 股票成交量时间序列图 229
9.6.4 股票涨跌情况分析图 230
9.6.5 股票k线走势图 231
9.7 关键技术 232
9.8 小结 234
第 10 章 京东电商销售数据分析与预测 235
视频讲解:49 分钟 精彩案例:4 个
10.1 概述 236
10.2 项目效果预览 236
10.3 项目开发环境 236
· · · · · ·
发表回复
要发表评论,您必须先登录。