Python电商数据分析实战 | PDF下载|ePub下载
类别: 计算机
作者:[美] Gayle Laakmann McDowell
出版社: 人民邮电出版社
原作名: Cracking the coding interview:150 programming questions and solutions,fifth edition
译者:李琳骁/漆犇
出版年: 2013-11
页数: 372
定价: 59.00元
装帧: 平装
ISBN: 9787115332912
出版社: 人民邮电出版社
原作名: Cracking the coding interview:150 programming questions and solutions,fifth edition
译者:李琳骁/漆犇
出版年: 2013-11
页数: 372
定价: 59.00元
装帧: 平装
ISBN: 9787115332912
内容简介 · · · · · ·
内容简介这既是一本能带领读者零基础快速掌握Python数据分析方法与流程的工具书,又是一本从电商出发指导读者解决各类数据分析问题的实用指南。首先,本书以Python数据分析中使用率极高的Pandas为切入点,注重对数据分析思维和技能的培养,详细讲解了Pandas的操作以及数据分析的方法,可覆盖80%以上的数据分析应用场景,为数据分析师打下坚实基础。然后,本书以电商这个广大读者熟知且普适性极强的业务领域为依托,通过大量案例讲解了报表自动化、行业机会挖掘、用户分层、用户分群、用户偏好分析、同期群分析、指标波动归因分析、品牌分析等8大电商场景的数据分析方法,理论与案例深度融合。本书以实用为本,聚焦重点,Python数据分析常用的高频功能不到Python数据分析能力的20%,本书去繁就简,只专注于能解决大部分问题的重点模块。本书以实战制胜,案例牵引,从表层直观地看,这些案例能解决各种电商业务问题;从深层仔细地分析,作者的本意实则是通过对这些案例抽丝剥茧,手把手教读者在实战中掌握数据分析的通用思维、方法和技能。所以,如果你是关注电商业务的数据分析师,本书针对常见电商数据分析场景给出了具体的方法和解决方案,可照搬使用;如果你是一位没有任何数据分析基础的小白,这本书更加适合你,不仅能快速掌握数据分析的基本思维和方法,而且能在大量案例中获得实战技能和经验。
目录 · · · · · ·
目 录 Contents
前 言
第1章 Python数据分析准备 1
1.1 Python数据分析基础 1
1.1.1 数据分析的基本概念 1
1.1.2 为什么选择Python 2
1.1.3 Pandas和Python的关系 2
1.2 如何高效学习Pandas 3
1.2.1 Pandas学习中的误区 3
1.2.2 高效学习Pandas 3
1.3 Python所需的环境搭建 5
1.3.1 Python环境的选择 5
1.3.2 Anaconda的下载和安装 5
1.3.3 运行代码 7
1.4 本章小结 13
第2章 Pandas快速入门 14
2.1 Pandas的两大数据结构 14
2.1.1 初识Pandas 14
2.1.2 Series和DataFrame 15
2.2 数据读取和存储 17
2.2.1 Excel文件的读取 17
2.2.2 CSV文件的读取 20
2.2.3 其他文件类型的读取 21
2.2.4 存储数据 22
2.3 快速认识数据 22
2.3.1 查看数据 22
2.3.2 查看数据类型 23
2.3.3 统计信息概览 23
2.4 数据处理初体验 24
2.4.1 增 24
2.4.2 删 24
2.4.3 选 25
2.4.4 改 25
2.5 常用数据类型及操作 25
2.5.1 字符串 25
2.5.2 数值型 26
2.5.3 时间类型 28
2.6 本章小结 29
第3章 玩转索引 30
3.1 索引概述 30
3.1.1 到底什么是索引 30
3.1.2 两种索引类型 31
3.2 基于位置(数字)的索引 31
3.2.1 场景一:行选取 32
3.2.2 场景二:列选取 32
3.2.3 场景三:行列交叉选取 33
3.3 基于名称(标签)的索引 33
3.3.1 基于loc的行选取 34
3.3.2 基于loc的列选取 35
3.3.3 基于loc的交叉选取 35
3.3.4 场景四:多条件索引 36
3.4 本章小结 38
第4章 数据清洗四大核心操作 39
4.1 增:拓展数据维度 39
4.1.1 纵向合并 39
4.1.2 横向连接 41
4.2 删:剔除噪声数据 44
4.2.1 缺失值处理 44
4.2.2 去除重复项 47
4.3 选:基于条件选择数据 48
4.3.1 按条件索引/筛选 48
4.3.2 排序 49
4.4 改:改变数据形态 50
4.4.1 转置 50
4.4.2 分组 50
4.4.3 切分 52
4.5 本章小结 54
第5章 Pandas两大进阶利器 55
5.1 数据透视表 55
5.1.1 什么是数据透视表 55
5.1.2 Pandas数据透视表简介 55
5.1.3 Pandas数据透视表实例 56
5.2 强大又灵活的apply 58
5.2.1 apply初体验 59
5.2.2 用apply计算最好、最差
成绩 59
5.2.3 筛选每个分组下的第3名 61
5.3 本章小结 64
第6章 数据可视化 65
6.1 Matplotlib基础知识 65
6.1.1 Matplotlib简介 65
6.1.2 可视化的关键步骤 65
6.2 Matplotlib基础操作 66
6.2.1 画图前的准备 66
6.2.2 创建画布 66
6.2.3 画图 68
6.2.4 设置坐标轴 69
6.2.5 润色 71
6.3 绘制常用图形 74
6.3.1 绘制折线图 74
6.3.2 绘制柱状图 75
6.3.3 绘制散点图 76
6.3.4 绘制其他常用图形 77
6.4 本章小结 78
第7章 走近电商:商业方法论与
分析体系 79
7.1 什么是电商 79
7.2 三大关键角色 80
7.2.1 用户 80
7.2.2 商家 80
7.2.3 平台 81
7.3 电商基础指标 82
7.3.1 用户相关指标 83
7.3.2 商品相关指标 83
7.4 电商分析方法论及应用 84
7.4.1 黄金公式 84
7.4.2 GROW 86
7.4.3 AIPL 88
7.4.4 抖音5A与京东4A 89
7.5 数据分析师重生之我是老板 90
7.5.1 数据分析师和老板 90
7.5.2 行业趋势分析 91
7.5.3 竞争格局分析 92
7.5.4 品牌策略探究 92
7.5.5 用户分析—探索期 93
7.5.6 用户分析—正式期 94
7.6 本章小结 95
第8章 Python报表自动化 97
8.1 行业数据报表自动化 97
8.1.1 案例背景 97
8.1.2 单张表的处理 99
8.1.3 批量循环执行 101
8.2 报表批量处理与品牌投放
分析 102
8.2.1 新的需求背景 102
8.2.2 数据预览 102
8.2.3 分析思路 104
8.2.4 数据处理 104
8.2.5 数据分析 105
8.3 本章小结 108
第9章 行业机会分析与权重确定 109
9.1 案例背景介绍 109
9.2 传统的解题方法 109
9.2.1 之前的传统思路 109
9.2.2 数据预览和汇总 110
9.2.3 每个类目增长最快的细分
类目 111
9.3 权重确定方法 113
9.3.1 级别法 113
9.3.2 权值因子判表法 113
9.3.3 变异系数法 115
9.4 Pandas权重计算和分析 117
9.4.1 数据整合 117
9.4.2 关键指标计算 118
9.4.3 权重的计算 119
9.4.4 数据标准化 122
9.4.5 综合发展指数 123
9.5 本章小结 124
第10章 用户分层实战 125
10.1 用户分层的基本概念 125
10.1.1 无处不在的用户分层 125
10.1.2 用户分层的类型 126
10.1.3 用户分层的特征 126
10.1.4 为什么要做用户分层 127
10.1.5 分层的两个问题 127
10.2 二八法则 128
10.2.1 二八法则在用户分层上的
应用 128
10.2.2 数据预览 129
10.2.3 数据清洗 131
10.2.4 二八法则下的用户分层 134
10.3 拐点法 136
10.3.1 什么是拐点法 136
10.3.2 拐点法在用户分层上的
应用 136
10.3.3 基于Pandas的拐点法
分层 137
10.4 本章小结 143
第11章 用户分群实战与加强版
RFM模型 144
11.1 走近用户分群 144
11.1.1 用户分群的定义及作用 144
11.1.2 用户分群和用户分层的
区别 144
11.2 RFM用户分群实战 145
11.2.1 经典的RFM模型 145
11.2.2 第一步:数据概览 146
11.2.3 第二步:数据处理 147
11.2.4 第三步:维度打分 149
11.2.5 第四步:分值计算 150
11.2.6 第五步:用户分层 152
11.2.7 RFM模型结果分析 154
11.3 关于RFM模型的重要思考 156
11.3.1 RFM模型隐藏的问题 156
11.3.2 为什么用平均金额作
为M 157
11.4 RFM模型的加强和拓展 158
11.4.1 模型加强和拓展的方向 158
11.4.2 RFM加强版实战案例 158
11.5 本章小结 161
第12章 用户偏好分析 162
12.1 用户偏好分析和TGI 162
12.1.1 用户偏好分析与TGI的
关系 162
12.1.2 TGI的定义 162
12.1.3 通过拆解指标来理解
TGI 163
12.2 用Pandas实现TGI分析 163
12.2.1 项目背景 163
12.2.2 用户打标 165
12.2.3 匹配城市 165
12.2.4 高客单价TGI计算 166
12.2.5 TGI计算中隐藏的问题 168
12.3 本章小结 169
第13章 万能的同期群分析 170
13.1 数据分析师必知必会的同期
群分析 170
13.1.1 同期群分析的基本概念 170
13.1.2 同期群分析的价值 171
13.1.3 同期群分析的万能之处 171
13.2 Pandas同期群分析实战 173
13.2.1 数据概览 173
13.2.2 实现思路剖析 173
13.2.3 单月实现 174
13.2.4 遍历合并和分析 176
13.2.5 回购客单价的同期群
实现 179
13.3 本章小结 181
第14章 指标波动归因分析 182
14.1 指标波动贡献率 182
14.1.1 什么是贡献率 182
14.1.2 可加型指标波动贡献率的
计算 183
14.1.3 乘法型指标波动贡献率的
计算 185
14.1.4 除法型指标波动贡献率的
计算 187
14.2 Adtributor算法 193
14.2.1 Adtributor介绍 193
14.2.2 单个维度的基础案例 194
14.2.3 多个维度的算法逻辑和
Pandas实现 196
14.3 本章小结 200
第15章 一份全面的品牌分析
报告 202
15.1 探索性数据分析简介 202
15.1.1 常规的探索性数据分析 202
15.1.2 探索性数据分析的价值 202
15.1.3 不一样的探索性数据
分析 203
15.2 数据预处理 203
15.2.1 数据导入 203
15.2.2 数据预览 203
15.2.3 重复项检验 205
15.2.4 缺失值处理 205
15.2.5 异常值清洗 206
15.2.6 字段格式规整 207
15.2.7 订单状态筛选 208
15.3 数据总览分析 208
15.3.1 年度销售额变化 208
15.3.2 年度用户数和客单价
变化 209
15.4 用户数据分析 210
15.4.1 销售额和用户数月度
趋势 210
15.4.2 客单价月度趋势 212
15.4.3 客单价细拆 213
15.4.4 新老用户分析 214
15.4.5 复购率分析 217
15.4.6 用户购买时间间隔 218
15.5 商品数据分析 221
15.5.1 品类销售结构 221
15.5.2 价格带分析 223
15.5.3 商品销售集中度分析 226
15.6 购物篮关联分析 228
15.6.1 什么是购物篮关联分析 228
15.6.2 购物篮关联分析的三大核心
指标 229
15.6.3 购物篮关联分析实战 230
15.7 本章小结 238
· · · · · ·
前 言
第1章 Python数据分析准备 1
1.1 Python数据分析基础 1
1.1.1 数据分析的基本概念 1
1.1.2 为什么选择Python 2
1.1.3 Pandas和Python的关系 2
1.2 如何高效学习Pandas 3
1.2.1 Pandas学习中的误区 3
1.2.2 高效学习Pandas 3
1.3 Python所需的环境搭建 5
1.3.1 Python环境的选择 5
1.3.2 Anaconda的下载和安装 5
1.3.3 运行代码 7
1.4 本章小结 13
第2章 Pandas快速入门 14
2.1 Pandas的两大数据结构 14
2.1.1 初识Pandas 14
2.1.2 Series和DataFrame 15
2.2 数据读取和存储 17
2.2.1 Excel文件的读取 17
2.2.2 CSV文件的读取 20
2.2.3 其他文件类型的读取 21
2.2.4 存储数据 22
2.3 快速认识数据 22
2.3.1 查看数据 22
2.3.2 查看数据类型 23
2.3.3 统计信息概览 23
2.4 数据处理初体验 24
2.4.1 增 24
2.4.2 删 24
2.4.3 选 25
2.4.4 改 25
2.5 常用数据类型及操作 25
2.5.1 字符串 25
2.5.2 数值型 26
2.5.3 时间类型 28
2.6 本章小结 29
第3章 玩转索引 30
3.1 索引概述 30
3.1.1 到底什么是索引 30
3.1.2 两种索引类型 31
3.2 基于位置(数字)的索引 31
3.2.1 场景一:行选取 32
3.2.2 场景二:列选取 32
3.2.3 场景三:行列交叉选取 33
3.3 基于名称(标签)的索引 33
3.3.1 基于loc的行选取 34
3.3.2 基于loc的列选取 35
3.3.3 基于loc的交叉选取 35
3.3.4 场景四:多条件索引 36
3.4 本章小结 38
第4章 数据清洗四大核心操作 39
4.1 增:拓展数据维度 39
4.1.1 纵向合并 39
4.1.2 横向连接 41
4.2 删:剔除噪声数据 44
4.2.1 缺失值处理 44
4.2.2 去除重复项 47
4.3 选:基于条件选择数据 48
4.3.1 按条件索引/筛选 48
4.3.2 排序 49
4.4 改:改变数据形态 50
4.4.1 转置 50
4.4.2 分组 50
4.4.3 切分 52
4.5 本章小结 54
第5章 Pandas两大进阶利器 55
5.1 数据透视表 55
5.1.1 什么是数据透视表 55
5.1.2 Pandas数据透视表简介 55
5.1.3 Pandas数据透视表实例 56
5.2 强大又灵活的apply 58
5.2.1 apply初体验 59
5.2.2 用apply计算最好、最差
成绩 59
5.2.3 筛选每个分组下的第3名 61
5.3 本章小结 64
第6章 数据可视化 65
6.1 Matplotlib基础知识 65
6.1.1 Matplotlib简介 65
6.1.2 可视化的关键步骤 65
6.2 Matplotlib基础操作 66
6.2.1 画图前的准备 66
6.2.2 创建画布 66
6.2.3 画图 68
6.2.4 设置坐标轴 69
6.2.5 润色 71
6.3 绘制常用图形 74
6.3.1 绘制折线图 74
6.3.2 绘制柱状图 75
6.3.3 绘制散点图 76
6.3.4 绘制其他常用图形 77
6.4 本章小结 78
第7章 走近电商:商业方法论与
分析体系 79
7.1 什么是电商 79
7.2 三大关键角色 80
7.2.1 用户 80
7.2.2 商家 80
7.2.3 平台 81
7.3 电商基础指标 82
7.3.1 用户相关指标 83
7.3.2 商品相关指标 83
7.4 电商分析方法论及应用 84
7.4.1 黄金公式 84
7.4.2 GROW 86
7.4.3 AIPL 88
7.4.4 抖音5A与京东4A 89
7.5 数据分析师重生之我是老板 90
7.5.1 数据分析师和老板 90
7.5.2 行业趋势分析 91
7.5.3 竞争格局分析 92
7.5.4 品牌策略探究 92
7.5.5 用户分析—探索期 93
7.5.6 用户分析—正式期 94
7.6 本章小结 95
第8章 Python报表自动化 97
8.1 行业数据报表自动化 97
8.1.1 案例背景 97
8.1.2 单张表的处理 99
8.1.3 批量循环执行 101
8.2 报表批量处理与品牌投放
分析 102
8.2.1 新的需求背景 102
8.2.2 数据预览 102
8.2.3 分析思路 104
8.2.4 数据处理 104
8.2.5 数据分析 105
8.3 本章小结 108
第9章 行业机会分析与权重确定 109
9.1 案例背景介绍 109
9.2 传统的解题方法 109
9.2.1 之前的传统思路 109
9.2.2 数据预览和汇总 110
9.2.3 每个类目增长最快的细分
类目 111
9.3 权重确定方法 113
9.3.1 级别法 113
9.3.2 权值因子判表法 113
9.3.3 变异系数法 115
9.4 Pandas权重计算和分析 117
9.4.1 数据整合 117
9.4.2 关键指标计算 118
9.4.3 权重的计算 119
9.4.4 数据标准化 122
9.4.5 综合发展指数 123
9.5 本章小结 124
第10章 用户分层实战 125
10.1 用户分层的基本概念 125
10.1.1 无处不在的用户分层 125
10.1.2 用户分层的类型 126
10.1.3 用户分层的特征 126
10.1.4 为什么要做用户分层 127
10.1.5 分层的两个问题 127
10.2 二八法则 128
10.2.1 二八法则在用户分层上的
应用 128
10.2.2 数据预览 129
10.2.3 数据清洗 131
10.2.4 二八法则下的用户分层 134
10.3 拐点法 136
10.3.1 什么是拐点法 136
10.3.2 拐点法在用户分层上的
应用 136
10.3.3 基于Pandas的拐点法
分层 137
10.4 本章小结 143
第11章 用户分群实战与加强版
RFM模型 144
11.1 走近用户分群 144
11.1.1 用户分群的定义及作用 144
11.1.2 用户分群和用户分层的
区别 144
11.2 RFM用户分群实战 145
11.2.1 经典的RFM模型 145
11.2.2 第一步:数据概览 146
11.2.3 第二步:数据处理 147
11.2.4 第三步:维度打分 149
11.2.5 第四步:分值计算 150
11.2.6 第五步:用户分层 152
11.2.7 RFM模型结果分析 154
11.3 关于RFM模型的重要思考 156
11.3.1 RFM模型隐藏的问题 156
11.3.2 为什么用平均金额作
为M 157
11.4 RFM模型的加强和拓展 158
11.4.1 模型加强和拓展的方向 158
11.4.2 RFM加强版实战案例 158
11.5 本章小结 161
第12章 用户偏好分析 162
12.1 用户偏好分析和TGI 162
12.1.1 用户偏好分析与TGI的
关系 162
12.1.2 TGI的定义 162
12.1.3 通过拆解指标来理解
TGI 163
12.2 用Pandas实现TGI分析 163
12.2.1 项目背景 163
12.2.2 用户打标 165
12.2.3 匹配城市 165
12.2.4 高客单价TGI计算 166
12.2.5 TGI计算中隐藏的问题 168
12.3 本章小结 169
第13章 万能的同期群分析 170
13.1 数据分析师必知必会的同期
群分析 170
13.1.1 同期群分析的基本概念 170
13.1.2 同期群分析的价值 171
13.1.3 同期群分析的万能之处 171
13.2 Pandas同期群分析实战 173
13.2.1 数据概览 173
13.2.2 实现思路剖析 173
13.2.3 单月实现 174
13.2.4 遍历合并和分析 176
13.2.5 回购客单价的同期群
实现 179
13.3 本章小结 181
第14章 指标波动归因分析 182
14.1 指标波动贡献率 182
14.1.1 什么是贡献率 182
14.1.2 可加型指标波动贡献率的
计算 183
14.1.3 乘法型指标波动贡献率的
计算 185
14.1.4 除法型指标波动贡献率的
计算 187
14.2 Adtributor算法 193
14.2.1 Adtributor介绍 193
14.2.2 单个维度的基础案例 194
14.2.3 多个维度的算法逻辑和
Pandas实现 196
14.3 本章小结 200
第15章 一份全面的品牌分析
报告 202
15.1 探索性数据分析简介 202
15.1.1 常规的探索性数据分析 202
15.1.2 探索性数据分析的价值 202
15.1.3 不一样的探索性数据
分析 203
15.2 数据预处理 203
15.2.1 数据导入 203
15.2.2 数据预览 203
15.2.3 重复项检验 205
15.2.4 缺失值处理 205
15.2.5 异常值清洗 206
15.2.6 字段格式规整 207
15.2.7 订单状态筛选 208
15.3 数据总览分析 208
15.3.1 年度销售额变化 208
15.3.2 年度用户数和客单价
变化 209
15.4 用户数据分析 210
15.4.1 销售额和用户数月度
趋势 210
15.4.2 客单价月度趋势 212
15.4.3 客单价细拆 213
15.4.4 新老用户分析 214
15.4.5 复购率分析 217
15.4.6 用户购买时间间隔 218
15.5 商品数据分析 221
15.5.1 品类销售结构 221
15.5.2 价格带分析 223
15.5.3 商品销售集中度分析 226
15.6 购物篮关联分析 228
15.6.1 什么是购物篮关联分析 228
15.6.2 购物篮关联分析的三大核心
指标 229
15.6.3 购物篮关联分析实战 230
15.7 本章小结 238
· · · · · ·
发表回复
要发表评论,您必须先登录。