Python数据分析实战 | PDF下载|ePub下载
类别: 计算机
作者:[美] Gayle Laakmann McDowell
出版社: 人民邮电出版社
原作名: Cracking the coding interview:150 programming questions and solutions,fifth edition
译者:李琳骁/漆犇
出版年: 2013-11
页数: 372
定价: 59.00元
装帧: 平装
ISBN: 9787115332912
出版社: 人民邮电出版社
原作名: Cracking the coding interview:150 programming questions and solutions,fifth edition
译者:李琳骁/漆犇
出版年: 2013-11
页数: 372
定价: 59.00元
装帧: 平装
ISBN: 9787115332912
内容简介 · · · · · ·
本书从零开始系统讲解了使用Pandas导入Excel数据,然后使用Pandas技术对数据做整理和分析,后导出为不同形式的Excel文件。完整实现了数据的导入、处理、输出的处理流程。
全书共10章。第1章为Pandas数据处理环境的搭建,第2章为使用Pandas对Excel数据读取与保存,第3章介绍与Pandas底层数据相关的NumPy库,第4章介绍了Pandas中DataFrame表格的增、删、改、查等常用操作,第5章介绍了对Series与DataFrame两种数据的运算、分支、遍历等处理,第6章介绍了字符串的各种清洗技术,第7章介绍时间戳与时间差数据的处理,第8章介绍Pandas中分层索引及与索引相关的操作,第9章介绍了对数据的分组处理及做数据透视表处理,第10章介绍了表格的数据结构转换,以及多表读取与保存。书中包含相应示例,不仅可以学会理论知识还可以灵活应用。 本书可作为Excel爱好者和数据分析初学者的入门书籍,以及想提高数据分析效率,拓展数据分析手段相关人员的参考书籍。
· · · · · ·
作者简介 · · · · · ·
曾贤志,Office技术培训专家,我要自学网专家讲师,特邀技术图书作者,擅长使用VBA、SQL、Power BI、Python等技术做数据分析。著有《Power Query For Excel让工作化繁为简》《加薪不加班:174个Excel函数案例闯职场》《从Excel到Python:用Python轻松处理Excel数据》等与数据分析相关的技术图书。
目录 · · · · · ·
第1章Pandas数据处理环境搭建
1.1Pandas环境配置
1.1.1安装Python发行版本Anaconda
1.1.2程序编写工具Jupyter Notebook
1.2Python基础操作
1.2.1变量
1.2.2注释
1.2.3代码缩进
1.2.4数据结构
1.2.5控制语句
1.2.6函数
第2章Pandas中数据的存取
2.1读取Excel文件数据
2.2读取CSV文件数据
2.3保存为Excel文件格式
2.4保存为CSV文件格式
2.5Pandas中表格的结构
2.5.1DataFrame数据结构
2.5.2Series数据结构
第3章NumPy数据处理基石
3.1NumPy的定义
3.2NumPy数组的创建与转换
3.2.1普通数组
3.2.2序列数组
3.2.3随机数组
3.2.4转换数组
3.3NumPy数组的预处理
3.3.1类型转换
3.3.2缺失值处理
3.3.3重复值处理
3.4NumPy数组维度转换
3.4.1数组维度转换
3.4.2数组合并
3.5Series数据的创建
3.6DataFrame表格的创建
3.6.1使用NumPy数组创建DataFrame表格
3.6.2使用Python列表创建DataFrame表格
3.6.3使用Python字典创建DataFrame表格
第4章表格管理技术
4.1表格属性获取与修改
4.1.1表格属性的获取
4.1.2表格属性修改
4.2表格的切片选择
4.2.1切片法
4.2.2筛选法
4.2.3loc切片法
4.2.4iloc切片法
4.3添加表格的行和列
4.3.1添加行
4.3.2添加列
4.4删除表格的行和列
4.4.1删除行
4.4.2删除列
4.4.3删除有缺失值的行和列
4.5表格数据的修改
4.6巩固案例
第5章数据处理基础
5.1数据运算处理
5.1.1运算符与运算函数
5.1.2Series与单值的运算
5.1.3DataFrame与单值运算
5.1.4Series与Series运算
5.1.5DataFrame与DataFrame运算
5.1.6DataFrame与Series运算
5.1.7数据运算时的对齐特性
5.2数据分支判断
5.2.1条件判断处理1(mask与where)
5.2.2条件判断处理2(np.where)
5.3数据遍历处理
5.3.1遍历Series元素(map)
5.3.2遍历DataFrame行和列(apply)
5.3.3遍历DataFrame元素(applymap)
5.4数据统计处理
5.4.1聚合统计
5.4.2逻辑统计
5.4.3极值统计
5.4.4排名统计
5.5巩固案例
5.5.1根据不同蔬菜的采购数量统计每天采购金额
5.5.2筛选出成绩表中各科目均大于或等于100的记录
5.5.3筛选出成绩表中各科目的和大于或等于300的记录
5.5.4统计每个人各科目总分之和的排名
5.5.5统计每个人所有考试科目的科目
第6章字符串清洗技术
6.1正则
6.1.1正则表达式的导入与创建
6.1.2正则表达式处理函数
6.1.3正则表达式编写规则
6.2拆分
6.2.1普通拆分
6.2.2正则拆分
6.2.3拆分次数
6.2.4拆为表格
6.2.5实例应用
6.3提取
6.3.1将数据提取到列方向
6.3.2将数据提取到行方向
6.3.3实例应用
6.4查找
6.4.1查找位置
6.4.2查找判断
6.4.3查找数据
6.4.4实例应用
6.5替换
6.5.1Series数据替换
6.5.2DataFrame表格替换
6.5.3实例应用
6.6长度
6.7重复
6.8修剪
6.9填充
6.9.1元素填充
6.9.2字符填充
6.10去重
6.10.1重复项判断
6.10.2重复项删除
6.11排序
6.11.1单列排序
6.11.2多列排序
6.11.3自定义排序
6.12合并
6.12.1Series数据自身元素合并
6.12.2Series数据与其他数据合并
6.13扩展
6.14巩固案例
6.14.1筛选出分数中至少有3个大于或等于90分的记录
6.14.2两表查询合并应用
6.14.3给关键信息加掩码
6.14.4提取文本型单价后与数量做求和统计
6.14.5提取不重复名单
6.14.6对文本中的多科目成绩排序
第7章日期和时间处理技术
7.1时间戳
7.1.1单个时间戳
7.1.2时间戳序列
7.1.3时间戳转换
7.1.4时间戳信息获取
7.2时间差
7.2.1单个时间差
7.2.2时间差序列
7.2.3时间差信息获取
7.2.4时间差偏移
7.3巩固案例
7.3.1根据出生日期计算年龄
7.3.2将不规范日期整理为标准日期
7.3.3根据开始时间到结束时间的时长计算金额
7.3.4根据借书起始时间及租借天数计算归还日期
第8章高级索引技术
8.1Pandas索引
8.1.1Series索引
8.1.2DataFrame索引
8.2分层索引的设置
8.2.1Series的分层索引设置
8.2.2DataFrame的分层索引设置
8.3分层索引设置的4种方法
8.4文件导入导出时分层索引设置
8.5行索引与列数据的相互转换
8.5.1列数据设置为行索引
8.5.2行索引设置为列数据
8.6分层索引切片
8.6.1选择单行
8.6.2选择单列
8.6.3选择单值
8.6.4选择多行多列
8.6.5选择指定级别数据
8.6.6筛选索引
8.7索引的修改
8.7.1索引重命名
8.7.2索引重置
8.7.3索引排序
8.7.4索引层级交换
8.7.5索引删除
8.8巩固案例
8.8.1筛选出下半年总销量大于上半年的记录
8.8.2对文本型数字月份排序
8.8.3根据分数返回等级设置索引
第9章数据汇总技术
9.1分组处理
9.1.1分组
9.1.2聚合
9.1.3转换
9.1.4过滤
9.1.5高级分组
9.2数据透视表
9.2.1指定索引方向分组聚合
9.2.2多列执行单种聚合
9.2.3单列执行多种聚合
9.2.4多列执行多种聚合
9.2.5指定列做指定聚合
9.2.6行索引和列索引分组聚合
9.2.7跟列数据长度相同的数组做分组
9.2.8数据透视表缺失值处理
9.2.9数据透视表的行和列总计设置
9.3巩固案例
9.3.1提取各分组的前两名记录
9.3.2按条件筛选各分组的记录
9.3.3提取各分组下的值
9.3.4分组批量拆分表格到Excel文件
9.3.5将数据透视表拆分为Excel文件
第10章表格转换技术
10.1表格方向转换
10.1.1列索引数据转换成行索引数据
10.1.2将行索引数据转换成列索引数据
10.2表格纵横拼接
10.2.1表格纵向拼接(初级)
10.2.2表格纵向拼接(进阶)
10.2.3表格横向拼接(初级)
10.2.4表格横向拼接(进阶)
10.3表格数据存取
10.3.1批量读取
10.3.2批量保存
10.4巩固案例
10.4.1多个工作表数据合并
10.4.2工资条制作
10.4.3特殊的纵向表格拼接
10.4.4多工作表合并与聚合处理
10.4.5跨表查询后再聚合汇总
10.4.6将汇总结果分发到不同工作表
· · · · · ·
1.1Pandas环境配置
1.1.1安装Python发行版本Anaconda
1.1.2程序编写工具Jupyter Notebook
1.2Python基础操作
1.2.1变量
1.2.2注释
1.2.3代码缩进
1.2.4数据结构
1.2.5控制语句
1.2.6函数
第2章Pandas中数据的存取
2.1读取Excel文件数据
2.2读取CSV文件数据
2.3保存为Excel文件格式
2.4保存为CSV文件格式
2.5Pandas中表格的结构
2.5.1DataFrame数据结构
2.5.2Series数据结构
第3章NumPy数据处理基石
3.1NumPy的定义
3.2NumPy数组的创建与转换
3.2.1普通数组
3.2.2序列数组
3.2.3随机数组
3.2.4转换数组
3.3NumPy数组的预处理
3.3.1类型转换
3.3.2缺失值处理
3.3.3重复值处理
3.4NumPy数组维度转换
3.4.1数组维度转换
3.4.2数组合并
3.5Series数据的创建
3.6DataFrame表格的创建
3.6.1使用NumPy数组创建DataFrame表格
3.6.2使用Python列表创建DataFrame表格
3.6.3使用Python字典创建DataFrame表格
第4章表格管理技术
4.1表格属性获取与修改
4.1.1表格属性的获取
4.1.2表格属性修改
4.2表格的切片选择
4.2.1切片法
4.2.2筛选法
4.2.3loc切片法
4.2.4iloc切片法
4.3添加表格的行和列
4.3.1添加行
4.3.2添加列
4.4删除表格的行和列
4.4.1删除行
4.4.2删除列
4.4.3删除有缺失值的行和列
4.5表格数据的修改
4.6巩固案例
第5章数据处理基础
5.1数据运算处理
5.1.1运算符与运算函数
5.1.2Series与单值的运算
5.1.3DataFrame与单值运算
5.1.4Series与Series运算
5.1.5DataFrame与DataFrame运算
5.1.6DataFrame与Series运算
5.1.7数据运算时的对齐特性
5.2数据分支判断
5.2.1条件判断处理1(mask与where)
5.2.2条件判断处理2(np.where)
5.3数据遍历处理
5.3.1遍历Series元素(map)
5.3.2遍历DataFrame行和列(apply)
5.3.3遍历DataFrame元素(applymap)
5.4数据统计处理
5.4.1聚合统计
5.4.2逻辑统计
5.4.3极值统计
5.4.4排名统计
5.5巩固案例
5.5.1根据不同蔬菜的采购数量统计每天采购金额
5.5.2筛选出成绩表中各科目均大于或等于100的记录
5.5.3筛选出成绩表中各科目的和大于或等于300的记录
5.5.4统计每个人各科目总分之和的排名
5.5.5统计每个人所有考试科目的科目
第6章字符串清洗技术
6.1正则
6.1.1正则表达式的导入与创建
6.1.2正则表达式处理函数
6.1.3正则表达式编写规则
6.2拆分
6.2.1普通拆分
6.2.2正则拆分
6.2.3拆分次数
6.2.4拆为表格
6.2.5实例应用
6.3提取
6.3.1将数据提取到列方向
6.3.2将数据提取到行方向
6.3.3实例应用
6.4查找
6.4.1查找位置
6.4.2查找判断
6.4.3查找数据
6.4.4实例应用
6.5替换
6.5.1Series数据替换
6.5.2DataFrame表格替换
6.5.3实例应用
6.6长度
6.7重复
6.8修剪
6.9填充
6.9.1元素填充
6.9.2字符填充
6.10去重
6.10.1重复项判断
6.10.2重复项删除
6.11排序
6.11.1单列排序
6.11.2多列排序
6.11.3自定义排序
6.12合并
6.12.1Series数据自身元素合并
6.12.2Series数据与其他数据合并
6.13扩展
6.14巩固案例
6.14.1筛选出分数中至少有3个大于或等于90分的记录
6.14.2两表查询合并应用
6.14.3给关键信息加掩码
6.14.4提取文本型单价后与数量做求和统计
6.14.5提取不重复名单
6.14.6对文本中的多科目成绩排序
第7章日期和时间处理技术
7.1时间戳
7.1.1单个时间戳
7.1.2时间戳序列
7.1.3时间戳转换
7.1.4时间戳信息获取
7.2时间差
7.2.1单个时间差
7.2.2时间差序列
7.2.3时间差信息获取
7.2.4时间差偏移
7.3巩固案例
7.3.1根据出生日期计算年龄
7.3.2将不规范日期整理为标准日期
7.3.3根据开始时间到结束时间的时长计算金额
7.3.4根据借书起始时间及租借天数计算归还日期
第8章高级索引技术
8.1Pandas索引
8.1.1Series索引
8.1.2DataFrame索引
8.2分层索引的设置
8.2.1Series的分层索引设置
8.2.2DataFrame的分层索引设置
8.3分层索引设置的4种方法
8.4文件导入导出时分层索引设置
8.5行索引与列数据的相互转换
8.5.1列数据设置为行索引
8.5.2行索引设置为列数据
8.6分层索引切片
8.6.1选择单行
8.6.2选择单列
8.6.3选择单值
8.6.4选择多行多列
8.6.5选择指定级别数据
8.6.6筛选索引
8.7索引的修改
8.7.1索引重命名
8.7.2索引重置
8.7.3索引排序
8.7.4索引层级交换
8.7.5索引删除
8.8巩固案例
8.8.1筛选出下半年总销量大于上半年的记录
8.8.2对文本型数字月份排序
8.8.3根据分数返回等级设置索引
第9章数据汇总技术
9.1分组处理
9.1.1分组
9.1.2聚合
9.1.3转换
9.1.4过滤
9.1.5高级分组
9.2数据透视表
9.2.1指定索引方向分组聚合
9.2.2多列执行单种聚合
9.2.3单列执行多种聚合
9.2.4多列执行多种聚合
9.2.5指定列做指定聚合
9.2.6行索引和列索引分组聚合
9.2.7跟列数据长度相同的数组做分组
9.2.8数据透视表缺失值处理
9.2.9数据透视表的行和列总计设置
9.3巩固案例
9.3.1提取各分组的前两名记录
9.3.2按条件筛选各分组的记录
9.3.3提取各分组下的值
9.3.4分组批量拆分表格到Excel文件
9.3.5将数据透视表拆分为Excel文件
第10章表格转换技术
10.1表格方向转换
10.1.1列索引数据转换成行索引数据
10.1.2将行索引数据转换成列索引数据
10.2表格纵横拼接
10.2.1表格纵向拼接(初级)
10.2.2表格纵向拼接(进阶)
10.2.3表格横向拼接(初级)
10.2.4表格横向拼接(进阶)
10.3表格数据存取
10.3.1批量读取
10.3.2批量保存
10.4巩固案例
10.4.1多个工作表数据合并
10.4.2工资条制作
10.4.3特殊的纵向表格拼接
10.4.4多工作表合并与聚合处理
10.4.5跨表查询后再聚合汇总
10.4.6将汇总结果分发到不同工作表
· · · · · ·
发表回复
要发表评论,您必须先登录。