深入浅出Pandas:利用Python进行数据处理与分析
¥
40.85
4.1折
¥
99
九五品
仅1件
作者李庆辉 著
出版社机械工业出版社
出版时间2021-07
版次1
装帧其他
货号A4
上书时间2024-11-06
商品详情
- 品相描述:九五品
图书标准信息
-
作者
李庆辉 著
-
出版社
机械工业出版社
-
出版时间
2021-07
-
版次
1
-
ISBN
9787111685456
-
定价
99.00元
-
装帧
其他
-
开本
16开
-
页数
428页
-
字数
100千字
- 【内容简介】
-
内容简介
如果你想充分发挥Python的强大作用,如果你想成为一名好的Python工程师,你应该先学好Pandas。
这是一本全面覆盖了Pandas使用者的普遍需求和痛点的著作,基于实用、易学的原则,从功能、使用、原理等多个维度对Pandas做了全方位的详细讲解,既是初学者系统学习Pandas难得的入门书,又是有经验的Python工程师案头必不可少的查询手册。
本书共17章,分为七部分。
第1部分(第1~2章) Pandas入门
首先介绍了Pandas的功能、使用场景和学习方法,然后详细讲解了Python开发环境的搭建,Z后介绍了Pandas的大量基础功能,旨在引领读者快速入门。
第二部分(第3~5章) Pandas数据分析基础
详细讲解了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。
第三部分(第6~9章) 数据形式变化
讲解了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,以及如何利用多层索引对数据进行升降维。
第四部分(第10~12章) 数据清洗
讲解了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,以及分类数据的应用场景和操作方法。
第五部分(第13~14章)时序数据分析
讲解了Pandas中对于各种时间类型数据的处理和分析,以及在时序数据处理中经常使用的窗口计算。
第六部分(第15~16章) 可视化
讲解了Pandas的样式功能如何让数据表格更有表现力,以及Pandas的绘图功能如何让数据自己说话。
第七部分(第17章) 实战案例
介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈,此外还从数据处理和数据分析两个角度给出了大量的应用案例及代码详解。
- 【作者简介】
-
李庆辉
数据产品专家,某电商公司数据产品团队负责人,擅长通过数据治理、数据分析、数据化运营提升公司的数据应用水平。
精通Python数据科学及Python Web开发,曾独立开发公司的自动化数据分析平台,参与教育部“1+X”数据分析(Python)职业技能等级标准评审。
中国人工智能学会会员,企业数字化、数据产品和数据分析讲师,在个人网站“盖若”上编写的技术和产品教程广受欢迎。
- 【目录】
-
前言
第一部分 Pandas入门
第1章 Pandas简介及快速入门2
1.1 Pandas是什么2
1.1.1 Python简介2
1.1.2 Python的应用3
1.1.3 为什么不选择R4
1.1.4 Pandas简介4
1.1.5 Pandas的使用人群5
1.1.6 Pandas的基本功能5
1.1.7 Pandas的学习方法6
1.1.8 小结6
1.2 环境搭建及安装6
1.2.1 Python环境安装7
1.2.2 Anaconda简介7
1.2.3 安装miniconda8
1.2.4 多Python版本环境9
1.2.5 安装编辑器10
1.2.6 Jupyter Notebook10
1.2.7 用pip安装三方库11
1.2.8 安装Jupyter Notebook12
1.2.9 启动Jupyter Notebook12
1.2.10 使用Jupyter Notebook13
1.2.11 安装Pandas14
1.2.12 小结14
1.3 Pandas快速入门14
1.3.1 安装导入14
1.3.2 准备数据集15
1.3.3 读取数据15
1.3.4 查看数据16
1.3.5 验证数据17
1.3.6 建立索引17
1.3.7 数据选取18
1.3.8 排序19
1.3.9 分组聚合19
1.3.10 数据转换20
1.3.11 增加列21
1.3.12 统计分析21
1.3.13 绘图21
1.3.14 导出24
1.3.15 小结24
1.4 本章小结24
第2章 数据结构25
2.1 数据结构概述25
2.1.1 什么是数据25
2.1.2 什么是数据结构26
2.1.3 小结26
2.2 Python的数据结构26
2.2.1 数字27
2.2.2 字符串27
2.2.3 布尔型28
2.2.4 列表29
2.2.5 元组30
2.2.6 字典30
2.2.7 集合31
2.2.8 小结32
2.3 NumPy32
2.3.1 NumPy简介33
2.3.2 数据结构33
2.3.3 创建数据34
2.3.4 数据类型34
2.3.5 数组信息35
2.3.6 统计计算35
2.3.7 小结35
2.4 Pandas的数据结构35
2.4.1 Series36
2.4.2 DataFrame36
2.4.3 索引37
2.4.4 小结38
2.5 Pandas生成数据38
2.5.1 导入Pandas38
2.5.2 创建数据38
2.5.3 生成Series40
2.5.4 生成DataFrame41
2.5.5 小结43
2.6 Pandas的数据类型43
2.6.1 数据类型查看43
2.6.2 常见数据类型44
2.6.3 数据检测44
2.6.4 小结45
2.7 本章小结45
第二部分 Pandas数据分析基础
第3章 Pandas数据读取与输出48
3.1 数据读取48
3.1.1 CSV文件49
3.1.2 Excel49
3.1.3 JSON 50
3.1.4 HTML50
3.1.5 剪贴板51
3.1.6 SQL51
3.1.7 小结52
3.2 读取CSV52
3.2.1 语法52
3.2.2 数据内容53
3.2.3 分隔符53
3.2.4 表头54
3.2.5 列名54
3.2.6 索引54
3.2.7 使用部分列54
3.2.8 返回序列55
3.2.9 表头前缀55
3.2.10 处理重复列名55
3.2.11 数据类型55
3.2.12 引擎55
3.2.13 列数据处理56
3.2.14 真假值转换56
3.2.15 跳过指定行56
3.2.16 读取指定行57
3.2.17 空值替换57
3.2.18 保留默认空值57
3.2.19 日期时间解析58
3.2.20 文件处理59
3.2.21 符号60
3.2.22 小结61
3.3 读取Excel61
3.3.1 语法61
3.3.2 文件内容62
3.3.3 表格62
3.3.4 表头62
3.3.5 列名62
3.3.6 其他62
3.3.7 小结63
3.4 数据输出63
3.4.1 CSV63
3.4.2 Excel63
3.4.3 HTML64
3.4.4 数据库(SQL)64
3.4.5 Markdown65
3.4.6 小结65
3.5 本章小结65
第4章 Pandas基础操作66
4.1 索引操作66
4.1.1 认识索引66
4.1.2 建立索引67
4.1.3 重置索引68
4.1.4 索引类型68
4.1.5 索引对象69
4.1.6 索引的属性70
4.1.7 索引的操作70
4.1.8 索引重命名72
4.1.9 修改索引内容72
4.1.10 小结73
4.2 数据的信息73
4.2.1 查看样本73
4.2.2 数据形状74
4.2.3 基础信息74
4.2.4 数据类型74
4.2.5 行列索引内容75
4.2.6 其他信息75
4.2.7 小结75
4.3 统计计算76
4.3.1 描述统计76
4.3.2 数学统计77
4.3.3 统计函数78
4.3.4 非统计计算79
4.3.5 小结80
4.4 位置计算80
4.4.1 位置差值diff()80
4.4.2 位置移动shift()81
4.4.3 位置序号rank()81
4.4.4 小结82
4.5 数据选择82
4.5.1 选择列83
4.5.2 切片[]83
4.5.3 按轴标签.loc84
4.5.4 按数字索引.iloc86
4.5.5 取具体值.at/.iat86
4.5.6 获取数据.get86
4.5.7 数据截取.truncate87
4.5.8 索引选择器87
4.5.9 小结87
4.6 本章小结88
第5章 Pandas高级操作89
5.1 复杂查询89
5.1.1 逻辑运算89
5.1.2 逻辑筛选数据91
5.1.3 函数筛选92
5.1.4 比较函数92
5.1.5 查询df.query()93
5.1.6 筛选df.filter()93
5.1.7 按数据类型查询93
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价