pandas数据处理与分析
全新正版 极速发货
¥
63.53
6.5折
¥
98
全新
库存9件
作者耿远昊
出版社人民邮电出版社
ISBN9787115583659
出版时间2022-08
装帧平装
开本16开
定价98元
货号1202683612
上书时间2024-09-04
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
耿远昊
威斯康星大学麦迪逊分校统计学硕士在读,Datawhale成员,“Joyful Pandas”开源项目作者。pandas贡献者,活跃于pandas开源社区,主要贡献涉及漏洞修复、功能实现与性能优化等方面,对pandas在数据处理与分析中的应用有丰富经验。
目录
第一部分 基础知识
第1章 预备知识
1.1 Python基础
1.1.1 推导式
1.1.2 匿名函数
1.1.3 打包函数
1.2 NumPy基础
1.2.1 NumPy数组的构造
1.2.2 NumPy数组的变形
1.2.3 NumPy数组的切片
1.2.4 广播机制
1.2.5 常用函数
1.3 习题
第2章 pandas基础
2.1 文件的读取和写入
2.1.1 文件读取
2.1.2 数据写入
2.2 基本数据结构
2.2.1 Series
2.2.2 DataFrame
2.3 常用基本函数
2.3.1 汇总函数
2.3.2 特征统计函数
2.3.3 频次函数
2.3.4 替换函数
2.3.5 排序函数
2.3.6 apply()函数
2.4 窗口
2.4.1 滑动窗口
2.4.2 扩张窗口
2.5 习题
第二部分 4类操作
第3章 索引
3.1 单级索引
3.1.1 DataFrame的列索引
3.1.2 Series的行索引
3.1.3 loc索引器
3.1.4 iloc索引器
3.1.5 query()函数
3.1.6 索引运算
3.2 多级索引
3.2.1 多级索引及其表的结构
3.2.2 多级索引中的loc索引器
3.2.3 多级索引的构造
3.3 常用索引方法
3.3.1 索引层的交换和删除
3.3.2 索引属性的修改
3.3.3 索引的设置与重置
3.3.4 索引的对齐
3.4 习题
第4章 分组
4.1 分组模式及其对象
4.1.1 分组的一般模式
4.1.2 分组依据的本质
4.1.3 groupby对象
4.2 聚合函数
4.2.1 内置聚合函数
4.2.2 agg()函数
4.3 变换和过滤
4.3.1 变换函数
4.3.2 组索引与过滤
4.4 跨列分组
4.5 习题
第5章 变形
5.1 长宽表的变形
5.1.1 长表的透视变形
5.1.2 宽表的逆透视变形
5.2 其他变形方法
5.2.1 索引变形
5.2.2 扩张变形
5.3 习题
第6章 连接
6.1 关系连接
6.1.1 关系连接的基本概念
6.1.2 列连接
6.1.3 索引连接
6.2 其他连接
6.2.1 方向连接
6.2.2 比较与组合
6.3 习题
第三部分 4类数据
第7章 缺失数据
7.1 缺失值的统计和删除
7.1.1 缺失信息的统计
7.1.2 缺失信息的删除
7.2 缺失值的填充和插值
7.2.1 利用fillna() 进行填充
……
内容摘要
本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
本书共包含13章,第一部分介绍NumPy和pandas的基本内容;第二部分介绍pandas库中的4类操作,包括索引、分组、变形和连接;第三部分介绍基于pandas库的4类数据,包括缺失数据、文本数据、分类数据和时间序列数据,并介绍这4类数据的处理方法;第四部分介绍数据观测、特征工程和性能优化的相关内容。本书以丰富的练习为特色,每章的最后一节为习题,同时每章包含许多即时性的练习(练一练)。读者可通过这些练习将对数据科学的宏观认识运用到实践中。
主编推荐
1.梳理pandas中常用的函数,将函数之间的逻辑关系总结为“基础知识+4类操作+4类数据”的模块结构
2.展示了数据处理的宏观体系,并针对数据分析中“怎么分析”“怎么处理”“怎么加速”3个核心问题给出解决方案。
3.结合大量代码讲解理论知识,并通过“练一练”和章末的“习题”等形式提供高质量的练习,帮助读者理解、强化和拓展所学知识。
4.不需要读者掌握数据科学或数据分析的先验知识,适合具有一定Python编程基础、想要使用pandas进行数据处理与分析的数据科学领域的从业者或研究人员阅读。
媒体评论
pandas是Python数据科学生态中一个核心的第三方库。使用pandas,我们能够快捷解决现实中各类与数据相关的问题。本书讲解了基于pandas的数据处理与分析技术,理论与实践相结合,是学习pandas很好的教程。
——张日权 华东师范大学经济与管理学部统计学院院长,教授、博士生导师
Python作为数字经济时代的编程语言之一,正成为广大有志于投身数据科学领域的青年学子学习的技术。“Joyful Pandas”是Datawhale社区的开源项目,也是pandas官方目前推荐的中文教程,本书在该教程的基础上进一步完善,强化理论与实践的结合,对Python初学者和进阶者均有裨益。
——陈海强 厦门大学王亚南经济研究院教授、博士生导师
数据分析能力正逐步成为数字化发展浪潮中学习者应具备的基本技能。本书分为“基础知识”“4类操作”“4类数据”和“进阶实战”四大部分,结合简洁易懂的代码示例,涵盖pandas的所有核心操作与特性,非常适合数据分析人员自学。
——黄鹂强 浙江大学数据科学系教授、博士生导师
这是一本非常有针对性的教程,内容丰富且结构完整,还提供了详细的示例,既可以作为进行系统学习的入门指南,也可以作为即查即用的参考手册。与传统的纯讲授式的教程不同,本书除了讲解代码,还附有许多有趣的问题与练习,启发式地引导读者自主探索编程的细节。相信本书会帮助读者从零上手并爱上编程。
——钟威 厦门大学王亚南经济研究院和经济学院统计学与数据科学系教授、博士生导师
“Joyful Pandas”教程涵盖了NumPy和pandas的基本操作、4类主要的数据操作方法(包括索引、分组、变形和连接)和4种主要的数据类型(包括缺失数据、文本数据、分类数据和时间序列数据)。每章的末尾会给出相应的习题。所有数据集和相关资料可以在GitHub的datawhalechina/joyful-pandas仓库中找到。
——pandas官方网站
— 没有更多了 —
以下为对购买帮助不大的评价