利用python进行数据分析(原书第3版) 数据库 (美)韦斯·麦金尼
none
¥
86.75
5.8折
¥
149
全新
库存325件
作者(美)韦斯·麦金尼
出版社机械工业出版社
ISBN9787111726722
出版时间2023-11
版次1
装帧平装
开本32
页数1024页
字数635千字
定价149元
货号xhwx_1203118885
上书时间2024-11-15
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
主编:
阅读本书可以学使用python对数据集进行作、处理、清洗和规整。第3版针对python 3.10和panda 1.4进行了更新,并通过实讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学新版本的panda、numpy、ipython和jupyter。 本书作者we mckinney是python panda项目的创始人。本书对python数据科学工具的介绍既贴近实战又内容新颖,非常适合刚开始学python的数据分析师或刚开始学数据科学和科学计算的python程序员阅读。读者可以从github获取数据文件和相关资料。 学完本书,你将能够: ?使用jupyter notebook和ipython hell进行探索计算。 ?掌握numpy的基础功能和功能。 ?掌握panda库中的数据分析工具。 ?使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。 ?使用matplotlib进行信息可视化。 ?使用panda的groupby功能对数据集进行切片、切块和汇。 ?分析并处理规则的时间序列数据和不规则的时间序列数据。 ?利用完整、详细的示例学如何解决现实中的数据分析问题。
目录:
前言1
章 准备工作7
1.1 本书内容7
1.2 为什么使用python进行数据分析8
1.3 重要的python库9
1.4 安装和设置14
1.5 社区和会议18
1.6 本书导航18
第2章 python语法基础、ipython和jupyter notebook21
2.1 python解释器22
2.2 ipython基础23
2.3 python语法基础29
2.4结47
第3章 python的数据结构、函数和文件48
3.1 数据结构和序列48
3.2 函数65
3.3 文件和作系统76
3.4 结81
第4章 numpy基础:数组和向量化计算82
4.1 numpy的ndarray:多维数组对象84
4.2 生成伪数101
4.3 通用函数:快速的元素级数组函数103
4.4 利用数组进行面向数组编程105
4.5 使用数组进行文件输入和输出113
4.6 线代数114
4.7 示例:漫步115
4.8 结118
第5章 pandas入门119
5.1 pandas的数据结构介绍120
5.2 基本功能133
5.3 描述统计的汇和计算159
5.4 结167
第6章 数据加载、存储与文件格式168
6.1 读写文本格式的数据168
6.2 二进制数据格式185
6.3 与web api交互190
6.4 与数据库交互191
6.5 结193
第7章 数据清洗和准备194
7.1 处理缺失数据194
7.2 数据转换200
7.3 扩展数据类型214
7.4 字符串作216
7.5 分类数据224
7.6 结233
第8章 数据规整:连接、联合和重塑234
8.1 层次化索引234
8.2 联合与合并数据集240
8.3 重塑和透视256
8.4 结264
第9章 绘图和可视化265
9.1 matplotlib api入门266
9.2 使用pandas和seaborn绘图279
9.3 其他python可视化工具293
9.4 结294
0章 数据聚合与分组作295
10.1 groupby机制296
10.2 数据聚合304
10.3 apply:通用的“拆分-应用-联合”范式310
10.4 分组转换和“展开式”groupby运算322
10.5 透视表和交表326
10.6 结330
1章 时间序列331
11.1 期和时间数据的类型及工具332
11.2 时间序列基础知识336
11.3 期的范围、频率以及移位341
11.4 时区处理348
11.5 周期及其算术运算353
11.6 重采样及频率转换360
11.7 移动窗函数369
11.8 结375
2章 python建模库介绍376
12.1 pandas与模型代码的接376
12.2 用patsy创建模型描述379
12.3 statsmodels介绍385
12.4 scikit-learn介绍390
12.5 结393
3章 数据分析案例395
13.1 来自1.usa.gov的bitly数据395
13.2 movielens 1m数据集404
13.3 1880—2010年间全美婴儿姓名411
13.4 usda食品数据库425
13.5 2012年联邦选举委员会数据库431
13.6 结440
附录a 高阶numpy441
附录b 更多关于ipython的内容475
内容简介:
阅读本书可以学使用python对数据集进行作、处理、清洗和规整。第3版针对python3.10和panda1.4进行了更新,并通过实讲解和实际案例向读者展示了如何高效地解决一系列数据分析问题。读者将在阅读过程中学新版本的panda、numpy、ipython和jupyter。
本书作者we mckinney是python panda项目的创始人。本书对python数据科学工具的介绍既贴近实战又内容新颗,非常适合刚开始学python的数据分析师或刚开始学数据科学和科学计算的python程序员阅读。读者可以从github获取数据文件和相关资料。
学完本书,你将能够:
使用jupyter notebook和ipython hell进行探索计算。
掌握numpy的基础功能和功能。
掌握panda库中的数据分析工具。
使用灵活的工具对数据进行加载、清洗、转换、合并和重塑。
使用matplotlib进行信息可视化。
使用panda的groupby功能对数据集进行切片、切块和汇。
分析并处理规则的时间序列数据和不规则的时间序列数据。
利用完整、详细的示例学如何解决现实中的数据分析问题。
— 没有更多了 —
以下为对购买帮助不大的评价