Pandas入门与实战应用 :基于Python的数据分析与处理
编程语言 知识点介绍全面、详尽;丰富实例提高学习效率;全书源代码资源可下载 新华书店全新正版书籍
¥
42.68
4.8折
¥
89
全新
库存4件
作者周峰
出版社电子工业出版社
出版时间2022-08
版次1
装帧其他
货号1202720677
上书时间2023-02-12
商品详情
- 品相描述:全新
-
新华文轩网络书店 全新正版书籍
- 商品描述
-
"内容详细,生动易懂。
讲解细致,面向实战。
知识体系由浅入深,循序渐进。
内容表现形象生动,图文并茂"
图书标准信息
-
作者
周峰
-
出版社
电子工业出版社
-
出版时间
2022-08
-
版次
1
-
ISBN
9787121440700
-
定价
89.00元
-
装帧
其他
-
开本
16开
-
页数
388页
-
字数
388千字
- 【内容简介】
-
本书首先讲解Pandas快速入门的基础知识,如Pandas的定义、可处理的数据类型、优势、开发环境配置、常用的数据结构等;然后通过实例剖析讲解Pandas数据的导入、导出、查看、清洗、合并、对比、预处理;接着讲解Pandas数据的提取、筛选、汇总、统计及可视化;然后讲解Pandas数据的线性模型和广义线性模型,最后讲解Pandas数据实战分析。在讲解过程中即考虑读者的学习习惯,又通过具体实例剖析讲解Pandas实战应用中的热点问题、关键问题及种种难题。
- 【作者简介】
-
周峰,毕业于青岛海洋大学计算机科学与应用专业。曾先后就职于青岛商业中专和青岛远洋学院计算机系,从事计算机辅助设计的教学与研究。曾出版作品如下:《C语言实用程序设计100例》 《VB控件实用程序设计100例》 《计算机立体美术设计3ds max实例教程》《Flash MX 2004网络动画精彩实例创作通》
- 【目录】
-
第1章 Pandas快速入门1
1.1 初识Pandas2
1.1.1 什么是Pandas2
1.1.2 Pandas的主要数据结构2
1.1.3 Pandas的优势2
1.2 Pandas开发环境配置3
1.2.1 Python概述3
1.2.2 Anaconda概述5
1.2.3 Anaconda的下载5
1.2.4 Anaconda的安装8
1.2.5 Jupyter Notebook概述11
1.3 Jupyter Notebook界面的基本操作13
1.3.1 Jupyter Notebook的主界面13
1.3.2 Jupyter Notebook的编辑页面14
1.3.3 Jupyter Notebook的文件操作18
1.4 实例:第一个Pandas数据处理程序20
第2章 Pandas常用的数据结构22
2.1 初识数据结构23
2.1.1 什么是数据及数据处理23
2.1.2 什么是信息23
2.1.3 什么是数据结构24
2.2 Python的数据结构24
2.2.1 数值型应用实例24
2.2.2 字符串型应用实例27
2.2.3 列表应用实例30
2.2.4 元组应用实例34
2.2.5 字典应用实例36
2.2.6 集合应用实例38
2.3 NumPy的数据结构40
2.3.1 NumPy数组的创建41
2.3.2 NumPy特殊数组42
2.3.3 NumPy序列数组43
2.3.4 NumPy数组运算44
2.3.5 NumPy的矩阵45
2.3.6 两个数组的点积46
2.3.7 两个向量的点积47
2.3.8 数组的向量内积48
2.3.9 矩阵的行列式49
2.3.10 矩阵的逆50
2.4 Pandas的数据结构51
2.4.1 一维数组系列应用实例52
2.4.2 二维数组应用实例53
第3章 Pandas数据的导入与导出55
3.1 导入CSV文件56
3.1.1 CSV文件概述56
3.1.2 创建CSV文件,并输入内容56
3.1.3 read_csv()方法58
3.1.4 利用read_csv()方法导入CSV文件实例60
3.2 导入Excel文件63
3.2.1 在Excel中输入内容并上传63
3.2.2 read_excel()方法65
3.2.3 利用read_excel()方法导入Excel文件实例66
3.3 导入JSON文件68
3.3.1 创建JSON文件,并输入内容68
3.3.2 read_json()方法69
3.3.3 利用read_json()方法导入JSON文件实例70
3.4 Pandas数据的输出70
3.4.1 输出CSV文件71
3.4.2 输出Excel文件73
3.4.3 输出JSON文件76
第4章 Pandas数据表的查看和清洗79
4.1 Pandas数据表信息的查看80
4.1.1 利用shape属性查看数据表的维度80
4.1.2 利用dtype和dtypes属性查看列数据的类型82
4.1.3 利用columns和values属性查看表头和数据表数据信息84
4.1.4 利用isnull()方法查看空值信息85
4.1.5 利用unique()方法查看列中的无重复数据信息87
4.1.6 利用info()方法查看数据表的基本信息88
4.1.7 利用head()方法查看数据表前几行数据89
4.1.8 利用tail()方法查看数据表后几行数据91
4.2 Pandas数据表的清洗92
4.2.1 空值的清洗92
4.2.2 格式错误数据的清洗97
4.2.3 错误数据的清洗98
4.2.4 重复数据的清洗101
4.2.5 数据表列名的清洗103
4.2.6 数据内容的清洗105
第5章 Pandas数据的合并与对比108
5.1 利用append()方法追加数据109
5.1.1 append()方法及参数109
5.1.2 利用append()方法实现相同结构数据表的数据追加109
5.1.3 利用append()方法实现不同结构数据表的数据追加111
5.1.4 利用append()方法实现忽略索引的数据追加113
5.1.5 追加Series序列115
5.1.6 追加字典列表117
5.2 利用concat()方法合并数据118
5.2.1 concat()方法及参数118
5.2.2 利用concat()方法纵向合并数据119
5.2.3 利用concat()方法横向合并数据120
5.2.4 合并数据的交集122
5.3 利用merge()方法合并数据125
5.3.1 merge()方法及参数125
5.3.2 利用merge()方法合并数据实例126
5.4 利用compare()方法对比数据130
5.4.1 compare()方法及参数130
5.4.2 利用compare()方法对比数据实例131
第6章 Pandas数据的预处理135
6.1 设置索引列135
6.1.1 Pandas索引的作用136
6.1.2 set_index()方法及参数136
6.1.3 利用set_index()方法设置索引列实例137
6.1.4 利用reset_index()方法还原索引列实例139
6.2 排序141
6.2.1 按索引列排序141
6.2.2 按指定列排序144
6.3 分组标记146
6.3.1 利用where()方法添加分组标记146
6.3.2 根据多个条件进行分组标记148
6.4 列的拆分151
第7章 Pandas数据的提取155
7.1 利用loc[ ]提取数据155
7.1.1 利用loc[ ]提取整行数据156
7.1.2 利用loc[ ]提取整列数据158
7.1.3 利用loc[ ]提取具体数据161
7.2 利用iloc[ ]提取数据164
7.2.1 利用iloc[ ]提取整行数据165
7.2.2 利用iloc[ ]提取整列数据167
7.2.3 利用iloc[ ]提取具体数据168
7.3 利用属性提取数据170
7.4 利用For循环提取数据172
第8章 Pandas数据的筛选175
8.1 Pandas数据关系筛选176
8.1.1 等于关系数据筛选实例176
8.1.2 不等于关系数据筛选实例178
8.1.3 大于和大于等于关系数据筛选实例180
8.1.4 小于和小于等于关系数据筛选实例182
8.2 Pandas数据逻辑筛选183
8.2.1 使用“与”进行数据筛选实例183
8.2.2 使用“或”进行数据筛选实例185
8.2.3 使用“非”进行数据筛选实例186
8.3 使用query()方法进行数据筛选实例188
8.4 使用filter()方法进行数据筛选192
8.4.1 filter()方法及意义193
8.4.2 使用filter()方法进行数据筛选实例193
第9章 Pandas数据的聚合函数197
9.1 sum()函数的应用197
9.1.1 sum()函数及参数198
9.1.2 sum()函数应用实例198
9.2 mean()函数的应用202
9.2.1 mean()函数及参数203
9.2.2 mean()函数应用实例203
9.3 max()函数的应用207
9.3.1 max()函数及参数207
9.3.2 max()函数应用实例207
9.4 min()函数的应用210
9.4.1 min()函数及参数210
9.4.2 min()函数应用实例211
9.5 count()函数的应用213
9.5.1 count()函数及参数214
9.5.2 count()函数应用实例214
第10章 Pandas数据的分组与透视217
10.1 Pandas数据的分组218
10.1.1 groupby()方法及参数218
10.1.2 groupby()方法的应用218
10.1.3 agg()方法的应用223
10.1.4 transform()方法的应用226
10.2 Pandas数据的透视230
10.2.1 pivot_table()方法及参数230
10.2.2 利用pivot_table()方法透视数据实例231
10.2.3 crosstab()方法及参数235
10.2.4 利用crosstab()方法透视数据实例236
第11章 Pandas数据的统计243
11.1 数据采样243
11.1.1 sample()方法及参数244
11.1.2 利用sample()方法进行数据采样实例244
11.2 数据统计249
11.2.1 数据表描述性统计249
11.2.2 利用describe()方法进行数据表描述性统计实例250
11.2.3 中位数的应用255
11.2.4 方差的应用260
11.2.5 标准差的应用263
11.3 数据相关性分析267
11.3.1 协方差的应用267
11.3.2 协方差相关系数的应用270
第12章 Pandas数据的可视化275
12.1 利用Pandas中的plot()方法绘图276
12.1.1 plot()方法及参数276
12.1.2 绘制折线图实例277
12.1.3 绘制条形图实例279
12.1.4 利用plot()方法绘制其他类型图形实例283
12.2 利用Matplotlib包绘制Pandas数据图形287
12.2.1 figure()方法的应用实例288
12.2.2 plot()方法的应用实例290
12.2.3 subplot()方法的应用实例294
12.2.4 add_axes()方法的应用实例296
12.2.5 legend()方法的应用实例298
12.2.6 设置线条的宽度和颜色实例300
12.2.7 添加坐标轴网格线实例302
第13章 Pandas数据的机器学习算法303
13.1 机器学习概述304
13.1.1 什么是机器学习304
13.1.2 机器学习的类型304
13.2 常见的机器学习算法305
13.3 机器学习的sklearn包307
13.3.1 sklearn包中的数据集308
13.3.2 iris数据集308
13.3.3 查看iris数据集实例309
13.4 决策树314
13.4.1 决策树的组成315
13.4.2 决策树的优点315
13.4.3 决策树的缺点316
13.4.4 决策树实现实例316
13.5 随机森林318
13.5.1 随机森林的构建318
13.5.2 随机森林的优缺点318
13.5.3 随机森林的应用范围319
13.5.4 随机森林实现实例319
13.6 支持向量机321
13.6.1 支持向量机的工作原理321
13.6.2 核函数322
13.6.3 支持向量机的优点324
13.6.4 支持向量机的缺点324
13.6.5 支持向量机实现实例325
13.7 朴素贝叶斯算法328
13.7.1 朴素贝叶斯算法的思想329
13.7.2 朴素贝叶斯算法的步骤329
13.7.3 朴素贝叶斯算法的优缺点330
13.7.4 高斯朴素贝叶斯模型实现实例330
13.7.5 多项式分布朴素贝叶斯模型实现实例333
13.7.6 伯努力朴素贝叶斯模型实现实例336
第14章 Pandas的时间序列数据338
14.1 Pandas时间序列的创建339
14.1.1 date_range()方法及参数339
14.1.2 利用date_range()方法创建时间序列实例340
14.1.3 时间戳对象341
14.2 时间类型与字符串类型的转换343
14.3 时间序列数据的操作技巧345
14.3.1 时间序列数据的提取345
14.3.2 时间序列数据的筛选349
14.3.3
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价