Python数据分析基础教程
¥
36.7
7.4折
¥
49.8
全新
库存4件
作者郑丹青 著
出版社人民邮电出版社
ISBN9787115511577
出版时间2020-03
装帧平装
开本16开
定价49.8元
货号1202034948
上书时间2024-12-01
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1章
数据分析概述1
1.1数据的性质1
1.1.1数据的概念1
1.1.2数据的类型1
1.2数据分析2
1.2.1数据分析的概念2
1.2.2数据分析的过程2
1.2.3数据分析的作用5
1.2.4数据分析的常用工具5
本章小结5
思考练习6
第2章
Python与数据分析7
2.1Python简介7
2.1.1Python语言的特点7
2.1.2Python解释器8
2.2Python与数据分析的关系8
2.3Python数据分析常用的类库8
2.4Python开发环境的搭建10
2.5Python集成开发环境的搭建13
2.5.1PyCharm的安装与使用13
2.5.2JupyterNotebook的安装与
使用19
项目实践25
本章小结25
思考练习25
第3章
Python语言基础26
3.1Python基础语法26
3.1.1Python的语法规则26
3.1.2常量、变量与标准数据类型29
3.1.3第一个Python程序30
3.2Python的数据类型31
3.2.1数字31
3.2.2字符串33
3.2.3Python的数据结构组成36
3.2.4列表36
3.2.5元组40
3.2.6字典43
3.2.7集合48
3.3Python流程控制语句50
3.3.1if条件语句51
3.3.2while循环控制语句52
3.3.3for循环控制语句53
3.3.4range()函数的作用53
3.3.5break、continue、pass语句54
3.4Python的函数55
3.4.1自定义函数55
3.4.2设置函数参数55
3.4.3返回函数值57
3.4.4调用自定义函数57
3.4.5局部变量和全局变量58
3.4.6函数嵌套59
3.4.7匿名函数60
项目实践60
本章小结62
思考练习62
第4章
NumPy数组与矢量计算64
4.1NumPy概述64
4.1.1NumPy简介64
4.1.2NumPy的安装与测试65
4.1.3SciPy简介及其安装与测试65
4.1.4NumPy的简单应用:一维
数组相加66
4.2NumPy数组对象67
4.2.1创建数组对象68
4.2.2选取数组元素68
4.2.3数组的属性68
4.2.4创建数组的其他方法69
4.2.5NumPy的数据类型70
4.3NumPy数组操作72
4.3.1数组的索引和切片72
4.3.2修改数组形状74
4.3.3数组的展平75
4.3.4数组转置和轴对换76
4.3.5数组的连接77
4.3.6数组的分割78
4.3.7数组转换79
4.3.8添加/删除数组元素79
4.4NumPy数组的矢量计算81
4.4.1数组的运算81
4.4.2通用函数(ufunc)83
4.5NumPy矩阵创建、计算及
操作84
4.6随机数的生成87
项目实践89
本章小结90
思考练习90
第5章
用NumPy进行简单统计
分析91
5.1文件读写操作91
5.1.1使用NumPy读写文本文件91
5.1.2使用NumPy读写二进制格式
文件93
5.1.3使用NumPy读写多维数据
文件94
5.2NumPy常用的统计函数94
5.3使用NumPy函数进行统计
分析98
5.3.1NumPy的排序函数98
5.3.2NumPy的去重与重复函数100
5.3.3NumPy的搜索和计数函数102
5.4简单的统计分析103
项目实践106
本章小结107
思考练习107
第6章
数据可视化——
Matplotlib库109
6.1Matplotlib概述109
6.1.1Matplotlib简介109
6.1.2Matplotlib的测试、安装与
导入110
6.1.3IPython及pylab模式111
6.2使用pyplot创建图形111
6.2.1创建简单图形111
6.2.2创建子图114
6.3Matplotlib参数配置115
6.3.1matplotlibrc配置文件115
6.3.2设置动态rc参数116
6.4分析变量间关系图117
6.4.1绘制散点图117
6.4.2绘制折线图119
6.5分析变量数据分布和分散
状况120
6.5.1绘制直方图120
6.5.2绘制柱状图122
6.5.3绘制饼图123
6.5.4绘制箱线图125
项目实践126
本章小结127
思考练习127
第7章
pandas数据分析基础128
7.1pandas概述128
7.1.1pandas简介128
7.1.2pandas测试、安装与
导入129
7.2pandas的数据结构及常用
操作130
7.2.1Series对象及常用操作130
7.2.2DataFrame对象及常用
操作134
7.3pandas的索引141
7.3.1Index索引对象141
7.3.2Index对象的属性和方法141
7.3.3重新索引143
7.3.4层级索引144
7.4pandas数据结构之间的
运算148
7.4.1算术和数据对齐148
7.4.2算术运算方法149
7.4.3DataFrame与Series对象
之间的运算150
7.5pandas的函数应用151
7.5.1数据筛选151
7.5.2apply()函数151
7.5.3数据统计函数153
7.5.4DataFrame格式化函数153
7.5.5排序和排名154
7.6数据读取与写入156
7.6.1读/写文本文件156
7.6.2读/写Excel文件158
7.6.3读/写数据库文件159
7.6.4读/写JSON文件162
7.7数据分析方法163
7.7.1基本统计分析163
7.7.2分组分析164
7.7.3分布分析165
7.7.4交叉分析166
7.7.5结构分析168
7.7.6相关分析169
项目实践171
本章小结171
思考练习172
第8章
用pandas进行数据
预处理173
8.1数据清洗173
8.1.1重复值的处理173
8.1.2缺失值的处理174
8.1.3异常值的处理177
8.2数据合并178
8.2.1按键连接数据179
8.2.2沿轴连接数据181
8.2.3合并重叠数据184
8.3数据抽取185
8.3.1字段抽取与拆分185
8.3.2记录抽取186
8.4重塑层次化索引187
8.5映射与数据转换188
8.5.1用映射替换元素189
8.5.2用映射添加元素190
8.5.3重命名轴索引190
8.6排列与随机抽样191
8.7日期转换、日期格式化和日期
抽取192
8.8字符串处理194
8.8.1内置的字符串处理方法194
8.8.2正则表达式196
8.8.3矢量化的字符串函数201
项目实践203
本章小结204
思考练习204
第9章
机器学习库scikit-learn
入门206
9.1机器学习概述206
9.2scikit-learn概述208
9.2.1scikit-learn介绍208
9.2.2scikit-learn测试、安装和
导入209
9.3第一个机器学习程序209
9.4使用scikit-learn进行机器
学习210
9.4.1Seaborn绘图210
9.4.2准备数据集215
9.4.3选择模型220
9.4.4调整参数训练和测试模型223
项目实践226
本章小结228
思考练习228
第10章
电影数据分析项目230
10.1项目描述230
10.2准备数据231
10.3数据清洗231
10.4数据分析与数据可视化232
本章小结238
思考练习238
参考文献239
内容摘要
本书详细讲解了Python数据分析的相关内容,共分为10章,第1〜9章分别讲解了数据分析概述、Python与数据分析、Python语言基础、NumPy数组与矢量计算、用NumPy进行简单统计分析、数据可视化一Matplotlib库、pandas数据分析基础、用pandas进行数据预处理、机器学习库scikit-leam入门;第10章用一个综合案例——电影数据分析项目,带领读者灵活掌握本书所学内容。
本书适合作为高等院校本、专科计算机相关专业的教材,也可供爱好者自学使用。
— 没有更多了 —
以下为对购买帮助不大的评价