Python数据分析与挖掘
全新正版 极速发货
¥
34.34
5.7折
¥
59.8
全新
仅1件
作者齐福利 杨 玲
出版社人民邮电出版社
ISBN9787115622211
出版时间2023-11
装帧平装
开本16开
定价59.8元
货号1203129098
上书时间2024-07-02
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
齐福利,四川大学软件工程专业硕士,讲师,信息学院专业教师、专业主任,CIW数据分析师、中国教育协会无人机专委会副秘书长、计算机行业协会工种考评员、Aopa无人机驾驶员、无人机测量测绘工程师。先后主持教育部协同育人项目一项,主持参与科研项目4项。主编参编教材2部,在国内外学术期刊发表论文十余篇,多篇被SSCI、EI收录,拥有专利1项。担任过《大数据技术原理与应用》、《python数据分析》、《JAVA程序设计》、《大数据项目实战》、《Html网页制作》、《无人机编队飞行程序设计》、《Android应用开发》《无人机模拟飞行》、《LINUX网络操作系统》、《大学信息技术》等课程建设和教学工作。先后指导学生参加重量、省市级比赛,获得一等奖、二等奖、等各项大奖二十多次。多次荣获“三全育人”优选个人、“优秀员工”、“工会积极分子”等称号。
目录
第1章数值计算模块NumPy1
1.1NumPy数组的创建与保存2
1.1.1使用基本方法创建数组2
1.1.2使用通用方法创建数组3
1.1.3读取外部数据创建数组6
1.1.4数组保存为文本文件7
1.2NumPy数组操作8
1.2.1数组的数据类型操作8
1.2.2数组的形状及其相关操作10
1.2.3数组元素访问:索引与切片13
1.2.4数组运算15
1.3NumPy数组常用函数19
1.3.1统计函数19
1.3.2逻辑函数24
1.3.3离散差分函数和梯度函数26
1.3.4随机函数28
1.3.5其他常用函数31
1.4股价统计分析案例31
1.4.1读取南方股价数据文件32
1.4.2计算市盈率34
1.4.3计算成交额加权平均价格35
1.4.4计算股价的极值36
1.4.5计算股价方差与标准差37
1.4.6计算股票收益率和波动率38
1.4.7求平均收盘价极值分别为星期几41
第2章数据分析模块pandas43
2.1pandas基础43
2.1.1pandas简介43
2.1.2pandas的数据结构43
2.1.3pandas的安装和导入44
2.1.4pandas数据结构的运算操作44
2.2从文件读取数据构建DataFrame49
2.2.1读取csv文件49
2.2.2读取txt文件53
2.2.3读取Excel文件中的数据54
2.2.4将DataFrame保存为csv文件55
2.3DataFrame的访问与删除57
2.3.1访问方式57
2.3.2行列的删除58
2.3.3DataFrame的访问实例59
2.4时间类型的转换与处理60
2.4.1pandas.to_datetime()60
2.4.2提取年月日、时分秒、季节、星期61
2.4.3批量处理Datetime数据62
2.5数据的清洗63
2.5.1查找所有存在缺失值的行63
2.5.2删除缺失值64
2.5.3填充缺失值67
2.5.4重复值的处理70
2.5.5设置与重置索引74
2.6数据整理78
2.6.1列内容模糊筛选78
2.6.2列数据转换80
2.6.3数据处理80
2.7数据分析统计84
2.7.1数据的描述性分析84
2.7.2数据的分组分析86
2.7.3连续数据分区91
2.7.4数据的相关性分析93
第3章JSON模块与格式转换97
3.1JSON对象与Python对象97
3.1.1Python对象转换为JSON对象97
3.1.2JSON对象转换成Python对象98
3.1.3Python对象和JSON对象的对比98
3.2JSON文件的读操作99
3.2.1保存JSON文件99
3.2.2读取json文件100
3.2.3JSON模块的4个函数100
3.3JSON文件的练习101
3.3.1读取JSON文件101
3.3.2pprint模块102
3.4打开文件103
3.4.1引入with打开文件的原因103
3.4.2使用withopen()as读写文件104
第4章连接数据库的pymysql模块107
4.1在Python3中连接MySQL107
4.1.1游标107
4.1.2使用pymysql链接MySQL108
4.1.3pymysql.connect()的参数与实例110
4.2pymysql的基本使用112
4.2.1数据库记录的增删改查操作112
4.2.2返回字典格式数据120
4.2.3pymysql与pandas结合121
第5章matplotlib可视化模块125
5.1确定画布的大小和格局125
5.1.1主画布的设置125
5.1.2matplotlib属性的设置126
5.1.3增加子图127
5.1.4解决子图标题重叠问题129
5.2绘制折线图和散点图130
5.2.1plt.plot()函数的语法与基本使用130
5.2.2图形的主要设置133
5.2.3设置x、y轴坐标刻度136
5.2.4在图上添加注释137
5.2.5使用plt.plot()函数绘制散点图140
5.3使用plt.scatter()函数绘制散点图141
5.4使用plt.bar()函数绘制条形图142
5.4.1plt.bar()函数的语法与参数143
5.4.2堆叠条形图143
5.4.3并列条形图144
5.4.4条形图(横图)145
5.4.5正负条形图146
5.5使用plt.hist()函数绘制直方图147
5.5.1直方图与条形图的区别148
5.5.2绘制直方图的一般格式148
5.6绘制箱形图151
5.6.1箱形图的组成、形状与作用151
5.6.2绘制画箱形图153
5.6.3给箱形图添加注释159
5.7雷达图164
5.7.1极坐标164
5.7.2绘制雷达图164
5.8三维图166
5.9通过DataFrame生成折线图167
第6章Flask框架与ECharts可视化170
6.1Flask框架的基本概念与使用170
6.1.1Flask的基本使用方法170
6.1.2Flask框架的概念与更多使用方法172
6.2ECharts的使用175
6.2.1下载ECharts视图示例网页175
6.2.2编号Flask程序调用示例网页177
6.3Flask结合ECharts实现动态视图179
6.3.1准备js支持文件179
6.3.2在Flask框架的程序中定义数据182
6.3.3修改HTML以适应Flask动态数据184
6.4Flask+MySQL+ECharts联动视图187
6.4.1数据库及表的准备工作187
6.4.2选择简单柱状图作为模板189
6.4.3从MySQL中获取数据到ECharts视图展示190
第7章机器学习模块sklearn195
7.1sklearn线性回归195
7.1.1一元线性回归模型训练195
7.1.2线性回归模型的评估方法198
7.1.3分割语句的用法199
7.1.4最小二乘法线性回归200
7.2sklearn分类算法202
7.2.1与分类器相关的概念202
7.2.2K近邻算法203
7.2.3贝叶斯算法205
7.2.4决策树算法208
7.2.5随机森林算法210
7.2.6SVM算法211
7.3Sklearn聚类算法213
7.3.1K均值聚类的基本原理213
7.3.2K均值聚类算法的主要参数214
7.3.3根据身高、体重和性别聚类215
7.3.4对鸢尾花数据进行K均值聚类220
内容摘要
本书面向大数据应用型人才,以任务为导向,全面地介绍Python数据分析与挖掘的常用技术与真实案例。全书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为全面地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplotlib可视化模块,用于绘制一些统计图形;第6章主要讲解Flask框架结合ECharts实现可视化效果;第7章主要讲解在机器学习和数据挖掘中sklearn模块的应用。本书适合作为高等院校大数据专业、人工智能专业的Python教材,也可作为Python相关培训的教材。
主编推荐
1.本书采用大量的实践案例,实战型极高,内容非常直观,可读性较强。
2.本书作者是多年从事一线开发工作的工程师,具有较为丰富的开发经验。
3.本书采用模块化组织方式,依据Python大数据处理与分析的要求按模块组织内容。
— 没有更多了 —
以下为对购买帮助不大的评价