Python数据分析案例教程(微课版)
全新正版未拆封
¥
65.16
6.5折
¥
99.9
全新
库存2件
作者于晓梅 李贞 郑向伟 朱磊
出版社清华大学出版社
出版时间2022-06
版次1
装帧其他
上书时间2024-09-04
商品详情
- 品相描述:全新
图书标准信息
-
作者
于晓梅 李贞 郑向伟 朱磊
-
出版社
清华大学出版社
-
出版时间
2022-06
-
版次
1
-
ISBN
9787302604211
-
定价
99.90元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
548页
-
字数
860千字
- 【内容简介】
-
本书内容从Python基础到扩展库,从编程到数据分析,再到机器学习和深度学习,循序渐进,逐步推进知识点的实际应用。首先简要介绍数据分析相关概念和Python基础知识;然后按照数据分析的主要步骤,重点介绍数据获取、数据预处理、数据分析、数据可视化以及机器学习过程相关的扩展库,包括beautifulsoup4、numpy、matplotlib、pandas、pyecharts和sklearn等;最后将Python数据分析知识和实用案例有机结合,通过大量的实用案例演示相关理论和Python语言的应用。 本书适合作为高等院校本科生、研究生数据分析等课程的教材,也可以作为数据分析初学者的自学用书,还适合从事相关工作的工程师和爱好者阅读。
- 【作者简介】
-
:
于晓梅,女,博士,现为山东师范大学信息科学及工程学院副教授,主要从事数据挖掘、智能计算等研究,在国内外期刊和会议发表论文60余篇;长期承担程序设计和大学信息技术等课程的教学工作,出版了专著《智能数据挖掘》《软件与教育信息服务》,参与编写了《大学IT》《网页设计与制作教程》《人工智能教育》等多部教材。
- 【目录】
-
第1章数据分析和Python概述1
1.1数据分析概述1
1.1.1数据、信息、知识1
1.1.2数据分析5
1.1.3数据分析、数据挖掘与机器学习6
1.2数据分析的基本步骤7
1.2.1明确目的7
1.2.2数据收集8
1.2.3数据预处理8
1.2.4数据分析10
1.2.5结果呈现10
1.2.6撰写报告10
1.3Python概述10
1.4Python环境安装与使用12
1.4.1IDLE开发环境12
1.4.2Anaconda开发环境17
1.5Python库简介24
1.5.1标准库24
1.5.2扩展库25
1.6扩展库的获取和安装25
1.6.1安装pip25
1.6.2使用pip安装扩展库26
1.6.3手动安装Python扩展库27
1.6.4扩展库安装说明28
1.6.5使用conda安装扩展库29Python数据分析案例教程(微课版)目录第2章Python基本语法30
2.1Python程序的格式30
2.1.1缩进要求30
2.1.2注释31
2.1.3关键字32
2.1.4标识符33
2.1.5常量和变量34
2.2数据类型35
2.2.1对象35
2.2.2基本数据类型36
2.2.3数字类型36
2.2.4字符串37
2.3运算符和表达式42
2.4程序的基本控制结构46
2.4.1顺序结构46
2.4.2分支结构50
2.4.3循环结构52
2.5程序的异常处理56
2.5.1Python中的异常56
2.5.2try…except…结构59
2.5.3try…except…else…结构62
2.5.4try…except…finally结构62
2.6函数63
2.6.1函数定义63
2.6.2函数调用64
2.6.3函数的参数传递65
2.6.4匿名函数67
2.6.5变量的作用域69
2.7案例精选70
第3章组合数据类型77
3.1组合数据类型的基本概念77
3.2列表78
3.2.1列表的创建与删除78
3.2.2列表的基本操作79
3.2.3列表可用操作符83
3.2.4列表常用函数84
3.2.5列表常用方法87
3.3元组90
3.3.1元组的创建与删除90
3.3.2元组与列表的区别92
3.4字典93
3.4.1字典的创建和删除94
3.4.2字典的基本操作95
3.5集合98
3.5.1集合的创建和删除99
3.5.2集合的基本操作99
3.6字符串常用方法101
3.7推导式104
3.7.1列表推导式104
3.7.2字典推导式105
3.7.3集合推导式105
3.8迭代器对象和生成器表达式106
3.8.1迭代器对象106
3.8.2生成器表达式106
3.9案例精选107
3.9.1英文词频统计107
3.9.2中文词频分析109
3.9.3词云113
第4章本地数据采集和操作116
4.1文件的基本操作116
4.1.1文件的打开116
4.1.2文件的关闭118
4.1.3文件的读写118
4.2os模块操作文件与目录122
4.2.1os模块常用操作122
4.2.2os.path模块常用操作123
4.3JSON文件操作124
4.3.1JSON数据124
4.3.2JSON文件操作125
4.4CSV文件操作127
4.4.1普通方式读写CSV文件128
4.4.2使用csv模块读写CSV文件129
4.4.3使用numpy模块读写CSV文件129
4.4.4使用pandas模块读写CSV文件132
4.5Excel文件操作133
4.5.1读写.xls格式的Excel文件134
4.5.2读写xlsx格式的Excel文件138
4.5.3使用pandas模块读写Excel文件139
4.6SQLite数据库操作142
4.6.1SQLite数据库简介142
4.6.2SQL语句142
4.6.3sqlite3模块145
4.6.4操作SQLite数据库147
4.7案例精选150
4.7.1欧洲职业足球球员信息获取150
4.7.2教工信息管理系统154
第5章网络数据获取160
5.1网络爬虫简介160
5.1.1网络爬虫的定义160
5.1.2网络爬虫的类型160
5.1.3网络爬虫基本架构162
5.2网页下载模块163
5.2.1requests库简介164
5.2.2requests库的使用164
5.3网页解析模块167
5.3.1beautifulsoup4库简介167
5.3.2文档对象模型167
5.3.3创建BeautifulSoup对象168
5.3.4查询节点169
5.3.5获取节点信息172
5.4scrapy爬虫框架概述175
5.4.1scrapy爬虫框架简介176
5.4.2scrapy框架工作过程177
5.4.3scrapy爬虫框架的安装178
5.5scrapy框架的使用181
5.5.1创建scrapy项目182
5.5.2编写Spider183
5.5.3执行爬虫185
5.5.4构造爬取对象186
5.5.5编写pipeline和配置数据189
5.6精选案例191
5.6.1《红楼梦》网络文本爬取191
5.6.2空气质量数据爬取194
第6章numpy科学计算201
6.1numpy库简介201
6.2数组对象ndarray201
6.2.1ndarray对象的创建202
6.2.2ndarray对象常用属性204
6.2.3ndarray对象基本操作205
6.2.4索引和切片209
6.2.5numpy常用函数211
6.2.6numpy数组运算214
6.3numpy矩阵217
6.3.1numpy矩阵简介217
6.3.2矩阵生成218
6.3.3矩阵特征218
6.3.4矩阵常用操作219
6.4精选案例224
6.4.1美国总统大选数据统计224
6.4.2约会配对案例229
第7章matplotlib数据可视化236
7.1探索性数据分析236
7.1.1EDA简介236
7.1.2EDA常用工具237
7.2matplotlib绘图基础238
7.2.1matplotlib绘图简介238
7.2.2matplotlib基本元素可视化240
7.2.3matplotlib的ax对象绘图248
7.2.4matplotlib绘制子图250
7.2.5matplotlib中文字体的显示252
7.3定性数据可视化254
7.3.1条形图254
7.3.2帕累托图256
7.3.3饼图256
7.3.4环形图257
7.4定量数据可视化259
7.4.1直方图259
7.4.2茎叶图261
7.4.3箱线图262
7.4.4折线图263
7.4.5散点图265
7.4.6气泡图267
7.4.7雷达图268
7.4.8矩阵图270
7.5使用matplotlib绘制三维图形271
7.5.13D绘图基本步骤272
7.5.23D曲线272
7.5.33D散点图273
7.5.43D柱状图274
7.6精选案例275
7.6.1约会配对数据可视化275
7.6.2《平凡的荣耀》收视趋势可视化分析280
第8章pandas数据分析290
8.1认识pandas290
8.1.1pandas简介290
8.1.2pandas的安装与导入290
8.2pandas常用数据结构291
8.2.1数据结构Series291
8.2.2数据结构DataFrame295
8.2.3Index对象301
8.3索引操作304
8.3.1Series的索引操作304
8.3.2DataFrame的索引操作305
8.4算术运算与常见应用307
8.4.1运算与对齐307
8.4.2常见应用310
8.4.3排序312
8.4.4描述性统计与计算313
8.5数据清洗315
8.5.1处理缺失数据316
8.5.2处理重复数据320
8.5.3替换数据321
8.6分组和聚合322
8.6.1分组和聚合数据322
8.6.2自定义分组及聚合操作325
8.6.3透视表328
8.7数据规整331
8.7.1层级索引331
8.7.2数据合并335
8.7.3数据连接337
8.7.4数据重构340
8.8精选案例342
8.8.1全球食品数据分析342
8.8.2互联网电影资料库分析346
8.8.3美国总统大选数据可视化分析353
第9章pyecharts可视化356
9.1认识pyecharts356
9.1.1pyecharts简介356
9.1.2pyecharts使用357
9.1.3pyecharts数据格式358
9.1.4pyecharts图表分类359
9.2pyecharts绘图基础359
9.2.1Faker数据构造器359
9.2.2pyecharts数据可视化360
9.2.3pyecharts的渲染方式362
9.2.4常用配置项362
9.3项目对比可视化367
9.3.1柱状图和条形图367
9.3.2堆叠柱状图367
9.3.3漏斗图368
9.4时间趋势可视化370
9.4.1折线图370
9.4.2面积图370
9.4.3K线图371
9.4.4堆叠折线图372
9.4.5阶梯图373
9.4.6折线图中常用的配置项374
9.5数据关系可视化376
9.5.1散点图376
9.5.2气泡图377
9.5.3热力图377
9.5.4其他相关图表378
9.6成分比例可视化381
9.6.1饼图381
9.6.2圆环图382
9.6.3矩形树图382
9.6.4多饼图384
9.6.5玫瑰图384
9.6.6雷达图385
9.7统计分布及3D可视化386
9.7.1箱线图386
9.7.2直方图387
9.7.33D柱状图388
9.7.4叠加图389
9.8文本数据可视化390
9.9案例精选391
9.9.1电子商城销售数据分析与可视化391
9.9.2电商用户行为数据可视化398
第10章机器学习库sklearn411
10.1机器学习简介411
10.2机器学习工具sklearn412
10.2.1sklearn常用模块412
10.2.2sklearn使用流程414
10.3数据集准备及划分415
10.3.1sklearn常用数据集415
10.3.2数据集划分420
10.4模型选择及处理422
10.4.1分类422
10.4.2聚类430
10.4.3回归434
10.5数据预处理及特征工程438
10.5.1数据标准化438
10.5.2数据归一化440
10.5.3数据正则化442
10.5.4数据二值化443
10.5.5缺失值处理443
10.6模型调参444
10.6.1交叉验证444
10.6.2网格搜索446
10.7模型测试及评价447
10.7.1分类模型评价指标447
10.7.2回归模型评价指标454
10.8精选案例457
10.8.1移动用户行为数据分析457
10.8.2基于手机定位数据的商圈分析464
第11章综合案例470
11.1综艺节目选手数据爬取与探索性分析470
11.1.1任务描述470
11.1.2数据获取471
11.2波士顿房价预测484
11.2.1任务描述484
11.2.2数据集介绍484
11.2.3数据探索486
11.2.4数据预处理491
11.2.5基于sklearn经典模型的房价预测493
11.2.6构建网络模型进行房价预测496
11.2.7模型评估499
第12章案例报告502
参考文献527
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价