• Python大数据分析与可视化
  • Python大数据分析与可视化
  • Python大数据分析与可视化
  • Python大数据分析与可视化
  • Python大数据分析与可视化
21年品牌 40万+商家 超1.5亿件商品

Python大数据分析与可视化

全新正版 现货速发

44.1 6.3折 69.8 全新

仅1件

江苏无锡
认证卖家担保交易快速发货售后保障

作者李辉,倪健

出版社清华大学出版社

ISBN9787302642695

出版时间2023-10

装帧平装

开本16开

定价69.8元

货号1203126796

上书时间2024-10-21

翰林文轩旗舰店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第1章数据分析与可视化概述/1

1.1数据分析概念与常用指标1

1.1.1数据分析的概念1

1.1.2数据分析常用指标2

1.1.3数据分析常用方法4

1.2什么是数据可视化4

1.3数据分析与可视化基本流程5

1.4数据分析与可视化开发环境安装与包管理6

1.4.1Python做数据分析与可视化的优势6

1.4.2Anaconda工具的安装与配置7

1.4.3通过Anaconda管理Python包8

1.5Jupyter Notebook的启动与使用10

1.5.1Jupyter Notebook的启动11

1.5.2Jupyter Notebook界面功能11

1.5.3Jupyter Notebook的基本使用13

1.6Jupyter的魔术命令16

1.7常见的数据分析与可视化工具17

小结18

思考与练习18

第2章Python编程基础/19

2.1Python语法基础19

2.1.1编写规范19

2.1.2数据类型20

2.1.3运算符21

2.2列表和元组22

2.2.1列表定义与元素访问22

2.2.2列表的操作方法23

2.2.3元组定义与元素操作25

2.3字典和集合27

2.3.1字典定义与元素操作272.3.2集合定义与元素操作28

2.4程序控制结构29

2.4.1输入、输出与顺序控制语句29

2.4.2if选择语句31

2.4.3循环语句31

2.5函数34

2.5.1函数的定义与调用35

2.5.2函数参数类型36

2.5.3函数参数的作用域38

2.5.4匿名函数38

2.6面向对象39

2.6.1类和对象39

2.6.2类的继承41

2.7模块与包42

2.7.1模块的导入42

2.7.2模块的创建与使用43

2.7.3第三方库的安装44

2.7.4包的创建与使用46

2.8程序的错误与异常处理48

2.8.1程序的错误与处理48

2.8.2程序的异常与处理49

小结50

思考与练习50

第3章NumPy数组计算/52

3.1NumPy与数组对象52

3.1.1NumPy概述52

3.1.2NumPy数组对象53

3.2创建NumPy数组54

3.2.1利用array函数创建数组54

3.2.2其他方式创建数组55

3.2.3利用随机数模块生成随机数组58

3.2.4从已有的数组中创建数组60

3.3数组对象的数据类型63

3.3.1查看数据类型63

3.3.2转换数据类型64

3.4数组运算65

3.4.1形状相同的数组间运算65

3.4.2形状不同的数组间运算66

3.4.3数组与标量间的运算67

3.5数组元素的操作68

3.5.1整数索引和切片的基本使用68

3.5.2花式(数组)索引的基本使用70

3.5.3布尔型索引的基本使用71

3.5.4数组元素的删除、修改和查询72

3.6数组的重塑和转置73

3.6.1数组重塑73

3.6.2数组合并74

3.6.3数组分割75

3.6.4数组转置75

3.7NumPy通用函数77

3.8NumPy数据处理与统计分析79

3.8.1将条件逻辑转为数组运算79

3.8.2数组统计运算79

3.8.3数组排序80

3.8.4检索数组元素82

3.8.5重复数据与去重(专享化)82

3.9NumPy矩阵的基本操作84

3.9.1矩阵创建84

3.9.2矩阵运算86

3.9.3矩阵转换88

3.10数组读/写88

3.10.1读/写二进制文件88

3.10.2读/写文本文件89

3.10.3读取CSV文件89

小结90

思考与练习90

第4章Pandas基础知识/92

4.1Pandas与数据结构92

4.1.1Pandas概述92

4.1.2Pandas中的数据结构93

4.1.3Series对象与生成93

4.1.4DataFrame对象与生成95

4.1.5Pandas的数据类型99

4.1.6算术运算与数据对齐99

4.2Pandas索引操作100

4.2.1Series对象索引操作101

4.2.2DataFrame对象索引操作103

4.2.3索引对象的不可操作性105

4.2.4设置索引106

4.2.5重命名轴名称111

4.3数据编辑112

4.3.1增加数据112

4.3.2修改数据115

4.3.3删除数据118

4.4Pandas中调用函数的方法119

4.4.1map()方法应用119

4.4.2apply()方法应用120

4.4.3applymap()方法应用121

4.4.4pipe()方法应用121

小结122

思考与练习122

第5章Pandas数据获取与清洗/123

5.1数据获取操作123

5.1.1读取文本(CSV和TXT)文件123

5.1.2读取Excel文件126

5.1.3读取JSON数据文件128

5.1.4读取HTML表格数据129

5.1.5读取MySQL数据库中数据130

5.2数据清洗133

5.2.1空值和缺失值的处理134

5.2.2重复值的处理139

5.2.3异常值的处理141

5.2.4更改数据类型146

5.3数据格式化149

5.3.1数据设置小数位数149

5.3.2数据设置百分比150

5.3.3数据设置千位分隔符151

5.4数据保存操作151

5.4.1数据保存为CSV文件151

5.4.2数据保存为Excel文件152

5.4.3数据保存为JSON格式文件152

5.4.4数据保存为HTML文件154

5.4.5数据保存到MySQL数据库154

小结155

思考与练习155

第6章Pandas数据形式变化/156

6.1数据集成与合并156

6.1.1数据集成概述156

6.1.2主键合并数据158

6.1.3轴向堆叠合并数据159

6.1.4合并重叠数据160

6.1.5根据行索引合并数据163

6.1.6数据追加164

6.2数据变换165

6.2.1数据标准化变换166

6.2.2数据离散化处理168

6.2.3数据泛化处理170

6.2.4哑变量处理类别数据170

6.2.5轴向旋转173

6.3层次化索引与数据重塑175

6.3.1层次化索引的创建175

6.3.2层次化索引的数据访问与操作180

6.3.3重塑层次化索引183

6.4数据分组与聚合187

6.4.1分组与聚合的原理187

6.4.2数据分组188

6.4.3数据聚合192

小结196

思考与练习196

第7章Pandas数据分析与可视化/197

7.1数据基本统计分析197

7.1.1了解数据信息197

7.1.2统计描述199

7.1.3统计计算200

7.1.4位置计算207

7.2数据选取与查询209

7.2.1选取指定列的数据210

7.2.2选取一行数据212

7.2.3选取多行数据212

7.2.4选取指定行列数据214

7.2.5剔除区间以外的数据215

7.2.6其他复杂查询选取数据215

7.3数据排序与排名218

7.3.1按索引排序218

7.3.2按值排序219

7.3.3数据排名221

7.4常用的数据分析223

7.4.1分组分析223

7.4.2分布分析225

7.4.3交叉分析229

7.4.4结构分析230

7.4.5相关分析231

7.5Pandas可视化方法232

小结233

思考与练习234

第8章Pandas数据处理与分析实战/235

8.1数据集准备235

8.2编程实现数据处理分析235

8.2.1数据探索235

8.2.2处理数据236

8.3Pandas实现成绩数据处理与分析237

8.3.1数据探索237

8.3.2数据预处理239

8.3.3数据选取241

8.3.4数据分析243

8.3.5数据可视化244

8.3.6数据输出245

小结245

思考与练习245

第9章Matplotlib库绘制可视化图表/246

9.1数据可视化概述246

9.1.1常见的可视化图表类型246

9.1.2可视化图表的基本构成249

9.1.3数据可视化方式选择依据250

9.1.4常见的数据可视化库252

9.2可视化Matplotlib库的概述253

9.2.1Matplotlib库的使用导入与设置253

9.2.2Matplotlib库绘图的层次结构253

9.3Matplotlib库绘图的基本流程254

9.3.1创建简单图表的基本流程254

9.3.2绘制子图的基本流程256

9.4使用Matplotlib库绘制常用图表262

9.4.1绘制直方图262

9.4.2绘制散点图263

9.4.3绘制柱状图264

9.4.4绘制折线图265

9.4.5绘制饼图266

9.4.6绘制面积图270

9.4.7绘制热力图271

9.4.8绘制箱形图272

9.4.9绘制雷达图275

9.4.10绘制3D图形276

小结278

思考与练习278

第10章图表辅助元素定制与美化/279

10.1图表辅助元素的设置279

10.2图表样式定制279

10.2.1默认图表样式279

10.2.2颜色样式定制281

10.2.3线型样式选择282

10.2.4数据标记添加283

10.2.5字体样式设置284

10.3设置坐标轴的标签、刻度范围和刻度标签286

10.3.1设置坐标轴的标签286

10.3.2设置刻度范围和刻度标签287

10.4标题和图例添加与网格线显示288

10.4.1添加图表标题288

10.4.2添加图表图例289

10.4.3显示网格线290

10.5添加参考线和参考区域290

10.5.1显示网格线290

10.5.2添加参考区域291

10.6添加注释文本与表格291

10.6.1添加指向型注释文本291

10.6.2添加无指向型注释文本292

10.6.3在图表中添加表格293

小结294

思考与练习295

第11章Seaborn绘制数据分析图表/296

11.1Seaborn与数据集加载296

11.1.1Seaborn概述296

11.1.2Seaborn数据集加载297

11.2Seaborn图表的基本设置298

11.2.1背景风格设置298

11.2.2设置绘图元素比例298

11.2.3边框控制299

11.3常用图表的绘制300

11.3.1可视化数据的分布300

11.3.2对分类数据绘图305

11.3.3类别内的统计估计307

小结310

思考与练习311

第12章时间序列数据处理与分析/312

12.1日期和时间数据类型312

12.1.1datetime构造312

12.1.2数据转换314

12.2时间序列的基本操作315

12.2.1创建时间序列315

12.2.2通过时间戳索引选取子集317

12.3固定频率的时间序列319

12.3.1创建固定频率的时间序列319

12.3.2时间序列的频率、偏移量321

12.3.3时间序列的移动323

12.4时间周期及计算324

12.4.1时期对象创建与运算324

12.4.2时期的频率转换326

12.5重采样处理326

12.5.1重采样方法(resample)327

12.5.2降采样328

12.5.3升采样328

12.6窗口计算处理330

12.7基于四类影响要素的时间序列分析332

小结334

思考与练习335

第13章文本数据分析/336

13.1文本数据处理与分析工具336

13.1.1文本数据处理336

13.1.2语料库中的NLTK与jieba338

13.1.3安装NLTK和下载语料库339

13.1.4jieba库的安装341

13.2文本预处理341

13.2.1预处理的流程342

13.2.2分词343

13.2.3词性标注345

13.2.4词形归一化346

13.2.5删除停用词348

13.3文本情感分析349

小结352

思考与练习352

第14章图像处理与分析/353

14.1OpenCV概述353

14.2cv2图像处理基础353

14.2.1cv2的基本方法与属性353

14.2.2图像处理中的阈值355

14.2.3cv2图像处理中的几何变换357

14.3图像的降噪处理362

14.3.1均值滤波器图像降噪362

14.3.2中值滤波器图像降噪363

14.3.3高斯滤波器图像降噪364

14.3.4双边滤波器图像降噪366

14.4图像中的图形检测367

14.4.1图像的轮廓367

14.4.2图像处理中的边缘检测369

14.5图像的分割370

14.5.1常用的图像分割方法370

14.5.2基于K-means的图像分割371

14.5.3基于区域生长的图像分割373

14.5.4基于分水岭算法的图像分割374

小结376

思考与练习377

内容摘要
本书全面介绍了使用Python进行数据分析所必需的各项知识,全书共分为14章,包括数据分析与可视化概述、Python编程基础、NumPy数组计算、Pandas基础知识、Pandas数据获取与清洗、Pandas数据形式变化、Pandas数据分析与可视化、Pandas数据处理与分析实战、Matplotlib库绘制可视化图表、图表辅助元素定制与美化、Seaborn绘制数据分析图表、时间序列数据处理与分析、文本数据分析、图像处理与分析等内容。结合了有应用背景的数据分析示例,系统介绍了数据分析与可视化方法,可以帮助读者逐步掌握运用Python技术解决数据分析问题的能力。本书可以作为高校数据科学与大数据技术、大数据管理与应用、软件工程和计算机科学与技术等专业的教材,也可以作为Python数据分析爱好者的自学用书。

主编推荐
(1)本书内容丰富,涵盖了数据分析中主流常用库:NumPy、Pandas、Matplotlib和Seaborn等,内容系统详细。配套资源丰富,方便教学和学习。
(2)内容从Python的基础知识讲起,结合应用背景,由浅入深,力求易懂,尽量避免晦涩难懂的专业解释,帮助读者轻松入门。
(3)结合有应用背景的例子,尽量做到知识点有应用点,透彻讲述了数据处理、分析以及可视化。
(4)本书采用图文结合的方式,能够让读者直观、清晰地了解操作步骤和呈现效果,方便读者校对操作时的正误。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP