• 从0到1——Python数据分析
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

从0到1——Python数据分析

52.88 5.9折 89.9 全新

库存3件

山东泰安
认证卖家担保交易快速发货售后保障

作者莫振杰

出版社人民邮电出版社

出版时间2022-05

版次1

装帧平装

货号604 1-1

上书时间2025-01-01

邹鲁文化书店

十一年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 莫振杰
  • 出版社 人民邮电出版社
  • 出版时间 2022-05
  • 版次 1
  • ISBN 9787115585868
  • 定价 89.90元
  • 装帧 平装
  • 开本 其他
  • 纸张 胶版纸
  • 页数 436页
  • 字数 717千字
【内容简介】
作者根据自己多年的前后端开发经验,站在完全零基础读者的角度,详尽介绍了Pytho数据分析的基础知识,以及大量的开发技巧,全书围绕着“数据分析三剑客(NumPy、Pandas、Matplotlib)”进行细致的介绍。这三款工具的知识点非常多,本书尽量系统细致地介绍精华的知识点,以便为读者构建一个完善的知识体系,并且为后续的工作打下坚实的基础。 每一章后面的实战题以及练习题,经过精心设计,可以锻炼读者的数据分析实战能力,对于巩固基础以及锻炼技术是非常有帮助的。
【作者简介】
莫振杰,毕业于暨南大学信科院计算机科学与技术专业,从事前后端开发4年多,开发过绿叶学习网、广州智能工程研究会网站、大量在线应用工具及其他各种类型网站,著有多本编程书且销量过万, 现为绿叶学习网的站长,该网站用于分享其在前后端开发中的一些经验,其制作的前后端开发在线教程在互联网引起广泛关注,每一个教程广受网友称赞与推崇。
【目录】
目    录

前言 xvii

第 一部分 NumPy篇

第 1章  数据分析概述3

1.1 数据分析简介3

1.1.1  数据科学是什么?3

1.1.2  数据分析是什么?4

1.1.3  应该学些什么?4

1.2  课程介绍6

1.2.1  课程说明6

1.2.2  常见问题6

1.3  使用 VSCode7

1.3.1  安装 VSCode7

1.3.2  安装插件8

1.3.3  运行代码9

第 2章  NumPy基础11

2.1  NumPy是什么?11

2.2  创建数组12

2.2.1  基本方法12

2.2.2  随机数组18

2.2.3  数组与列表的区别21

2.3  数组属性22

2.4  元素操作24

2.4.1  访问元素25

2.4.2  修改元素26

2.4.3  添加元素26

2.4.4  删除元素28

2.4.5  切片29

2.5  数组操作31

2.5.1  修改形状31

2.5.2  修改维度33

2.5.3  翻转数组34

2.5.4  数组去重34

2.5.5  合并数组35

2.5.6  分割数组37

2.6  各种运算39

2.6.1  基本运算39

2.6.2  比较运算41

2.6.3  标量运算42

2.6.4  数学函数43

2.6.5  统计函数45

2.7  遍历数组53

2.8  大小排序55

2.9  本章练习57

第3章  NumPy进阶58

3.1 浅拷贝和深拷贝58

3.1.1  浅拷贝58

3.1.2  深拷贝59

3.2  axis的值60

3.3  广播机制61

3.3.1  维数不同61

3.3.2  维数相同63

3.3.3  标量运算64

3.4  读写文件65

3.4.1  读取文件65

3.4.2  写入文件66

3.5  矩阵简介67

3.5.1  全0矩阵68

3.5.2  全1矩阵69

3.5.3  单位矩阵69

3.5.4  随机矩阵70

3.6  本章练习71

第二部分 Pandas篇

第4章  Pandas简介75

4.1 Pandas是什么?75

4.2  Series76

4.2.1  创建Series76

4.2.2  Series的属性78

4.2.3  获取某行的值78

4.2.4  深入了解79

4.3  DataFrame79

4.3.1  创建DataFrame79

4.3.2  DataFrame的属性83

4.3.3  深入了解86

4.4  DataFrame的数据操作88

4.4.1  访问数据88

4.4.2  修改数据95

4.4.3  添加数据96

4.4.4  删除数据98

4.5  遍历行列101

4.5.1  遍历行101

4.5.2  遍历列102

4.6  深入了解103

4.7  本章练习105

第5章  获取数据107

5.1 数据分析流程107

5.2  读写数据简介108

5.3  读写JSON109

5.3.1  JSON简介109

5.3.2  读取JSON110

5.3.3  写入JSON111

5.4  读写CSV113

5.4.1  CSV简介113

5.4.2  读取CSV114

5.4.3  写入CSV116

5.5  读写Excel117

5.5.1  Excel简介117

5.5.2  读取Excel118

5.5.3  写入Excel119

5.6  读写HTML120

5.7  深入文件读取122

5.7.1  分块读取122

5.7.2  只读取一部分124

5.8  读取数据库125

5.8.1  安装MySQL125

5.8.2  安装Navicat for MySQL129

5.8.3  读取MySQL134

5.9  本章练习136

第6章  筛选数据137

6.1 筛选数据简介137

6.2  获取行、列:loc[]、iloc[]和df[]138

6.2.1  获取行138

6.2.2  获取列139

6.3  重新索引:reindex()141

6.3.1  语法简介141

6.3.2  深入了解143

6.4  获取首尾数据:head()和tail()145

6.5  随机抽样:sample()147

6.6  逻辑比较149

6.6.1  语法简介149

6.6.2  深入了解152

6.7  过滤操作155

6.7.1  query()155

6.7.2  filter()157

6.8  模式匹配159

6.9  本章练习162

第7章  处理数据164

7.1 处理数据简介164

7.2  操作行名和列名165

7.2.1  设置某一列为行名165

7.2.2  重置行名166

7.2.3  修改行名和列名168

7.3  类型转换171

7.3.1  针对DataFrame171

7.3.2  针对某一列174

7.4  行列转置:T175

7.5  大小排序:sort_values()176

7.6  数据排名:rank()179

7.7  数据替换:replace()181

7.8  数据移动:shift()183

7.9  数据清洗185

7.9.1  缺失值186

7.9.2  重复值192

7.9.3  异常值196

7.10  数据合并197

7.10.1  轴向合并:concat()198

7.10.2  主键合并:merge()203

7.10.3  行列连接:join()207

7.10.4  纵向合并:append()208

7.11  字符串处理209

7.11.1  获取长度:len()210

7.11.2  统计次数:count()211

7.11.3  去除空格:strip()212

7.11.4  替换字符串:replace()213

7.11.5  分割字符串:split()214

7.11.6  重复字符串:repeat()215

7.11.7  连接列:cat()216

7.11.8  大小写转换219

7.11.9  判断类型220

7.11.10  判断包含221

7.12  自定义函数222

7.12.1  map()222

7.12.2  apply()224

7.12.3  applymap()226

7.13  实战题:处理天气数据227

7.14  实战题:拆分数据229

7.15  本章练习230

第8章  分析数据232

8.1 分析数据简介232

8.2  基本统计函数232

8.2.1  求和:sum()233

8.2.2  统计个数:count()235

8.2.3  求值:max()与min()236

8.2.4  求中位数:median()238

8.2.5  求众数:mode()239

8.2.6  求平均数:mean()240

8.2.7  求方差:var()241

8.2.8  求标准差:std()242

8.2.9  求分位数:quantile()243

8.3  其他统计函数244

8.3.1  统计取值种类244

8.3.2  统计取值个数245

8.3.3  求变化百分比246

8.3.4  求值的行名247

8.4  整体情况247

8.4.1  describe()248

8.4.2  info()248

8.5  聚合函数:agg()249

8.6  数据分组252

8.6.1  基本语法252

8.6.2  统计分析256

8.7  实战题:求平均寿命258

8.8  本章练习259

第9章  时间序列260

9.1 时间序列概述260

9.1.1  时间序列简介260

9.1.2  转换类型261

9.1.3  获取日期264

9.1.4  索引与切片266

9.2  重采样:resample()268

9.2.1  降采样268

9.2.2  升采样271

9.3  移动计算:rolling()273

9.4  分组器:Grouper()274

9.5  实战题:求每个月的销量总和276

9.6  本章练习277

第 10章  高级技术279

10.1 透视表279

10.1.1  透视表简介279

10.1.2  统计函数281

10.2  交叉表282

10.3  层次化索引284

10.3.1  层次化索引简介284

10.3.2  常用操作286

10.4  离散化处理292

10.4.1  离散化简介292

10.4.2  常用参数293

10.5  哑变量处理296

10.6  实战题:创建透视表298

10.7  本章练习299

第 11章  其他操作300

11.1 广播机制300

11.2  索引对象301

11.3  inplace参数304

11.4  缺失值306

11.5  实战题:统计每一列的缺失值个数307

11.6  本章练习308

第三部分 Matplotlib篇

第 12章  基础图表313

12.1 Matplotlib简介313

12.2  基本绘图(折线图)315

12.2.1  基本语法315

12.2.2  定义样式317

12.3  通用设置325

12.3.1  画布样式325

12.3.2  定义标题326

12.3.3  定义图例330

12.3.4  刻度标签332

12.3.5  刻度范围335

12.3.6  网格线338

12.3.7  参考线340

12.3.8  参考区域343

12.3.9  注释文本(有指向)345

12.3.10  注释文本(无指向)347

12.4  通用样式350

12.5  散点图350

12.5.1  基本语法350

12.5.2  定义样式352

12.5.3  气泡图354

12.6  柱形图356

12.6.1  基本语法356

12.6.2  高级柱形图358

12.6.3  条形图361

12.7  直方图362

12.7.1  基本语法362

12.7.2  定义样式364

12.8  饼状图366

12.8.1  基本语法366

12.8.2  定义样式367

12.8.3  圆环图372

12.9  实战题:绘制气温折线图373

12.10  实战题:浏览器所占市场份额柱形图375

第 13章  高级图表378

13.1 高级图表简介378

13.2  箱线图378

13.2.1  基本语法378

13.2.2  样式定义381

13.3  面积图387

13.3.1  基本语法387

13.3.2  高级面积图388

13.4  棉棒图389

13.4.1  基本语法389

13.4.2  定义样式390

13.5  热力图393

13.5.1  基本语法393

13.5.2  定义样式394

13.6  子图表395

13.6.1  基本语法395

13.6.2  实际案例398

13.7  实战题:使用箱线图查找异常值399

13.8  实战题:绘制每月销量的棉棒图401

第四部分 工具篇

第 14章  Jupyter Notebook407

14.1 Jupyter Notebook简介407

14.2  Jupyter Notebook的使用408

14.2.1  安装Anaconda409

14.2.2  运行Jupyter Notebook409

14.3  应用场景411

14.4  常用技巧414

14.4.1  问号查询414

14.4.2  输出多个变量415

14.4.3  读取文件417

第五部分 附录

附录A  读写文件(Pandas)422

附录B  统计函数(Pandas)423

附录C  绘图函数(Matplotlib)424
点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP