• Python数据分析从小白到专家
21年品牌 40万+商家 超1.5亿件商品

Python数据分析从小白到专家

全新正版 极速发货

42.87 4.9折 88 全新

库存2件

广东广州
认证卖家担保交易快速发货售后保障

作者田越

出版社电子工业出版社

ISBN9787121409233

出版时间2021-05

装帧平装

开本16开

定价88元

货号31131932

上书时间2024-06-06

书香美美

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
前言

前 言

 

 
Python*重要的应用领域之一就是数据分析,这主要得益于Python强大的第三方库。Python的第三方库为其提供了良好的生态环境,使得编码更加方便,程序员不需要写太多的数据结构和算法,因为Python的第三方库提供的方法足够用了。
在金融、销售、供应链等各个领域,Python数据分析都有用武之地。为了方便读者快速掌握数据分析方法,笔者特编写了本书。
本书内容
本书共13章,主要内容涵盖Python语法及数据分析方法。
第1章主要介绍数据分析的概念,使读者有一个大致的印象,并简单介绍本书频繁使用的Python的5个第三方库。
第2章主要做一些准备工作,手把手带读者搭建Python环境,包括Python 3.7.6的安装和pip的安装。
第3章介绍Python编程基础。
第4章到第7章介绍使用Python进行简单数据分析的基础库,包括NumPy、Pandas和Matplotlib库,并介绍使用正则表达式处理数据的方法。
第8章到第13章属于进阶内容,但也是Python数据分析的基础,结合机器学习介绍一些常见的用于数据分析的机器学习算法及常用的数学模型。
本书特色
(1)本书详细讲解NumPy、Pandas和Matplotlib库,从开源代码和官方文档入手,结合相应的数学运算(矩阵运算、数理统计等),帮助读者快速入门。
(2)本书并非空谈理论、没有实际的操作与代码,而是通过公式定理及算法原理引出代码,由浅入深,每个案例都有相应的代码和讲解。
(3)本书的案例使用较为真实的数据,而不是随机生成一组数字进行分析。
(4)“纸上得来终觉浅”,读者可以在笔者的博客和GitHub主页上找到相应的代码和数据材料,方便亲自试验与操作。
(5)本书图文并茂,读者可以通过将自己编写的代码的输出与案例的输出进行比较来判断结果的正误。
特别说明:由于本书是黑白印刷的,涉及的颜色无法在书中呈现,请读者结合软件界面进行辨识。
本书读者对象
? 有一定Python基础的读者。
? 对数据分析和数据科学感兴趣的学生。
? Python程序员及其他编程爱好者。
? 机器学习、人工智能相关从业人员。



 
 
 
 

商品简介

本书共13章,主要内容涵盖Python语法及数据分析方法。第1章主要介绍数据分析的概念,使读者有一个大致的印象,并简单介绍本书频繁使用的Python的5个第三方库。第2章主要做一些准备工作,手把手带读者搭建Python环境,包括Python 3.7.6的安装和pip的安装。第3章介绍Python编程基础。第4章到第7章介绍使用Python进行简单数据分析的基础库,包括NumPy、Pandas和Matplotlib库,并介绍使用正则表达式处理数据的方法。第8章到第13章属于进阶内容,但也是Python数据分析的基础,结合机器学习介绍一些常见的用于数据分析的机器学习算法及常用的数学模型。



作者简介
田越:曾参加蓝桥杯和ACM等算法竞赛,以及微软公司举办的创新杯竞赛,对于数据分析技术有着执着的追求,善于在学习中发现自己的不足,并将其转化为努力向前的动力。

目录
第1章  数据分析存在的意义1
1.1  数据分析与Python1
1.1.1  数据科学和数据分析的始末1
1.1.2  为什么使用Python作为脚本2
1.2  本书的主要内容3
1.2.1  数据分析基础:NumPy、Pandas和Matplotlib库概述3
1.2.2  数据处理:NumPy库简介4
1.2.3  数据处理:Pandas库简介4
1.2.4  图表绘制:Matplotlib库简介5
1.2.5  中坚力量:Sklearn和Statsmodels库简介5
第2章  开始前的准备6
2.1  Python 3.7.6的安装6
2.1.1  Python3和Python2的区别6
2.1.2  在Windows 10系统中下载并安装Python 3.7.67
2.1.3  手动配置环境变量10
2.2  pip的安装12
2.2.1  pip是什么12
2.2.2  在Windows系统中下载和安装pip12
2.2.3  使用pip命令下载和管理pip14
第3章  Python编程基础17
3.1  Python编程初识18
3.1.1  第一个Python程序18
3.1.2  整型、浮点型、布尔型与复数型19
3.1.3  不同数据类型之间的运算法则22
3.1.4  Python中的常用内建函数25
3.2  Python编程常用类型27
3.2.1  Python的列表27
3.2.2  Python的元组31
3.2.3  Python的字典34
3.2.4  Python的字符串38
3.3  Python的条件、循环和分支语句以及异常处理42
3.3.1  Python的编程风格42
3.3.2  错误、异常和异常处理43
3.3.3  条件语句:if、if-else和elif45
3.3.4  循环语句:while和for46
3.4  其他关于Python的重要知识点49
3.4.1  匿名函数lambda49
3.4.2  Python自定义类与打印函数51
第4章  线性代数知识和第三方库NumPy的使用54
4.1  必要的线性代数知识55
4.1.1  线性代数综述55
4.1.2  行列式56
4.1.3  矩阵及矩阵的运算60
4.1.4  矩阵的初等变换与秩、向量组与线性相关65
4.1.5  相似矩阵67
4.2  NumPy库的基础操作69
4.2.1  NumPy库的安装和基本方法69
4.2.2  创建一个数组70
4.2.3  索引、切片和迭代73
4.2.4  拼合、划分一个矩阵79
4.2.5  深拷贝、浅拷贝与不拷贝84
4.3  用NumPy库实现矩阵运算87
4.3.1  矩阵基本运算一(矩阵加法、矩阵减法、矩阵数乘)87
4.3.2  矩阵基本运算二(矩阵相乘、逆矩阵、矩阵的特征值和特征向量)88
第5章  使用正则表达式处理数据91
5.1  RE模块简述91
5.1.1  正则表达式(RE)模块使用的符号92
5.1.2  正则表达式的匹配规则93
5.2  使用正则表达式模块94
5.2.1  匹配对象方法group()和groups()的用法95
5.2.2  使用管道符进行匹配98
5.2.3  使用*、+、?、{}符号实现多个条件匹配99
5.2.4  一些特殊格式的正则表达式匹配模式100
第6章  使用Pandas库处理数据101
6.1  Pandas库简述101
6.1.1  Pandas库能做什么101
6.1.2  Pandas库功能简述105
6.2  三种格式的文件后缀简述108
6.2.1  什么是CSV文件108
6.2.2  Python自带的CSV模块109
6.2.3  为什么要将TXT和Excel文件转化为CSV文件111
6.3  处理.csv格式的数据111
6.3.1  用read_csv()和head()读取CSV文件并显示其行/列112
6.3.2  查看列数、维度以及切片操作112
6.3.3  读取特定的列以及列的改值操作113
6.3.4  求某一列的最大值、最小值、算术平均数以及数据的排序114
6.3.5  Pandas库的写入操作――to_csv()方法115
6.4  处理非.csv格式的数据116
6.4.1  用Pandas库读取TXT文件116
6.4.2  用Pandas库读取Excel文件118
6.5  Pandas库的其他常用操作121
6.5.1  新增DataFrame数据结构的意义121
6.5.2  创建与遍历DataFrame数据结构122
6.5.3  检索已有的DataFrame数据结构124
6.5.4  DataFrame数据结构的选择操作128
6.5.5  处理DataFrame数据结构中的缺失数据134
第7章  使用Matplotlib库实现数据可视化136
7.1  Matplotlib库简述136
7.1.1  Matplotlib库的安装137
7.1.2  Matplotlib库常见的问题138
7.2  Matplotlib库的基本方法139
7.2.1  设定x轴与y轴的相关内容139
7.2.2  “点”和“线”样式的设定144
7.3  使用Matplotlib库绘制图表146
7.3.1  绘制柱状图147
7.3.2  绘制直方图149
7.3.3  绘制散点图151
7.3.4  绘制饼状图153
7.3.5  绘制折线图155
第8章  数学模型与数理统计157
8.1  走进数学模型158
8.1.1  什么是数学模型158
8.1.2  建立数学模型的一般步骤160
8.1.3  数学模型示例162
8.2  必要的数理统计知识164
8.2.1  样本、总体、个体、统计量164
8.2.2  3个重要的分布:χ2分布、t分布、f分布165
8.2.3  点估计、矩估计与区间估计167
8.2.4  全概率公式和贝叶斯公式168
8.2.5  依概率收敛与切比雪夫不等式170
第9章  线性回归172
9.1  最小二乘法与切比雪夫准则172
9.1.1  最小二乘法的数学原理173
9.1.2  切比雪夫准则的数学原理175
9.2  OLS回归模型175
9.2.1  OLS回归模型的概念176
9.2.2  如何生成测试数据176
9.2.3  OLS回归模型的代码实现和可视化179
9.3  LAD回归模型182
9.3.1  LAD回归模型的概念182
9.3.2  LAD回归模型的代码实现和可视化183
9.4  OLS回归模型与LAD回归模型186
9.4.1  比较OLS回归模型与LAD回归模型的拟合曲线186
9.4.2  简单的一元线性回归分析的代码展示187
9.5  从极大似然估计再审视线性回归189
9.5.1  从传统的数理统计到线性回归189
9.5.2  极大似然估计190
9.5.3  假设检验基本概念191
9.5.4  区间估计、置信区间和置信限192
第10章  分类问题与逻辑回归197
10.1  逻辑回归:从分类问题谈起197
10.1.1  从线性回归到分类问题198
10.1.2  逻辑回归与Sigmoid函数199
10.1.3  使用极大似然估计计算Sigmoid函数的损失函数201
10.1.4  逻辑回归模型求解的本质202
10.2  从梯度上升法与梯度下降法到逻辑回归202
10.2.1  梯度上升法和梯度下降法的由来202
10.2.2  梯度下降法及梯度上升法的数学原理203
10.2.3  用Python实现逻辑回归206
10.2.4  题外话:从用Python实现逻辑回归中看psutil库216
10.2.5  逻辑回归可视化:绘制决策边界220
第11章  模型评估与模型改进223
11.1  线性回归模型的评估与改进223
11.1.1  线性回归模型的评估224
11.1.2  模型改进:从一元线性回归到多元线性回归问题231
11.1.3  模型改进:过度拟合与添加、设定惩罚项238
11.2  逻辑回归模型的评估与改进239
11.2.1  分类模型的评估:查准率、查全率及F-score239
11.2.2  分类模型的评估:ROC曲线、AUC指标241
11.2.3  模型改进:随机梯度下降法242
11.2.4  逻辑回归最终代码展示(使用随机梯度下降法)245
第12章  聚类:K-means算法248
12.1  K-means算法及相关内容的基本概念248
12.1.1  聚类与机器学习的概念249
12.1.2  聚类:K-means算法的原理250
12.2  K-means算法的Python实现253
12.2.1  朴素的K-means算法的Python实现253
12.2.2  朴素的K-means算法的Python实现的具体解析256
12.2.3  模型改进:使用不同颜色和形状标记不同的簇261
12.2.4  K-means算法改进:使用二分K-means算法263

第13章  分类:KNN算法271
13.1  KNN算法的基本概念271
13.1.1  KNN算法的相关概念271
13.1.2  KNN算法原理概述272
13.2  KNN算法的Python实现274
13.2.1  制作测试用例数据集274
13.2.2  KKN算法的具体实现279
13.2.3  KKN算法的完整代码282
13.3  结语:关于数据分析285
13.3.1  决策树之前:树的概念285
13.3.2  信息熵和决策树285
13.3.3  写在最后的话:留给机器学习286

内容摘要
本书共13章,主要内容涵盖Python语法及数据分析方法。第1章主要介绍数据分析的概念,使读者有一个大致的印象,并简单介绍本书频繁使用的Python的5个第三方库。第2章主要做一些准备工作,手把手带读者搭建Python环境,包括Python3.7.6的安装和pip的安装。第3章介绍Python编程基础。第4章到第7章介绍使用Python进行简单数据分析的基础库,包括NumPy、Pandas和Matplotlib库,并介绍使用正则表达式处理数据的方法。第8章到第13章属于进阶内容,但也是Python数据分析的基础,结合机器学习介绍一些常见的用于数据分析的机器学习算法及常用的数学模型。

主编推荐
"系统:讲解了11 种数据分析方法,拿来就用
图示:全书包括100多张图表,方便读者学习
深入:剖析NumPy、Pandas、Matplotlib的使用方法
案例:全书包括142个案例,都附有详细源代码

本书核心知识点:
Python数据分析概述
1. 数据分析的概念
2. 数据分析与Python的联系(为什么使用Python来进行数据分析?)
Python基础
3. Python和pip的安装以及pip的使用
4. Python 3与Python 2的区别
5. Python数据分析常用的第三方库简介
6. Python编程基础(常见类型、分支、循环)
7. lambda函数介绍和Python实战:打印输出内容的函数
Python数据分析常用库及必要的数学知识
8. 线性代数知识
9. 数理统计知识
10. NumPy库常用方法介绍
11. 使用NumPy库实现各种线性代数的操作
12. 正则表达式模块简介
13. Pandas库常用方法介绍
14. CSV文件的处理与非CSV文件的处理
15. Pandas库不错操作:使用DataFrame类型处理数据
16. Matplotlib库简述
17. 实战:使用Matplotlib库绘制各种图表
数据分析相关的机器学习算法
18. 一元线性回归:切比雪夫准则(理论和代码实现)
19. 一元线性回归:很小二乘法(理论和代码实现)
20. 逻辑回归和Sigmoid函数(理论和代码实现)
21. 梯度下降法(理论和代码实现)
22. 二元线性回归(理论和代码实现)
23. 随机梯度下降法(理论和代码实现)
24. K-means算法(理论和代码实现)
25. KNN算法(理论和代码实现)"

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP