全新正版 急速发货
¥ 64 6.7折 ¥ 95 全新
库存40件
作者潘风文、庞资胜 编著
出版社化学工业出版社
ISBN9787122433923
出版时间2023-07
装帧平装
开本16开
定价95元
货号29592180
上书时间2024-11-24
Python是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱;Python广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。
本书以浅显易懂的方式讲解了Python机器学习所涉及的多个方面,汇集了笔者在Python机器学习开发应用实践中的经验精华,供读者在Python学习和使用过程中参考,具有很高的实用价值。结合实用范例和实际经验来讲解Python机器学习是本书的主要特色,具有针对性、系统性、实操性强的特点,读者对代码进行简单修改,就可以直接拿来使用。本书各章主要内容如下。
第1章:本章讲解了数据读取的技巧性知识。无论是简单的数据分析,还是复杂的数据挖掘,都要以数据作为基础的元素,数据的读取和导入是Python中基本的数据操作,是数据分析的基础。
第2章:本章讲述数据探索性分析。数据探索性分析是统计过程中的数据整理环节,对数据资料进行初步的整理、归纳、特征描述,提供常见的统计量(例如均值、方差等),产生所有个案或不同分组个案的综合统计量,明悉数据含义,理解数据结构,概括主要特征,以找出数据初步的内在规律(例如数据集中趋势、分散趋势、相关性),以便于进行数据的合并、清洗、预处理。
第3章:本章讲解了数据预处理、特征选择等模型建立前的工作。在具体的工程实践中,大部分数据是不完整或者不准确的,数据质量往往达不到数据挖掘标准,无法直接拿来进行数据挖掘和建模;为了提升分析结果的准确性,提高数据挖掘模型质量,缩短计算过程,必须进行数据预处理。
第4章:本章讲解了特征选择的常用技巧。特征选择的目的是从所有特征中选择出对学习算法有益的相关特征,降低学习任务的难度,提升模型的使用效率和精确度,使模型获得更好的解释性,增强对特征和特征值的理解,减少模型过拟合现象,减少运行时间。特征选择不涉及对特征值的修改,只是筛选出对模型性能提升较大的少量特征。
第5章:本章讲解了算法建模中的核心内容,并对常用的scikit-learn(sklearn)类库进行了重点讲解,对并发式pyspark库进行了一定程度的讲解,为了加深理解,还对算法模型中典型案例进行了详细的讲解。
第6章:本章介绍了Python中数据可视化的常用方法。借助可视化,可以更直观地发现数据中隐藏的规律,观察变量之间的互动关系,更好地给他人解释现象,做到一图胜千文的说明效果。利用Python可以画出非常优美的图像,尤其是专业的数据分析图像,例如箱式图、对应分析图、分类图等。
本书由潘风文、庞资胜编著,孔峰对书稿进行审校整理。本书适合于具有一定Python基础,且有志于从事机器学习、人工智能开发的读者。相信本书一定会给您带来很大收获。书中例子运行的Python版本号是Ver3.8.1及以上,所有实例都可以通过化工出版社网站www.cipedu.com.cn下载,也可以通过QQ:420165499联系,在线下载实例包。读者在阅读和使用过程中,若有任何问题,可通过QQ在线咨询,笔者将竭诚为您服务。
编者
2023年4月
Python是一种面向对象的脚本语言,广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。本书是作者长期应用Python进行机器学习开发实践的经验结晶,主要内容包括Python数据读取的技巧,数据探索性分析,数据预处理,特征选择,特征选择的常用技巧,算法模型,sklearn类库,Python中数据可视化的常用方法等。本书具有针对性、系统性、实操性强,原创度高的特点,读者对代码进行简单修改,就可以直接拿来使用。本书适合于具有一定Python基础,且有志于从事机器学习、人工智能开发的读者使用。
无
1 数据读取 1
1.1 数据读取常见问题 2
1.2 核心代码 4
1.2.1 读取Excel、csv、txt、json数据 4
1.2.2 读取docx文件和查询关键词 5
1.2.3 读取日志、图像、声音、视频 7
1.2.4 Oracle、MySQL数据读取 13
1.2.5 读取Hive数据 18
1.2.6 数据导出到本地 19
2 数据探索性分析 20
2.1 数据查看 21
2.2 数据统计 22
2.3 数据分组分析 23
2.4 相关性分析 24
2.5 典型案例 25
3 数据预处理 28
3.1 注意问题 30
3.2 核心代码 31
3.2.1 缺失值检测和处理 31
3.2.2 异常值检测和处理 34
3.2.3 数据标准化规范化正则化 38
3.2.4 数据平滑处理 41
3.2.5 样本类别分布不均衡处理 47
3.2.6 数据降维 51
3.2.7 训练集验证集切分 56
3.3 典型案例 66
3.3.1 原理 66
3.3.2 代码 68
4 特征选择 69
4.1 过滤式特征提取 70
4.2 递归特征消除 73
4.3 嵌入式特征提取 74
4.4 典型案例 76
5 算法建模 79
5.1 主流数据挖掘算法 82
5.1.1 有监督学习 82
5.1.2 无监督学习 193
5.2 自动化调参 212
5.2.1 暴力搜索寻优 213
5.2.2 随机搜索寻优 217
5.3 组合分类模型器 221
5.3.1 原理 221
5.3.2 函数及代码 221
5.4 典型案例 226
5.4.1 人脸识别 227
5.4.2 多方程模型预测 232
6 可视化 237
6.1 基本图形 239
6.1.1 折线图 239
6.1.2 面积图 248
6.1.3 柱形图 253
6.1.4 散点图 268
6.1.5 饼图 279
6.2 分析图形 280
6.2.1 词云图 280
6.2.2 相似度热力图 285
6.2.3 箱式分布图 291
6.2.4 对应分析图 306
Python是一种面向对象的脚本语言,广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。本书是作者长期应用Python进行机器学习开发实践的经验结晶,主要内容包括Python数据读取的技巧,数据探索性分析,数据预处理,特征选择,特征选择的常用技巧,算法模型,sklearn类库,Python中数据可视化的常用方法等。本书具有针对性、系统性、实操性强,原创度高的特点,读者对代码进行简单修改,就可以直接拿来使用。本书适合于具有一定Python基础,且有志于从事机器学习、人工智能开发的读者使用。
无
— 没有更多了 —
以下为对购买帮助不大的评价