机器学习实践教程(高等职业教育人工智能工程技术系列教材)

23.28 5.4折 43 全新

库存5件

山东泰安

认证卖家担保交易快速发货售后保障

作者吕焱飞

出版社电子工业出版社

出版时间2024-01

版次1

装帧其他

货号R4库 9-20

上书时间2024-09-20

齐鲁淘宝书店

十四年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 24小时
好评率暂无

最新上架

艺术设计的多维研究与应用 ¥32.19

西方前近代政治法律思想史与现代法学批判/吕世伦法学论丛 ¥32.19

海上英雄·海上英雄续/民国武侠小说典藏文库·顾明道卷 ¥31.73

翻译教学与翻译人才培养研究 ¥31.26

高职院校校史建设及发展路径研究教学方法及理论华新华正版 ¥31.26

弦上琴歌:二胡演奏艺术的美学观探索 ¥30.34

Java程序设计项目化立体教程 ¥31.26

水利工程施工管理与组织研究 ¥31.26

中小学语文体验阅读教学导航 ¥31.26

商品详情

品相描述：全新

图书标准信息

作者吕焱飞
出版社电子工业出版社
出版时间 2024-01
版次 1
ISBN 9787121469237
定价 43.00元
装帧其他
开本 16开
页数 212页
字数 298千字

【内容简介】: 机器学是计算机人工智能的重要研究领域和应用方向，本书是学和实践机器学的入门教材，基于python语言，介绍如何使用机器学的相关算法对数据进行分析。本书在内容上涵盖机器学相关基础知识，在组织编排上循序渐进。全书共11章，分为3个部分：部分（～3章）为机器学基础知识，包括数值计算基础、数据分析、数据可视化；第二部分（第4～9章）为机器学算法，包括线模型、朴素贝叶斯、支持向量机、决策树、聚类分析和集成学；第三部分（0～11章）为实践项目，包括房价预测和手写数字识别，每章有5个相对独立的部分，方便使用。
【目录】: 章  数值计算基础1
1.1  python基础1
1.1.1  列表与元组2
1.1.2  切片3
1.1.3  列表推导4
1.1.4  生成器表达式5
1.2  numpy数组6
1.2.1  创建numpy数组6
1.2.2  数组的属6
1.2.3  reshape7
1.2.4  python列表与numpy数组7
1.2.5  创建特定数组8
1.2.6  创建单调数组9
1.2.7  生成数9
1.3  numpy索引10
1.3.1  切片索引10
1.3.2  布尔索引11
1.3.3  更复杂的布尔索引12
1.3.4  整数数组索引12
1.3.5  索引赋值13
1.4  多维索引13
1.4.1  定位单个元素13
1.4.2  多维切片14
1.4.3  newas14
1.4.4  elliis15
1.4.5  整数数组索引16
1.5  广播17
1.5.1  一个实例17
1.5.2  广播的条件18
1.5.3  如何广播18
1.5.4  几个作实例19
1.5.5  原地修改21
1.6  图像处理22
1.6.1  导入22
1.6.2  翻转23
1.6.3  截取下半部分23
1.6.4  缩小24
1.6.5  纵向拉伸24
1.6.6  遮罩25
1.6.7  添加两条对角线26
第2章  数据分析27
2.1  series27
2.1.1  简单的series27
2.1.2  指定索引28
2.1.3  索引的使用28
2.1.4  将python字典转换为series29
2.1.5  自定义索引29
2.1.6  判断na值30
2.1.7  索引自动对齐31
2.2  dataframe31
2.2.1  构建dataframe32
2.2.2  获取指定列33
2.2.3  获取指定行33
2.2.4  对列赋值34
2.2.5  索引对齐35
2.2.6  删除列35
2.2.7  的ndarray36
2.3  数据的选择36
2.3.1  数据开放台36
2.3.2  导入数据36
2.3.3  选择列37
2.3.4  选择行37
2.3.5  选择指定区域38
2.3.6  布尔型数组39
2.3.7  多个条件的选择39
2.3.8  loc与iloc40
2.4  概要与映41
2.4.1  查看数据头部41
2.4.2  查看所有的列名42
2.4.3  查看数据概要42
2.4.4  计算数值的频率42
2.4.5  与均值的差43
2.4.6  map的用法43
2.4.7  apply的用法44
2.4.8  map与apply的区别45
2.5  分组与排序45
2.5.1  导入数据46
2.5.2  分组统计47
2.5.3  分组小值47
2.5.4  用lambda函数做分组统计48
2.5.5  更复杂的分组49
2.5.6  同时使用多个聚合函数49
2.5.7  分组后的排序50
2.5.8  区分不同的apply函数50
2.5.9  带“max”的函数51
2.6  空值51
2.6.1  fifa数据集51
2.6.2  查看空值的数量52
2.6.3  计算空值的百分比52
2.6.4  清除空值52
2.6.6  清除带有空值的列53
2.6.6  填充空值53
2.6.7  用均值来填充空值55
2.6.8  返回值56
2.7  不一致数据的处理56
2.7.1  thefuzz库56
2.7.2  数据集56
2.7.3  unique57
2.7.4  清除大写与空格57
2.7.5  模糊匹配58
2.7.6  字段替换59
第3章  数据可视化60
3.1  matplotlib基本概念60
3.1.1  导入与设置60
3.1.2  剖析图形61
3.1.3  两种风格63
3.2  作图基础65
3.2.1  绘制直线65
3.2.2  绘制折线66
3.2.3  格式字符串66
3.2.4  绘制散点图67
3.2.5  绘制类别数据68
3.2.6  绘制文本69
3.2.7  绘制注解70
3.3  macd指标分析71
3.3.1  加载贵州茅台股价数据72
3.3.2  收盘价趋势图72
3.3.3  计算macd和signal序列73
3.3.4  绘制macd指标图74
3.3.5  金与死74
3.3.6  计算收益76
3.4  沪深300收益计算77
3.4.1  加载历史数据77
3.4.2  绘制趋势图78
3.4.3  计算收益率78
3.4.4  计算年化收益率79
3.4.5  计算年化波动率80
3.4.6  计算优选回撤率80
3.4.7  计算卡玛比率81
3.5  历策略82
3.5.1  指标计算函数82
3.5.2  只在每月前5交易的策略82
3.5.3  准备数据82
3.5.4  标记出每月前583
3.5.5  计算收益率84
3.5.6  绘制两条收益曲线84
3.5.7  比较收益指标85
3.5.8  每月后5的策略85
第4章  线模型87
4.1  机器学87
4.1.1  传统软件与机器学87
4.1.2  特征与标签88
4.1.3  机器学算法的分类88
4.1.4  crisp-dm89
4.2  线回归90
4.2.1  模型公式91
4.2.2  scikit-learn91
4.2.3  线回归的用法92
4.2.4  线回归的参数92
4.2.5  残差93
4.2.6  均方误差与均误差93
4.2.7  bootstrap统计方法94
4.3  岭回归95
4.3.1  bootstrap函数96
4.3.2  系数分布97
4.3.3  alpha参数99
4.3.4  很好alpha参数100
4.4  lasso回归101
4.4.1  基本用法101
4.4.2  非零的系数101
4.4.3  很好alpha参数102
4.4.4  特征选择102
4.5  逻辑回归103
4.5.1  iris数据集103
4.5.2  训练集与测试集104
4.5.3  logisticregression类104
4.5.4  混淆矩阵105
4.5.5  预测的概率105
第5章  朴素贝叶斯107
5.1  贝叶斯107
5.1.1  患癌的概率107
5.1.2  贝叶斯公式108
5.1.3  朴素贝叶斯108
5.1.4  sklearn中的朴素贝叶斯109
5.2  tf-idf110
5.2.1  词项频率与文档频率110
5.2.2  逆文档频率110
5.2.3  tf-idf110
5.2.4  tfidfvectorizer111
5.3  中文文档分类112
5.3.1  中文分类数据集112
5.3.2  jieba分词113
5.3.3  加载文本113
5.3.4  停用词表114
5.3.5  计算tf-idf权重114
5.3.6  朴素贝叶斯分类器115
第6章  支持向量机116
6.1  支持向量116
6.1.1  鸢尾花数据集116
6.1.2  线svc118
6.2  特征缩放119
6.2.1  特殊的数据点119
6.2.2  标准缩放120
6.2.3  pipeline类121
6.3  多项式特征122
6.3.1  生成数据集122
6.3.2  添加多项式特征123
6.3.3  应用实例124
6.4  核函数125
6.4.1  常用核函数125
6.4.2  多项式核函数125
6.4.3  高斯核函数126
第7章  决策树128
7.1  决策树128
7.1.1  熵128
7.1.2  信息增益129
7.1.3  计算实例129
7.1.4  基尼指数130
7.2  decisiontreeclassifier类131
7.2.1  基本用法131
7.2.2  展示决策树131
7.3  决策树调参133
7.3.1  gridsearchcv类134
7.3.2  搜索结果134
7.3.3  优选深度135
第8章  聚类分析136
8.1  聚类的基本概念136
8.1.1  距离136
8.1.2  k均值算法的核心思想137
8.1.3  轮廓系数137
8.2  k均值算法137
8.2.1  生成数据集137
8.2.2  kmeans类138
8.2.3  样本点到中心点的距离140
8.2.4  轮廓系数140
8.2.5  很好中心点个数141
第9章  集成学143
9.1  集成学143
9.1.1  常用架构143
9.1.2  提升法144
9.1.3  装袋法144
9.1.4  集成方法144
9.2  森林145
9.2.1  糖尿病数据集145
9.2.2  分层抽样145
9.2.3  randomforestregressor145
9.2.4  特征重要146
9.3  baggingregressor147
9.3.1  基本用法147
9.3.2  参数说明147
9.3.3  搜索很好参数147
9.3.4  很好参数的效果148
9.4  梯度提升决策树149
9.4.1  房价数据集149
9.4.2  初始参数集150
9.4.3  很好参数150
9.4.4  很好模型152
9.4.5  增加预估器数量152
0章  房价预测154
10.1  探索数据154
10.1.1  加载数据154
10.1.2  查看空值155
10.1.3  属的直方图155
10.1.4  对收入中位数进行分组157
10.1.5  分组统计158
10.1.6  分层抽样158
10.2  数据可视化与相关160
10.2.1  根据地理位置展示数据160
10.2.2  相关关系161
10.2.3  相关系数163
10.2.4  3个新属163
10.3  空值的处理164
10.3.1  列出有nan的行165
10.3.2  处理nan165
10.3.3  simpleimputer类166
10.4  文本属与流式处理167
10.4.1  文本属167
10.4.2  ordinalencoder转换器167
10.4.3  onehotencoder类168
10.4.4  流式处理169
10.4.5  自定义pipeline170
10.4.6  columntransformer171
10.5  模型选择171
10.5.1  分离标签171
10.5.2  数值处理pipeline172
10.5.3  线回归173
10.5.4  决策树173
10.5.5  森林174
10.5.6  模型微调174
10.5.7  很好参数模型175
1章  手写数字识别176
11.1  mnist数据集176
11.1.1  下载数据集176
11.1.2  查看数据集176
11.1.3  绘制数字图像177
11.1.4  不易辨认的数字图像178
11.1.5  识别数字5的分类器179
11.2  精度与召回率180
11.2.1  类型转换180
11.2.2  二类分类器180
11.2.3  非5分类器181
11.2.4  混淆矩阵181
11.2.5  计算精度与召回率182
11.2.6  f1分数183
11.3  阈值分类器183
11.3.1  分类器评分184
11.3.2  阈值的用法184
11.3.3  计算精度与召回率185
11.3.4  90%精度的分类器187
11.4  roc曲线188
11.4.1  tpr与fpr188
11.4.2  绘制roc曲线188
11.4.3  roc曲线下的面积189
11.4.4  randomforestclassifier189
11.4.5  比较roc曲线190
11.4.6  比较精度与召回率191
11.4.7  比较f1分数192
11.5  多类分类器192
11.5.1  训练集与测试集192
11.5.2  randomforestclassifier193
11.5.3  标准缩放194
11.5.4  混淆矩阵195
11.5.5  突出错误率196

点击展开点击收起

— 没有更多了 —