消息首页搜索举报

python机器学基础教程编程语言作者

基于python3的机器学入门教程以机器学算法实践为重点使用scikit-learn库从头构建机器学应用涵盖模型评估调参方法交差验证网格搜索管道概念及文本数据处理方法等内容

33.05 4.2折 79 全新

库存2件

北京丰台

认证卖家担保交易快速发货售后保障

作者作者

出版社人民邮电出版社

ISBN9787115475619

出版时间2018-01

版次1

装帧平装

开本16

页数285页

字数443千字

定价79元

货号303_9787115475619

上书时间2024-12-16

智胜图书专营店

七年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 26小时
好评率暂无

最新上架

菜单设计与成本分析经济理论、法规刘念慈,董希文 ¥16.85

王羲之兰亭序集字对联毛笔书法孔顼编 ¥7.35

赵孟頫前后赤壁赋集字古诗毛笔书法孔顼编 ¥6.55

野史记中国历史杨早 ¥16.35

广州市哲学社会科学规划课题成果选编中国哲学广州市社会科学规划小组办公室编 ¥29.65

公案例研究法学理论秦守勤编 ¥20.05

越南概论史学理论孙衍峰等 ¥32.65

本中世研究史学理论韦立新 ¥23.55

进步党与民初政治史学理论别琳 ¥22.65

商品详情

品相描述：全新: 正版特价新书

商品描述: 目录：

前言ix
章引言1
1.1为何选择机器学1
1.1.1机器学能够解决的问题2
1.1.2熟悉任务和数据4
1.2为何选择python4
1.3scikit-learn4
1.4必要的库和工具5
1.4.1jupyternotebook6
1.4.2numpy6
1.4.3scipy6
1.4.4matplotlib7
1.4.5pandas8
1.4.6mglearn9
1.5python2与python3的对比9
1.6本书用到的版本10
1.7个应用：鸢尾花分类11
1.7.1初识数据12
1.7.2衡量模型是否成功：训练数据与测试数据14
1.7.3要事：观察数据15
1.7.4构建个模型：k近邻算法16
1.7.5做出预测17
1.7.6评估模型18
1.8小结与展望19
第2章监督学21
2.1分类与回归21
2.2泛化、过拟合与欠拟合22
2.3监督学算法24
2.3.1一些样本数据集25
2.3.2k近邻28
2.3.3线模型35
2.3.4朴素贝叶斯分类器53
2.3.5决策树54
2.3.6决策树集成64
2.3.7核支持向量机71
2.3.8神经网络（深度学）80
2.4分类器的不确定度估计91
2.4.1决策函数91
2.4.2预测概率94
2.4.3多分类问题的不确定度96
2.5小结与展望98
第3章无监督学与预处理100
3.1无监督学的类型100
3.2无监督学的挑战101
3.3预处理与缩放101
3.3.1不同类型的预处理102
3.3.2应用数据变换102
3.3.3对训练数据和测试数据进行相同的缩放104
3.3.4预处理对监督学的作用106
3.4降维、特征提取与流形学107
3.4.1主成分分析107
3.4.2非负矩阵分解120
3.4.3用t-sne进行流形学126
3.5聚类130
3.5.1k均值聚类130
3.5.2凝聚聚类140
3.5.3dbscan143
3.5.4聚类算法的对比与评估147
3.5.5聚类方法小结159
3.6小结与展望159
第4章数据表示与特征工程161
4.1分类变量161
4.1.1one-hot编码（虚拟变量）162
4.1.2数字可以编码分类变量166
4.2分箱、离散化、线模型与树168
4.3交互特征与多项式特征171
4.4单变量非线变换178
4.5自动化特征选择181
4.5.1单变量统计181
4.5.2基于模型的特征选择183
4.5.3迭代特征选择184
4.6利用专家知识185
4.7小结与展望192
第5章模型评估与改进193
5.1交验证194
5.1.1scikit-learn中的交验证194
5.1.2交验证的优点195
5.1.3分层k折交验证和其他策略196
5.2网格搜索200
5.2.1简单网格搜索201
5.2.2参数过拟合的风险与验证集202
5.2.3带交验证的网格搜索203
5.3评估指标与评分213
5.3.1牢记目标213
5.3.2二分类指标214
5.3.3多分类指标230
5.3.4回归指标232
5.3.5在模型选择中使用评估指标232
5.4小结与展望234
第6章算法链与管道236
6.1用预处理进行参数选择237
6.2构建管道238
6.3在网格搜索中使用管道239
6.4通用的管道接242
6.4.1用make_pipeline方便地创建管道243
6.4.2访问步骤属244
6.4.3访问网格搜索管道中的属244
6.5网格搜索预处理步骤与模型参数246
6.6网格搜索选择使用哪个模型248
6.7小结与展望249
第7章处理文本数据250
7.1用字符串表示的数据类型250
7.2示例应用：电影的情感分析252
7.3将文本数据表示为词袋254
7.3.1将词袋应用于玩具数据集255
7.3.2将词袋应用于电影256
7.4停用词259
7.5用tf-idf缩放数据260
7.6研究模型系数263
7.7多个单词的词袋（n元分词）263
7.8分词、词干提取与词形还原267
7.9主题建模与文档聚类270
7.10小结与展望277
第8章全书结278
8.1处理机器学问题278
8.2从原型到生产279
8.3测试生产系统280
8.4构建你自己的估计器280
8.5下一步怎么走281
8.5.1理论281
8.5.2其他机器学框架和包281
8.5.3排序、系统与其他学类型282
8.5.4概率建模、推断与概率编程282
8.5.5神经网络283
8.5.6推广到更大的数据集283
8.5.7磨练你的技术284
8.6结284
关于作者285
关于封面285

内容简介：

本书是机器学入门书，以python语言介绍。主要内容包括：机器学的基本概念及其应用；实践中常用的机器学算法以及这些算法的优缺点；在机器学中待处理数据的呈现方式的重要，以及应重点关注数据的哪些方面；模型评估和调参的方法，重点讲解交验证和网格搜索；管道的概念；如何将前面各章的方法应用到文本数据上，还介绍了一些文本特有的处理方法。本书适合机器学从业者或有志成为机器学从业者的人阅读。

作者简介：

安德里亚斯穆勒，cikitlearn库维护者和核心贡献者。现任哥伦比亚大学数据科学研究院讲师，曾任纽约大学数据科学中心助理研究员、公司计算机视觉应用的机器学研究员。在波恩大学获得机器学博士。
莎拉吉多，mahable公司数据科学家，曾担任bitly公司数据科学家。

— 没有更多了 —

python机器学基础教程 编程语言 作者

智胜图书专营店

商品详情

python机器学基础教程编程语言作者