• Python大战机器学习:数据科学家的第一个小目标
21年品牌 40万+商家 超1.5亿件商品

Python大战机器学习:数据科学家的第一个小目标

书号:9787121308949;作者:华校专,王正林;出版社:电子工业出版社;

24.84 九品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者华校专、王正林 著

出版社电子工业出版社

出版时间2017-02

版次1

装帧平装

货号C17

上书时间2018-08-17

龙翔书店

十年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
商品描述
基本信息
书名:Python大战机器学习:数据科学家的个小目标
定价:69.00元
作者:华校专,王正林
出版社:电子工业出版社
出版日期:2017-02-01
ISBN:9787121308949
字数:
页码:
版次:
装帧:平装-胶订
开本:128开
商品重量:0.4kg
编辑推荐
时下极热门的职业是数据科学家,而不是传统的信息科学家,也不是大数据工程师。数据科学家的技能中,机器学习和Python 应该是位列前五的两项,学习本书,实现自己的第1个小目标。更多计算机好书请关注:电子工业出版社自营店
内容提要
数据科学家是当下炙手可热的职业,机器学习则是他们的技能,机器学习在大数据分析中居于核心的地位,在互联网、金融保险、制造业、业、医疗等产业领域发挥了越来越大的作用且日益受到关注。Python是又好又热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的zui佳语言。《Python大战机器学习:数据科学家的第—个小目标》以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python编程实践,采用“原理笔记精华 算法Python实现 问题实例 实际代码 运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。全书共13 章分为4篇展开:第—篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k近邻法、数据降维、聚类和EM算法;第二篇:机器学习高级篇(第7~10章),讲述经典而常用的高级机器学习算法,包括支持向量机、人工神经网络、半监督学习和集成学习;第三篇:机器学习工程篇(第11~12章),讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等。第四篇:kaggle实战篇(第13章),讲述一个kaggle竞赛题目的实战。《Python大战机器学习:数据科学家的第—个小目标》内容丰富、深入浅出,算法与代码齐头并进,无论你是新手还是有经验的读者,都能快速学到你想要的。《Python大战机器学习:数据科学家的第—个小目标》可供为高等院校计算机、金融、数学、自动化及相关理工科专业的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
目录
篇 机器学习基础篇1第1 章 线性模型 21.1 概述21.2 算法笔记精华21.2.1 普通线性回归21.2.2 广义线性模型51.2.3 逻辑回归51.2.4 线性判别分析71.3 Python 实战101.3.1 线性回归模型111.3.2 线性回归模型的正则化121.3.3 逻辑回归221.3.4 线性判别分析26第2 章 决策树 302.1 概述302.2 算法笔记精华302.2.1 决策树原理302.2.2 构建决策树的3 个步骤312.2.3 CART 算法372.2.4 连续值和缺失值的处理422.3 Python 实战432.3.1 回归决策树(DecisionTreeRegressor) 432.3.2 分类决策树(DecisionTreeClassifier) 492.3.3 决策图54第3 章 贝叶斯分类器 553.1 概述553.2 算法笔记精华553.2.1 贝叶斯定理553.2.2 朴素贝叶斯法563.3 Python 实战593.3.1 高斯贝叶斯分类器(GaussianNB) 613.3.2 多项式贝叶斯分类器(MultinomialNB) 623.3.3 伯努利贝叶斯分类器(BernoulliNB) 653.3.4 递增式学习partial_fit 方法69第4 章 k 近邻法 704.1 概述704.2 算法笔记精华704.2.1 kNN 三要素704.2.2 k 近邻算法724.2.3 kd 树734.3 Python 实践74第5章 数据降维 835.1 概述835.2 算法笔记精华835.2.1 维度灾难与降维835.2.2 主成分分析(PCA) 845.2.3 SVD 降维915.2.4 核化线性(KPCA)降维915.2.5 流形学习降维935.2.6 多维缩放(MDS)降维935.2.7 等度量映射(Isomap)降维965.2.8 局部线性嵌入(LLE) 975.3 Python 实战995.4 小结118第6章 聚类和EM 算法 1196.1 概述1196.2 算法笔记精华1206.2.1 聚类的有效性指标1206.2.2 距离度量1226.2.3 原型聚类1236.2.4 密度聚类1266.2.5 层次聚类1276.2.6 EM 算法1286.2.7 实际中的聚类要求1366.3 Python 实战1376.3.1 K 均值聚类(KMeans) 1386.3.2 密度聚类(DBSCAN) 1436.3.3 层次聚类(AgglomerativeClustering) 1466.3.4 混合高斯(GaussianMixture)模型1496.4 小结153第二篇 机器学习高级篇155第7章 支持向量机 1567.1 概述1567.2 算法笔记精华1577.2.1 线性可分支持向量机1577.2.2 线性支持向量机1627.2.3 非线性支持向量机1667.2.4 支持向量回归1677.2.5 SVM 的优缺点1707.3 Python 实战1707.3.1 线性分类SVM 1717.3.2 非线性分类SVM 1757.3.3 线性回归SVR 1827.3.4 非线性回归SVR 186第8章 人工神经网络 1928.1 概述1928.2 算法笔记精华1928.2.1 感知机模型1928.2.2 感知机学习算法1948.2.3 神经网络1978.3 Python 实战2058.3.1 感知机学习算法的原始形式2058.3.2 感知机学习算法的对偶形式2098.3.3 学习率与收敛速度2128.3.4 感知机与线性不可分数据集2138.3.5 多层神经网络2158.3.6 多层神经网络与线性不可分数据集2168.3.7 多层神经网络的应用219第9章 半监督学习 2259.1 概述2259.2 算法笔记精华2269.2.1 生成式半监督学习方法2269.2.2 图半监督学习2289.3 Python 实战2349.4 小结243第10章 集成学习 24410.1 概述24410.2 算法笔记精华24410.2.1 集成学习的原理及误差24410.2.2 Boosting 算法24610.2.3 AdaBoost 算法24610.2.4 AdaBoost 与加法模型25210.2.5 提升树25310.2.6 Bagging 算法25610.2.7 误差-分歧分解25710.2.8 多样性增强25910.3 Python 实战26010.3.1 AdaBoost 26110.3.2 Gradient Tree Boosting 27210.3.3 Random Forest 28810.4 小结298第三篇 机器学习工程篇299第11章 数据预处理 30011.1 概述30011.2 算法笔记精华30011.2.1 去除属性30011.2.2 处理缺失值的三种方法30111.2.3 常见的缺失值补全方法30211.2.4 特征编码30711.2.5 数据标准化、正则化30811.2.6 特征选择31011.2.7 稀疏表示和字典学习31311.3 Python 实践31611.3.1 二元化31611.3.2 独热码31711.3.3 标准化32111.3.4 正则化32511.3.5 过滤式特征选取32611.3.6 包裹式特征选取33011.3.7 嵌入式特征选取33411.3.8 学习器流水线(Pipeline) 33911.3.9 字典学习340第12 章 模型评估、选择与验证 34512.1 概述34512.2 算法笔记精华34612.2.1 损失函数和风险函数34612.2.2 模型评估方法34812.2.3 模型评估34912.2.4 性能度量35012.2.5 偏差方差分解35612.3 Python 实践35712.3.1 损失函数35712.3.2 数据集切分35912.3.3 性能度量37012.3.4 参数优化387第四篇 Kaggle 实战篇401第13 章 Kaggle 牛刀小试 40213.1 Kaggle 简介40213.2 清洗数据40313.2.1 加载数据40313.2.2 合并数据40613.2.3 拆分数据40713.2.4 去除值40813.2.5 数据类型转换41013.2.6 Data_Cleaner 类41213.3 数据预处理41513.3.1 独热码编码41513.3.2 归一化处理41913.3.3 Data_Preprocesser 类42113.4 学习曲线和验证曲线42413.4.1 程序说明42413.4.2 运行结果43013.5 参数优化43313.6 小结435全书符号 436
作者介绍
华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C STL 的风格实现了各种算法(算法导论的C 实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。
序言
暂无相关内容
图书标准信息
  • 作者 华校专、王正林 著
  • 出版社 电子工业出版社
  • 出版时间 2017-02
  • 版次 1
  • ISBN 9787121308949
  • 定价 69.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 452页
  • 正文语种 简体中文
  • 丛书 数据科学家成长之路
【内容简介】

  数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能,机器学习在大数据分析中居于核心的地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。Python是*好*热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的**语言。 本书以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python编程实践,采用“原理笔记精华+算法Python实现+问题实例+实际代码+运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。全书共13 章分为4篇展开:第一篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k近邻法、数据降维、聚类和EM算法;第二篇:机器学习高级篇(第7~10章),讲述经典而常用的高级机器学习算法,包括支持向量机、人工神经网络、半监督学习和集成学习;第三篇:机器学习工程篇(第11~12章),讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等。第四篇:kaggle实战篇(第13章),讲述一个kaggle竞赛题目的实战。本书内容丰富、深入浅出,算法与代码齐头并进,无论你是新手还是有经验的读者,都能快速学到你想要的。本书可供为高等院校计算机、金融、数学、自动化及相关理工科专业的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

【作者简介】

  华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。

【目录】

第一篇  机器学习基础篇1
第1 章  线性模型  2
1.1 概述2
1.2 算法笔记精华2
1.2.1 普通线性回归2
1.2.2 广义线性模型5
1.2.3 逻辑回归5
1.2.4 线性判别分析7
1.3 Python 实战10
1.3.1 线性回归模型11
1.3.2 线性回归模型的正则化12
1.3.3 逻辑回归22
1.3.4 线性判别分析26

 

第2 章  决策树  30
2.1 概述30
2.2 算法笔记精华30
2.2.1 决策树原理30
2.2.2 构建决策树的3 个步骤31
2.2.3 CART 算法37
2.2.4 连续值和缺失值的处理42
2.3 Python 实战43
2.3.1 回归决策树(DecisionTreeRegressor) 43
2.3.2 分类决策树(DecisionTreeClassifier) 49
2.3.3 决策图54

 

第3 章  贝叶斯分类器  55
3.1 概述55
3.2 算法笔记精华55
3.2.1 贝叶斯定理55
3.2.2 朴素贝叶斯法56
3.3 Python 实战59
3.3.1 高斯贝叶斯分类器(GaussianNB) 61
3.3.2 多项式贝叶斯分类器(MultinomialNB) 62
3.3.3 伯努利贝叶斯分类器(BernoulliNB) 65
3.3.4 递增式学习partial_fit 方法69

 

第4 章  k 近邻法  70
4.1 概述70
4.2 算法笔记精华70
4.2.1 kNN 三要素70
4.2.2 k 近邻算法72
4.2.3 kd 树73
4.3 Python 实践74

 

第5章  数据降维  83
5.1 概述83
5.2 算法笔记精华83
5.2.1 维度灾难与降维83
5.2.2 主成分分析(PCA) 84
5.2.3 SVD 降维91
5.2.4 核化线性(KPCA)降维91
5.2.5 流形学习降维93
5.2.6 多维缩放(MDS)降维93
5.2.7 等度量映射(Isomap)降维96
5.2.8 局部线性嵌入(LLE) 97
5.3 Python 实战99
5.4 小结118

 

第6章  聚类和EM 算法  119
6.1 概述119
6.2 算法笔记精华120
6.2.1 聚类的有效性指标120
6.2.2 距离度量122
6.2.3 原型聚类123
6.2.4 密度聚类126
6.2.5 层次聚类127
6.2.6 EM 算法128
6.2.7 实际中的聚类要求136
6.3 Python 实战137
6.3.1 K 均值聚类(KMeans) 138
6.3.2 密度聚类(DBSCAN) 143
6.3.3 层次聚类(AgglomerativeClustering) 146
6.3.4 混合高斯(GaussianMixture)模型149
6.4 小结153

 

第二篇  机器学习高级篇155
第7章  支持向量机   156
7.1 概述156
7.2 算法笔记精华157
7.2.1 线性可分支持向量机157
7.2.2 线性支持向量机162
7.2.3 非线性支持向量机166
7.2.4 支持向量回归167
7.2.5 SVM 的优缺点170
7.3 Python 实战170
7.3.1 线性分类SVM 171
7.3.2 非线性分类SVM 175
7.3.3 线性回归SVR 182
7.3.4 非线性回归SVR 186

 

第8章  人工神经网络  192
8.1 概述192
8.2 算法笔记精华192
8.2.1 感知机模型192
8.2.2 感知机学习算法194
8.2.3 神经网络197
8.3 Python 实战205
8.3.1 感知机学习算法的原始形式205
8.3.2 感知机学习算法的对偶形式209
8.3.3 学习率与收敛速度212
8.3.4 感知机与线性不可分数据集213
8.3.5 多层神经网络215
8.3.6 多层神经网络与线性不可分数据集216
8.3.7 多层神经网络的应用219

 

第9章  半监督学习  225
9.1 概述225
9.2 算法笔记精华226
9.2.1 生成式半监督学习方法226
9.2.2 图半监督学习228
9.3 Python 实战234
9.4 小结243

 

第10章  集成学习  244
10.1 概述244
10.2 算法笔记精华244
10.2.1 集成学习的原理及误差244
10.2.2 Boosting 算法246
10.2.3 AdaBoost 算法246
10.2.4 AdaBoost 与加法模型252
10.2.5 提升树253
10.2.6 Bagging 算法256
10.2.7 误差-分歧分解257
10.2.8 多样性增强259
10.3 Python 实战260
10.3.1 AdaBoost 261
10.3.2 Gradient Tree Boosting 272
10.3.3 Random Forest 288
10.4 小结298

 

第三篇  机器学习工程篇299
第11章  数据预处理 300
11.1 概述300
11.2 算法笔记精华300
11.2.1 去除唯一属性300
11.2.2 处理缺失值的三种方法301
11.2.3 常见的缺失值补全方法302
11.2.4 特征编码307
11.2.5 数据标准化、正则化308
11.2.6 特征选择310
11.2.7 稀疏表示和字典学习313
11.3 Python 实践316
11.3.1 二元化316
11.3.2 独热码317
11.3.3 标准化321
11.3.4 正则化325
11.3.5 过滤式特征选取326
11.3.6 包裹式特征选取330
11.3.7 嵌入式特征选取334
11.3.8 学习器流水线(Pipeline) 339
11.3.9 字典学习340

 

第12 章  模型评估、选择与验证  345
12.1 概述345
12.2 算法笔记精华346
12.2.1 损失函数和风险函数346
12.2.2 模型评估方法348
12.2.3 模型评估349
12.2.4 性能度量350
12.2.5 偏差方差分解356
12.3 Python 实践357
12.3.1 损失函数357
12.3.2 数据集切分359
12.3.3 性能度量370
12.3.4 参数优化387

 

第四篇 Kaggle 实战篇401
第13 章 Kaggle 牛刀小试  402
13.1 Kaggle 简介402
13.2 清洗数据403
13.2.1 加载数据403
13.2.2 合并数据406
13.2.3 拆分数据407
13.2.4 去除唯一值408
13.2.5 数据类型转换410
13.2.6 Data_Cleaner 类412
13.3 数据预处理415
13.3.1 独热码编码415
13.3.2 归一化处理419
13.3.3 Data_Preprocesser 类421
13.4 学习曲线和验证曲线424
13.4.1 程序说明424
13.4.2 运行结果430
13.5 参数优化433
13.6 小结435

 

全书符号 436

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP