深入浅出 工业机器学习算法详解与实战
全新正版 极速发货
¥
35.4
5.1折
¥
69
全新
库存2件
作者张朝阳
出版社机械工业出版社
ISBN9787111640561
出版时间2020-01
装帧平装
开本其他
定价69元
货号1202010927
上书时间2024-05-25
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
张朝阳,毕业于华中科技大学工业工程系,获硕士学位。曾就职于58同城、字节跳动,现任脉脉不错算法研究员,从事过反作弊、推荐、搜索等业务的算法研究和系统开发工作,擅长自然语言处理、点击率预估和特征工程。多年坚持写博客,总能以浅显易懂的文字将算法原理讲清楚,在博客园上吸引了众多粉丝。
目录
前言
章概述
1.1机器学习基本流程/1
1.2业界常用算法/2
1.3构建机器学习系统/3
第2章统计学
2.1概率分布/5
2.1.1期望与方差/5
2.1.2概率密度函数/7
2.1.3累积分布函数/10
2.2极大似然估计与贝叶斯估计/11
2.2.1极大似然估计/11
2.2.2贝叶斯估计/13
2.2.3共轭先验与平滑的关系/15
2.3置信区间/15
2.3.1t分布/16
2.3.2区间估计/17
2.3.3Wilson置信区间/19
2.4相关性/20
2.4.1数值变量的相关性/20
2.4.2分类变量的相关性/22
2.4.3顺序变量的相关性/27
2.4.4分布之间的距离/28
第3章矩阵
3.1矩阵的物理意义/30
3.1.1矩阵是什么/30
3.1.2矩阵的行列式/31
3.1.3矩阵的逆/32
3.1.4特征值和特征向量/32
3.2矩阵的数值稳定性/33
3.2.1矩阵数值稳定性的度量/33
3.2.2基于列主元的高斯{约当消元法/33
3.2.3岭回归/38
3.3矩阵分解/38
3.3.1特征值分解与奇异值分解/39
3.3.2高维稀疏矩阵的特征值分解/40
3.3.3基于矩阵分解的推荐算法/45
3.4矩阵编程实践/46
3.4.1numpy数组运算/46
3.4.2稀疏矩阵的压缩方法/50
3.4.3用MapReduce实现矩阵乘法/52
第4章优化方法
4.1无约束优化方法/54
4.1.1梯度下降法/54
4.1.2拟牛顿法/56
4.2带约束优化方法/58
4.3在线学习方法/61
4.3.1随机梯度下降法/61
4.3.2FTRL算法/63
4.4深度学习中的优化方法/70
4.4.1动量法/70
4.4.2AdaGrad/71
4.4.3RMSprop/71
4.4.4Adadelta/71
4.4.5Adam/72
4.5期望优选化算法/72
4.5.1Jensen不等式/73
4.5.2期望优选化算法分析/73
4.5.3高斯混合模型/77
第5章线性模型
5.1广义线性模型/79
5.1.1指数族分布/79
5.1.2广义线性模型的特例/80
5.2逻辑回归模型/83
5.3分解机制模型/84
5.3.1特征组合/84
5.3.2分解机制/86
5.3.3分解机制模型构造新特征的思路/87
5.4基于域感知的分解机制模型/88
5.5算法实验对比/95
第6章概率图模型
6.1隐马尔可夫模型/98
6.1.1模型介绍/98
6.1.2模型训练/101
6.1.3模型预测/102
6.2条件随机场模型/103
6.2.1条件随机场模型及特征函数/103
6.2.2向前变量和向后变量/107
6.2.3模型训练/110
6.2.4模型预测/111
6.2.5条件随机场模型与隐马尔可夫模型的对比/112
第7章文本向量化
7.1词向量/113
7.1.1word2vec/113
7.1.2fastText/117
7.1.3GloVe/118
7.1.4算法实验对比/120
7.2文档向量/121
7.2.1ParagraphVector/121
7.2.2LDA/123
第8章树模型
8.1决策树/130
8.1.1分类树/131
8.1.2回归树/134
8.1.3剪枝/137
8.2随机森林/139
8.3AdaBoost/140
8.4XGBoost/141
8.5LightGBM/146
8.5.1基于梯度的单边采样算法/147
8.5.2互斥特征捆绑/147
8.5.3Leaf-Wise生长策略/148
8.5.4DART/149
8.6算法实验对比/150
第9章深度学习
9.1神经网络概述/154
9.1.1网络模型/154
9.1.2反向传播/157
9.1.3损失函数/158
9.1.4过拟合问题/159
9.1.5梯度消失/161
9.1.6参数初始化/161
9.2卷积神经网络/162
9.2.1卷积/162
9.2.2池化/165
9.2.3CNN网络结构/165
9.2.4textCNN/167
9.3循环神经网络/168
9.3.1RNN通用架构/168
9.3.2RNN的学习问题/170
9.3.3门控循环单元/172
9.3.4LSTM/174
9.3.5seq2seq/177
9.4注意力机制/179
0章Keras编程
10.1快速上手/182
10.2Keras层/184
10.2.1Keras内置层/184
10.2.2自定义层/191
10.3调试技巧/194
10.3.1查看中间层的输出/194
10.3.2回调函数/195
10.4CNN和RNN的实现/198
1章推荐系统实战
11.1问题建模/203
11.2数据预处理/206
11.2.1归一化/206
11.2.2特征哈希/208
11.3模型探索/210
11.3.1基于共现的模型/210
11.3.2图模型/211
11.3.3DeepFM/214
11.3.4DCN/219
11.4推荐服务/221
11.4.1远程过程调用简介/221
11.4.2gRPC的使用/223
11.4.3服务发现与负载均衡/226
2章收集训练数据
12.1日志的设计/229
12.2日志的传输/231
12.3日志的合并/238
12.4样本的存储/248
3章分布式训练
13.1参数服务器/250
13.2基于PS的优化算法/256
13.3在线学习/259
4章A/B测试
14.1实验分组/261
14.2指标监控/266
14.2.1指标的计算/266
14.2.2指标的上报与存储/267
14.2.3指标的展现与监控/269
14.3实验结果分析/272
内容摘要
实用性是本书的基本出发点,书中介绍了近年来在工业界被广泛应用的机器学习算法,这些算法经受了时间的考验,不但效果好而且使用方便。此外,本书也十分注重理论的深度和完整性,内容编排力求由浅入深、推理完整、前后连贯、自成体系,先讲统计学、矩阵、优化方法这些基础知识,再介绍线性模型、概率图模型、文本向量化算法、树模型和深度学习。与大多数机器学习图书不同,本书还介绍了算法周边的一些工程架构及实现原理,比如如何实时地收集训练样本和监控算法指标、参数服务器的架构设计、做A/B测试的注意事项等。本书理论体系完整,公式推导清晰,可作为机器学习初学者的自学用书。读者无需深厚的专业知识,本科毕业的理工科学生都能看懂。另外由于本书与工业实践结合得很紧密,所以也很好适合于从事算法相关工作的工程技术人员阅读。
— 没有更多了 —
以下为对购买帮助不大的评价