消息首页搜索举报

精通推荐算法：核心模块+经典模型+代码详解

全新正版极速发货

55.24 6.2折 89 全新

库存16件

广东广州

认证卖家担保交易快速发货售后保障

作者谢杨易

出版社电子工业出版社

ISBN9787121474514

出版时间2024-03

装帧平装

开本其他

定价89元

货号1203234272

上书时间2024-07-02

曲奇书店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 17小时
好评率暂无

最新上架

小博物馆里的大中国华中华南卷 ¥24.75

自然语言处理基础与大模型案例与实践 ¥70.00

乡镇国土空间总体规划 ¥36.44

信步山河 ¥10.36

游走在字里行间 ¥24.60

寄生虫原创剧本 ¥20.29

脑图快解高考历史(全2册) ¥9.31

三国热搜榜群雄逐鹿卷 ¥23.62

病毒性肝炎防治——你必须知道的那些事 ¥11.63

商品详情

品相描述：全新

商品描述: 目录
第1章  推荐系统概述1
1.1  为什么需要推荐系统1
1.1.1  推荐系统与用户体验2
1.1.2  推荐系统与内容生产3
1.1.3  推荐系统与平台发展4
1.2  推荐系统分类5
1.2.1  业务领域分类5
1.2.2  内容介质分类5
1.2.3  交互形态分类6
1.2.4  应用场景分类6
1.3  推荐系统技术架构7
1.4  本章小结9
第2章  数据样本和特征工程10
2.1  数据样本10
2.1.1  样本不均衡问题11
2.1.2  样本不置信问题14
2.1.3  离/在线样本不一致问题16
2.2  特征工程17
2.2.1  特征类目体系18
2.2.2  特征处理范式21
2.2.3  特征重要性评估22
2.3  本章小结23
第3章  传统推荐算法25
3.1  协同过滤25
3.1.1  基于用户的协同过滤26
3.1.2  基于物品的协同过滤27
3.1.3  协同过滤的优点和局限性28
3.2  矩阵分解29
3.2.1  矩阵分解实现方法30
3.2.2  矩阵分解的优点和局限性31
3.3  逻辑回归31
3.3.1  逻辑回归求解过程33
3.3.2  逻辑回归的优点和局限性34
3.4  因子分解机35
3.4.1  因子分解机模型简化35
3.4.2  因子分解机的优点和局限性36
3.5  组合模型37
3.5.1  GBDT + LR组合模型结构38
3.5.2  GBDT特征转换过程39
3.5.3  组合模型的思考和总结40
3.6  本章小结40
第4章  特征交叉42
4.1  特征交叉概述43
4.1.1  特征交叉的意义43
4.1.2  特征交叉基本范式44
4.1.3  特征交叉的难点45
4.2  Deep Crossing：经典DNN框架模型46
4.2.1  业务背景和特征体系46
4.2.2  模型结构48
4.2.3  实现方法52
4.3  FNN54
4.3.1  为什么Embedding收敛慢55
4.3.2  模型结构55
4.4  PNN58
4.4.1  模型结构58
4.4.2  特征交叉实现方法59
4.5  Wide＆Deep：异构模型奠基者61
4.5.1 “记忆”和“泛化”61
4.5.2  模型结构62
4.5.3  系统实现64
4.5.4  代码解析66
4.6  DeepFM：异构模型Wide侧引入FM68
4.6.1  模型结构68
4.6.2  代码解析70
4.7  DCN：异构模型Wide侧引入高阶交叉74
4.8  NFM：异构模型Deep侧引入显式交叉77
4.9  xDeepFM：异构模型引入子分支79
4.10  本章小结83
第5章  用户行为序列建模85
5.1  用户行为序列建模概述86
5.1.1  行为序列建模的意义87
5.1.2  行为序列建模的基本范式87
5.1.3  行为序列建模的主要难点88
5.1.4  行为序列特征工程89
5.2  DIN：基于注意力机制建模用户行为序列90
5.2.1  背景90
5.2.2  模型结构92
5.2.3  模型训练方法95
5.2.4  代码解析98
5.3  DIEN：GRU建模用户行为序列100
5.3.1  模型结构：兴趣抽取层100
5.3.2  模型结构：兴趣进化层103
5.4  BST：Transformer建模用户行为序列105
5.4.1  模型结构105
5.4.2  代码解析109
5.5  DSIN：基于Session建模用户行为序列114
5.6  MIMN：基于神经图灵机建模长周期行为序列117
5.6.1  工程设计：UIC模块118
5.6.2  MIMN模型结构119
5.7  SIM：基于检索建模长周期行为序列123
5.8  ETA：基于SimHash实现检索索引在线化126
5.8.1  ETA模型结构127
5.8.2  SimHash原理128
5.9  本章小结129
第6章  Embedding表征学习131
6.1  Embedding表征学习概述132
6.1.1  Embedding概述133
6.1.2  Embedding表征学习的意义134
6.1.3  Embedding表征学习的基本范式134
6.1.4  Embedding表征学习的主要难点135
6.2  基于序列的Embedding建模方法135
6.2.1  Word2vec任务定义：CBOW和Skip-gram136
6.2.2  Word2vec模型结构137
6.2.3  Word2vec训练方法138
6.2.4  Item2vec：推荐系统引入序列Embedding139
6.2.5  序列建模总结和思考139
6.3  基于同构图游走的Graph Embedding139
6.3.1  DeepWalk：同构图游走算法开山之作140
6.3.2  LINE：一阶相似度和二阶相似度探索141
6.3.3  Node2vec：同质性和结构等价性探索142
6.3.4  同构图游走的优缺点144
6.4  基于异构图游走的Graph Embedding145
6.4.1  Metapath2vec145
6.4.2  EGES146
6.4.3  异构图游走的优缺点149
6.5  图神经网络149
6.5.1  GCN：图神经网络开山之作149
6.5.2  GraphSAGE：图神经网络工业应用的高潮152
6.5.3  图神经网络总结153
6.6  向量检索技术153
6.6.1  向量距离计算方法154
6.6.2  向量检索算法156
6.6.3  向量检索常用工具：Faiss161
6.7  本章小结162
第7章  多任务学习165
7.1  多任务学习发展历程166
7.1.1  为什么需要多任务学习166
7.1.2  多任务学习的基本框架167
7.1.3  多任务学习的难点和挑战168
7.2  ESMM模型：解决SSB和DS问题的利器169
7.2.1  样本选择偏差和数据稀疏问题169
7.2.2  ESMM模型结构170
7.2.3  ESMM核心代码172
7.3  MMOE模型：多专家多门控网络174
7.3.1  MMOE模型结构174
7.3.2  MMOE核心代码177
7.4  PLE模型：解决负迁移和跷跷板现象的利器179
7.4.1  负迁移和跷跷板现象180
7.4.2  单层CGC模型结构180
7.4.3  PLE模型结构183
7.4.4  PLE核心代码184
7.5  多任务融合188
7.5.1  网格搜索189
7.5.2  排序模型190
7.5.3  强化学习190
7.6  本章小结192
第8章  召回算法194
8.1  召回概述196
8.1.1  推荐底池196
8.1.2  多路召回197
8.1.3  召回的难点198
8.1.4  召回评价体系199
8.2  个性化召回200
8.2.1  基于内容的个性化召回200
8.2.2  基于协同过滤的个性化召回201
8.2.3  基于社交关系的个性化召回203
8.3  向量召回203
8.3.1  实现方法204
8.3.2  YouTube DNN204
8.3.3  Facebook EBR206
8.3.4  百度MOBIUS208
8.4  用户行为序列类向量召回209
8.4.1  多峰兴趣建模的意义210
8.4.2  MIND的模型结构210
8.4.3  胶囊网络212
8.5  样本选择偏差问题213
8.5.1  召回样本构建方法213
8.5.2  ESAM和迁移学习215
8.6  召回检索优化和TDM218
8.6.1  TDM在线检索过程218
8.6.2  TDM索引构建和模型训练过程220
8.6.3  JTM221
8.6.4  OTM222
8.7  本章小结223
第9章  粗排算法226
9.1  粗排概述228
9.1.1  粗排样本和特征228
9.1.2  粗排发展历程228
9.1.3  粗排的难点230
9.1.4  粗排评价体系230
9.2  PFD模型：知识蒸馏学习交叉特征231
9.2.1  PFD模型结构231
9.2.2  PFD模型原理232
9.2.3  PFD与传统蒸馏相结合233
9.2.4  PFD在精排中的应用234
9.3  COLD模型：显式特征交叉235
9.3.1  双塔内积模型235
9.3.2  COLD模型237
9.4  FSCD模型：效果和效率联合优化238
9.4.1  FSCD特征选择原理239
9.4.2  FSCD训练步骤241
9.5  本章小结242
第10章  重排算法243
10.1  重排概述245
10.1.1  为什么需要重排245
10.1.2  重排的难点和挑战245
10.1.3  流量调控246
10.2  打散和多样性246
10.2.1  打散247
10.2.2  多样性248
10.2.3  多样性发展历程248
10.3  上下文感知和PRM模型249
10.3.1  什么是上下文感知250
10.3.2  PRM模型结构250
10.3.3  其他上下文感知实现方案253
10.4  实时性和延迟反馈问题254
10.4.1  推荐系统实时性的意义254
10.4.2  推荐系统实时性分类255
10.4.3  延迟反馈问题256
10.4.4  延迟反馈优化方案257
10.5  端上重排和EdgeRec257
10.5.1  为什么需要端上模型258
10.5.2  端上推理引擎259
10.5.3  EdgeRec系统架构259
10.5.4  EdgeRec模型结构260
10.6  本章小结262

内容摘要
本书系统介绍了推荐算法的知识框架和技术细节，包括召回、粗排、精排和重排等模块。第1章从用户体验、内容生产和平台发展角度介绍为什么需要推荐系统，并阐述推荐系统的分类及整体技术架构。第2章介绍推荐算法模型的基础――数据样本和特征工程。第3章介绍传统推荐算法。第4~7章介绍推荐系统中最复杂的部分――精排模块，包括特征交叉、用户行为序列建模、Embedding表征学习和多任务学习。第8章介绍召回模块，并详细讲解非个性化召回和个性化召回算法。第9章介绍粗排模块，重点讲解特征蒸馏和轻量级特征交叉等方法。第10章介绍重排模块，包括打散和多样性、上下文感知和端上重排等技术细节。本书适用于推荐算法初学者、有一定工作经验的推荐算法工程师，以及搜索、广告和营销等领域的从业者，也可作为高等院校计算机等相关专业师生的参考资料。

— 没有更多了 —