机器学习算法实践——推荐系统的协同过滤理论及其应用
¥
12
1.7折
¥
69
全新
仅1件
作者王建芳
出版社清华大学出版社
出版时间2018-11
版次1
装帧平装
上书时间2024-11-26
商品详情
- 品相描述:全新
图书标准信息
-
作者
王建芳
-
出版社
清华大学出版社
-
出版时间
2018-11
-
版次
1
-
ISBN
9787302507833
-
定价
69.00元
-
装帧
平装
-
开本
16开
-
页数
208页
-
字数
270千字
- 【内容简介】
-
个性化推荐能够根据用户的历史行为显式或者隐式地挖掘用户潜在的兴趣和需求,并为其推送个性化信息,因此受到研究者的追捧及工业界的青睐,其研究具有重大的学术价值及商业应用价值,已广泛应用于大型电子商务平台、社交平台、新闻客户端以及其他各类旅游和娱乐类网站中。
本书内容丰富,较全面地介绍了基于协同过滤的推荐系统存在的问题、解决方法和评估策略,主要内容涉及协同过滤推荐算法中的时序技术、矩阵分解技术和社交网络信任技术等知识。
本书可供从事推荐系统、人工智能、机器学习、模式识别和信息检索等领域的科研人员及研究生阅读、参考。
- 【作者简介】
-
王建芳,博士,副教授,硕士研究生导师,现任河南理工大学ACM/ICPC总教练;主要从事人工智能、数据挖掘和智能计算算法等方向的研究工作,具有丰富的系统研究开发经验和扎实的理论基础知识。长期指导学生参加各种程序算法设计类竞赛,并多次获得省级及以上奖励;曾多次获得相关赛事的“很好指导教师”称号。
- 【目录】
-
篇基础理论
章理论入门
1.1引言
1.2推荐系统的形式化定义
1.3基于近邻的协同过滤推荐算法
1.3.1余弦相似度
1.3.2修正余弦相似度
1.3.3Pearson相似度
1.3.4Jaccard相似度
1.4基于用户兴趣的推荐算法
1.5基于模型的协同过滤推荐算法
1.5.1矩阵分解模型
1.5.2交替最小二乘
1.5.3概率矩阵分解
1.5.4非负矩阵分解
1.6基于信任的协同过滤推荐算法
1.7推荐系统现存问题
1.7.1冷启动
1.7.2数据稀疏性
1.7.3可扩展性
1.7.4用户兴趣漂移
1.8评测指标
本章小结
参考文献
第二篇基于时序的协同过滤推荐算法
第2章基于巴式系数改进相似度的协同过滤推荐算法
2.1引言
2.2相关工作
2.2.1余弦相似度
2.2.2调整余弦相似度
2.2.3Pearson相关系数
2.2.4Jaccard相似度
2.3一种巴氏系数改进相似度的协同过滤推荐算法
2.3.1巴氏系数
2.3.2巴氏系数相似度
2.3.3BCCF算法描述
2.4实验与分析
2.4.1数据集
2.4.2评价标准
2.4.3实验结果与分析
本章小结
参考文献
第3章基于用户兴趣和项目属性的协同过滤推荐算法
3.1引言
3.2相关工作
3.3基于用户兴趣和项目属性的协同过滤推荐算法
3.3.1基于时间的用户兴趣度权重
3.3.2改进相似度计算
3.3.3加权预测评分
3.3.4算法步骤
3.4实验结果与分析
3.4.1数据集
3.4.2评价标准
3.4.3结果分析
本章小结
参考文献
第三篇基于矩阵分解的协同过滤推荐算法
第4章SVD和信任因子相结合的协同过滤推荐算法
4.1引言
4.2标注和相关工作
4.2.1标注
4.2.2奇异值分解
4.2.3计算相似度
4.3SVD和信任因子相结合的协同过滤推荐算法
4.3.1项目特征空间
4.3.2两阶段k近邻选择
4.3.3信任因子
4.3.4预测评分
4.3.5算法
4.4实验结果与分析
4.4.1数据集和实验环境
4.4.2评价标准
4.4.3实验结果分析
本章小结
参考文献
第5章相似度填充的概率矩阵分解的协同过滤推荐算法
5.1引言
5.2相关工作
5.2.1协同过滤推荐算法
5.2.2概率矩阵分解技术
5.3CF?PFCF算法
5.3.1算法设计思想
5.3.2CF?PFCF算法的描述
5.4实验分析
5.4.1数据集与误差标准
5.4.2实验结果与性能比较
本章小结
参考文献
第6章基于偏置信息的改进概率矩阵分解算法研究
6.1引言
6.2相关工作
6.2.1矩阵分解模型
6.2.2Baseline预测
6.3算法流程
6.4实验分析
6.4.1实验所用数据集
6.4.2实验环境配置
6.4.3实验评价标准
6.4.4实验结果及分析
本章小结
参考文献
第7章基于项目属性改进概率矩阵分解算法
7.1引言
7.2IAR?BP算法
7.2.1相似度度量
7.2.2算法描述
7.2.3算法复杂度分析
7.3实验结果对比分析
7.3.1实验数据集
7.3.2实验评价标准
7.3.3对比实验配置及说明
7.3.4实验参数分析
7.3.5实验对比
本章小结
参考文献
第8章基于交替最小二乘的改进概率矩阵分解算法
8.1引言
8.2交替最小二乘
8.3Baseline预测
8.4IPMF算法
8.4.1算法改进思想
8.4.2算法流程
8.4.3复杂度分析
8.5实验结果分析
8.5.1对比实验设定
8.5.2实验分析
本章小结
参考文献
第9章基于社交网络的改进概率矩阵分解算法研究
9.1引言
9.2相关工作
9.2.1推荐系统的形式化
9.2.2矩阵分解与推荐系统
9.3概率矩阵分解
9.4主要研究内容
9.4.1基于社交网络的改进概率矩阵分解
9.4.2算法流程
9.4.3算法复杂度分析
9.5实验分析
9.5.1实验数据集
9.5.2实验评价标准
9.5.3对比算法
9.5.4潜在因子维度的影响
9.5.5偏置的影响
9.5.6信任因子的影响
9.5.7对比实验分析
本章小结
参考文献
0章带偏置的非负矩阵分解推荐算法
10.1引言
10.2相关工作
10.2.1矩阵分解
10.2.2奇异值矩阵
10.2.3Baseline预测
10.2.4NMF算法
10.3RBNMF算法
10.3.1理论分析
10.3.2RBNMF算法流程
10.4实验分析
10.4.1数据集
10.4.2评价标准
10.4.3实验结果及分析
本章小结
参考文献
1章基于项目热度的协同过滤推荐算法
11.1引言
11.2非负矩阵分解
11.3两阶段近邻选择
11.3.1两阶段k近邻选择
11.3.2项目“热度”和局部信任
11.3.3预测评分
11.4算法描述
11.5实验结果分析
11.5.1不同策略下相似度的分布
11.5.2两种因素的分布与分析
11.5.3实验结果及分析
本章小结
参考文献
第四篇基于信任的协同过滤推荐算法
2章带偏置的专家信任推荐算法
12.1引言
12.2相关工作
12.2.1专家算法
12.2.2生成推荐值
12.2.3Baseline预测
12.3改进专家算法
12.3.1改进专家信任
12.3.2评分形成
12.3.3算法描述
12.4实验结果与分析
12.4.1数据集
12.4.2评估标准
12.4.3实验结果及分析
本章小结
参考文献
3章一种改进专家信任的协同过滤推荐算法
13.1引言
13.2标注与相关工作
13.2.1标注
13.2.2近邻模型
13.2.3专家算法
13.3改进专家算法
13.3.1重要概念
13.3.2评分形成
13.3.3算法描述
13.4实验结果与分析
13.4.1数据集
13.4.2评估标准
13.4.3实验结果与分析
本章小结
参考文献
第五篇原型系统开发
4章电影推荐原型系统
14.1引言
14.2主要功能
14.3关键技术
14.3.1概率矩阵分解模型
14.3.2社交网络正则化
14.4集群搭建
14.4.1集群软硬件环境
14.4.2Spark集群
14.4.3HBase集群
14.5系统特点
14.6用户使用说明
14.6.1系统简介界面
14.6.2建模一和建模二界面
14.6.3集群界面
14.6.4看过的电影界面
14.6.5推荐电影界面
14.6.6统计分析界面
参考文献
内容摘要
个性化推荐能够根据用户的历史行为显式或者隐式地挖掘用户潜在的兴趣和需求,并为其推送个性化信息,因此受到研究者的追捧及工业界的青睐,其研究具有重大的学术价值及商业应用价值,已广泛应用于大型电子商务平台、社交平台、新闻客户端以及其他各类旅游和娱乐类网站中。本书内容丰富,较全面地介绍了基于协同过滤的推荐系统存在的问题、解决方法和评估策略,主要内容涉及协同过滤推荐算法中的时序技术、矩阵分解技术和社交网络信任技术等知识。本书可供从事推荐系统、人工智能、机器学习、模式识别和信息检索等领域的科研人员及研究生阅读、参考。
精彩内容
第3章基于用户兴趣和项目属性的协同过滤推荐算法针对传统协同过滤推荐算法不能及时反映用户的兴趣变化、时效性不足导致推荐精度不高的问题,提出一种基于用户兴趣和项目属性的协同过滤推荐算法。在传统协同过滤基础上综合考虑评分时间、相似度以及项目属性等因素,首先在计算相似度过程中加入基于时间的用户兴趣度权重函数,然后再与项目属性相似度进行融合,最后进行项目预测与推荐。在Movielens数据集上的实验结果表明,所提出的算法与已有的经典算法相比,平均绝对误差降低了3%~6%,有效提高了推荐的准确性。
3.1引言
个性化推荐是从海量数据中挖掘出有用信息的一种技术,协同过滤是其应用最广泛、最成功的推荐算法之一,通过收集和分析用户的信息数据来学习用户的兴趣偏好和行为模式,从而为用户推荐所需要的信息或商品。
传统的协同过滤推荐算法忽略了随着时间变化而用户的兴趣也在不断发生变化的问题,即存在用户兴趣漂移现象。用户的兴趣偏好不但范围广泛,而且实时变化。例如,一个孩子在几岁时可能对动画片感兴趣,青春期可能对浪漫爱情片感兴趣,随后有可能对文艺片感兴趣,再过几年可能对剧情片感兴趣,等等。随着时间推移,用户的关注点在不断变化,如何捕获这一动态的时间效应是个难题。
通常将时间窗作为判断用户兴趣变化的一种表征方式,采用加权处理的方法,来提高推荐质量。文献[1]通过对心理遗忘曲线拟合出用户兴趣权重函数,提出基于时间窗的改进协同过滤推荐算法,从而追踪和学习用户的兴趣偏好;文献[2]~[4]提出基于评价时间数据权重的用户兴趣度量函数,使得用户最可能感兴趣近期访问过的资源。这些方法在相似度度量过程中加入了时间因子,从一定程度上解决了用户兴趣漂移问题,但是忽略了不同对象的类别属性等特征信息,这在一定程度上也会影响最终的推荐质量。
针对这一问题,本章提出了一种基于用户兴趣和项目属性的协同过滤推荐算法,在传统的用户—项目评分矩阵基础上综合考虑用户偏好、评分时间以及项目属性特征等因素,先在计算相似度过程中加入时间逻辑性因素,再与项目属性相似度进行融合,明确用户对项目中各个属性的偏好程度,更能体现出用户的行为需求。
3.2相关工作提供个性化推荐服务已经成为各大电子商务网站和社交媒体的核心竞争力所在,如何实时根据用户的浏览和购买行为为其推荐更加符合用户偏好的项目,即在正确的时间推荐合适的项目,是目前推荐系统面临的一大挑战。在信息飞速发展的当代,用户兴趣和信息话题的流行转移速度也非常快。文献[5,6]提出了一个实时的在线推荐系统——TencentRec,并在此系统上部署一系列的应用,每天为10亿用户根据其兴趣爱好实时推荐话题,在实践中观察TencentRec的性能;并在此系统上提出了一个基于项目的可扩展协同过滤推荐算法,处理隐式反馈问题,通过增量更新和实时修剪以减少计算成本,对数据进行实时采集和处理,可以随时捕捉用户的兴趣,提高推荐质量。文献[7]提出了一种基于空间正则化和突发加权平滑的混合模型推荐算法,利用正则化框架发现社交网络中的空间信息以及在时间轴上采用突发加权平滑方案发现的时变信息,实验结果表明所提出的混合模型能够在单一的检测过程中区别时变话题和稳定话题,从而可以针对用户不同的兴趣分别推荐话题。此算法只适用于新闻类信息网站,针对目前流行的社交媒体平台,文献[8]设计了一个潜在的类统计混合模型,称为时间上下文感知混合模型(TCAM),TCAM同时根据用户内在兴趣相关话题和时间上下文相关话题这两个因素的影响对用户行为建模;为了进一步提高TCAM算法的性能,提出项目加权方法使TCAM更好地为用户推荐其偏好的项目。文献[9]提出了一种利用人类行为对信息过滤的协同过滤推荐算法,与传统的协同过滤推荐算法相比推荐精度得到了很大提高,同时改善了推荐的新颖性和多样性。上述研究在计算相似度时加入时间因素,但是没有考虑项目特征属性问题,为此本书提出一种基于用户兴趣和项目属性的协同过滤推荐算法,在计算相似度时不单单考虑用户兴趣而且考虑项目本身的属性特征,提高算法的推荐精度。
时间是一种重要的上下文信息,对用户兴趣偏好有着深入的影响。本书以Movielens数据集为例(1997年9月—1998年4月,以月为单位),分析了3种不同类型影片观众人次比例随时间的变化情况,如图31所示为3种不同类型影片月观众人次比例走势图。
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价