Mahout实验指南
正版新书 新华官方库房直发 可开电子发票
¥
13.14
7.3折
¥
18
全新
仅1件
作者李琳,袁景凌,熊盛武 主编
出版社武汉大学出版社
ISBN9787307127692
出版时间2017-04
版次1
装帧平装
开本16开
纸张胶版纸
页数65页
字数108千字
定价18元
货号SC:9787307127692
上书时间2024-12-23
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
李琳,博士,武汉理工大学计算机科学与技术学院教授。近年来主要从事信息检索与推荐系统、数据挖掘与知识管理、自然言语处理与机器学习等方面的研究工作,先后承担国家863项目、国家自然科学基金、湖北省科技重大专项等项目20余项。主要研究方向:研究人工智能方法和大规模数据分析技术,特别是互联网数据挖掘、文本分析、信息检索和推荐系统等相关问题,致力于将数据挖掘、机器学习与知识发现技术结合。
内容简介:
本书是一本数据挖掘和机器学习领域入门阶段的实验教材,每章由知识要点和实验两个部分组成。知识要点部分给出了实验内容对应的知识脉络,以及对相关问题的理解和分析方法。实验部分以Mahout工具包为实验平台,针对每章的知识点设计了帮助读者理解和掌握的实验,这些实验同时也为读者运用Mahout工具包针对各种数据挖掘和机器学习的实际应用提供了方法和思路。
目录:
1概述
1.1数据挖掘
1.1.1推荐系统
1.1.2聚类算法
1.1.3分类算法
1.1.4监督学习和无监督学习
1.1.5关联规则
1.2Mahout使用说明
1.2.1关于Mahout
1.2.2配置Mahout
2推荐系统
2.1知识要点
2.1.1推荐系统定义
2.1.2查准率与查全率
2.1.3协同过滤
2.1.4相似度计算
2.2创建一个推荐程序
2.2.1创建输入
2.2.2运行推荐程序
2.3评估一个推荐程序
2.4基于用户的协同过滤
2.4.1算法思想
2.4.2基于欧几里得距离的user-based推荐程序
2.5基于商品的协同过滤
2.5.1算法思想
2.5.2基于欧几里得距离的item-based推荐程序
2.6Slope-one推荐算法
2.6.1算法思想
2.6.2Slope-one推荐程序
3聚类算法
3.1知识要点
3.1.1TFIDF权重
3.1.2向量空间模型及距离度量
3.1.3k-means聚类算法
3.1.4模糊k-means聚类算法
3.2聚类示例
3.2.1生成输入数据
3.2.2使用Mahout聚类
3.3使用各种距离度量
3.3.1欧氏距离测度
3.3.2平方欧氏距离测度
3.3.3曼哈顿距离测度
3.3.4余弦距离测度
3.3.5谷本距离测度
3.4数据向量化表示
3.4.1将数据转换为向量
3.4.2从文档中生成向量
3.5k.means新闻聚类...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价