¥ 17.19 2.9折 ¥ 59 九品
库存3件
作者樊哲 著
出版社机械工业出版社
出版时间2014-07
版次1
装帧平装
货号22
上书时间2024-12-27
《大数据技术丛书:Mahout算法解析与案例实战》是一本经典的Mahout著作,原理与实战并重。不仅全面分析了Mahout算法库中不同模块中的各个算法的原理及其Mahout实现流程,而且每个算法都辅之以实战案例。此外,还包括4个系统级案例,实战性非常强。
全书共11章分为三个部分:第一部分为基础篇(第1~2章),首先介绍了Mahout的应用背景、Mahout算法库收录的算法、Mahout的应用实例,以及开发环境的搭建;第二部分为算法篇(第3~7章),分析了Mahout算法库中不同模块的各个算法的原理以及Mahout实现流程,同时在每章书末含有每个算法的实战,让读者可以自己运行程序,感受程序运行的各个流程;第三部分为实战篇(第8~11章),通过对4个不同系统案例的分析讲解,让读者了解一个完整的云平台系统的各个流程,从需求到系统框架到系统功能再到功能开发。
樊哲,资深软件开发工程师,精通Java相关技术,专注数据挖掘领域,对Hadoop和Mahout等大数据技术有较深入的研究和丰富的实践,目前正从事Mahout算法开发方面的工作。活跃于CSDN和Hadoop技术论坛等社区,荣获“CSDN2013博客之星”头衔。
前言
第一部分 基础篇
第1章 Mahout简介
1.1 Mahout应用背景
1.2 Mahout算法库
1.2.1 聚类算法
1.2.2 分类算法
1.2.3 协同过滤算法
1.2.4 频繁项集挖掘算法
1.3 Mahout应用
1.4 本章小结
第2章 Mahout安装配置
2.1 Mahout安装前的准备
2.1.1 安装JDK
2.1.2 安装Hadoop
2.2 两种安装方式
2.2.1 使用Maven安装
2.2.2 下载发布版安装
2.3 测试安装
2.4 本章小结
第二部分 算法篇
第3章 聚类算法
3.1 Canopy算法
3.1.1 Canopy算法简介
3.1.2 Mahout中Canopy算法实现原理
3.1.3 Mahout的Canopy算法实战
3.1.4 Canopy算法小结
3.2 K-Means算法
3.2.1 K-Means算法简介
3.2.2 Mahout中K-Means算法实现原理
3.2.3 Mahout的K-Means算法实战
3.2.4 K-Means算法小结
3.3 Mean Shift算法
3.3.1 Mean Shift算法简介
3.3.2 Mahout中Mean Shift算法实现原理
3.3.3 Mahout的Mean Shift算法实战
3.3.4 Mean Shift算法小结
3.4 本章小结
第4章 分类算法
4.1 Bayesian算法
4.1.1 Bayesian算法简介
4.1.2 Mahout 中Bayesian算法实现原理
4.1.3 Mahout的Bayesian算法实战
4.1.4 拓展
4.1.5 Bayesian算法小结
4.2 Random Forests算法
4.2.1 Random Forests算法简介
4.2.2 Mahout中Random Forests算法实现原理
4.2.3 Mahout的Random Forests算法实战
4.2.4 拓展
4.2.5 Random Forests算法小结
4.3 本章小结
第5章 协同过滤算法
5.1 Distributed Item-Based Collaborative Filtering算法
5.1.1 Distributed Item-Based Collaborative Filtering算法简介
5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法实现原理
5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法实战
5.1.4 拓展
5.1.5 Distributed ItemBased Collabo-rative Filtering算法小结
5.2 Collaborative Filtering with ALSWR算法
5.2.1 Collaborative Filtering with ALSWR算法简介
5.2.2 Mahout中Collaborative Filtering with ALS-WR算法实现原理
5.2.3 Mahout的Collaborative Filtering with ALS-WR算法实战
5.2.4 拓展
5.2.5 Collaborative Filtering with ALSWR算法小结
5.3 本章小结
第6章 模式挖掘算法
6.1 FP树关联规则算法
6.1.1 FP树关联规则算法简介
6.1.2 Mahout中Parallel Frequent Pattern Mining算法实现原理
6.1.3 Mahout的Parallel Frequent Pattern Mining算法实战
6.1.4 拓展
6.2 本章小结
第7章 Mahout中的其他算法
7.1 Dimension Reduction算法
7.1.1 Dimension Reduction算法简介
7.1.2 Mahout中Dimension Reduction算法实现原理
7.1.3 Mahout的Dimension Reduction算法实战
7.1.4 拓展
7.2 本章小结
第三部分 实战篇
第8章 Friend Find系统
8.1 系统功能
8.1.1 系统管理员
8.1.2 普通用户
8.1.3 总体功能
8.2 数据库设计
8.2.1 原始用户数据表
8.2.2 注册用户数据表
8.2.3 系统管理员表
8.2.4 聚类中心表
8.3 系统技术框架
8.4 系统流程
8.4.1 登录
8.4.2 注册
8.4.3 上传数据
8.4.4 调用K-Means算法
8.4.5 查看用户分组
8.4.6 查看分组情况
8.4.7 查看分组成员
8.5 系统实现
8.5.1 登录
8.5.2 注册
8.5.3 上传数据
8.5.4 调用K-Means算法
8.5.5 查看用户分组
8.5.6 查看分组情况
8.5.7 查看分组成员
8.6 本章小结
第9章 Wine Identification系统
9.1 系统功能
9.1.1 用户管理模块
9.1.2 随机森林模型建立模块
9.1.3 随机森林模型预测模块
9.2 系统框架
9.3 数据库设计
9.3.1 用户表
9.3.2 系统常量表
9.4 系统流程
9.4.1 登录
9.4.2 注销
9.4.3 权限修改
9.4.4 密码修改
9.4.5 用户列表
9.4.6 数据上传
9.4.7 随机森林模型建立
9.4.8 随机森林模型评估
9.4.9 随机森林模型预测
9.5 系统实现
9.5.1 登录
9.5.2 注销
9.5.3 权限修改
9.5.4 密码修改
9.5.5 用户列表
9.5.6 数据上传
9.5.7 随机森林模型建立
9.5.8 随机森林模型评估
9.5.9 随机森林模型预测
9.6 本章小结
第10章 Dating Recommender系统
10.1 系统功能
10.1.1 系统管理员功能
10.1.2 普通用户功能
10.1.3 功能总述
10.2 系统框架
10.3 数据库设计
10.3.1 系统管理员表
10.3.2 原始用户推荐信息表
10.3.3 基础数据top10表
10.4 系统流程
10.4.1 登录
10.4.2 上传数据
10.4.3 推荐分析
10.4.4 单用户推荐
10.4.5 新用户推荐
10.5 算法设计
10.5.1 协同过滤算法接口设计
10.5.2 top10算法设计
10.5.3 新用户推荐算法设计
10.6 系统实现
10.6.1 登录
10.6.2 上传数据
10.6.3 推荐分析
10.6.4 单用户推荐
10.6.5 新用户推荐
10.7 本章小结
第11章 博客推荐系统
11.1 系统功能
11.1.1 用户管理
11.1.2 建立知识库
11.1.3 博客管理
11.2 系统框架
11.3 数据库设计
11.3.1 用户信息表
11.3.2 知识库信息表
11.3.3 系统常量表
11.4 系统流程
11.4.1 登录
11.4.2 注册
11.4.3 密码修改
11.4.4 订阅博客查看
11.4.5 博客订阅与退订
11.4.6 博客推荐
11.4.7 上传数据
11.4.8 调用FP树关联规则算法
11.5 算法设计
11.6 系统实现
11.6.1 登录
11.6.2 注册
11.6.3 密码修改
11.6.4 订阅博客查看
11.6.5 运行FP云算法
11.6.6 博客订阅与退订
11.6.7 博客推荐
11.7 本章小结
— 没有更多了 —
以下为对购买帮助不大的评价