• Hadoop与大数据挖掘
21年品牌 40万+商家 超1.5亿件商品

Hadoop与大数据挖掘

全新正版 极速发货

36.9 5.3折 69 全新

库存2件

广东广州
认证卖家担保交易快速发货售后保障

作者张良均 等 著

出版社机械工业出版社

ISBN9787111567875

出版时间2017-05

装帧平装

开本16开

定价69元

货号1201517504

上书时间2024-11-14

大智慧小美丽

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
张良均,资历大数据挖掘专家和模式识别专家,有10多年的大数据挖掘应用、咨询经验,10余年数据仓库系统管理与实施经验,超过10年的系统开发与设计经验。为电信、电力、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验很好丰富。此外,他精通Java EE企业级应用开发,是广东工业大学和华南师范大学兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》等畅销书。

目录
前言
第一篇基础篇
第1章浅谈大数据2
1.1大数据概述3
1.2大数据平台4
1.3本章小结5
第2章大数据存储与运算利器—Hadoop6
2.1Hadoop概述6
2.1.1Hadoop简介6
2.1.2Hadoop存储—HDFS8
2.1.3Hadoop计算—MapReduce11
2.1.4Hadoop资源管理—YARN13
2.1.5Hadoop生态系统14
2.2Hadoop配置及IDE配置17
2.2.1准备工作17
2.2.2环境配置18
2.2.3集群启动关闭与监控24
2.2.4动手实践:一键式Hadoop集群启动关闭25
2.2.5动手实践:HadoopIDE配置26
2.3Hadoop集群命令28
2.3.1HDFS常用命令hdfsdfs30
2.3.2动手实践:hdfsdfs命令实战31
2.3.3MapReduce常用命令mapred job32
2.3.4YARN常用命令yarnjar32
2.3.5动手实践:运行MapReduce任务33
2.4Hadoop编程开发33
2.4.1HDFSJavaAPI操作33
2.4.2MapReduce原理35
2.4.3动手实践:编写Word Count程序并打包运行44
2.4.4MapReduce组件分析与编程实践46
2.5K—Means算法原理及Hadoop MapReduce实现53
2.5.1K—Means算法原理53
2.5.2动手实践:K—Means算法实现55
2.5.3Hadoop K—Means算法实现思路55
2.5.4Hadoop K—Means编程实现57
2.6TF—IDF算法原理及Hadoop MapReduce实现67
2.6.1TF—IDF算法原理67
2.6.2Hadoop TF—IDF编程思路67
2.6.3Hadoop TF—IDF编程实现68
2.7本章小结79
第3章大数据查询—Hive81
3.1Hive概述81
3.1.1Hive体系架构82
3.1.2Hive数据类型86
3.1.3Hive安装87
3.1.4动手实践:Hive安装配置91
3.1.5动手实践:HiveQL基础—SQL91
3.2HiveQL语句93
3.2.1数据库操作94
3.2.2Hive表定义94
3.2.3数据导入100
3.2.4数据导出103
3.2.5HiveQL查询104
3.3动手实践:基于Hive的学生信息查询108
3.4基于Hive的航空公司客户价值数据预处理及分析109
3.4.1背景与挖掘目标109
3.4.2分析方法与过程111
3.5本章小结115
第4章大数据快速读写—HBase116
4.1HBase概述116
4.2配置HBase集群118
4.2.1Zookeeper简介及配置118
4.2.2配置HBase121
4.2.3动手实践:HBase安装及运行122
4.2.4动手实践:ZooKeeper获取HBase状态122
4.3HBase原理与架构组件123
4.3.1HBase架构与组件123
4.3.2HBase数据模型127
4.3.3读取/写入HBase数据128
4.3.4RowKey设计原则129
4.3.5动手实践:HBase数据模型验证131
4.4HBaseShell操作132
4.4.1HBase常用Shell命令132
4.4.2动手实践:HBaseShell操作136
4.5Java API&MapReduce与HBase交互137
4.5.1搭建HBase开发环境137
4.5.2使用JavaAPI操作HBase表144
4.5.3动手实践:HBaseJava API使用147
4.5.4MapReduce与HBase交互147
4.5.5动手实践:HBase表导入导出150
4.6基于HBase的冠字号查询系统151
4.6.1案例背景151
4.6.2功能指标151
4.6.3系统设计152
4.6.4动手实践:构建基于HBase的冠字号查询系统162
4.7本章小结175
第5章大数据处理—Pig176
5.1Pig概述176
5.1.1Pig Latin简介177
5.1.2Pig数据类型179
5.1.3Pig与Hive比较179
5.2配置运行Pig180
5.2.1Pig配置181
5.2.2Pig运行模式181
5.3常用PigLatin操作182
5.3.1数据加载182
5.3.2数据存储184
5.3.3Pig参数替换185
5.3.4数据转换186
5.4综合实践194
5.4.1动手实践:访问统计信息数据处理194
5.4.2动手实践:股票交易数据处理195
5.5本章小结196
第6章大数据快速运算与挖掘—Spark197
6.1Spark概述197
6.2Spark安装集群199
6.2.13种运行模式199
6.2.2动手实践:配置Spark独立集群199
6.2.33种运行模式实例201
6.2.4动手实践:Spark Streaming实时日志统计205
6.2.5动手实践:Spark开发环境—Intellij IDEA配置207
6.3Spark架构与核心原理212
6.3.1Spark架构212
6.3.2RDD原理213
6.3.3深入理解Spark核心原理215
6.4Spark编程技巧218
6.4.1Scala基础218
6.4.2Spark基础编程218
6.5如何学习Spark MLlib225
6.5.1确定应用227
6.5.2ALS算法直观描述228
6.5.3编程实现229
6.5.4问题解决及模型调优233
6.6动手实践:基于Spark ALS电影推荐系统234
6.6.1动手实践:生成算法包235
6.6.2动手实践:完善推荐系统239
6.7本章小结250
第7章大数据工作流—Oozie252
7.1Oozie简介252
7.2编译配置并运行Oozie253
7.2.1动手实践:编译Oozie253
7.2.2动手实践:Oozie Server/client配置254
7.3Oozie WorkFlow实践257
7.3.1定义及提交工作流257
7.3.2动手实践:MapReduce Work—Flow定义及调度260
7.3.3动手实践:Pig WorkFlow定义及调度263
7.3.4动手实践:Hive WorkFlow定义及调度265
7.3.5动手实践:Spark WorkFlow定义及调度267
7.3.6动手实践:Spark On Yarn定义及调度268
7.4Oozie Coordinator实践270
7.4.1动手实践:基于时间调度270
7.4.2动手实践:基于数据有效性调度273
7.5本章小结275
第二篇挖掘实战篇
第8章法律服务大数据智能推荐278
8.1背景278
8.2目标279
8.3系统架构及流程279
8.4分析过程及实现281
8.4.1数据传输281
8.4.2数据传输:动手实践282
8.4.3数据探索分析283
8.4.4数据预处理292
8.4.5模型构建297
8.5构建法律服务大数据智能推荐系统313
8.5.1动手实践:构建推荐系统JavaEE313
8.5.2动手实践:Oozie工作流任务317
8.6本章小结322

内容摘要
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你接近没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(第8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进行分析,使读者切身感受到利用大数据技术解决问题的魅力。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP