Hadoop与大数据挖掘
正版新书 新华官方库房直发 可开电子发票
¥
44.16
6.4折
¥
69
全新
库存2件
作者张良均 等 著
出版社机械工业出版社
ISBN9787111567875
出版时间2017-05
版次1
装帧平装
开本16开
纸张胶版纸
页数322页
定价69元
货号SC:9787111567875
上书时间2024-12-02
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
张良均,资历大数据挖掘专家和模式识别专家,有10多年的大数据挖掘应用、咨询经验,10余年数据仓库系统管理与实施经验,超过10年的系统开发与设计经验。为电信、电力、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验很好丰富。此外,他精通Java EE企业级应用开发,是广东工业大学和华南师范大学兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》等畅销书。
精彩内容:
Preface 前 言为什么要写这本书最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” 早在2012年,大数据(big data)一词已经被广泛提起,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。那时就有人预计,从2013年至2020年,全球数据规模将增长10倍,每年产生的数据量将由当时的4.4万亿GB,增长至44万亿GB,每两年翻一番。 既然“大数据”浪潮已经来临,那么与之对应的大数据人才呢?在国外,大数据技术发展正如火如荼,各种方便大家学习的资料、教程应有尽有。但是,在国内,这种资料却是有“门槛”的。其一,这类资料是英文的,对于部分人员来说,阅读是有难度的;其二,这些资料对于初学者或在校生来说,在理论理解上也有一些难度,没有充分的动手实践来协助理解大数据相关技术的原理、架构等;其三,在如何应用大数据技术来解决企业实实在在遇到的大数据相关问题方面,没有很好的资料;其四,对于企业用户来说,如何将大数据技术和数据挖掘技术相结合,对企业大量数据进行挖掘,以挖掘出有价值的信息,也是难点。 作为大数据相关技术,Hadoop无疑应用很广泛。Hadoop具有以下优势:高可靠性、高扩展性、高效性、高容错性、低成本、生态系统完善。 一般来说,使用Hadoop相关技术可以解决企业相关大数据应用,特别是结合诸如Mahout、Spark 
...
内容简介:
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你接近没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(第8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进行分析,使读者切身感受到利用大数据技术解决问题的魅力。
目录:
前言
第一篇基础篇
第1章浅谈大数据2
1.1大数据概述3
1.2大数据平台4
1.3本章小结5
第2章大数据存储与运算利器—Hadoop6
2.1Hadoop概述6
2.1.1Hadoop简介6
2.1.2Hadoop存储—HDFS8
2.1.3Hadoop计算—MapReduce11
2.1.4Hadoop资源管理—YARN13
2.1.5Hadoop生态系统14
2.2Hadoop配置及IDE配置17
2.2.1准备工作17
2.2.2环境配置18
2.2.3集群启动关闭与监控24
2.2.4动手实践:一键式Hadoop集群启动关闭25
2.2.5动手实践:HadoopIDE配置26
2.3Hadoop集群命令28
2.3.1HDFS常用命令hdfsdfs30
2.3.2动手实践:hdfsdfs命令实战31
2.3.3MapReduce常用命令mapred job32
2.3.4YARN常用命令yarnjar32
2.3.5动手实践:运行MapReduce任务33
2.4Hadoop编程开发33
2.4.1HDFSJavaAPI操作33
2.4.2MapReduce原理35
2.4.3动手实践:编写Word Count程序并打包运行44
2.4.4MapReduce组件分析与编程实践46
2.5K—Means算法原理及Hadoop MapReduce实现53
2.5.1K—Means算法原理53
2.5.2动手实践:K—Means算法实现55
2.5.3Hadoop K
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价