Hadoop大数据挖掘从入门到进阶实战
正版新书 新华官方库房直发 可开电子发票
¥
72.28
7.3折
¥
99
全新
库存4件
作者邓杰 编著
出版社机械工业出版社
ISBN9787111600107
出版时间2018-06
版次1
装帧平装
开本16开
纸张胶版纸
页数402页
定价99元
货号SC:9787111600107
上书时间2024-12-23
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
邓杰,博客园资历博主,资历大数据全栈开发者,极客学院大数据讲师,开源爱好者。善于开发大数据监控系统辅助日常工作,提升工作效率。开发了大数据自助类平台系统。开发并在GitHub上发布了Kafka系统监控管理工具Kafka Eagle,深受业内开发者的赞誉。作为极客学院特邀讲师,制作了多个技术视频,讲授Hadoop和Kafka等相关技术课程,广受学员好评。
精彩内容:
前言 大数据时代,数据的存储与挖掘至关重要。企业在追求高可靠性、高扩展性及高容错性的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案。 Hadoop在分布式计算与存储上具有先天优势。它作为Apache软件基金会的很好开源项目,其版本迭代持续至今,而且已经拥有一个非常活跃的社区和全球众多开发者,并且成为了当前非常流行的大数据处理平台。很多公司,特别是互联网公司,都纷纷开始使用或者已经使用Hadoop来做海量数据存储与数据挖掘。 Hadoop简单易学,其学习曲线平缓且学习周期短。它的操作命令和Linux命令非常相似。一个熟悉Linux的开发者只需要短短的一周时间,就可以学会Hadoop开发,完成一个高可用集群的部署和高可用应用程序的编写。 面对Hadoop的普及和学习热潮,笔者愿意分享自己多年的开发经验,带领读者比较轻松地掌握Hadoop数据挖掘的相关知识。这便是笔者编写本书的原因。本书使用通俗易懂的语言进行讲解,从基础部署到集群的管理,再到底层设计等内容均有涉及。通过阅读本书,读者可以较为轻松地掌握Hadoop大数据挖掘与分析的相关技术。 本书特色 1.提供专业的配套教学视频,高效、直观 笔者曾接受过极客学院的专业视频制作指导,并在极客学院录制过多期Hadoop和Kafka实战教学视频课程,得到了众多学习者的青睐及好评。为了便于读者更加高效、直观地学习本书内容,笔者特意为本书实战部分的内容录制了配套教学视频,读者可以在教学视频
...
内容简介:
本书采用“理论+实战”的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。本书共分为13章,涵盖的主要内容有:集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程——使用SQL提交MapReduce任务到Hadoop集群;游戏玩家的用户行为分析——特征提取;Hadoop平台管理与维护;Hadoop异常处理解决方案;初识Hadoop核心源码;Hadoop通信机制和内部协议;Hadoop分布式文件系统剖析;ELK实战案例——游戏应用实时日志分析平台;Kafka实战案例——实时处理游戏用户数据;Hadoop拓展——Kafka剖析。本书不但适合刚入门的初学者系统学习Hadoop的各种基础语法和开发技巧,而且也适合有多年开发经验的开发者进阶提高。另外,本书也适合社会培训机构和相关院校作为教材或者教学参考书。
目录:
前言
第1章 集群及开发环境搭建1
1.1 环境准备1
1.1.1 基础软件下载1
1.1.2 准备Linux操作系统2
1.2 安装Hadoop4
1.2.1 基础环境配置4
1.2.2 Zookeeper部署7
1.2.3 Hadoop部署9
1.2.4 效果验证21
1.2.5 集群架构详解24
1.3 Hadoop版Hello World25
1.3.1 Hadoop Shell介绍25
1.3.2 WordCount初体验27
1.4 开发环境28
1.4.1 搭建本地开发环境28
1.4.2 运行及调试预览31
1.5 小结34
第2章 实战:快速构建一个Hadoop项目并线上运行35
2.1 构建一个简单的项目工程35
2.1.1 构建Java Project结构工程35
2.1.2 构建Maven结构工程36
2.2 操作分布式文件系统(HDFS)39
2.2.1 基本的应用接口操作39
2.2.2 在高可用平台上的使用方法42
2.3 利用IDE提交MapReduce作业43
2.3.1 在单点上的操作43
2.3.2 在高可用平台上的操作46
2.4 编译应用程序并打包51
2.4.1 编译Java P
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价