• hadoop核心技术及其在灾减灾中的应用 大中专理科计算机 新华正版
21年品牌 40万+商家 超1.5亿件商品

hadoop核心技术及其在灾减灾中的应用 大中专理科计算机 新华正版

大中专理科计算机 新华书店全新正版书籍 支持7天无理由

49.75 7.2折 69 全新

库存3件

河北保定
认证卖家担保交易快速发货售后保障

作者作者

出版社北京交通大学出版社

ISBN9787512151536

出版时间2024-02

版次1

装帧平装

开本16开

页数340页

字数544千字

定价69元

货号xhwx_1203195995

上书时间2024-03-03

浩子书屋

八年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
主编:

"本书围绕“理论联系实际”的指导思想,在内容上对hadoop核心技术的阐述与典型实践作相辅相成,二者紧密结合、相互作用,形成完整的知识系统,具有连续、完整、一致。内容编排上读者在阅读过程中不断提出问题、分析问题、解决问题,进而达到循序渐进、抽丝剥茧剖析hadoop生态圈各组件的内在、运行机制和相互之间的联系,达到掌握、理解、应用hadoop核心技术的能力。对提高学兴趣、提升学效果、提高学质量具有重要的现实作用。"

目录:

目    录

章  大数据概述1
1.1  大数据的产生背景和发展历史1
1.1.1  大数据产生的背景2
1.1.2  大数据的发展历程3
1.2  大数据的特征4
1.2.1  数据量大4
1.2.2  数据类型繁多5
1.2.3  处理速度快6
1.2.4  价值密度低6
1.2.5  真实6
1.3  大数据的影响7
1.3.1  大数据对科学研究的影响7
1.3.2  大数据对思维方式的影响8
1.3.3  大数据对社会发展的影响9
1.3.4  大数据对业市场的影响10
1.3.5  大数据对人才培养的影响10
1.4  大数据关键技术11
1.5  大数据计算模式13
1.6  大数据的应用13
1.7  人工智能、大数据、物联网、云计算之间的关系14
本章小结15
题16
实验1.1  vmware虚拟机中安装centos系统16
第2章  hadoop概述及生态系统26
2.1  hadoop概述26
2.1.1  hadoop起源26
2.1.2  hadoop的发展简史27
2.1.3  hadoop的特29
2.1.4  hadoop的应用现状29
2.1.5  hadoop的版本30
2.2  hadoop生态系统31
2.2.1  hdfs31
2.2.2  hbase31
2.2.3  mapreduce32
2.2.4  hive32
2.2.5  pig32
2.2.6  mahout32
2.2.7  zookeeper32
2.2.8  flume33
2.2.9  sqoop33
2.2.10  ambari33
本章小结33
题34
实验2.1  centos 7集群环境配置34
第3章  分布式文件系统hdfs51
3.1  分布式文件系统介绍51
3.1.1  什么是dfs51
3.1.2  dfs集群架构52
3.1.3  分布式文件系统的结构52
3.2  hdfs简介53
3.2.1  hdfs概念53
3.2.2  hdfs体系结构53
3.2.3  hdfs命名空间54
3.2.4  hdfs通信协议54
3.2.5  hdfs客户端54
3.2.6  hdfs特点54
3.2.7  hdfs的局限55
3.3  hdfs主要组件56
3.3.1  数据块56
3.3.2  名称节点58
3.3.3  数据节点58
3.3.4  第二名称节点58
3.3.5  数据错误与恢复60
3.4  hdfs的数据读写过程61
3.4.1  hdfs读数据的过程61
3.4.2  hdfs写数据的过程62
本章小结63
题63
实验3.1  接近分布式文件系统搭建63
实验3.2  hdfs基本访问作71
第4章  hdfs 2.0新特93
4.1  hadoop的优化与发展93
4.1.1  hadoop 1.0的局限与不足93
4.1.2  针对hadoop的改进与提升94
4.2  hdfs 2.0的新特94
4.2.1  hdfs ha95
4.2.2  hdfs联邦96
本章小结97
题98
实验4.1  hdfs ha配置与api访问98
第5章  分布式计算框架mapreduce118
5.1  mapreduce概述118
5.1.1  mapreduce核心思想119
5.1.2  mapreduce编程模型120
5.1.3  mapreduce的特点121
5.1.4  mapreduce的应用场景121
5.2  mapreduce的工作122
5.2.1  mapreduce的执行过程122
5.2.2  map阶段工作123
5.2.3  shuffle过程详解123
5.2.4  reduce阶段工作126
5.3  典型实例:wordcount126
5.3.1  wordcount的程序任务126
5.3.2  wordcount的设计思路126
5.3.3  一个wordcount执行过程实例127
5.4  资源管理系统yarn128
5.4.1  yarn设计思想128
5.4.2  yarn体系结构129
5.4.3  yarn工作流程130
5.4.4  yarn的发展目标131
本章小结132
题132
实验5.1  mapreduce并行编程基础133
实验5.2  mapreduce应用实例139
第6章  数据仓库hive157
6.1  数据仓库简介157
6.1.1  什么是数据仓库157
6.1.2  数据仓库的结构158
6.2  hive基础159
6.2.1  什么是hive159
6.2.2  hive与传统数据库的区别160
6.2.3  hive与其他组件的关系160
6.2.4  hive的特点161
6.2.5  hive系统架构161
6.3  hive工作162
6.3.1  hive的数据类型162
6.3.2  hive的数据模型163
6.3.3  sql语句转换成mapreduce165
6.3.4  hive工作过程166
本章小结167
题167
实验6.1  数据仓库工具hive环境搭建168
实验6.2  数据仓库工具hive作183
第7章  分布式数据库hbase200
7.1  hbase简介200
7.1.1  什么是hbase200
7.1.2  hbase与传统关系型数据库的区别201
7.1.3  hbase访问接202
7.2  hbase数据模型202
7.2.1  hbase基本结构203
7.2.2  概念视图204
7.2.3  物理视图205
7.2.4  面向列的存储205
7.2.5  hbase数据模型206
7.3  hbase 的运行机制207
7.3.1  hbase系统架构207
7.3.2  表和region209
7.3.3  region的定位210
7.3.4  region服务器的工作211
7.3.5  store的工作212
7.3.6  hlog的工作212
本章小结213
题213
实验7.1  分布式数据库hbase的安装与作214
第8章  数据迁移工具sqoop231
8.1  sqoop简介231
8.1.1  什么是sqoop231
8.1.2  sqoop特点232
8.1.3  数据导入的方式232
8.2  sqoop工作机制232
8.2.1  sqoop基本架构232
8.2.2  sqoop import233
8.2.3  sqoop export234
本章小结235
题235
实验8.1  sqoop的安装与作235
第9章  志采集系统flume251
9.1  flume简介251
9.1.1  什么是flume252
9.1.2  flume的特点252
9.2  flume架构252
9.2.1  flume基本架构252
9.2.2  flume的主要组件253
9.2.3  复杂结构254
9.3  flume的数据传输255
9.3.1  source——event获取255
9.3.2  channel——event传输256
9.3.3  sink——event发送257
9.3.4  其他组件258
本章小结258
题259
实验9.1  志采集工具flume259
0章  nosql数据库280
10.1  nosql数据库简介280
10.1.1  什么是nosql数据库280
10.1.2  为什么用nosql数据库281
10.1.3  nosql与关系型数据库的比较282
10.2  nosql数据库分类283
10.2.1  键值对存储数据库283
10.2.2  列式存储数据库284
10.2.3  文档存储数据库284
10.2.4  图形存储数据库285
10.2.5  各类nosql数据库的比较286
10.3  nosql理论基石287
10.3.1  cap287
10.3.2  base289
10.3.3  终一致289
本章小结290
题290
实验10.1  monb的安装与作291
1章  数据可视化299
11.1  数据可视化简介299
11.1.1  数据可视化的发展299
11.1.2  什么是数据可视化302
11.1.3  视觉感知和数据可视化302
11.1.4  数据可视化的作用303
11.2  数据可视化工具303
11.2.1  入门级工具303
11.2.2  信息图表工具304
11.2.3  地图工具305
11.2.4  时间线工具305
11.2.5  分析工具306
本章小结307
题307
实验11.1  地震数据可视化307
参文献329

内容简介:

本书系统介绍了hadoop生态系统主要组件的基本概念、特点、主要组成、运行机制及存在的问题等内容。全书共11章,内容包含大数据基本概念、大数据处理台hadoop、分布式文件系统hdfs、hdfs2.0新特、分布式计算框架mapreduce、数据仓库hive、分布式数据库hbase、数据迁移工具sqoop、志采集系统flume、nosql数据库及数据可视化等内容。每一部分都有相应的实验指导,以便读者更好地学和掌握hadoop核心技术,进一步提高实践作能力。本书可作为高等院校大数据、计算机类、信息管理等专业大数据课程教材,也可作为相关技术人员参用书。

作者简介:

陈新房长期从事数据科学与大数据技术专业的工作,在过程中积累了大量的资料,具有丰富的经验,对课程结构、内容能够很好的把握,同时参加过相关培训,对当前高校hadoop核心技术的情况有的掌握。在多个学期教授hadoop核心技术与实战课程中查阅了大量相关资料和官方文档,收看了大量讲座,整理成文档形成讲义,这些讲义已经在9个班级使用了6轮,作达到预期结果,效果良好。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP