• Hadoop HDFS深度剖析与实践
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

Hadoop HDFS深度剖析与实践

正版书籍支持开票

57.42 5.8折 99 全新

库存16件

江苏无锡
认证卖家担保交易快速发货售后保障

作者祝江华 编著

出版社机械工业出版社

出版时间2023-05

版次1

装帧其他

货号文轩7.1

上书时间2024-07-01

  • 店主推荐
  • 最新上架

   商品详情   

品相描述:全新
图书标准信息
  • 作者 祝江华 编著
  • 出版社 机械工业出版社
  • 出版时间 2023-05
  • 版次 1
  • ISBN 9787111724797
  • 定价 99.00元
  • 装帧 其他
  • 开本 16开
  • 纸张 胶版纸
  • 页数 272页
  • 字数 428千字
【内容简介】
本书以Hadoop HDFS为载体,介绍了构建一款分布式系统(尤其是存储方向)所需的核心技术,所有内容均基于当前较新的3.3.x/3.4.x版本,分别从理论和实践两个维度逐一阐述。本书主要包括两篇:核心原理篇介绍了HDFS的诞生历史、元数据及Block管理、节点间通信机制、读写数据流程和高可用实现原理等;拓展与实践篇从实际出发,充分考虑了用户在应用过程中会遇到的痛点,详细介绍了集群拓展方法、数据分层存储、集群维护与多租户实施等实践经验。
  本书各章节都配有必要的流程图和原理分析图,便于读者阅读理解,并精选了非常有用的实际案例及拓展知识。阅读本书后,相信会给读者带来“1 1>2”的效果。
  本书非常适合大数据从业者、云计算领域研发及运维人员、高校研究生和热衷于分布式的技术极客阅读学习。
【作者简介】
祝江华,大数据技术专家。多年来一直供职于头部互联网公司,积累了较为丰富的大数据行业一线研发和集群维护经验;热爱开源,长期活跃在Apache开源社区,对包括Hadoop生态在内的多款组件有过深入研究;分布式技术极客,擅长分布式存储方向,同时对大数据计算、数据湖等也有丰富实战经验。
【目录】
第1篇 核心原理篇

第1章 HDFS历史延展/

1.1 分布式与文件系统/

1.1.1 分布式文件系统部署架构/

1.1.2 系统性能的影响因素/

1.2 HDFS设计及实现思想/

1.2.1 HDFS发展历史/

1.2.2 HDFS特性/

1.2.3 HDFS服务视图/

1.2.4 HDFS架构/

1.3 小结/

第2章 元数据架构/

2.1 内存Tree设计/

2.1.1 Namenode介绍/

2.1.2 Namenode启动/

2.1.3 meta视图/

2.1.4 FsDirectory和INodeMap/

2.1.5 文件维护/

2.2 FsImage和Edit Log/

2.2.1 FsImage分析/

2.2.2 Edit Log分析/

2.3 meta更新/

2.3.1 内存结构Update/

2.3.2 拓展:锁优化/

2.4 小结/

第3章 数据管理/

3.1 Namespace/

3.1.1 Namespace概况/

3.1.2 Namenode与Namespace/

3.1.3 DataNode与Namespace/

3.2 Slave节点/

3.2.1 Heartbeat机制/

3.2.2 FsDataset和DataStorage/

3.2.3 DataNode检查器/

3.2.4 存储类型/

3.2.5 拓展:NVDIMM/

3.3 Topology(Rack) Awareness/

3.3.1 Topology Awareness在分布式存储中的意义/

3.3.2 Topology Awareness在HDFS中实现/

3.3.3 Topology改进/

3.4 小结/

第4章 Block与副本/

4.1 理解Block/

4.1.1 Block构成解析/

4.1.2 副本存储解析/

4.2 Block状态管理/

4.2.1 UnderConstruction/

4.2.2 Committed/

4.2.3 Complete/

4.2.4 UnderRecovery/

4.2.5 Block状态小结/

4.3 副本状态管理/

4.3.1 RBW/

4.3.2 finalized/

4.3.3 RWR/

4.3.4 RUR/

4.3.5 Temporary/

4.3.6 副本状态小结/

4.4 Block管理/

4.4.1 无效Block/

4.4.2 损坏Block/

4.4.3 缺失与冗余Block/

4.4.4 Block Recovery/

4.5 副本策略/

4.5.1 位置策略/

4.5.2 选盘(Volume)策略/

4.5.3 选盘策略改进/

4.6 小结/

第5章 通信与访问/

5.1 HDFS RPC/

5.1.1 Protocol Buffers介绍/

5.1.2 RPC架构/

5.1.3 非幂等访问/

5.2 文件写入/

5.2.1 数据包(packet)与Pipeline/

5.2.2 数据写入/

5.2.3 Lease管理与pipeline Recovery/

5.3 数据访问/

5.3.1 文件读剖析/

5.3.2 short-circuit/

5.3.3 读写策略改进/

5.4 小结/

第6章 HA和QJM/

6.1 HA发展路径/

6.2 Quorum Journal Manager/

6.2.1 分布式一致性原理/

6.2.2 Edit共享存储系统/

6.2.3 QJM架构设计/

6.2.4 Edit Recovery/

6.3 HA原理/

6.3.1 ZKFC解析/

6.3.2 HA隔离机制/

6.3.3 Multi-Standby特性/

6.3.4 HA优化及改进/

6.4 小结/

第7章 缓存/

7.1 分布式系统缓存设计/

7.1.1 本地缓存/

7.1.2 分布式缓存/

7.2 集中式缓存管理/

7.2.1 原理介绍/

7.2.2 缓存调度/

7.2.3 DataNode缓存原理/

7.2.4 Cache&Uncache场景/

7.3 缓存实践场景及改进/

7.3.1 实践场景介绍/

7.3.2 集中式缓存V2/

7.4 小结/

第2篇 拓展与实践篇

第8章 集群拓展/

8.1 水平拓展/

8.1.1 水平拓展策略及实践/

8.1.2 Router-Based Federation/

8.2 垂直伸缩/

8.2.1 垂直伸缩策略及实践/

8.2.2 HDFS Quotas/

8.3 多Namespace业务规划/

8.4 小结/

第9章 数据分层/

9.1 存储分层的意义/

9.2 HDFS存储分层/

9.2.1 冷热集群分层管理/

9.2.2 异构分层存储/

9.2.3 动态感知数据类型/

9.3 纠删码(Erasure Coding)/

9.3.1 EC使用介绍/

9.3.2 常见EC算法介绍/

9.3.3 EC读写解析/

9.4 数据迁移/

9.4.1 DistCp迁移/

9.4.2 FastCopy迁移/

9.5 小结/

第10章 监控、多租户和数据湖/

10.1 大数据监控/

10.1.1 基础设施监控采集/

10.1.2 故障自愈/

10.2 多租户与认证/

10.2.1 多租户存储规划/

10.2.2 基于Kerberos的认证/

10.2.3 基于Delegation Token的认证/

10.3 HDFS与Data Lakes/

10.4 小结/
点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP