• HBASE 原理与实践
21年品牌 40万+商家 超1.5亿件商品

HBASE 原理与实践

全新正版 极速发货

72.06 5.6折 129 全新

库存8件

广东广州
认证卖家担保交易快速发货售后保障

作者胡争 范欣欣

出版社机械工业出版社

ISBN9787111634959

出版时间2019-09

装帧其他

开本16开

定价129元

货号1201944679

上书时间2024-12-03

大智慧小美丽

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
胡争,小米公司HBase工程师,Apache HBase PMC成员,负责Apache HBase项目研发及小米HBase集群维护,对HBase及相关分布式存储有很多独到的见解。开源技术爱好者,长期活跃在Apache开源社区,热衷技术分享,博客地址为http://openinx.github.io。

目录
前  言章  HBase概述  11.1  HBase前生今世  11.2  HBase数据模型  41.2.1  逻辑视图  41.2.2  多维稀疏排序Map  51.2.3  物理视图  71.2.4  行式存储、列式存储、列簇式存储  71.3  HBase体系结构  91.4  HBase系统特性  11第2章  基础数据结构与算法  132.1  跳跃表  142.2  LSM树  172.3  布隆过滤器  212.4  设计KV存储引擎MiniBase  25第3章  HBase依赖服务  343.1  ZooKeeper简介  343.2  HBase中ZooKeeper核心配置  373.3  HDFS简介  393.4  HBase在HDFS中的文件布局  44第4章  HBase客户端  484.1  HBase客户端实现  484.1.1  定位Meta表  514.1.2  Scan的复杂之处  534.2  HBase客户端避坑指南  57第5章  RegionServer的核心模块  635.1  RegionServer内部结构  635.2  HLog  645.2.1  HLog文件结构  645.2.2  HLog文件存储  655.2.3  HLog生命周期  665.3  MemStore  675.3.1  MemStore内部结构  685.3.2  MemStore的GC问题  685.3.3  MSLAB内存管理方式  695.3.4  MemStore Chunk Pool  715.3.5  MSLAB相关配置  725.4  HFile  725.4.1  HFile逻辑结构  735.4.2  HFile物理结构  745.4.3  HFile的基础Block  755.4.4  HFile中与布隆过滤器相关的Block  775.4.5  HFile中索引相关的Block  795.4.6  HFile文件查看工具  815.4.7  HFile V3版本  835.5  BlockCache  845.5.1  LRUBlockCache  845.5.2  SlabCache  865.5.3  BucketCache  86第6章  HBase读写流程  936.1  HBase写入流程  936.1.1  写入流程的三个阶段  936.1.2  Region写入流程  966.1.3  MemStore Flush  986.2  BulkLoad功能  1046.2.1  BulkLoad核心流程  1046.2.2  BulkLoad基础案例  1056.3  HBase读取流程  1076.3.1  Client-Server读取交互逻辑  1086.3.2  Server端Scan框架体系  1096.3.3  过滤淘汰不符合查询条件的HFile  1126.3.4  从HFile中读取待查找Key  1126.4  深入理解Coprocessor  1156.4.1  Coprocessor分类  1166.4.2  Coprocessor加载  118第7章  Compaction实现  1207.1  Compaction基本工作原理  1207.1.1  Compaction基本流程  1227.1.2  Compaction触发时机  1237.1.3  待合并HFile集合选择策略  1247.1.4  挑选合适的执行线程池  1257.1.5  HFile文件合并执行  1267.1.6  Compaction相关注意事项  1277.2  Compaction不错策略  128第8章  负载均衡实现  1338.1  Region迁移  1338.2  Region合并  1378.3  Region分裂  1378.4  HBase的负载均衡应用  144第9章  宕机恢复原理  1479.1  HBase常见故障分析  1479.2  HBase故障恢复基本原理  1489.3  HBase故障恢复流程  1499.4  HBase故障时间优化  1540章  复制  15810.1  复制场景及原理  15810.1.1  管理流程的设计和问题  15910.1.2  复制原理  16110.2  串行复制  16410.2.1  非串行复制导致的问题  16410.2.2  串行复制的设计思路  16610.3  同步复制  16710.3.1  设计思路  16810.3.2  同步复制和异步复制对比  1711章  备份与恢复  17311.1  Snapshot概述  17311.2  Snapshot创建  17511.2.1  Snapshot技术基础原理  17511.2.2  在线Snapshot的分布式架构—两阶段提交  17611.2.3  Snapshot核心实现  17811.3  Snapshot恢复  17911.4  Snapshot进阶  1812章  HBase运维  18412.1  HBase系统监控  18412.1.1  HBase监控指标输出方式  18412.1.2  HBase核心监控指标  18512.1.3  HBase表级监控  18712.2  HBase集群基准性能测试  18912.3  HBase YCSB  19212.4  HBase业务隔离  19412.5  HBase HBCK  19512.6  HBase核心参数配置  19812.7  HBase表设计  20312.8  Salted Table  2063章  HBase系统调优  20913.1  HBase GC调优  20913.2  G1 GC性能调优  21113.3  HBase操作系统调优  22313.4  HBase-HDFS调优策略  22813.5  HBase读取性能优化  23013.5.1  HBase服务器端优化  23113.5.2  HBase客户端优化  23213.5.3  HBase列簇设计优化  23313.6  HBase写入性能调优  23313.6.1  HBase服务器端优化  23413.6.2  HBase客户端优化  2354章  HBase运维案例分析  23714.1  RegionServer宕机  23714.2  HBase写入异常  24114.3  HBase运维时问题分析思路  2505章  HBase 2.x核心技术  25315.1  Procedure功能  25315.2  In Memory Compaction  26815.3  MOB对象存储  27315.4  Offheap读路径和Offheap写路径  27715.5  异步化设计  2836章  不错话题  28916.1  二级索引  28916.2  单行事务和跨行事务  29316.3  HBase开发与测试  30116.3.1  HBase社区运作机制  30116.3.2  项目测试  303附录A  HBase热门问题集锦  308

内容摘要
本书系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。主要内容包括:HBase的体系结构和系统特性,HBase的基础数据结构与算法、依赖服务、客户端,RegionServer的核心模块,HBase的读写流程,Compaction实现原理和使用策略,负载均衡的实现与应用,HBase的宕机恢复原理,复制、备份与恢复原理,HBase的运维方法、系统调优与案例分析,*后介绍了HBase 2.x的核心技术以及一些不错话题,如二级索引、单行事务和跨行事务、HBase开发与测试等。

主编推荐
这是一本深入介绍HBase系统的书籍,由HBase PMC成员与网易工程师倾力打造,多位技术专家联袂推荐。本书不仅用大量图片详细解剖HBase内核,还用案例展示了HBase的开发运维技巧,是一本不可能多得的高质量图书,值得每一位大数据开发运维人员放在案头深读。

精彩内容
Apache HBase是基于Apache Hadoop构建的一个高可用、高性能、多版本的分布式NoSQL数据库,是Google BigTable的开源实现,通过在廉价服务器上搭建大规模结构化存储集群,提供海量数据高性能的随机读写能力。HBase项目自2006年提交行代码以来,经历了13年的蓬勃发展。现在已经有大量企业采用HBase来存储和分析飞速增长的业务数据。从全球范围来看,国内HBase的关注度更是高居榜首,这得益于国内互联网、移动互联网、物联网等领域庞大的数据体量。诸多国内大型科技公司,如阿里巴巴、小米、腾讯、网易、华为、滴滴、快手、中国移动等,都已经把HBase作为极重要的基础设施,很多公司对HBase社区也有长期的投入。截至2019年8月,HBase全球社区已经拥有了83位HBase Committer,而国内就有20位左右的Committer,占了近1/4的比例。近一两年,HBase在国内更是得到了长足的发展,2018年中国HBase技术社区成立,一年时间里社区在多个城市相继组织了9次线下技术沙龙活动,为HBase更好地在国内各公司茁壮成长做出了卓越的贡献。我们和社区用户多次交流后发现,很多人都希望我们能推荐一本HBase的书。当前市面上有关HBase的书籍大部分都集中于如何使用HBase,例如部署HBase集群,使用客户端API进行读写操作以及协处理器等,诚然,这些内容对快速掌握和使用HBase非常有好处,但是许多HBase使用者并不满足于此,他们更希望能了解和掌握其内部运行原理。因此,当机械工业出版社的吴怡编辑询问我们是否有想法为HBase写一本书时,我们毫不犹豫地答应了。本书从设计的角度对HBase的整个体系架构和各核心组件进行系统的分析和讲解。与此同时,还介绍常用的性能调优策略以及问题诊断的方法和技巧,帮助读者更好地在实际生产环境中实践。另外,本书最后章节集中介绍HBase 2.x版本的核心特性,例如Procedure v2、In Memory Compaction以及MOB等。本书主要内容本书不是一本入门级读物,本书面向那些使用HBase作为数据库后端存储的应用程序开发者、有一定经验的运维人员和对HBase内核设计感兴趣的人。如果你想深入了解HBase的每个组件是如何工作的,如果你想更好地运维或者调优你的HBase集群,如果你想了解HBase 2.x版本的核心特性,就请阅读本书。想要更好地阅读本书,需要具备如下先决条件:了解HBase的基本操作。了解C、Java等不错语言。对一些基本算法有所了解,因为本书会从源代码层面分析HBase的工作机制,如果你能了解这些算法,会使你更深入地理解HBase。本书共有16章,可以分为6个部分。部分:HBase基础部分,包含、2章。其中,章主要介绍HBase系统的发展历史、数据模型以及体系结构,第2章主要介绍HBase系统中常用的数据结构以及基础算法。第二部分:HBase系统相关组件,包含第3、4、5章。其中,第3章重点介绍HBase所依赖的核心组件,包括ZooKeeper、HDFS等,第4章介绍HBase客户端组件实现,第5章介绍RegionServer内部组件的实现。第三部分:HBase核心工作原理,包含第6、7、8、9、10、11章。其中,第6章详细分析HBase读写流程,第7章介绍HBase Compaction的实现原理,第8章介绍HBase中Region的迁移、合并以及分裂等操作是如何实现的,第9章介绍RegionServer宕机后如何通过HLog进行数据恢复,0章介绍HBase不同集群之间的复制是如何实现的,1章介绍HBase如何通过Snapshot机制完成数据的备份和恢复。第四部分:HBase运维调优实践,包含2、13、14章。其中,2章介绍HBase集群常用的运维管理操作,包括集群如何有效监控,基准性能如何测试等,3章集中介绍HBase集群的常用调优技巧,4章重点分析几个HBase实际运维案例,通过案例分析介绍HBase集群定位和处理问题的技巧。第五部分:HBase 2.x核心特性(5章),介绍HBase最新2.x版本的核心功能与特性。第六部分:HBase不错话题(6章),介绍社区中比较热门的二级索引话题,以及HBase内核的开发与测试。本书的六个部分都是相互独立的话题,读者完全可以从书中任何一个部分开始阅读。当然,如果你想更加系统地学习HBase,建议你从前往后逐章阅读。致谢在编写本书的过程中,我们非常感谢给予了我们如此多帮助和鼓励的朋友、家人以及同事们。首先感谢HBase官方社区的开发者,是他们极其卓越的工作让我们有机会写这样一本书。另外,还要感谢许许多多中国HBase技术社区的小伙伴,感谢他们提供丰富的HBase使用场景和相关解决方案,他们的经验和分享对推广和普及HBase项目做出了重大贡献。同时感谢我们的家人,没有他们的鼓励和支持,本书不可能完成。最后,一份特别的感谢要送给本书策划编辑吴怡,感谢她在全书撰写过程中所给予的详细指点以及有用的建议。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP