全新正版 极速发货
¥ 22.7 4.6折 ¥ 49 全新
库存2件
作者陈建平 陈岸青 李金湖
出版社清华大学出版社
ISBN9787302602149
出版时间2022-04
装帧平装
开本16开
定价49元
货号31426779
上书时间2024-11-18
大数据(Big Data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。现在的各个行业都依赖于大量数据的支撑,数据量也越来越庞大,关系型数据库海量数据读写性能差、灵活度欠缺等缺点也暴露出来。因此,大量NewSQL数据库在这个背景下诞生并被广泛应用,其中HBase就是这样的一个分布式、可扩展的数据存储系统。HBase于2006年年底由PowerSet的Chad Walters和Jim Kellerman发起,2008年成为Apache Hadoop的一个子项目,现在已作为成熟产品应用在淘宝、百度、天猫、菜鸟、阿里云、高德、优酷等多家知名互联网企业,满足业务对于大数据分布式存储的基本需求。它不同于关系型数据库着重于增、删、改,而转向着重于查询,使数据读取更加高效、安全。基于Hadoop生态,HBase使用HDFS分布式存储系统作为共享文件存储系统。
HBase技术来源于Fay Chang所撰写的论文Google BigTable,是BigTable的开源实现。HBase在Hadoop上提供了BigTable的功能,现已成为Apache开源项目的一个项目。
在Hadoop生态圈中,HBase位于结构化存储层,HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,ZooKeeper为HBase提供了稳定的failover(故障转移)机制。此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变得非常简单,Sqoop则为HBase提供了方便的关系型数据库数据导入功能。HBase在Hadoop生态圈中的地位可见一斑。
HBase和Hadoop一样,目标是通过横向扩展,添加普通机器来提高存储性能和计算性能。HBase特点:大(一个表可以有上亿行以及百万级的列)、面向行存储、稀疏(由于null不占用存储空间,所以表结构可以设计得非常稀疏)。因此,HBase和 Hadoop一样,目标是通过横向扩展,添加普通机器来提高存储性能和计算性能。
关于本书
本书定位是HBase从入门到应用的简明系统教材,特色是理论和实践相结合,更多的是以实战为主,内容全面、深入浅出地讲解每个知识点,尽力做到通俗易懂。对每个案例进行分步骤式讲述,每个步骤都有文字说明和效果截图,使读者能够清晰地知晓自己在动手实操过程的效果和错误之处,对问题一目了然。例如,在5.5节的话单表分析案例中,通过“预分区建立话单表”→“添加话单表项目数据”→“Java编写代码和Shell命令行进行查询操作”这种方式,详细展开教与学,充分发挥学生学习的自主性。
本课程采用了“案例贯穿式”“问题导向教学法”等教学方法,每个学习情境中的教学案例都基于一个真实的工作项目或实例。例如,后一章就展开了从基础数据到可视化数据的真实案例 教学。
本书分为8章,全书由陈建平进行统稿工作。第1章由陈建平撰写,着重介绍非关系型数据库的原理以及优缺点;第2章由陈岸青撰写,着重介绍HBase的基本架构和各个组件,其中包括HMaster、HBase Client、ZooKeeper、HRegionServer;第3章由李金湖编写,着重介绍HBase的接口以及使用Java操作HBase;第4章由邓维编写,着重介绍MapReduce与HBase之间的联系和使用;第5章由余仰淇编写,着重介绍HBase的表设计;第6章由许梓明编写,着重介绍Hive和HBase的整合和使用;第7章由王斌编写,着重介绍HBase的表属性版本和BlockCache配置;第8章由马汉斌编写,整合了HBase与Hadoop生态,介绍了一个完整的大数据实践案例。全书提供与章节内容配套的案例,重点章节配有习题。
本书适合的读者
本书适合HBase初学者、对大数据感兴趣的技术人员,以及想要从事大数据开发工作的人员。
本书也适合作为大数据技术中HBase案例的基础用书,适合作为中职、高职、应用型本科大数据技术的前导课程,在整个人才培养方案里面属于大数据的专业基础课程,建议授课时间为第2学期或者第3学期。
阅读本书之前,读者应该具有如下基础:有一定计算机网络基础知识;了解 Linux基本原理;掌握基本的Linux操作命令;了解Java编程语言;了解传统的数据库理论知识。
资源下载与答疑服务
本书配套资源包括课程标准、课程大纲、教学日历、教学课件PPT、实训手册、课后习题和答案、期末考试卷和答案、案例环境、教学视频。这些资源非常方便各高校教师的授课。
本书配套资源,需要使用微信扫描右边二维码下载,可按页面提示,把链接转发到自己的邮箱中下载。如果下载有问题或者学习中发现问题,请联系booksaga@163.com,邮件主题为“分布式数据库HBase案例教程”。
大数据技术的发展非常快速,HBase的相关新用法也在不断发现,在今后的工作中,笔者以及本书的技术支持官网(德明教育官网)会持续跟踪HBase发展趋势,把HBase技术和本书相关补充资料及时发布到技术支持官网,方便读者通过网络及时获取到信息。由于笔者能力有限,书中难免存在不足之处,望广大读者能够提出宝贵意见。
大数据技术专家 陈岸青
2022年1月
本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频、习题及答案以及其他丰富的教学 资源。 本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。 本书既适合HBase初学者、大数据分析与挖掘初学者阅读,也适合作为高等院校和培训机构人工智能、大数据等相关专业师生的教学参考书。
本书通过案例讲解分布式数据库HBase,体系结构清晰,内容系统全面、通俗易懂、注重操作。本书配套丰富的教学资源,适合大数据分析与开发的初学者以及对大数据感兴趣的技术人员,也适合作为高等院校大数据专业课的前导课程。
— 没有更多了 —
以下为对购买帮助不大的评价