大数据实践
正版新书 新华官方库房直发 可开电子发票
¥
43.5
7.5折
¥
58
全新
库存4件
作者袁晓东 主编
出版社清华大学出版社
ISBN9787302494256
出版时间2018-06
版次1
装帧平装
开本16开
纸张胶版纸
页数222页
字数261千字
定价58元
货号SC:9787302494256
上书时间2024-09-18
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
袁晓东,数据库和大数据专家,1998年毕业于南京大学计算机系,获软件博士学位。曾任职于Oracle公司纽约分部、趋势科技南京研发中心,现为南京市领军型科技创业人才,云白科技创始人,江苏省计算机学会软件专委会委员,东南大学研究生院校外导师。
内容简介:
本书内容涵盖了目前使用很为广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和Spark SQL,详细介绍了它们的架构、工作原理、部署方法、常用配置、常用操作命令、SQL引擎等内容。本书对上述几大系统的各种安装部署方式给出了详细步骤,常用命令也都有具体示例介绍,是一本实操性很强的工具书,能帮助初学者快速掌握这几款常用的大数据处理系统。 本书以浅显易懂的语言风格和图文并茂的操作示例引领读者迈入大数据实践之门,可以作为培养应用型人才的课程教材,也可作为开发人员的自学教材和参考手册。
目录:
第1章大数据概述
1.1从数据库到大数据库1
1.1.1关系型数据库1
1.1.2大数据库2
1.2大数据库的类型4
1.3大数据库的应用5
习题18
参考文献8
第2章Hadoop基础
2.1Hadoop简介9
2.2Hadoop部署14
2.2.1单节点部署14
2.2.2伪分布式部署18
2.2.3集群部署25
2.3Hadoop常用命令33
2.3.1用户命令33
2.3.2管理命令35
2.3.3启动/关闭命令36
2.4HDFS常用命令38
2.4.1用户命令38
2.4.2管理命令39
实验1Hadoop实验41
习题242
参考文献42
第3章Hadoop数据库HBase
3.1HBase简介43
3.1.1体系架构43
3.1.2数据模型46
3.1.3主要特性51
3.2HBase部署51
3.2.1准备工作51
3.2.2单节点部署53
3.2.3伪分布式部署55
3.2.4集群部署57
3.2.5版本升级61
3.3HBase配置63
3.3.1配置文件63
3.3.2主要配置项65
3.3.3配置建议69
3.3.4客户端配置72
3.4HBaseShell72
3.4.1交互模式73
3.4.2非交互模式82
3.5HBase模式设计84
3.5.1设计准则84
3.5.2列族属性88
3.5.3表属性91
3.5.4设计实例94
3.6HBase安全97
3.
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价