Hive编程技术与应用(第2版普通高等教育数据科学与大数据技术专业教材)
全新正版 极速发货
¥
20.35
5.7折
¥
36
全新
仅1件
作者张铁红,张继山,那锐
出版社中国水利水电出版社
ISBN9787522611709
出版时间2023-02
装帧平装
开本16开
定价36元
货号1202811301
上书时间2024-05-26
商品详情
- 品相描述:全新
- 商品描述
-
目录
再版前言
第1章 Hive介绍
1.1 Hive的工作原理
1.2 Hive的数据类型
1.3 Hive的特点
本章小结
习题1
第2章 Hive架构
2.1 Hive用户接口
2.1.1 Hive CLI
2.1.2 HWI
2.1.3 Thrift服务
2.2 Hive元数据库
2.2.1 Hive元数据表结构
2.2.2 Hive元数据的三种存储模式
2.3 Hive数据存储
2.4 Hive文件格式
2.4.1 TextFile格式
2.4.2 SequenceFile格式
2.4.3 RCFile格式
2.4.4 ORC格式
本章小结
习题2
第3章 HiveQL表操作
3.1 内部表
3.2 外部表
3.3 分区表
3.3.1 静态分区
3.3.2 动态分区
3.4 桶表
3.5 视图
3.5.1 使用视图降低查询复杂度
3.5.2 使用视图来限制基于条件过滤的数据
3.5.3 动态分区中的视图和map类型
本章小结
习题3
第4章 HiveQL数据操作
4.1 装载数据到表中
4.2 通过查询语句向表中插入数据
4.3 单个查询语句中创建并加载数据
4.4 导出数据
本章小结
习题4
第5章 HiveQL查询
5.1 select...from语句
5.1.1 使用正则表达式来指定列
5.1.2 使用列值进行计算
5.1.3 算术运算符
5.1.4 函数
5.1.5 limit语句
内容摘要
本书通过原理加案例的方式系统地讲解了Hive编程技术,使读者能够全面地了解使用Hive的开发流程。书中精心安排了Hive的原理分析、架构特点、环境搭建、
HiveQL使用等内容,给出了大量的开发案例及其开发过程,使读者对Hive开发有直观的印象。
全书共10章:第1~7章系统讲解Hive工作原理、特点,Hive架构,HiveQL表操作,HiveQL数据操作,HiveQL查询,Hive配置与应用,Hive自定义函数;第8~10章是综合案例部分,通过案例帮助读者掌握整个大数据项目的开发流程,包括数据清洗、数据处理、数据导入与导出。本书知识结构简单明了,案例生动具体,内容设计新颖,思路清晰。
本书不仅可作为普通高校大数据相关专业的教材,也可以作为想继续深入了解大数据编程的读者的参考书,还可作为各类相关培训班的培训教材。
— 没有更多了 —
以下为对购买帮助不大的评价