¥ 2.76 八五品
库存10件
作者朱晓彦、方明清、李强 著
出版社中国铁道出版社
出版时间2020-09
版次1
装帧平装
货号9787113271947
上书时间2024-12-20
本书是大数据技术与应用专业校企合作系列教材之一,采用模块化的编写思路,内容包括Hive概述、环境准备、Hadoop搭建和配置、安装Hive的基础操作、HiveQL的数据定义、HiveQL语句、Hive综合应用7个单元和25个教学任务。每个单元通过学习目标引出单元的教学核心内容,明确教学任务。每个任务的编写分为任务目标、知识学习、任务实施、同步训练4个环节。最后通过单元小结回顾每个单元的学习重点。
本书适合作为高职院校软件技术、大数据技术及应用专业,以及计算机类相关专业的教材,也可以作为Hive爱好者的参考用书。
朱晓彦,安徽工业经济职业技术学院;方明清,珠海城市职业技术学院;李强,珠海城市职业技术学院
单元1 Hive概述1
任务1.1 Hive的产生背景1
1 Hive的产生背景2
2 Hive的发展历史和现状4
3 Hive与Hadoop4
任务1.2 Hive的概念9
1 Hive的系统与部署架构9
2 Hive与RDBM对比12
3笔据仓库的理解12
4 Hive的数据模型15
5 HiveQL与数据存储16
任务1.3 Hadoop生态与Hive20
1 Pig20
2 HBase21
单元小结25
单元2 环境准备26
任务2.1 VMware与SecureCRT Portable26
1 VMware简介26
2 VMware的虚拟化27
任务2.2 JDK的配置37
1 JDK的简介37
2 JDK的版本37
3鄙洗JDK的介质37
4 tar的解压与压缩37
任务2.3 免密登录41
1 免密登录用户41
2泵饷艿锹嫉挠诺42
单元小结46
单元3 Hadoop搭建和配置47
任务3.1 Hadoop搭建47
1鄙洗Hadoop的介质47
2苯庋Hadoop压缩包48
3迸渲Hadoop的环境变量48
4迸渲Hadoop环境变量48
5毙薷Hadoop的配置文件49
6逼舳Hadoop服务51
7奔觳Hadoop的成功52
任务3.2 Hadoop配置57
1 Hadoop简介57
2 MapReduce综述61
单元小结70
单元4 安装Hive的基础操作71
任务4.1 Hive的模式71
1北镜啬J72
2痹冻棠J72
3蹦谇赌J73
任务4.2 安装Hive实验88
1 Hive简介88
2 Hive的定义88
3鄙杓铺卣88
4笔据存储89
任务4.3 Hive命令95
1贝唇ū碛锞95
2奔釉厥据96
3备谋浔98
4碧婊101
5鄙境表102
6狈智103
任务4.4 Hive命令行界面107
1 CLI选项107
2北淞亢褪粜111
3痹Hive内使用Hadoop的DFS命令112
任务4.5 数据类型和文件格式114
1被本数据类型114
2蔽募格式116
3毖顾醣嗦119
4奔合数据类型121
任务4.6 Hive权限管理125
1笨启权限126
2比ㄏ薏僮128
任务4.7 Hive常用优化方法137
1笨刂Reducer数量137
2笔褂Map Join138
3笔褂distinct+union all 代替union139
4苯饩鍪据倾斜的通用方法140
单元小结141
单元5 HiveQL的数据定义143
任务5.1 HiveQL的数据定义143
1 HiveQL的数据定义143
2 HiveQL和SQL的区别146
任务5.2 Hive数据库150
1 Hive的数据库150
2毙薷氖据库属性151
任务5.3 修改表157
1痹黾印⑿薷暮蜕境表分区157
2北碇孛名157
3痹黾恿157
4鄙境或者替换列157
5毙薷谋硎粜158
6毙薷拇娲⑹粜158
7毙薷谋碛锞158
单元小结162
单元6 HiveQL语句163
任务6.1 SELECT、FROM语句的概念163
1笔褂谜则表达式来指定列163
2笔褂昧兄到行计算165
3彼闶踉怂惴165
4笔褂煤数168
5 LIMIT语句169
6绷械谋鹈169
7 CASE、WHEN、THEN句式169
8鼻短SELECT语句172
任务6.2 GROUP BY178
任务6.3 抽样查询180
1笔据块抽样180
2狈滞氨淼氖淙氩眉180
任务6.4 WHERE语句181
1蔽接锊僮鞣182
2备〉闶比较183
任务6.5 JOIN语句184
1 JOIN优化185
2 LEFT OUTER JOIN186
3 INNER JOIN187
4 FULL OUTER JOIN189
5 LEFT SEMIJOIN189
6 RIGHT OUTER JOIN190
7 OUTER JOIN190
8钡芽ǘ积JOIN191
9 mapsidejoin192
单元小结194
单元7 Hive综合应用195
任务7.1 Hive和亚马逊网络服务系统(AWS)195
1钡性MapReduce的优点196
2弊⒁馐孪196
3 EMR上的实例196
任务7.2 Hive综合案例199
1 Hive操作演示199
2苯灰资据演示207
单元小结227
参考文献228
— 没有更多了 —
以下为对购买帮助不大的评价