• Hive数据仓库案例教程
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

Hive数据仓库案例教程

买书,就上二手书海官方企业店,清仓处理,真实库存,特价正版,收藏店铺,优先发货! ps:下午三点之前的订单当天发货,之后明天发货,特殊情况除外。

5.96 1.3折 45 八五品

库存324件

河南鹤壁
认证卖家担保交易快速发货售后保障

作者王剑辉

出版社电子工业出版社

出版时间2021-08

版次1

装帧其他

货号wk-730183

上书时间2024-10-05

二手书海官方企业店

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:八五品
正版二手,几十万种图书无法都提供实拍图,但均为7-9成新,无缺页、会有瑕疵或者少许磨损 、或多或少都会有划线、笔记、涂写等,不影响使用。均不保证有光盘、卡片等,辅导习题类笔记较多;书籍有多封面的新老封面随机发货,内容一致,不影响使用,介意勿拍!图片孔网自动匹配,图片与标题不符时以及图片为套装,与标题不符时的下单前请咨询客服,望周知!
图书标准信息
  • 作者 王剑辉
  • 出版社 电子工业出版社
  • 出版时间 2021-08
  • 版次 1
  • ISBN 9787121418068
  • 定价 45.00元
  • 装帧 其他
  • 开本 16开
  • 页数 200页
  • 字数 320千字
【内容简介】


本书系统介绍hive数据仓库的相关知识和技术。全书共12章,主要内容包括hive数据仓库基础、hive环境搭建、hive基础、hive数据定义、hive数据作、hql查询、hive函数、hive数据压缩、hive优化、hive综合案例和上机实验等。本书知识结构简单明了,案例生动具体,内容设计新颖。本书费提供大纲、电子课件和所有案例源代码,书后附有部分题参。本书可作为普通高校数据科学与大数据相关专业的教材,也可作为想继续深入了解大数据存储和开发的读者的参书,还可作为各类大数据相关培训的教材。
【目录】

章  Hive数据仓库基础t11.1  数据仓库t11.1.1  数据仓库的概念t11.1.2  数据仓库的特点 t31.1.3  数据仓库的数据模型t31.1.4  数据仓库的体系结构t41.2  Hive数据仓库t51.3  Hive体系结构及执行流程t61.3.1  Hive体系结构t61.3.2  Hive执行流程t81.4  Hive数据仓库和数据库比较t8习题1t10第2章  Hive环境搭建t122.1  Hive安装及配置t122.1.1  Hive的安装模式t122.1.2  Hive安装及配置过程t122.1.3  Hive基本操作t142.2  MySQL安装及配置t152.2.1  MySQL安装包准备t152.2.2  MySQL服务器端安装t152.2.3  MySQL客户端安装t162.3  Hive元数据配置t162.3.1  驱动复制t162.3.2  配置元数据到MySQLt162.3.3  多终端启动Hivet172.4  Hive BC连接t182.4.1  HiveServer2配置t182.4.2  HiveServer2启动t182.4.3  Beeline启动t182.4.4  HiveServer2连接t192.5  Hive常见属性配置t192.5.1  Hive位置配置t192.5.2  信息显示配置t192.5.3  运行日志信息配置 t202.5.4  Hive参数配置方式 t20习题2 t21第3章  Hive基础 t233.1  Hive数据类型 t233.1.1  基本数据类型 t233.1.2  复杂数据类型 t243.1.3  数据类型转换 t243.2  Hive运算符 t253.2.1  算术运算符 t253.2.2  比较运算符 t253.2.3  逻辑运算符 t263.2.4  复杂运算符 t263.3  Hive数据存储 t273.4  Hive表存储格式 t273.4.1  行式存储和列式存储t283.4.2  TextFile格式t283.4.3  SequenceFile格式t283.4.4  ORC格式t293.4.5  Parquet格式t293.5  Hive常用交互命令t303.6  Hive其他操作命令t31习题3t31第4章  Hive数据定义t344.1  数据仓库的创建t344.2  数据仓库的查询t354.2.1  显示数据仓库t354.2.2  查看数据仓库详情t354.2.3  切换数据仓库t354.3  数据仓库的修改t354.4  数据仓库的删除t364.5  表的创建t364.5.1  内部表t374.5.2  外部表t404.5.3  内部表和外部表的转换t424.6  分区表t424.6.1  分区表基本操作t434.6.2  二级分区表创建t454.7  桶表t464.8  表的修改t484.8.1  重命名t484.8.2  增加和删除分区t484.8.3  修改、增加和替换列t494.9  表的删除t514.10  视图t52习题4t57第5章  Hive数据操作t605.1  数据导入t605.1.1  Load加载数据t605.1.2  Insert插入数据t615.1.3  As Select加载数据t635.1.4  Location加载数据t635.1.5  Import加载数据t645.2  数据导出t645.2.1  Insert语句导出t645.2.2  Hadoop命令导出t655.2.3  Hive Shell命令导出t655.2.4  Export语句导出t655.2.5  Sqoop导出t65习题5t66第6章  HQL查询t686.1  Select基本查询t686.1.1  全表和特定列查询t686.1.2  列的别名t696.1.3  Limit语句t696.2  Where语句t696.2.1  Like的使用t716.2.2  Rlike的使用t726.3  分组语句t746.3.1  Group By语句t746.3.2  Having语句t746.4  Join语句t756.4.1  等值连接t756.4.2  表的别名t766.4.3  内连接t766.4.4  左外连接t766.4.5  右外连接t766.4.6  满外连接t766.4.7  左半连接t776.4.8  多表连接t776.4.9  笛卡儿积Joint786.5  排序t796.5.1  Order By全局排序t796.5.2  字段别名排序t806.5.3  多字段排序t816.5.4  Sort By内部排序t816.5.5  Distribute By分区排序t836.5.6  Cluster By排序t836.6  抽样查询t846.6.1  桶表抽样查询t846.6.2  数据块抽样查询t856.6.3  随机抽样查询t87习题6t87第7章  Hive函数t897.1  Hive内置函数t897.1.1  数值计算函数t897.1.2  聚合函数t907.1.3  日期时间函数t917.1.4  条件函数t927.1.5  字符串处理函数t937.1.6  内置函数查看命令t967.2  其他常用函数t967.2.1  空字段赋值函数t967.2.2  列转行函数t977.2.3  窗口函数t1007.2.4  排序函数t1067.3  自定义函数t1087.3.1  UDF函数t1087.3.2  UDTF函数t1107.3.3  UDAF函数t112习题7t113第8章  Hive数据压缩t1168.1  数据压缩格式t1168.2  Hadoop压缩配置t1178.2.1  Snappy压缩方式配置t1178.2.2  MapReduce支持的压缩编码t1188.2.3  MapReduce压缩格式参数配置t1188.3  Map输出压缩开启t1198.4  Reduce输出压缩开启t1198.5  常用Hive表存储格式比较t1208.5.1  存储文件的压缩比测试t1208.5.2  存储文件的查询速度测试t1228.6  存储和压缩结合t123习题8t125第9章  Hive优化t1279.1  Hive参数优化t1279.1.1  本地模式t1279.1.2  Fetch抓取t1289.1.3  并行执行t1289.1.4  严格模式t1299.1.5  推测执行t1309.1.6  JVM重用t1319.2  数据倾斜t1319.2.1  合理设置Map个数t1319.2.2  合并小文件t1329.2.3  复杂文件增加Map个数t1329.2.4  合理设置Reduce个数t1339.3  HQL优化t1349.3.1  Group By优化t1349.3.2  小表、大表Joint1349.3.3  大表Join大表t1369.3.4  MapJoint1379.3.5  Count优化t1389.3.6  行/列过滤优化t1399.3.7  动态分区调整优化t1409.3.8  执行计划优化t141习题9t1420章  综合案例1:广电大数据分析t14410.1  案例需求分析t14410.2  案例数据及建表t14410.2.1  原始数据t14410.2.2  数据表结构t14410.2.3  创建表t14510.2.4  向TextFile表导入数据t14710.2.5  向ORC表导入数据t14710.3  数据统计分析t14710.3.1  基本信息查询t14710.3.2  单个用户观看时长Top20t14810.3.3  用户观看时长Top20t14910.3.4  电视观看数Top20t15010.3.5  电视观看时长Top20t15010.3.6  用户正常状态及数量t1511章  综合案例2:影评大数据分析t15211.1  案例需求分析t15211.2  案例数据及建表t15211.2.1  原始数据t15211.2.2  创建表及导入数据t15311.2.3  基本信息查询t15311.3  数据统计分析t15411.3.1  评分次数最多的10部电影t15411.3.2  性别当中评分最高的10部电影t15411.3.3  一部电影各年龄段的平均影评t15611.3.4  评分最高的10部电影的平均影评分t15611.3.5  好片最多年份的看电影0t15711.3.6  评分最高的10部Comedy类电影t15811.3.7  各种类型电影中评价最高的5部电影t1592章  上机实验t163实验1  Hive安装部署t163实验2  Hive数据定义t165实验3  Hive数据操作t167实验4  Hive分区表和桶表t171实验5  Hive查询t174实验6  Hive分组排序t177实验7  Hive BC连接t179实验8  Hive UDFt182附录A  Hive常用网址t185附录B  常见错误及解决方案t186附录C  部分习题答案t188参考文献 t191
作者介绍
王剑辉,沈阳师范大学数学与系统科学学院教授,长期从事Web应用程序设计,Hive数据仓库,Hadoop大数据技术、Java程序设计、人工智能等方面的科研与教学工作。
序言
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

正版二手,几十万种图书无法都提供实拍图,但均为7-9成新,无缺页、会有瑕疵或者少许磨损 、或多或少都会有划线、笔记、涂写等,不影响使用。均不保证有光盘、卡片等,辅导习题类笔记较多;书籍有多封面的新老封面随机发货,内容一致,不影响使用,介意勿拍!图片孔网自动匹配,图片与标题不符时以及图片为套装,与标题不符时的下单前请咨询客服,望周知!
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP