• hive编程指南 编程语言 (美)卡普廖洛 等 新华正版
  • hive编程指南 编程语言 (美)卡普廖洛 等 新华正版
21年品牌 40万+商家 超1.5亿件商品

hive编程指南 编程语言 (美)卡普廖洛 等 新华正版

27.95 4.1折 69 全新

库存39件

河北保定
认证卖家担保交易快速发货售后保障

作者(美)卡普廖洛 等

出版社人民邮电出版社

ISBN9787115333834

出版时间2013-12

版次1

装帧平装

开本16

页数318页

字数428千字

定价69元

货号xhwx_1200807864

上书时间2024-10-28

浩子书屋

九年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
目录:

章基础知识 
1.1hadoop和mapreduce综述 
1.2hadoop生态系统中的hive 
1.2.1pig 
1.2.2hbase 
1.2.3casca、crunch及其他 
1.3java和hive:词频统计算法 
1.4后续事情 
第2章基础作 
2.1安装预先配置好的虚拟机 
2.2安装详细步骤 
2.2.1装java 
2.2.2安装hadoop 
2.2.3本地模式、伪分布式模式和分布式模式 
2.2.4测试hadoop 
2.2.5安装hive 
2.3hive是什么 
2.4启动hive 
2.5配置hadoop环境 
2.5.1本地模式配置 
2.5.2分布式模式和伪分布式模式配置 
2.5.3使用bc连接元数据 
2.6hive命令 
2.7命令行界面 
2.7.1cli选项 
2.7.2变量和属 
2.7.3hive中“一次使用”命令 
2.7.4从文件中执行hive查询 
2.7.5hiverc文件 
2.7.6使用hivecli的更多介绍 
2.7.7查看作命令历史 
2.7.8执行shell命令 
2.7.9在hive内使用hadoop的dfs命令 
2.7.10hive脚本中如何进行注释 
2.7.11显示字段名称 
第3章数据类型和文件格式 
3.1基本数据类型 
3.2集合数据类型 
3.3文本文件数据编码 
3.4读时模式 
第4章hiveql:数据定义 
4.1hive中的数据库 
4.2修改数据库 
4.3创建表 
4.3.1管理表 
4.3.2外部表 
4.4分区表、管理表 
4.4.1外部分区表 
4.4.2自定义表的存储格式 
4.5删除表 
4.6修改表 
4.6.1表重命名 
4.6.2增加、修改和删除表分区 
4.6.3修改列信息 
4.6.4增加列 
4.6.5删除或者替换列 
4.6.6修改表属 
4.6.7修改存储属 
4.6.8众多的修改表语句 
第5章hiveql:数据作 
5.1向管理表中装载数据 
5.2通过查询语句向表中插入数据 
5.3单个查询语句中创建表并加载数据 
5.4导出数据 
第6章hiveql:查询 
6.1select…from语句 
6.1.1使用正则表达式来指定列 
6.1.2使用列值进行计算 
6.1.3算术运算符 
6.1.4使用函数 
6.1.5limit语句 
6.1.6列别名 
6.1.7嵌套select语句 
6.1.8case…when…then句式 
6.1.9什么情况下hive可以避进行mapreduce 
6.2where语句 
6.2.1谓词作符 
6.2.2关于浮点数比较 
6.2.3like和rlike 
6.3groupby语句 
6.4join语句 
6.4.1innerjoin 
6.4.2join优化 
6.4.3leftouterjoin 
6.4.4outerjoin 
6.4.5rightouterjoin 
6.4.6fullouterjoin 
6.4.7leftsemi—join 
6.4.8笛卡尔积join 
6.4.9map—sidejoin 
6.5orderby和sortby 
6.6含有sortby的distributeby 
6.7clusterby 
6.8类型转换 
6.9抽样查询 
6.9.1数据块抽样 
6.9.2分桶表的输入裁剪 
6.10unionall 
第7章hiveql:视图 
7.1使用视图来降低查询复杂度 
7.2使用视图来基于条件过滤的数据 
7.3动态分区中的视图和map类型 
7.4视图零零碎碎相关的事情 
第8章hiveql:索引 
8.1创建索引 
8.2重建索引 
8.3显示索引 
8.4删除索引 
8.5实现一个定制化的索引处理器 
第9章模式设计 
9.1按天划分的表 
9.2关于分区 
9.3键和标准化 
9.4同一份数据多种处理 
9.5对于每个表的分区 
9.6分桶表数据存储 
9.7为表增加列 
9.8使用列存储表 
9.8.1重复数据 
9.8.2多列 
9.9(几乎)是使用压缩 
0章调优 
10.1使用en 
10.2enextended 
10.3调整 
10.4join优化 
10.5本地模式 
10.6并行执行 
10.7严格模式 
10.8调整mapper和reducer个数 
10.9jvm重用 
10.10索引 
10.11动态分区调整 
10.12推测执行 
10.13单个mapreduce中多个groupby 
10.14虚拟列 
1章其他文件格式和压缩方法 
11.1确定安装编 
11.2选择一种压缩编/ 
11.3开启中间压缩 
11.4终输出结果压缩 
11.5sequencefile存储格式 
11.6使用压缩实践 
11.7存档分区 
11.8压缩:包扎 
…… 
2章开发 
3章函数 
4章streaming 
5章自定义hive文件和记录格式 
6章hive的thrift服务 
7章存储处理程序和nosql 
8章安全 
9章锁 
第20章hive和oozie整合 
第21章hive和网络服务系统(aws) 
第22章hcatalog 
第23章案例研究 
术语词汇表 

内容简介:

hive编程指南是一本apache hive的编程指南,旨在介绍如何使用hive的ql方法——hiveql来汇、查询和分析存储在hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置hive,并对hadoop和mapreduce进行详尽阐述,终演示hive如何在hadoop生态系统进行工作。
hive编程指南适合对大数据感兴趣的爱好者以及正在使用hadoop系统的数据库管理员阅读使用。

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP