• 基于ApacheKylin构建大数据分析平台
  • 基于ApacheKylin构建大数据分析平台
  • 基于ApacheKylin构建大数据分析平台
21年品牌 40万+商家 超1.5亿件商品

基于ApacheKylin构建大数据分析平台

正版图书,可开发票,请放心购买。

58.95 8.5折 69 全新

库存2件

广东广州
认证卖家担保交易快速发货售后保障

作者蒋守壮

出版社清华大学

ISBN9787302454526

出版时间2017-01

装帧其他

开本其他

定价69元

货号3719810

上书时间2023-08-25

淘书宝店

九年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
蒋守壮,现就职于万达网络科技集团有限公司,资深大数据工程师,大数据实践者。曾任平安科技资深大数据分析师和架构师,CSDN社区专家,知识库特邀编辑。目前专注于Docker、Kubernetes、Mesos、Hadoop、Spark和Kylin等技术领域。

目录
第一部分  Apache Kylin基础部分
第1章  Apache Kylin前世今生
  1.1  Apache Kylin的背景
  1.2  Apache Kylin的应用场景
  1.3  Apache Kylin的发展历程
第2章  Apache Kylin前奏
  2.1  事实表和维表
  2.2  星型模型和雪花型模型
    2.2.1  星型模型
    2.2.2  雪花型模型
    2.2.3  星型模型示例
  2.3  OLAP
    2.3.1  OLAP分类
    2.3.2  OLAP的基本操作
  2.4  数据立方体(Data Cube)
第3章  Apache Kylin 工作原理和体系架构
  3.1  Kylin工作原理
  3.2  Kylin体系架构
  3.3  Kylin中的核心部分:Cube构建
  3.4  Kylin的SQL查询
  3.5  Kylin的特性和生态圈
第4章  搭建CDH大数据平台
  4.1  系统环境和安装包
    4.1.1  系统环境
    4.1.2  安装包的下载
  4.2  准备工作:系统环境搭建
    4.2.1  网络配置(CDH集群所有节点
    4.2.2  打通SSH,设置ssh无密码登录(所有节点)
  4.3  正式安装CDH:准备工作
  4.4  正式安装CDH5:安装配置
    4.4.1  CDH5的安装配置
    4.4.2  对Hive、HBase执行简单操作
第5章  使用Kylin构建企业大数据分析平台的4种部署方式
  5.1  Kylin部署的架构
  5.2  Kylin的四种典型部署方式
第6章  单独为Kylin部署HBase集群
第7章  部署Kylin集群环境
  7.1  部署Kylin的先决条件
  7.2  部署Kylin集群环境
  7.3  为Kylin集群搭建负载均衡器
    7.3.1  搭建Nginx环境
    7.3.2  配置Nginx实现Kylin的负载均衡
第二部分  Apache Kylin 进阶部分
第8章  Demo案例实战
  8.1  Sample Cube案例描述
  8.2  Sample Cube案例实战
    8.2.1  准备数据
    8.2.2  构建Cube
第9章  多维分析的Cube创建实战
  9.1  Cube模型
  9.2  创建Cube的流程
    9.2.1  步骤一:Hive中事实表,以及多张维表的处理
    9.2.2  步骤二:Kylin中建立项目(Project)
    9.2.3  步骤三:Kylin中建立数据源(Data Source)
    9.2.4  步骤四:Kylin中建立数据模型(Model)
    9.2.5  步骤五:Kylin中建立Cube
    9.2.6  步骤六:Build Cube
    9.2.7  步骤七:查询Cube
第10章  Build Cube的来龙去脉
    10.1  流程分析
    10.2  小结
第三部分  Apache Kylin 高级部分
第11章  Cube优化
第12章  备份Kylin的Metadata
  12.1  Kylin的元数据
  12.2  备份元数据
  12.3  恢复元数据
第13章  使用Hive视图
  13.1  使用Hive视图
  13.2  使用视图实战
第14章  Kylin的垃圾清理
  14.1  清理元数据
  14.2  清理存储器数据
第15章  JDBC访问方式
第16章  通过RESTful访问Kylin
第17章  Kylin版本之间升级
  17.1  从  1.5.2升级到最新版本  1.5.3
  17.2  从  1.5.1升级到  1.5.2版本
  17.3  从Kylin1.5.2.1升级到Kylin1.5.3实战
  17.4  补充内容
第18章  大数据可视化实践
  18.1  可视化工具简述
  18.2  安装Kylin ODBC驱动
  18.3  通过Excel访问Kylin
  18.4  通过Power BI访问Kylin
    18.4.1  安装配置Power BI
    18.4.2  实战操作
  18.5  通过Tableau访问Kylin
  18.6  Kylin + Mondrian + Saiku
  18.7  实战演练:通过Saiku访问
    18.7.1第一个Schema例子:myproject_pvuv_cube的演示
    18.7.2第二个Schema例子:kylin_sales_cube的演示
    18.7.3  Saiku使用的一些问题
  18.8  通过Apache Zepplin访问Kylin
  18.9  通过Kylin的“Insight”查询
第19章  使用Streaming Table 构建准实时Cube
第20章  快速数据立方算法
  20.1  快速数据立方算法概述
  20.2  快速数据立方算法优点和缺点
  20.3  获取Fast Cubing算法的优势
第四部分  Apache Kylin的扩展部分
第21章  大数据智能分析平台KAP
  21.1  大数据智能分析平台KAP概述
  21.2  KAP的安装部署

内容摘要
 ApacheKylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay公司开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。
蒋守壮著的《基于ApacheKylin构建大数据分析平台》分为21章,详细讲解ApacheKylin概念、安装、配置、部署,让读者对ApacheKylin构建大数据分析平台有一个感性认识。同时,本书从应用角度,结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。最后还介绍了Kyligence公司发布KAP大数据分析平台,对读者有极大的参考价值。
本书适合大数据技术初学者、大数据分析人员、
大数据架构师等,也适合用于高等院校和培训学校相关专业师生教学参考。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP