• 【正版9新】 Hadoop应用架构 9787115442437 【消毒塑封】
21年品牌 40万+商家 超1.5亿件商品

【正版9新】 Hadoop应用架构 9787115442437 【消毒塑封】

【消毒塑封 】 【正版9新】

17.3 2.5折 69 九五品

库存3件

浙江杭州
认证卖家担保交易快速发货售后保障

作者Sha

出版社人民邮电出版社

ISBN9787115442437

出版时间2017-01

装帧其他

开本其他

定价69元

货号9787115442437

上书时间2024-12-22

浅秋书社

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
作者简介
Mark Grover 
Apache Sentry项目管理委员会成员,《Hive编程指南》作者之一,曾参与Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等项目,并为Apache Bigtop项目和Apache Sentry(项目孵化中)项目贡献代码。 

Ted Malaska 
Cloudera公司的解决方案架构师,致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局(FINRA,Finan Industry Regulatory Authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。

Jonathan Seidman 
Cloudera公司的解决方案架构师,协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组(Chicago Hadoop User Group)及芝加哥大数据(Chicago Big Data)的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管,为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。 

Gwen Shapira 
Cloudera公司的解决方案架构师,知名博主,拥有15年从业经验,协助客户设计高扩展性的数据架构。曾任Pythian不错顾问、Oracle ACE主管以及NoCOUG董事会成员,活跃于诸多业内会议。

目录
译者序

前言
第一部分  考虑Hadoop应用的架构设计
  第1章  Hadoop数据建模
  1.1  数据存储选型
    1.1.1  标准文件格式
    1.1.2  Hadoop文件类型
    1.1.3  序列化存储格式
    1.1.4  列式存储格式
    1.1.5  压缩
  1.2  HDFS模式设计
    1.2.1  文件在HDFS中的位置
    1.2.2  高级HDFS模式设计
    1.2.3  HDFS模式设计总结
  1.3  HBase模式设计
    1.3.1  行键
    1.3.2  时间戳
    1.3.3  hop
    1.3.4  表和Region
    1.3.5  使用列
    1.3.6  列簇
    1.3.7  TTL
  1.4  元数据管理
    1.4.1  什么是元数据
    1.4.2  为什么元数据至关重要
    1.4.3  元数据的存储位置
    1.4.4  元数据管理举例
    1.4.5  Hive metastore与HCatalog的局限性
    1.4.6  其他存储元数据的方式
  1.5  结论
  第2章  Hadoop数据移动
  2.1  数据采集考量
    2.1.1  数据采集的时效性
    2.1.2  增量更新
    2.1.3  访问模式
    2.1.4  数据源系统及数据结构
    2.1.5  变换
    2.1.6  网络瓶颈
    2.1.7  网络安全性
    2.1.8  被动推送与主动请求
    2.1.9  错误处理
    2.1.10  复杂度
  2.2  数据采集选择
    2.2.1  文件传输
    2.2.2  文件传输与其他采集方法的考量
    2.2.3  Sqoop:Hadoop与关系数据库的批量传输
    2.2.4  Flume:基于事件的数据收集及处理
    2.2.5  Kafka
  2.3  数据导出
  2.4  小结
  第3章  Hadoop数据处理
  3.1  MapReduce
    3.1.1  MapReduce概述
    3.1.2  MapReduce示例
    3.1.3  MapReduce使用场景
  3.2  Spark
    3.2.1  Spark概述
    3.2.2  Spark组件概述
  ……
  第4章  Hadoop数据处理通用范式
  第5章  Hadoop图处理
  第6章  协调调度
  第7章Hadoop近实时处理
第二部分  案例研究
  第8章  点击流分析
  第9章  欺诈检测
  第10章  数据仓库
附录  AImpala中的关联
索引
作者简介

内容摘要
 马克·格洛沃所著的《Hadoop应用架构》讲解使用Hadoop平台进行应用架构所需要的关键知识,旨在帮助读者掌握有效集成HBase、Kafka、spark等Hadoop生态圈工具以形成完整的大数据解决方案。书中内容分为两部分,第一部分介绍使用Hadoop创建应用程序时要考虑的问题,第二部分展示如何使用前面介绍的组件实现基于Hadoop的完整解决方案。
本书适合软件开发人员、构架师、项目主管等。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP