• Druid实时大数据分析原理与实践
21年品牌 40万+商家 超1.5亿件商品

Druid实时大数据分析原理与实践

全新正版图书 可以开电子发票 有需要的联系客服!

13.03 1.6折 79 九品

仅1件

河北保定
认证卖家担保交易快速发货售后保障

作者欧阳辰

出版社电子工业出版社

ISBN9787121306235

出版时间2017-03

装帧平装

开本16开

定价79元

货号9787121306235

上书时间2025-01-03

思源汇书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
商品描述
商品简介
Druid 作为一款开源的实时大数据分析软件,很近几年快速风靡优选互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分析、运维监控分析等,在腾讯、阿里、优酷、小米等公司都有大量成功应用的案例。本书的目的就是帮助技术人员更好地深入理解Druid 技术、大数据分析技术选型、Druid 的安装和使用、不错特性的使用,也包括一些源代码的解析,以及一些常见问题的快速回答。Druid 的生态系统正在不断扩大和成熟,Druid 也正在解决越来越多的业务场景。希望本书能帮助技术人员做出更好的技术选型,深度了解Druid 的功能和原理,更好地解决大数据分析问题。本书适合大数据分析的从业人员、IT 人员、互联网从业者阅读。

作者简介
欧阳辰,小米商业产品部研发总监,负责广告架构和数据分析平台,擅长数据挖掘,大数据分析和广告搜索架构。之前,在微软工作10年,任微软公司不错开发经理,负责Contextual Ads产品研发,开发Bing Index Serve的核心模块。持有多项关于互联网广告及搜索的美国专利。创办“互联居”公众号,致力于互联网广告技术的繁荣。毕业于北京大学计算机系,获硕士学历。
刘麒赟,现任Testin云测公司技术总监,全面负责领导团队完成数据分析产品的研发。作为资历数据技术专家,曾为多个有名开源项目(Hadoop/Sqoop/Oozie/Druid)贡献源代码,在互联网大数据分析、机器学习和统计学应用等方面拥有丰富的实战经验和相关专利。在企业级产品研发和客户支持方面也有着丰富的经验,并曾为中国多地(包括香港和台湾地区地区)的龙头企业成功进行实地支持,为美国与新加坡等地客户进行远程支持。之前,曾任OneAPM公司大数据架构师,以及在IBM公司工作七年并任IBM优选大数据平台产品BigInsights的Advisory Software Engineer。
张海雷,资历工程师。目前在优酷土豆广告技术团队负责Druid集群的维护。活跃在Druid中国用户组,Druid、Redis和Storm的开源项目代码贡献者。

目录
第1章 初识Druid
  1.1 Druid 是什么
  1.2 大数据分析和Druid
  1.3 Druid 的产生
    1.3.1 MetaMarkets 简介
    1.3.2 失败总结
  1.4 Druid 的三个设计原则
    1.4.1 快速查询(Fast Query)
    1.4.2 水平扩展能力(Horizontal Scalability)
    1.4.3 实时分析(Realtime Analytics)
  1.5 Druid 的技术特点
    1.5.1 数据吞吐量大
    1.5.2 支持流式数据摄入
    1.5.3 查询灵活且快
    1.5.4 社区支持力度大
  1.6 Druid 的Hello World
    1.6.1 Druid 的部署环境
    1.6.2 Druid 的基本概念
  1.7 系统的扩展性
  1.8 性能指标
  1.9 Druid 的应用场景
    1.9.1 国内公司
    1.9.2 国外公司
  1.10 小结
  参考资料
第2章 数据分析及相关软件
  2.1 数据分析及相关概念
  2.2 数据分析软件的发展
  2.3 数据分析软件的分类
    2.3.1 商业软件
    2.3.2 时序数据库
    2.3.3 开源分布式计算平台
    2.3.4 开源分析数据库
    2.3.5 SQL on Hadoop/Spark
    2.3.6 数据分析云服务
  2.4 小结
  参考资料
第3章 架构详解
  3.1 Druid 架构概览
  3.2 Druid 架构设计思想
    3.2.1 索引对树结构的选择
    3.2.2 Druid 总体架构
    3.2.3 基于DataSource 与Segment 的数据结构
  3.3 扩展系统
    3.3.1 主要的扩展
    3.3.2 下载与加载扩展
  3.4 实时节点
    3.4.1 Segment 数据文件的制造与传播
    3.4.2 高可用性与可扩展性
  3.5 历史节点
    3.5.1 内存为王的查询之道
    3.5.2 层的分组功能
    3.5.3 高可用性与可扩展性
  3.6 查询节点
    3.6.1 查询中枢点
    3.6.2 缓存的使用
    3.6.3 高可用性
  3.7 协调节点
    3.7.1 集群数据负载均衡的主宰
    3.7.2 利用规则管理数据生命周期
    3.7.3 副本实现Segment 的高可用性
    3.7.4 高可用性
  3.8 索引服务
    3.8.1 主从结构的架构
    3.8.2 统治节点
    3.8.3 中间管理者与苦工
    3.8.4 任务
  3.9 小结
第4章 安装与配置
第5章 数据摄入
第6章 数据查询
第7章 高级功能和特性
第8章 核心源代码探析
第9章 监控和安全
第10章 实践和应用
第11章 Druid 生态与展望
附录A 常见问题(FAQ)
附录B 常用参数表

内容摘要
 Druid作为一款开源的实时大数据分析软件,最
近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分析、运维监控分析等,在腾讯、阿里、优酷、小米等公司都有大量成功应用的案例。欧阳辰、刘麒赟、张海雷、高振源、许哲编著的《Druid实时大数据分析原理与实践》的目的就是帮助技术人员更好地深入理解Druid技术、大数据分析技
术选型、Druid的安装和使用、高级特性的使用,也
包括一些源代码的解析,以及一些常见问题的快速回答。
Druid的生态系统正在不断扩大和成熟,Druid也
正在解决越来越多的业务场景。希望本书能帮助技术人员做出更好的技术选型,深度了解Druid的功能和原理,更好地解决大数据分析问题。本书适合大数据分析的从业人员、IT人员、互联网从业者阅读。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP