• 大数据实时计算与应用
21年品牌 40万+商家 超1.5亿件商品

大数据实时计算与应用

25.29 7.0折 36 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者吴斌 著

出版社清华大学出版社

ISBN9787302503217

出版时间2018-07

版次1

装帧平装

开本16开

纸张胶版纸

页数179页

字数99999千字

定价36元

上书时间2024-07-12

灵感飞驰

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:大数据实时计算与应用
定价:36.00元
作者:吴斌 著
出版社:清华大学出版社
出版日期:2018-07-01
ISBN:9787302503217
字数:288000
页码:179
版次:1
装帧:平装
开本:16开
商品重量:
编辑推荐
本书综合了大数据离线分析所需的主流技术Storm+Apache HBase+Zookeeper+Kafka,并配以案例和丰富的辅助学习资源,足以满足广大学习者入门的需要。
内容提要
本书定位于大数据专业核心技术——实时计算,重点讨论大数据应用场景中的数据特点和应用需求的实时流计算技术。 本书通过对分布式实时计算系统的分析,将学习部分按功能性质划分成四个模块,分别为Kafka数据流处理模块、Strom实时计算模块、HBase数据存储模块和Zookeeper分布式协调模块。对此四个工作模块进行教学化处理,形成HBase基础操作、Zookeeper集群管理、配置Storm集群等核心课程体系,并配以实例使学习者便于理解,易于上手,掌握实时计算Storm相关的基础知识和实际业务系统的开发能力。
目录
目录章分布式实时计算系.1分布式的概念1.1.1分布式系.1.2分布式计算1.2分布式通信1.2.1分布式通信基础1.2.2消息队列1.2.3Storm计算模型1.3分布式实时计算系统架构1.3.1数据获取——Kafka1.3.2数据处理——Storm1.3.3数据存储——HBase1.4系统架构本章小结习题第2章初识Kafka2.1什么是Kafka2.1.1Kafka概述2.1.2使用场景2.1.3Kafka基本特性2.1.4性能2.1.5总结2.1.6Kafka在LinkedIn中的应用2.2Topics和logs2.3分布式——consumers和producers本章小结习题第3章Kafka环境搭建3.1服务器搭建3.2开发环境搭建本章小结习题第4章Kafka消息传送4.1消息传输的事务定义4.2性能优化4.2.1消息集4.2.2数据压缩4.3生产者和消费者4.3.1Kafka生产者的消息发送4.3.2Kafka consumer4.4主从同步4.5客户端API4.5.1Kafka producer API4.5.2Kafka consumer API4.6消息和日志本章小结习题第5章Zookeeper开发5.1Zookeeper的来源5.2Zookeeper基础5.2.1基本概念5.2.2Zookeeper架构5.3Zookeeper的API5.3.1建立会话5.3.2管理权5.3.3节点注册5.3.4任务队列化5.4状态变化处理5.5故障处理5.6Zookeeper集群管理5.6.1集群配置5.6.2集群管理本章小结习题第6章初识HBase6.1什么是HBase6.1.1大数据的背景6.1.2HBase架构6.1.3HBase存储API6.2HBase部署6.2.1HBase配置及安装6.2.2运行模式6.2.3集群操作本章小结习题第7章HBase基础操作7.1CRUD操作7.1.1Put操作7.1.2Get操作7.1.3Delete操作7.2批处理操作7.3行锁7.4扫描7.5其他操作7.5.1HTable方法7.5.2Bytes方法本章小结习题第8章HBase高阶特性8.1过滤器8.1.1什么是过滤器8.1.2比较过滤器8.1.3专用过滤器8.1.4附加过滤器8.2计数器8.2.1什么是计数器8.2.2单计数器及多计数器8.3协处理器8.3.1什么是协处理器8.3.2协处理器API应用本章小结习题第9章管理HBase9.1HBase数据描述9.1.1表9.1.2列簇9.1.3属性9.2表管理API9.2.1基础操作9.2.2集群管理本章小结习题0章初识Storm10.1什么是Storm10.1.1Storm能做什么10.1.2Storm的特性10.1.3Storm分布式计算结构10.2构建topology10.2.1Storm的基本概念10.2.2构建topology10.2.3示例: 单词计数10.3Storm并发机制10.3.1topology并发机制10.3.2给topology增加Worker10.3.3配置Executor和task10.4数据流分组的理解10.5消息的可靠处理10.5.1消息被处理后会发生什么10.5.2Storm可靠性的实现方法10.5.3调整可靠性本章小结习题1章配置Storm集群11.1Storm集群框架介绍11.1.1理解nimbus守护进程11.1.2supervisor守护进程的工作方式11.1.3DRPC服务工作机制11.1.4Storm的UI简介11.2在Linux上安装Storm11.2.1搭建Zookeeper集群11.2.2安装Storm依赖库11.2.3下载并解压Storm发布版本11.2.4修改storm.yaml配置文件11.2.5启动Storm后台进程11.3将topology提交到集群上本章小结习题2章Trident和TridentML12.1Trident topology12.1.1Trident综述12.1.2Reach12.1.3字段和元组12.1.4状态12.1.5Trident topology的执行12.2Trident接口12.2.1综述12.2.2本地分区操作12.2.3重新分区操作12.2.4群聚操作12.2.5流分组操作12.2.6合并和连接12.3Trident状态12.3.1事务spouts12.3.2透明事务spouts12.3.3非事务spouts12.3.4Spout和State总结12.3.5State应用接口12.3.6MapState的更新12.3.7执行MapState12.4TridentML: 基于storm的实时在线机器学习库本章小结习题3章DRPC模式13.1DRPC概述13.2DRPC自动化组件13.3本地模式DRPC13.4远程模式DRPC13.5一个更复杂的例子本章小结习题4章Storm实战14.1网站页面浏览量计算14.1.1背景介绍14.1.2体系结构14.1.3项目相关介绍14.1.4Storm编码实现14.1.5运行topology14.2网站用户访问量计算14.2.1背景介绍14.2.2Storm代码实现14.2.3运行topology本章小结习题参考文献
作者介绍

序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP