• 流计算系统图解
21年品牌 40万+商家 超1.5亿件商品

流计算系统图解

49.9 5.1折 98 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者[美]乔什·费舍尔(JoshFischer)著,傅宇,黄鹏程

出版社清华大学出版社

ISBN9787302634652

出版时间2023-07

版次1

装帧平装

开本16开

纸张胶版纸

页数273页

字数99999千字

定价98元

上书时间2024-05-22

纵列風

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:流计算系统图解
定价:98.00元
作者:[美]乔什·费舍尔(JoshFischer)著,傅宇,黄鹏程,张晨 译
出版社:清华大学出版社
出版日期:2023-07-01
ISBN:9787302634652
字数:362000
页码:273
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐

内容提要
流计算系统尽可能地优化了接收处理事件数据的间隔时间,因此能实时地提供响应。对于金融、安全和物联网领域的应用来说,几毫秒都很关键,因此流计算系统是必要组件。而且,流计算是热门技术  具有Spark、Heron和Kafka经验的工程师供不应求。  《流计算系统图解》以浅显易懂的语言介绍了实时事件流应用。这本引人入胜的书阐明了数据并行化、事件窗口和反压等核心概念,让你不会被框架的具体细节所困扰。在学习过程中,你将从头开始构建一个简单的流计算工具,以确保深入领会各种理念和技术。当你读到实时信用卡欺诈检测和IoT监控服务等示例时,实用且有趣的插图使流计算系统显得更加生动。  主要内容  实现流计算系统以及故障排除  为复杂功能设计流计算系统  定位网络瓶颈并解决反压问题  为高性能系统对数据进行分组  阅读门槛  读者不需要流系统的相关经验。书中示例代码使用Java语言。
目录
第I部分 初识流系第1章 欢迎阅读《流计算系统图解》 31.1 什么是流处理 41.2 流系统的例子 51.3 流系统和实时性 61.4 流系统的工作方式 71.5 应用程序 81.6 后台服务 91.7 后台服务的内部实现 101.8 批处理系11.9 批处理系统内部 121.10 流处理系31.11 流处理系统的内部实现 141.12 多阶段架构的优势 151.13 批处理和流处理系统中的多阶段架构 161.13.1 批处理系61.13.2 流处理系61.14 比较这些系71.15 一个典型的流处理系81.16 小结 191.17 练习 19第2章 你好,流系统 212.1 老板需要一个高级收费站 222.2 失败案例:使用HTTP请求实现服务 232.3 AJ 和 Miranda 对失败的反思 242.4 AJ 对流系统的思考 252.5 比较后端服务和流 262.5.1 后端服务:一个同步模型 262.5.2 流:异步模型 262.6 流系统如何适用于当前场景 272.7 基本概念:队列 282.8 通过队列传输数据 292.9 初探流框架Streamwork 302.10 Streamwork 框架概述 312.11 深入 Streamwork 的引擎 322.12 流的核心概念 332.13 相关概念的更多细节 342.14 流作业的执行流程 352.15 你的个流作业 362.15.1 你的个流作业:创建事件类 362.15.2 你的个流作业:数据源 372.15.3 你的个流作业:数据源(续) 382.15.4 你的个流作业:算子 392.15.5 你的个流作业:算子(续) 402.15.6 你的个流作业:构建作业 412.16 执行作业 422.17 检查作业执行情况 432.18 深入了解处理引擎 442.18.1 深入了解引擎:源执行器 452.18.2 深入了解引擎:算子执行器 462.18.3 深入了解引擎:作业启动器 472.19 事件的流转 482.20 数据元素的生命周期 492.21 回顾流概念 502.22 小结 512.23 练习 51第3章 并行化和数据分组 533.1 传感器正在生成更多的事件 543.2 即使在流中,实时处理也很难 553.3 新概念:并行很重要 563.4 新概念:数据并行 573.5 新概念:数据执行的独立性 583.6 新概念:任务并行 593.7 数据并行与任务并行 603.8 并行与并发 613.9 作业的并行化 623.10 组件的并行化 633.11 数据源的并行化 643.12 查看作业输出 653.13 算子并行化 663.14 再次查看作业输出 673.15 事件和实例 683.16 事件顺序 693.17 事件分组 703.18 随机分组 713.19 随机分组原理 723.20 字段分组 733.21 字段分组原理 743.22 事件的分组执行 753.23 深入了解引擎:事件分发器 763.24 在作业中采用字段分组 773.25 查看事件顺序 783.26 比较分组行为 793.27 小结 803.28 练习 80第4章 流中的图 814.1 信用卡欺诈检测系统 824.2 信用卡欺诈检测系统的更多细节 834.3 欺诈检测业务流程 844.4 流并不总是一条直线 854.5 系统内部分析 864.6 欺诈检测作业的细节 874.7 新概念 884.8 上下游组件 894.9 流的扇出和扇入 904.10 图、有向图以及有向无环图 914.11 流处理系统中的 DAG 924.12 新概念概览 934.13 从流扇出到分析器 944.14 深入了解引擎 954.15 有一个问题: 效率 964.16 不同流的扇出 974.17 再次深入了解引擎 984.18 使用通道实现组件间通信 994.19 多个通道 1004.20 流扇入至评分聚合器 1014.21 引擎中的流扇入 1024.22 对另一个流扇入的简单介绍:Joi1034.23 回顾整个系044.24 图和流作业 1054.25 示例系064.26 小结 1074.27 练习 108第5章 送达语义 1095.1 欺诈检测系统的延迟需求 1105.2 重新审视欺诈检测作业 1115.3 关于准确性 1125.4 部分结果 1135.5 一个监控系统使用率的流作业 1145.6 新系统使用率作业 1155.7 新系统使用率作业的需求 1165.8 新概念:送达次数和处理次数 1175.9 新概念:送达语义 1185.10 选择正确的语义 1195.11 至多一次送达 1205.12 欺诈检测作业 1215.12.1 好的一面 1215.12.2 坏的一面 1215.12.3 希望 1215.13 至少一次送达 1225.14 用确认机制实现至少一次送达 1235.15 跟踪事件 1245.16 应对事件处理时的失败 1255.17 追踪提早结束处理的事件 1265.18 组件中关于确认的代码 1275.19 新概念:检查点 1285.20 新概念:状态 1295.21 在系统使用率作业中为至少一次送达语义生成检查点 1305.22 生成检查点和状态操作函数 1315.23 交易源组件中的状态处理代码 1325.24 恰好一次还是实际一次 1335.25 额外概念:幂等操作 1345.26 恰好一次送达 1355.27 系统使用率分析器组件中的状态处理代码 1365.28 再次比较送达语义 1375.29 小结 1385.30 练习 1385.31 接下来 139第6章 流系统回顾与展望 1416.1 流系统的基本概念 1426.2 并行化和事件分组 1436.3 有向无环图和流作业 1446.4 送达语义(送达保证) 1456.5 在信用卡欺诈检测系统中使用的送达语义 1466.6 接下来是什么 1476.7 窗口计算简介 1486.8 实时Join数据 1496.9 反压简介 1506.10 无状态计算和有状态计算 151第II部分 进阶 153第7章 窗口计算 1557.1 对实时数据进行切分 1567.2 详细分解问题 1577.3 继续分解问题 1587.4 两种上下文 1597.5 欺诈检测中的窗口处理 1607.6 窗口究竟是什么 1617.7 进一步了解窗口 1627.8 新概念:窗口策略 1637.9 固定窗口 1647.10 距离分析器中的固定窗口 1657.11 用固定时间窗口检测欺诈行为 1667.12 固定窗口:时间与数量 1677.13 滑动窗口 1687.14 滑动窗口与距离分析器 1697.15 用滑动窗口检测欺诈行为 1707.16 会话窗口 1717.17 会话窗口(续) 1727.18 使用会话窗口检测欺诈行为 1737.19 窗口化策略的总结 1747.20 将事件流切成数据集 1757.21 窗口:概念与实现 1767.22 回顾 1777.23 键值存储入门 1787.24 实现窗口化距离分析器 1797.25 事件时间和事件的其他时间 1807.26 窗口水位 1817.27 迟到事件 1827.28 小结 1837.29 练习 184第8章 Joi操作 1858.1 即时 Joi排放量数据 1868.2 排放量作业初版 1878.3 排放量解析器 1888.4 准确性是个问题 1898.5 排放量作业增强版 1908.6 聚焦 Joi1918.7 到底什么是 Joi1928.8 流 Join是如何工作的 1938.9 流式 Joi是一种不同的扇入方式 1948.10 车辆事件与温度事件 1958.11 表:流的物化视图 1968.12 物化车辆事件更低效 1978.13 数据完整性问题 1988.14 这个 Joi算子的问题出在哪 1998.15 Inner Joi2008.16 Outer Joi2018.17 Inner Joi与 Outer Joi2028.18 不同类型的 Joi2038.19 流系统中的 Outer Joi2048.20 新问题:网络连接 2058.21 窗口 Joi2068.22 两表 Joi而不是流表 Joi2078.23 重新审视物化视图 2088.24 小结 209第9章 反压 2119.1 可靠性很关键 2129.2 回顾系统 2139.3 精简的流作业 2149.4 新概念:容量、利用率和空余率 2159.5 进一步了解利用率与空余率 2169.6 新概念:反压 2179.7 测量容量利用率 2189.8  Streamwork引擎中的反压 21910.18 有状态组件与无状态组件 25310.19 手动管理实例状态 25410.20 Lambda架构 25510.21 小结 25610.22 练习 257第11章 总结:流系统中的高级概念 25911.1 真的结束了吗 26011.2 窗口计算回顾 26111.3 主要窗口类型回顾 26211.3.1 固定窗口 26211.3.2 滑动窗口 26211.3.3 会话窗口 26211.4 实时 Joi数据回顾 26311.5 SQL与流式 Join回顾 26411.6 Inner Joi和 Outer Join回顾 26511.7 流系统中的意外情况 26611.8 反压:减慢数据源或上游组件的速度 26711.8.1 停止数据源 26711.8.2 停止上游组件 26711.9 另一种处理滞后实例的方法:丢弃事件 26811.10 反压可能只是内部问题的表象 26911.10.1 实例停止工作,所以反压不会得到缓解 26911.10.2 实例无法赶上进度,反压将反复触发:抖动 26911.11 带有检查点的有状态组件 27011.12 基于事件的计时 27111.13 有状态组件与无状态组件回顾 27211.14 你做到了 27311.14.1 挑选一个开源项目来学习 27311.14.2 开始写博客,传授你所学的知识 27311.14.3 参加聚会和会议 27311.14.4 参与开源项目 27311.14.5 永不放弃 273
作者介绍
Josh Fischer 目前是 1904labs 的团队负责人,他曾为其他组织 ( 如孟山都和拜耳 )构建大规模实时数据应用。他是 Apache 委员会成员,也是 Apache Hero分布式流处理引擎项目管理委员会的成员。王宁现在是 Amplitude 的软件工程师,负责实时数据管道的构建。他是 Twitter 实时计算团队中 Apache Hero的关键贡献者。
序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP