• 基于Apache Flink的流处理
21年品牌 40万+商家 超1.5亿件商品

基于Apache Flink的流处理

正版新书 新华官方库房直发 可开电子发票

36.96 4.2折 88 全新

库存20件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)比安·霍斯克(Fabian Hueske),(美)瓦西里基·卡拉夫里(Vasiliki Kalavri)

出版社中国电力出版社

ISBN9787519840112

出版时间2017-12

版次1

装帧平装

开本16开

纸张胶版纸

页数344页

字数407千字

定价88元

货号SC:9787519840112

上书时间2024-12-14

问典书店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
Fabian Hueske是Apache Flink项目的PMC成员,他从Flink项目创始之初就开始参与贡献。Fabian是data Artisans(现在的Ververica)公司的创始人之一,拥有柏林工业大学的计算机科学博士学位。Vasiliki Kalavri是苏黎世联邦理工学院系统组的博士后研究员。她同样也是Apache Flink项目的PMC成员。作为Flink早期贡献者,Vasiliki参与了图计算库Gelly以及初期版本的Table API和流式SQL的建设工作。崔星灿,加拿大约克大学博士后,分布式流处理技术和开源爱好者,Apache Flink Committer。
精彩内容:
前言你能从本书学到什么本书将教给你基于Apache Flink 进行流处理的一切知识。它总共包含了11 章,我们希望通过这些章节讲述一个完整的故事。书中部分章节会侧重描述高层次的设计理念,而其余章节会更加注重实践并包含了很多示例代码。尽管我们在写书的时候是按照预期阅读顺序进行的章节编排,但如果你已经对某些章节的内容很熟悉,仍可以选择跳过。若是你迫不及待地想开始编写Flink 代码,也可以先阅读实践章节。接下来我们会简要介绍一下每个章节的内容,便于你直接跳到最感兴趣的部分。? 第 1 章是概述。我们在其中概括了状态化流处理、数据处理应用的架构和设计,以及流处理与传统方法相比的优势所在。此外,还简要介绍了如何在本地Flink 实例上运行你的第一个流式应用。? 第 2 章主要讨论流处理的基本概念和挑战。这些内容均是独立于 Flink 而存在的。? 第 3 章重点描述 Flink 的系统架构和内部实现。其中讨论了分布式架构、流式应用中的时间和状态处理问题以及Flink 的容错机制。? 第 4 章讲解如何配置用于开发和调试 Flink 应用的环境。? 第 5 章介绍 Flink DataStream API 的基础知识。你将从中学到如何实现DataStream 应用以及Flink 所支持的流式转换、函数及数据类型等。? 第 6 章讨论 DataStream API 中基于时间的算子。其中包含窗口算子、基于时间的Join 以及一系列处理函数(process function),它们让流式应用中的时间处理变得十分灵活。? 第 7 章介绍如何实现有状态函数以及一些与之相关的问题,例如性能、健壮性、有状态函数的演变等。同时本章还会展示如何使用Flink 的可查询式状态。? 第 8 章介绍 Flink 中最常用的数据源(data source)和数据汇(data sink)连接器。其中会讨论F
...
内容简介:
Apache Flink项目的资深贡献者Fabian Hueske和Vasiliki Kalavri展示了如何使用Flink DataStream API实现可伸缩的流式应用,以及怎样在业务环境中持续运行和维护这些应用。流处理的理想应用场景有很多,包括低延迟ETL、流式分析、实时仪表盘以及欺诈检测、异常检测和报警。你可以在任意类型的持续数据(包括用户交互、金融交易和物联网等数据)生成后,立即对它们进行处理。了解有关分布式状态化流处理的概念和挑战。探索Flink的系统架构,包括事件时间处理模式和容错模型。理解DataStream API的基础知识和构成要素,包括基于时间和有状态的算子。以准确一次的一致性读写外部系统。部署和配置Flink集群。对持续运行的流式应用进行运维。
目录:
前言1

第1章状态化流处理概述7

传统数据处理架构8

事务型处理8

分析型处理9

状态化流处理11

事件驱动型应用13

数据管道14

流式分析15

开源流处理的演变16

历史回顾17

Flink快览18

运行少有Flink应用20

小结23

第2章流处理基础25

Dataflow编程概述25

Dataflow图25

数据并行和任务并行26

数据交换策略27

并行流处理28

延迟和吞吐28

数据流上的操作31

时间语义36

流处理场景下一分钟的含义37

处理时间38

事件时间39

水位线40

处理时间与事件时间41

状态和一致性模型41

任务故障43

结果保障44

小结46

第3章ApacheFlink架构47

系统架构47

搭建Flink所需组件48

应用部署50

任务执行51

高可用性设置52

Flink中的数据传输54

基于信用值的流量控制56

任务链接57

事件时间处理58

时间戳59

水位线59

水位线传播和事件时间61

时间戳分配和水位线生成63

状态管理64

算子状态65

键值分区状态66

状态后端68

有状态算子的扩缩容68

检查点、保存点及状态恢复71...

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP