剑指大数据——Flink学习精要（Scala版）

34.1 3.2折 105 全新

仅1件

河北保定

认证卖家担保交易快速发货售后保障

作者尚硅谷教育

出版社电子工业出版社

出版时间2022-10

版次1

装帧其他

货号9787121443428

上书时间2024-12-14

尚贤文化保定分店的书店

三年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 27小时
好评率暂无

最新上架

原则与妥协（增订版）：美国宪法的精神与实践 ¥99.80

看得见的中国史（下） ¥16.50

机械设计基础课程设计 ¥8.60

中国戏剧史 ¥21.50

中国企业国际化战略：理论探讨与实证研究 ¥16.50

中国经济与资本市场纵横谈 ¥11.70

微运动：写给整天伏案工作没有时间锻炼的人们 ¥10.90

最容易写错的汉字 ¥6.30

机械设计基础 ¥12.80

商品详情

品相描述：全新

图书标准信息

作者尚硅谷教育
出版社电子工业出版社
出版时间 2022-10
版次 1
ISBN 9787121443428
定价 105.00元
装帧其他
开本其他
纸张胶版纸
页数 312页
字数 628千字

【内容简介】: 本书基于流行稳定版Flink 1.13进行讲解，从Flink数据处理思想开始讲起，带领读者深入理解Flink的基本架构，进而由浅入深结合具体案例进行讲解，详细剖析了Flink中DataStream API的使用，并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐释。同时，本书还对实际开发过程中常用的Flink SQL、CEP等高层级API进行了细致讲解，以电商网站中的实际应用为场景，提供了大量的代码实现。本书分为12章：第1～5章，带领读者初步认识Flink并编写基本的Flink程序；第6～10章，深入探讨了Flink内部的高级应用。第11～12章，讲解了Flink提供的扩展功能。本书适用于大数据的学习者与从业人员，以及院校大数据相关专业的学生，也是大数据学习的必备书籍。
【作者简介】: 尚硅谷教育是一家专业的IT教育培训机构，开设了JavaEE、大数据、HTML5前端等多门学科，在互联网上发布的JavaEE、大数据、HTML5前端、区块链、C语言、Python等技术视频教程广受赞誉。
【目录】: 第1章初识Flink 1

1.1　Flink的起源和设计理念 1

1.2　Flink的应用 3

1.2.1 Flink在企业中的应用 3

1.2.2 Flink主要的应用场景 3

1.3　流式数据处理的发展和演变 4

1.3.1 流处理和批处理 5

1.3.2 传统事务处理 6

1.3.3 有状态的流处理 6

1.3.4 Lambda架构 9

1.3.5 新一代流处理器 10

1.4　Flink的特性总结 10

1.4.1 Flink的核心特性 10

1.4.2 分层API 10

1.5　Flink与Spark 11

1.5.1 数据处理架构 12

1.5.2 数据模型和运行架构 13

1.5.3 Spark还是Flink 13

1.6　本章总结 14

第2章 Flink快速上手 15

2.1 环境准备 15

2.2 创建项目 15

2.3 编写代码 18

2.3.1 批处理 18

2.3.2 流处理 19

2.4 本章总结 22

第3章 Flink部署 23

3.1 快速启动一个Flink集群 24

3.1.1 环境配置 24

3.1.2 本地启动 24

3.1.3 集群启动 25

3.1.4 向集群提交作业 27

3.2 部署模式 30

3.2.1 会话模式 30

3.2.2 单作业模式 31

3.2.3 应用模式 31

3.3 独立模式 32

3.3.1 会话模式部署 32

3.3.2 单作业模式部署 32

3.3.3 应用模式部署 32

3.3.4 高可用 33

3.4 YARN模式 34

3.4.1 相关准备和配置 34

3.4.2 会话模式部署 35

3.4.3 单作业模式部署 36

3.4.4 应用模式部署 37

3.4.5 高可用 37

3.5 K8s模式 38

3.6 本章总结 38

第4章 Flink运行时架构 39

4.1 系统架构 39

4.1.1 整体构成 40

4.1.2 JobManager 40

4.1.3 TaskManager 41

4.2 作业提交流程 42

4.2.1 高层级抽象视角 42

4.2.2 独立模式 42

4.2.3 YARN集群 43

4.3 一些重要概念 45

4.3.1 数据流图 45

4.3.2 并行度 46

4.3.3 算子链 48

4.3.4 作业图与执行图 49

4.3.5 任务和任务槽 51

4.4 本章总结 56

第5章 DataStream API基础篇 57

5.1 执行环境 57

5.1.1 创建执行环境 58

5.1.2 执行模式 58

5.1.3 触发程序执行 60

5.2 数据源 60

5.2.1 准备工作 60

5.2.2 从集合中读取数据 61

5.2.3 从文件读取数据 61

5.2.4 从Socket读取数据 62

5.2.5 从Kafka读取数据 62

5.2.6 自定义数据源 64

5.2.7 Flink支持的数据类型 66

5.3 转换操作 67

5.3.1 基本转换算子 67

5.3.2 聚合算子 71

5.3.3 用户自定义函数 75

5.3.4 物理分区 78

5.4 输出 83

5.4.1 连接到外部系统 83

5.4.2 输出到文件 85

5.4.3 输出到Kafka 86

5.4.4 输出到Redis 87

5.4.5 输出到Elasticsearch 89

5.4.6 输出到MySQL 91

5.4.7 自定义Sink输出 93

5.5 本章总结 94

第6章 Flink中的时间和窗口 95

6.1 时间语义 95

6.1.1 Flink中的时间语义 95

6.1.2 哪种时间语义更重要 97

6.2 水位线 98

6.2.1 事件时间和窗口 98

6.2.2 什么是水位线 100

6.2.3 如何生成水位线 104

6.2.4 水位线的传递 110

6.2.5 水位线的总结 111

6.3 窗口 112

6.3.1 窗口的概念 112

6.3.2 窗口的分类 114

6.3.3 窗口API概览 117

6.3.4 窗口分配器 118

6.3.5 窗口函数 121

6.3.6 测试水位线和窗口的使用 129

6.3.7 其他API 131

6.3.8 窗口的生命周期 135

6.4 迟到数据的处理 136

6.4.1 设置水位线延迟时间 136

6.4.2 允许窗口处理迟到数据 137

6.4.3 将迟到数据放入窗口侧输出流 137

6.5 本章总结 140

第7章处理函数 141

7.1 基本处理函数 141

7.1.1 处理函数的功能和使用 141

7.1.2 ProcessFunction解析 143

7.1.3 处理函数的分类 144

7.2 按键分区处理函数 145

7.2.1 定时器和定时服务 145

7.2.2 KeyedProcessFunction的使用 146

7.3 窗口处理函数 149

7.3.1 窗口处理函数的使用 149

7.3.2 ProcessWindowFunction解析 150

7.4 应用案例——Top N 151

7.4.1 使用ProcessAllWindowFunction 151

7.4.2 使用KeyedProcessFunction 153

7.5 侧输出流 157

7.6 本章总结 157

第8章多流转换 158

8.1 分流 158

8.1.1 简单实现 158

8.1.2 使用侧输出流 159

8.2 基本合流操作 161

8.2.1 联合 161

8.2.2 连接 164

8.3 基于时间的合流——联结 169

8.3.1 窗口联结 169

8.3.2 间隔联结 172

8.3.3 窗口同组联结 175

8.4 本章总结 176

第9章状态编程 177

9.1 Flink中的状态 177

9.1.1 有状态算子 177

9.1.2 状态的管理 178

9.1.3 状态的分类 178

9.2 按键分区状态 180

9.2.1 基本概念和特点 180

9.2.2 支持的结构类型 180

9.2.3 代码实现 182

9.2.4 状态生存时间 189

9.3 算子状态 190

9.3.1 基本概念和特点 190

9.3.2 状态类型 190

9.3.3 代码实现 191

9.4 广播状态 194

9.4.1 基本用法 194

9.4.2 代码实例 196

9.5 状态持久化和状态后端 197

9.5.1 检查点 197

9.5.2 状态后端 198

9.6 本章总结 200

第10章容错机制 201

10.1 检查点 201

10.1.1 检查点的保存 202

10.1.2 从检查点恢复状态 204

10.1.3 检查点算法 206

10.1.4 检查点配置 210

10.1.5 保存点 212

10.2 状态一致性 213

10.2.1 一致性的概念和级别 214

10.2.2 端到端的状态一致性 214

10.3 端到端精确一次 215

10.3.1 输入端保证 215

10.3.2 输出端保证 215

10.3.3 Flink和Kafka连接时的精确一次保证 218

10.4 本章总结 221

第11章 Table API和SQL 222

11.1 快速上手 222

11.1.1 需要引入的依赖 223

11.1.2 一个简单示例 223

11.2 基本API 224

11.2.1 程序架构 225

11.2.2 创建表环境 225

11.2.3 创建表 226

11.2.4 表的查询 227

11.2.5 输出表 229

11.2.6 表和流的转换 230

11.3 流处理中的表 234

11.3.1 动态表和持续查询 235

11.3.2 将流转换成动态表 236

11.3.3 用SQL持续查询 237

11.3.4 将动态表转换为流 241

11.4 时间属性和窗口 242

11.4.1 事件时间 242

11.4.2 处理时间 244

11.4.3 窗口 245

11.5 聚合查询 247

11.5.1 分组聚合 247

11.5.2 窗口聚合 248

11.5.3 开窗聚合 250

11.5.4 应用实例——Top N 252

11.6 联结查询 255

11.6.1 常规联结查询 256

11.6.2 间隔联结查询 257

11.7 函数 257

11.7.1 系统函数 258

11.7.2 自定义函数 259

11.8 SQL客户端 265

11.9 连接到外部系统 267

11.9.1 Kafka 267

11.9.2 文件系统 269

11.9.3 JDBC 270

11.9.4 Elasticsearch 271

11.9.5 HBase 271

11.9.6 Hive 272

11.10 本章总结 275

第12章 Flink CEP 277

12.1 基本概念 277

12.1.1 CEP是什么 277

12.1.2 模式 278

12.1.3 应用场景 279

12.2 快速上手 279

12.2.1 需要引入的依赖 279

12.2.2 一个简单实例 279

12.3 模式API 281

12.3.1 个体模式 281

12.3.2 组合模式 285

12.3.3 模式组 288

12.3.4 匹配后跳过策略 289

12.4 模式的检测处理 290

12.4.1 将模式应用到流上 290

12.4.2 处理匹配事件 290

12.4.3 处理超时事件 293

12.4.4 处理迟到数据 296

12.5 CEP的状态机实现 297

12.6 本章总结 299

点击展开点击收起

— 没有更多了 —