正版现货新书 Flink入门与实战 9787302583813 汪明
全新正版现货,以书名为准,放心购买,购书咨询18931383650朱老师
¥
57.67
6.5折
¥
89
全新
库存3件
作者汪明
出版社清华大学出版社有限公司
ISBN9787302583813
出版时间2020-04
装帧平装
开本16开
定价89元
货号11197908
上书时间2024-12-17
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
汪明,中国矿业大学硕士,徐州软件协会副理事长,某创业公司合伙人。从事软件行业十余年,发表论文数十篇。著有图书《Python大数据处理库PySpark实战》《TypeScript实战》《Go并发编程实战》。
目录
章 Flink环境搭建
1.1 下载安装
1.1.1 什么是Flink
1.1.2 Flink用户
1.1.3 JDK安装
1.1.4 Scala安装
1.1.5 Python安装
1.1.6 FinalShell安装
1.2 配置与开发工具
1.2.1 基础配置
1.2.2 IDEA开发工具
1.3 编译
1.3.1 Scala项目模板
1.3.2 Java项目模板
1.3.3 Python项目
1.3.4 项目编译
1.4 运行Flink应用
1.4.1 单机Standalone模式
1.4.2 多机Standalone模式
1.4.3 On Yarn集群模式
1.5 本章小结
第2章 定义、架构与原理
2.1 流处理的应用场景
2.1.1 数据预处理场景
2.1.2 预警场景
2.1.3 实时数量统计场景
2.1.4 数据库交互场景
2.1.5 跟踪场景
2.1.6 基于数据流的机器学习场景
2.1.7 实时自动控制场景
2.2 流处理的原理
2.2.1 流数据特征
2.2.2 Dataflow模型
2.2.3 数据流图
2.2.4 流处理操作
2.2.5 窗口操作
2.3 Flink架构分析
2.3.1 Flink常见概念
2.3.2 Flink主从架构
2.3.3 任务和算子链
2.4 Flink中的几个语义——Streams、State、Time、API
2.4.1 Streams流
2.4.2 State状态
2.4.3 Time时间
2.4.4 API接口
2.5 Flink组件
2.6 本章小结
第3章 时间和窗口
3.1 时间
3.1.1 Flink中的时间
3.1.2 时间的特性
3.2 Timestamp和Watermark
3.2.1 在SourceFunction中生成
3.2.2 在assignTimestampsAndWatermarks中生成
3.2.3 Watermarks传播机制
3.3 EventTime+Watermark解决乱序数据
3.3.1 无迟到的乱序数据
3.3.2 有迟到的乱序数据
3.4 WindowAssigner、Evictor以及Trigger
3.4.1 WindowAssigner
3.4.2 Trigger
3.4.3 Evictor
3.5 Window内部实现
3.5.1 Flink Window源码分析
3.5.2 Flink Window执行过程
3.6 Window使用
3.6.1 Time Window
3.6.2 Count Window
3.6.3 Session Window
3.6.4 自定义Window
3.7 Window聚合分类
3.7.1 增量聚合
3.7.2 全量聚合
3.8 本章小结
第4章 状态管理及容错机制
4.1 什么是状态
4.2 什么场景会用到状态
4.3 状态的类型与使用
4.3.1 Keyed State托管状态
4.3.2 Operator State托管状态
4.4 Checkpoint机制
4.4.1 Checkpoint配置
4.4.2 State Backends状态后端
4.4.3 重启策略
4.5 SavePoint机制
4.6 本章小结
第5章 数据类型与序列化
5.1 Flink的数据类型
5.1.1 元组类型
5.1.2 Java POJOs类型
5.1.3 Scala样例类
5.1.4 基础类型
5.1.5 普通类
5.1.6 值类型
5.1.7 特殊类型
5.2 序列化原理
5.3 Flink的序列化过程
5.4 序列化的最佳实践
5.5 本章小结
第6章 DataStream API和DataSet API
6.1 DataStream API
6.1.1 DataSources数据输入
6.1.2 DataSteam转换操作
6.1.3 DataSinks数据输出
6.2 DataSet API
6.2.1 DataSources数据输入
6.2.2 DataSet转换操作
6.2.3 DataSinks数据输出
6.3 迭代计算
6.3.1 全量迭代
6.3.2 增量迭代
6.4 广播变量与分布式缓存
6.4.1 广播变量
6.4.2 分布式缓存
6.5 语义注解
6.5.1 Forwarded Fileds注解
6.5.2 Non-Forwarded Fileds注解
6.5.3 Read Fields注解
6.6 本章小结
第7章 Table API和SQL
7.1 TableEnviroment
7.1.1 开发环境构建
7.1.2 TableEnvironment基本操作
7.1.3 外部连接器
7.1.4 时间概念
7.1.5 Temporal Tables时态表
7.2 WordCount
7.3 Table API的操作
7.3.1 获取Table
7.3.2 输出Table
7.3.3 查询Table
7.3.4 聚合操作
7.3.5 多表关联
7.3.6 集合操作
7.3.7 排序操作
7.4 DataStream、DataSet和Table之间的转换
7.4.1 DataStream to Table
7.4.2 DataSet to Table
7.4.3 Table to DataStream
7.4.4 Table to DataSet
7.5 window aggregate与non-window aggregate
7.6 Flink SQL使用
7.6.1 使用SQL CLI客户端
7.6.2 在流上运行SQL查询
7.6.3 Group Windows窗口操作
7.6.4 多表关联
7.6.5 集合操作
7.6.6 去重操作
7.6.7 Top-N操作
7.6.8 数据写入
7.7 自定义函数
7.7.1 Scalar Function
7.7.2 Table Function
7.7.3 Aggregation Function
7.8 本章小结
第8章 并行
8.1 Flink并行度
8.2 TaskManager和Slot
8.3 并行度的设置
内容摘要
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态的计算,广泛应用于大数据相关的实际业务场景中。本书是一本从零开始讲解Flink的入门教材,学习本书需要有Java编程基础。本书共分10章,内容包括Flink开发环境搭建、Flink架构和原理、时间和窗口、状态管理和容错机制、数据类型与序列化、DataStream API和DataSet API、Table API和SQL、Flink并行、Flink部署与应用,很后以一个Flink实战项目为例,对Flink相关知识进行综合实践,其中涉及Web页面展示、WebSocket协议和Node.js服务等技术。
本书内容详尽、示例丰富,适合作为Flink初学者推荐的参考书,也很好适合作为高等院校和培训机构大数据及相关专业的师生教学参考。
主编推荐
本书针对Flink初学者,详细介绍Flink架构、原理、大数据处理机制和处理方法,以及Flink并行、部署与集群等方面的知识,最后通过一个实战项目来提高读者解决实际问题的能力。
精彩内容
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态的计算,广泛应用于大数据相关的实际业务场景中。本书是一本从零开始讲解Flink的入门教材,学习本书需要有Java编程基础。 本书共分10章,内容包括Flink开发环境搭建、Flink架构和原理、时间和窗口、状态管理和容错机制、数据类型与序列化、DataStream API和DataSet API、Table API和SQL、Flink并行、Flink部署与应用,最后以一个Flink实战项目为例,对Flink相关知识进行综合实践,其中涉及Web页面展示、WebSocket协议和Node.js服务等技术。 本书内容详尽、示例丰富,适合作为Flink初学者必备的参考书,也非常适合作为高等院校和培训机构大数据及相关专业的师生教学参考。
媒体评论
本书针对Flink初学者,详细介绍Flink架构、原理、大数据处理机制和处理方法,以及Flink并行、部署与集群等方面的知识,最后通过一个实战项目来提高读者解决实际问题的能力。
Flink是一个分布式处理引擎,用于对无界和有界数据流进行有状态的计算
— 没有更多了 —
以下为对购买帮助不大的评价