flink大数据分析实战 数据库 张伟洋 编
大数据专家编撰,详解flink生态系统主流的大数据开发技术
¥
57.05
6.4折
¥
89
全新
库存9件
作者张伟洋 编
出版社清华大学出版社
ISBN9787302598183
出版时间2022-02
版次1
装帧平装
开本16
页数356页
字数605千字
定价89元
货号xhwx_1202593281
上书时间2024-11-21
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
主编:
"flink的基础知识,包括flink应用场景、主要组件、编程模型等,通过单词示例带领读者快速体验flink应用程序的编写。
flink的多种运行时架构、任务调度、数据分区、flink集群的安装部署,以及flink命令行作、应用程序提交、常用hell命令等。
flink流式计算datatream api、关系型计算tableql api、图计算框架gelly等的基础知识和架构,以及api作、内核源码剖析。
通过丰富的实际案例讲解了各个框架的具体应用以及与hadoop生态系统框架hive、kafka的整合作。"
目录:
章 初识flink
1.1 大数据开发体架构
1.2 什么是flink
1.3 flink的应用场景
1.4 流计算框架对比
1.5 flink的主要组件
1.6 flink编程模型
1.6.1 数据集
1.6.2 编程接
1.6.3 程序结构
1.7 快速体验flink程序
1.7.1 intellij idea安装scala插件
1.7.2 intellij idea创建flink项目
1.7.3 示例:批处理单词
1.7.4 示例:流处理单词
第2章 flink运行架构及
2.1 flink运行时架构
2.1.1 yarn集群架构
2.1.2 flink standalone架构
2.1.3 flink on yarn的架构
2.2 flink任务调度
2.2.1 任务链
2.2.2 并行度
2.2.3 共享task slot
2.2.4 数据流
2.2.5 执行图
2.2.6 执行计划
2.3 flink数据分区
2.3.1 分区数量
2.3.2 分区策略
第3章 flink安装及部署
3.1 flink集群搭建
3.1.1 flink本地模式搭建
3.1.2 flink standalone搭建
3.1.3 flink on yarn搭建
3.2 flink ha模式
3.2.1 flink standalone模式的ha架构
3.2.2 flink standalone模式ha集群搭建
3.2.3 flink on yarn模式ha集群搭建
3.3 flink命令行界面
3.4 flink应用提交
3.5 flink shell的使用
第4章 flink datastream api
4.1 基本概念
4.2 执行模式
4.3 作业流程
4.4 程序结构
4.5 source数据源
4.5.1 基本数据源
4.5.2 数据源
4.5.3 自定义数据源
4.6 transformation数据转换
4.7 sink数据输出
4.8 数据类型与序列化
4.9 分区策略
4.9.1 内置分区策略
4.9.2 自定义分区策略
4.10 窗计算
4.10.1 事件时间
4.10.2 窗分类
4.10.3 窗函数
4.10.4 触发器
4.10.5 清除器
4.11 水印
4.11.1 计算规则
4.11.2 允许延迟与侧道输出
4.11.3 生成策略
4.12 管理
4.12.1 keyed state
4.12.2 operator state
4.13 容错机制
4.13.1 checkpoint
4.13.2 barrier
4.13.3 重启与故障恢复策略
4.13.4 savepoint
4.14 案例分析:计算5秒内输入的单词数量
4.15 案例分析:统计5分钟内每个用户产生的志数量
4.16 案例分析:统计24小时内每个用户的订单均消费额
4.17 案例分析:计算5秒内每个信号灯通过的汽车数量
4.18 案例分析:flink整合kafka计算实时单词数量
4.19 案例分析:实时交易额统计
4.19.1 创建自定义数据源
4.19.2 计算各个分类的订单额
4.19.3 计算销售额与分类top3
第5章 flink table api&sql
5.1 基本概念
5.1.1 计划器
5.1.2 api架构
5.1.3 程序结构
5.2 动态表
5.2.1 流映为动态表
5.2.2 连续查询
5.2.3 动态表转换为流
5.3 tableenvironment api
5.3.1 基本概念
5.3.2 创建tableenvironment
5.3.3 示例:简单订单统计
5.4 table api
5.4.1 基本概念
5.4.2 示例:订单分组
5.4.3 示例:每小时订单分组求均值
5.4.4 关系作
5.5 sql api
5.5.1 ddl作
5.5.2 dml作
5.5.3 dql作
5.5.4 窗函数
5.5.5 窗聚合
5.5.6 分组聚合
5.5.7 over聚合
5.5.8 连接查询
5.6 topn查询
5.6.1 over子句
5.6.2 示例:计算产品类别销售额topn
5.6.3 示例:搜索词热度统计
5.6.4 窗topn
5.7 catalog元数据管理
5.8 flink sql整合kafka
5.8.1 基本概念
5.8.2 示例:flink sql整合kafka实现实时etl
5.9 flink sql cli
5.9.1 启动sql cli
5.9.2 执行sql查询
5.9.3 可视化结果模式
5.10 flink sql整合hive
5.10.1 整合步骤
5.10.2 table api作hive
5.10.3 示例:flink sql整合hive分析搜用户搜索志
5.11 案例分析:flink sql实时单词
5.12 案例分析:flink sql实时计算5秒内用户订单金额
5.13 案例分析:用户行为分析
5.13.1 离线与实时计算业务架构
5.13.2 flume数据采集架构
5.13.3 kafka消息队列架构
5.14 案例分析:flink sql智慧交通数据分析
5.14.1 项目介绍
5.14.2 数据准备
5.14.3 统计正常卡数量
5.14.4 统计车流量排名前3的卡号
5.14.5 统计每个卡通过速度快的前3辆车
5.14.6 车辆轨迹分析
第6章 flink内核源码
6.1 流图
6.1.1 streamgraph核心对象
6.1.2 streamgraph生成过程
6.2 作业图
6.2.1 jobgraph的核心对象
6.2.2 jobgraph的生成过程
6.3 执行图
6.3.1 executiongraph的核心对象
6.3.2 executiongraph的生成过程
第7章 gelly图计算
7.1 什么是gelly
7.2 个gelly程序
7.3 gelly数据结构
7.4 如何使用gelly
7.5 图作
7.5.1 基本作
7.5.2 属作
7.5.3 结构作
7.5.4 连接作
7.6 图常用api
7.6.1 创建图
7.6.2 图的转换
7.6.3 图的添加与移除
7.6.4 图的邻域方法
7.7 案例分析:gelly计算社交网络中的均年龄
内容简介:
本书由大数据专家精心编写,循序渐进地介绍了flink生态系统主流的大数据开发技术。全书共7章,章讲解flink的基础知识,包括flink应用场景、主要组件、编程模型等,后通过一个单词示例带领读者快速体验flink应用程序的编写;第2、3章讲解flink的多种运行时架构、任务调度、数据分区以及flink集群的安装部署,同时包括flink命令行作、应用程序提交、常用hell命令等;第4~7章讲解了flink流式计算datatream api、关系型计算tableamp;ql api以及图计算框架gelly等的基础知识、架构,同时包括常用hell命令、api作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与hadoop生态系统框架hive、kafka的整合作。
本书内容翔实,实例丰富,适合flink新手、大数据开发人员阅读,也可作为培训机构和大专院校相关专业的用书。
作者简介:
张伟洋大数据领域专家,拥有多年互联网公司软件研发经验,曾在互联网旅游公司任软件研发事业部经理。先后多次为洋大学、曲阜师范大学、青岛理工大学等高校举行大数据专题讲座,对hadoop及周边大数据框架zookeeper、hive、hbae、torm、park、flink等有深入的研究。已出版hadoop大数据技术开发实战park大数据分析实战等图书,公众号 “奋斗在it” 的创办人。
— 没有更多了 —
以下为对购买帮助不大的评价