大数据技术及架构图解实战派
全新正版未拆封
¥
58.42
4.0折
¥
146
全新
仅1件
作者徐葳
出版社电子工业出版社
出版时间2022-07
版次1
装帧其他
上书时间2024-03-23
商品详情
- 品相描述:全新
图书标准信息
-
作者
徐葳
-
出版社
电子工业出版社
-
出版时间
2022-07
-
版次
1
-
ISBN
9787121437748
-
定价
146.00元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
500页
-
字数
750千字
- 【内容简介】
-
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。
.
一、数据采集
日志数据采集工具(Flume 、Logstash、Filebeat )
数据库数据采集工具(离线采集工具——Sqoop、DataX,实时数据采集工具——Canal、Maxwell
网页数据采集工具
物联网数据采集工具
消息队列中间件
.
二、数据存储
分布式文件存储之HDFS
NoSQL数据库之HBase
NoSQL数据库之Redis
.
三、离线数据计算
离线计算引擎MapReduce
离线计算引擎Spark
.
四、实时数据计算
实时计算引擎Storm
实时计算引擎Spark Streaming
新一代实时计算引擎Flink
.
五、OLAP数据分析
离线OLAP引擎(Hive、Impala、Kylin)
实时OLAP引擎(Druid、ClickHouse、Doris)
.
六、全文检索引擎
Lucene
Solr
Elasticsearch
.
七、分布式任务调度系统
Azkaban
Ooize
DolphinScheduler
.
八、分布式资源管理
YARN的原理、架构
YARN中的资源调度器
【实战】配置和使用YARN多资源队列
.
九 、大数据平台搭建工具
大数据平台工具HDP
大数据平台工具CDH
大数据平台工具CDP
.
本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。
.
在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解 实战”的形式帮助读者轻松理解复杂的知识。
- 【作者简介】
-
徐葳
中科院大数据研究院大数据技术专家
曾就职于北京猎豹移动科技有限公司,出版了《Flink入门与实战》
- 【目录】
-
基础篇
章 大数据的前世今生
1.1 什么是大数据
1.2 大数据产生的背景
1.3 大数据的4v特征
1.4 大数据的典型应用场景
1.5 大数据生态圈核心技术览
技术篇
第2章 海量数据采集
2.1 为什么需要数据采集
2.2 数据形态
2.3 数据来源
2.4 数据采集规则
2.5 志数据采集工具
2.5.1 对比常见的志数据采集工具
2.5.2 flume的及架构分析
2.5.3 flume的应用
2.5.3.1 安装flume
2.5.3.2 hello world
2.5.3.3 【实战】志汇采集
2.5.4 logstash的及架构分析
2.5.5 logstash的应用
2.5.5.1 安装logstash
2.5.5.2 【实战】hello world案例
2.5.5.3 【实战】采集异常志案例
2.5.6 filebeat的及架构分析
2.5.6.1 filebeat的由来
2.5.6.2 及架构分析
2.5.7 filebeat的应用
2.5.7.1 安装filebeat
2.5.7.2 【实战】采集应用程序志
2.6 数据库数据采集工具
2.6.1 对比常见的数据库数据采集工具
2.6.1.1 数据库离线数据采集工具
2.6.1.2 数据库实时数据采集工具
2.6.2 saoop的及架构分析
2.6.3 datax的及架构分析
2.6.4 sqoop的应用
2.6.4.1 安装sqoop
2.6.4.2 sqoop 常见参数
2.6.4.3 【实战】导入数据
2.6.4.4 【实战】导出数据
2.6.4.5 【实战】封装sqoop脚本
2.6.5 canal的及架构分析
2.6.6 maxwell的及架构分析
2.6.7 maxwell的应用
2.6.7.1 安装maxwell
2.6.7.2 【实战】采集mysql数据库的实时数据
2.7 网页数据采集工具
2.7.1 常见的网页数据采集工具
2.7.2 网页数据采集工具的及架构分析
2.8 物联网数据采集工具
……
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价