实战大数据(Hadoop+Spark+Flink)
正版新书 新华官方库房直发 可开电子发票
¥
62.37
6.3折
¥
99
全新
库存30件
作者杨俊编著
出版社机械工业出版社
ISBN9787111679660
出版时间2021-05
版次1
装帧平装
开本16开
纸张胶版纸
页数244页
字数376千字
定价99元
货号SC:9787111679660
上书时间2024-10-15
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
主编推荐:
面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
内容简介:
本书详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析——构建日志采集和分析平台、基于Spark的用户行为实时分析、基于Flink的用户行为实时分析、用户行为数据可视化。本书以一个完整的大数据项目为主线,涵盖Hadoop、Spark、Flink等主流大数据技术,按照大数据工程师的项目开发流程,理论与实践结合,逐步推进,使读者在学习大数据核心技术的同时,也能掌握开发大数据项目的完整流程,从而获得大数据项目开发经验。本书既可以作为大数据工程师的推荐开发手册,也可以作为高校大数据及相关专业的教材或实验手册。
目录:
前言
第1章 大数据技术概述
1.1 什么是大数据
1.2 大数据平台架构
1.2.1 数据获取
1.2.2 数据存储
1.2.3 数据处理
1.2.4 交互式分析
1.2.5 机器学习与数据挖掘
1.2.6 资源管理
1.3 大数据工程师的技能树
1.3.1 大数据主流开发语言
1.3.2 大数据平台的构建
1.3.3 大数据采集
1.3.4 大数据存储与交换
1.3.5 大数据离线计算
1.3.6 大数据实时计算
1.4 大数据项目需求分析与设计
1.4.1 项目需求分析
1.4.2 系统架构设计
1.4.3 离线和实时计算数据流程设计
1.4.4 大数据平台规划
1.5 本章小结
第2章 搭建IDEA开发环境及Linux虚拟机
2.1 搭建IDEA开发环境
2.1.1 JDK的安装与配置
2.1.2 Maven的安装与配置
2.1.3 IDEA的安装与配置
2.1.4 使用IDEA构建Maven项目
2.2 搭建Linux虚拟机
2.2.1 安装Linux系统
2.2.2 配置Linux静态IP
2.2.3 Linux主机名和IP映射
2.2.4 关闭Linux防火墙
2.2.5 创建Linux用户和用户组
2.2.6 Linux SSH免密登录
2.3 本章小结
第3章 基于Hadoop构建大数据平台
3.1 Zook
...
— 没有更多了 —
以下为对购买帮助不大的评价