全新正版现货,以书名为准,放心购买,购书咨询18931383650朱老师
¥ 27.82 6.0折 ¥ 46 全新
仅1件
作者何庆
出版社中南大学出版社
ISBN9787548716006
出版时间2021-08
装帧其他
开本其他
定价46元
货号11314876
上书时间2024-12-15
第1章大数据、Spark概论
1.1大数据
1.2大数据分布式计算平台
1.3 Hadoop简介·
1.4 Spark 简介…
1.4.1 Spark产生背景
1.4.2 Spark特征·
1.4.3 Spark相关概念…
1.4.4
Spark编程接口.
1.4.5 Spark的文件数据读写
1.4.6 Spark程序提交类型
1.4.7 Spark 与Hadoop
1.4.8 Spark生态系统
1.5本章小结
第2章 Python基础编程…
2.1 Python 基础…
2.1.1安装与使用…
2.1.2变量与数据类型
2.1.3算术运算符・
2.1.4比较运算符…
2.2 Python中的数据结构
2.3 Python 对象序列化…
2.4函数式编程基础…
2.5本章小结·
第3章 Spark集群部署
3.1运行环境说明…
3.1.1软硬件环境…
3.1.2集群网络环境…
3.2 安装VMware - Workstation15.5.exe
3.3 安装Ubantul8.04
3.4安装Hadoop
3.4.1克隆并启动虚拟机…
3.4.2网络基本配置…
3.4.3安装JDK
3.4.4免密钥登录配置
3.4.5Hadoop配置…
3.4.6配置从节点……
3.4.7配置系统文件……
3.4.8启动Hadoop集群
3.5 安装Seala
3.6 安装Spark……
3.6.1下载并解压Spark 安装包·
3.6.2 配置spark-env.sh
3.6.3_ 配置 spark - defaults. conf …
3.6.4 配置slaves …
3.6.5配置环境变量……
3.7 启动Spark … ……
3.8本章小结……
第4章 理解Spark集群架构…
4.1 Spark 应用中的常用术语……
4.1.1 Spark 驱动器…
4.1.2 Spark 驱动器节点与执行器节点…
4.1.3 Spark 主进程与集群管理器….……
4.2 使用独立集群的Spark 应用……
4.3在Yarn上运行Spark应用
4.3.1 Resource Manager作为集群管理器
4.3.2 Application Master作为Spark 主进程…
4.4 在Yarn上运行Spark应用的部署模式
4.4.1客户端模式…
4.4.2集群模式…
4.4.3本地模式
4.5本章小结
第5章 Spark编程基础
5.1RDD简介
5.1.1RDD定义
5.1.2RDD的属性
5.1.3RDD的特性
5.2加载数据到RDD
5.2.1并行化现有集合创建RDD
5.2.2读取外部数据集创建RDD
5.3RDD操作
5.3.1RDD核心概念
— 没有更多了 —
以下为对购买帮助不大的评价