PySpark原理深入与编程实战
正版新书 新华官方库房直发 可开电子发票
¥
82.11
6.9折
¥
119
全新
库存8件
作者辛立伟, 辛雨桐编著
出版社清华大学出版社
ISBN9787302625971
出版时间2023-08
版次1
装帧平装
开本32开
纸张胶版纸
页数1008页
字数688千字
定价119元
货号SC:9787302625971
上书时间2024-09-16
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
辛立伟,一个在IT领域摸爬滚打二十多年的老程序员、技术培训师、技术作者。横跨Java、数据库、大数据开发与分析、人工智能等多个领域,参与多个IT项目的架构设计与开发。长期坚持撰写技术博客,曾在多个大学讲授Java开发、数据库和大数据技术课程,曾担任中国石油大学(青岛校区)等多所院校的外聘讲师。
主编推荐:
本书具有以下几个特点:
(1) 面向零基础读者,知识点深浅适当,代码完整易懂。
(2) 内容全面系统,包括架构原理、开发环境及程序部署、流和批计算、综合项目案例等。
(3) 版本优选,所有代码均基于Spark 3.1.2和Python 3.7。
(4) 全书包含大量的示例代码讲解和完整项目案例。
内容简介:
本书系统讲述Apache Spark/PySpark大数据计算平台的原理,以及如果将Apache PySpark应用于大数据的实时流处理、批处理等各个场景。通过原理深入学习和实践示例、案例的学习应用,使读者了解并掌握Apache Spark/PySpark的基本原理和技能,接近理论与实践的距离。全书共分为8章,主要内容包括:Spark架构原理与集群搭建、开发和部署PySpark应用程序、PySpark核心编程、PySpark SQL、PySpark SQL高级分析、PySpark结构化流、PySpark结构化流高级处理、Spark大数据处理综合案例。本书源码全部在Apache Spark 3.1.2上调试成功,所有示例和案例均基于Python 3.x语言。为降低读者学习大数据技术的门槛,本书除了提供了丰富的上机实践操作和范例程序详解之外,本书作者还为购买和使用本书的读者提供了搭建好的Hadoop、Hive数仓和PySpark大数据开发和学习环境。读者既可以参照本书的讲解自行搭建Hadoop和PySpark环境,也可直接使用作者提供的开始和学习环境,快速开始大数据和PySpark的学习。本书系统讲解了Apache Spark/PySpark大数据计算平台的原理和流、批处理的开发实践,内容全面、实例丰富、可操作性强,做到了理论与实践相结合。本书适合大数据学习爱好者、想要入门Apache Spark/PySpark的读者作为入门和提高的技术参考书,也适合用作大中专院校大数据专业相关的学生和老师的教材或教学参考书。
目录:
第1章 Spark架构原理与集群搭建
1.1 Spark简介
1.2 Spark技术栈
1.2.1 Spark Core
1.2.2 Spark SQL
1.2.3 Spark Streaming Structured Streaming
1.2.4 Spark MLlib
1.2.5 Spark GraphX
1.2.6 SparkR
1.3 Spark和PySpark架构原理
1.3.1 Spark集群和资源管理系统
1.3.2 Spark应用程序
1.3.3 Spark Driver Executor
1.3.4 PySpark架构
1.4 Spark程序部署模式
1.5 安装和配置Spark集群
1.5.1 安装Spark
1.5.2 了解Spark目录结构
1.5.3 配置Spark/PySpark集群
1.5.4 验证PySpark安装
1.6 配置Spark历史服务器
1.6.1 历史服务器配置
1.6.2 启动Spark历史服务器
1.7 使用PySpark Shell进行交互式分析
1.7.1 运行模式--master
1.7.2 启动和退出PySpark Shell
1.7.3 PySpark Shell常用命令
1.7.4 SparkContext和SparkSession
1.7.5 Spark Web UI
1.8 使用spark-submit提交PySpark应用程序
1.8.1 spark-submit指令的各种参数说明
……
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价