PySpark大数据分析与应用
全新正版 极速发货
¥
44.2
6.3折
¥
69.8
全新
库存8件
作者戴刚,张良均
出版社人民邮电出版社
ISBN9787115634900
出版时间2024-04
装帧平装
开本16开
定价69.8元
货号1203244438
上书时间2024-08-08
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
戴刚,重庆大学计算机科学与技术博士,美国匹兹堡大学访问学者,重庆交通大学经济与管理学院副教授,硕士生导师。主持1项教育部产学研合作项目,主研国家自然科学基金2项,国家科技支持计划1项目,中国移动(重庆分公司)科技公关项目1项,省部级科研项目2项,在国际期刊、国际会议及国内权威学术期刊发辫学术论文7篇。熟悉Java、Python、大数据及相关软件架构,具有丰富的软件开发经验。从事教育教学工作十多年,有扎实的专业素养和丰富的教学经验。
目录
第1章PySpark大数据分析概述
1.1大数据分析概述
1.1.1大数据的概念
1.1.2大数据分析的概念
1.1.3大数据分析的流程
1.1.4大数据分析的应用场景
1.1.5大数据技术体系
1.2 Spark大数据技术框架
1.2.1 Spark简介
1.2.2 Spark特点
1.2.3Spark运行架构与流程
1.2.4 Spark RDD
1.2.5 Spark生态圈
1.3 PySpark大数据分析
1.3.1 PySpark简介
……
内容摘要
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1~5章包括PySpark 大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、 基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析 中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款 风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部 分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。
本书可作为高校数据科学或大数据相关专业的教材,也可作为机器学习爱好者的自学用书。
主编推荐
1.理论叙述由浅入深,循序渐进,表达通俗易懂。本书的知识点章节从基本概念入手,介绍相关的基础理论,并结合介绍的知识点进行操作实践,再通过应用实例介绍如何运用具体方法解决实际问题。
2.强化基础,突出知识的应用性。结合高校教学特点和学生的情况,突出PySpark大数据分析的重点内容,强调PySpark在实际问题中的应用性,充分体现了理论知识与应用的紧密结合。
3.从实践出发,重点突出可操作性。本书从构建PySpark的开发环境入手,详细介绍了单机模式的PySpark开发环境搭建(基于Windows系统搭建,搭建过程简单,易于操作)和分布式模式的PySpark开发环境搭建(基于Linux系统搭建,贴近实际应用场景,处理高效),帮助读者构建一个可操作的实践环境,实践本书各章节的内容。且本书大部分章节附有实训和课后习题,便于读者进行上机实验,巩固所学知识,真正理解并应用所学知识。
4.通过典型的案例完整展示PySpark数据分析的过程,强化知识的实际应用。本书最后介绍了两个案例,以应用为导向,从需求分析入手,再设计解决方案,最终运用所需知识实现基于PySpark的数据分析过程。
5.体现思政育人。本书不仅注重培养学生分析处理数据的能力,运用数据分析理论与方法解决实际问题的实践能力;同时注重课程内容与思政教育的有机融合,潜移默化中引领学生树立和践行社会主义核心价值观,建立正确的三观,培养拥有正确政治方向的四有青年。
— 没有更多了 —
以下为对购买帮助不大的评价