• PySpark大数据分析与应用
21年品牌 40万+商家 超1.5亿件商品

PySpark大数据分析与应用

全新正版 极速发货

44.2 6.3折 69.8 全新

库存8件

广东广州
认证卖家担保交易快速发货售后保障

作者戴刚,张良均

出版社人民邮电出版社

ISBN9787115634900

出版时间2024-04

装帧平装

开本16开

定价69.8元

货号1203244438

上书时间2024-08-08

谢岳书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
戴刚,重庆大学计算机科学与技术博士,美国匹兹堡大学访问学者,重庆交通大学经济与管理学院副教授,硕士生导师。主持1项教育部产学研合作项目,主研国家自然科学基金2项,国家科技支持计划1项目,中国移动(重庆分公司)科技公关项目1项,省部级科研项目2项,在国际期刊、国际会议及国内权威学术期刊发辫学术论文7篇。熟悉Java、Python、大数据及相关软件架构,具有丰富的软件开发经验。从事教育教学工作十多年,有扎实的专业素养和丰富的教学经验。

目录
第1章PySpark大数据分析概述

1.1大数据分析概述

1.1.1大数据的概念

1.1.2大数据分析的概念

1.1.3大数据分析的流程

1.1.4大数据分析的应用场景

1.1.5大数据技术体系

1.2 Spark大数据技术框架

1.2.1 Spark简介

1.2.2 Spark特点

1.2.3Spark运行架构与流程

1.2.4 Spark RDD

1.2.5 Spark生态圈

1.3 PySpark大数据分析

1.3.1 PySpark简介

……

内容摘要
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1~5章包括PySpark 大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、 基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析 中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款 风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部 分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。

本书可作为高校数据科学或大数据相关专业的教材,也可作为机器学习爱好者的自学用书。

主编推荐
1.理论叙述由浅入深,循序渐进,表达通俗易懂。本书的知识点章节从基本概念入手,介绍相关的基础理论,并结合介绍的知识点进行操作实践,再通过应用实例介绍如何运用具体方法解决实际问题。
2.强化基础,突出知识的应用性。结合高校教学特点和学生的情况,突出PySpark大数据分析的重点内容,强调PySpark在实际问题中的应用性,充分体现了理论知识与应用的紧密结合。
3.从实践出发,重点突出可操作性。本书从构建PySpark的开发环境入手,详细介绍了单机模式的PySpark开发环境搭建(基于Windows系统搭建,搭建过程简单,易于操作)和分布式模式的PySpark开发环境搭建(基于Linux系统搭建,贴近实际应用场景,处理高效),帮助读者构建一个可操作的实践环境,实践本书各章节的内容。且本书大部分章节附有实训和课后习题,便于读者进行上机实验,巩固所学知识,真正理解并应用所学知识。
4.通过典型的案例完整展示PySpark数据分析的过程,强化知识的实际应用。本书最后介绍了两个案例,以应用为导向,从需求分析入手,再设计解决方案,最终运用所需知识实现基于PySpark的数据分析过程。
5.体现思政育人。本书不仅注重培养学生分析处理数据的能力,运用数据分析理论与方法解决实际问题的实践能力;同时注重课程内容与思政教育的有机融合,潜移默化中引领学生树立和践行社会主义核心价值观,建立正确的三观,培养拥有正确政治方向的四有青年。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP