• Spark大数据分析与实战(高职高专大数据技术与应用专业系列教材)
21年品牌 40万+商家 超1.5亿件商品

Spark大数据分析与实战(高职高专大数据技术与应用专业系列教材)

33.15 8.5折 39 全新

库存5件

天津武清
认证卖家担保交易快速发货售后保障

作者郑述招

出版社西安电子科技大学出版社

ISBN9787560658117

出版时间2020-09

装帧平装

开本16开

定价39元

货号29128897

上书时间2024-11-06

安岳县墨韵书屋

八年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
导语摘要

Spark是当前主流的大数据计算框架,本书较为全面地介绍了Spark的基本知识。按照“项目驱动、任务导向”的理念,全书设计了七个项目,分别是搭建Spark环境、编写Scala程序处理4S店数据、Spark RDD分析交通违章记录、Spark SQL处理结构化学生信息、Spark编程进阶、Spark Streaming处理流数据及Spark ML实现电影推荐。

为了使读者迅速掌握Spark的基本知识,本书提供了大量编程实例及配套资源,包括源代码、软件、数据集、虚拟机、习题答案等;另外,为了进一步降低入门门槛,本书还提供了配置好开发环境的Ubuntu虚拟机,读者可通过使用Virtual Box等工具导入后,迅速开始Spark相关知识的学习,省却了大量的环境配置等工作。

本书既可作为大数据、计算机、软件工程、信息管理等相关专业的教材,也可以作为大数据技术爱好者的自学用书。



商品简介

Spark是当前主流的大数据计算框架,本书较为全面地介绍了Spark的基本知识。按照“项目驱动、任务导向”的理念,全书设计了七个项目,分别是搭建Spark环境、编写Scala程序处理4S店数据、Spark RDD分析交通违章记录、Spark SQL处理结构化学生信息、Spark编程进阶、Spark Streaming处理流数据及Spark ML实现电影推荐。

 

为了使读者迅速掌握Spark的基本知识,本书提供了大量编程实例及配套资源,包括源代码、软件、数据集、虚拟机、习题答案等;另外,为了进一步降低入门门槛,本书还提供了配置好开发环境的Ubuntu虚拟机,读者可通过使用Virtual Box等工具导入后,迅速开始Spark相关知识的学习,省却了大量的环境配置等工作。

 

本书既可作为大数据、计算机、软件工程、信息管理等相关专业的教材,也可以作为大数据技术爱好者的自学用书。



 
 
 
 

目录
项目一搭建Spark环境

项目概述

项目演示

思维导图

任务1.1认识大数据

1.1.1大数据时代

1.1.2大数据的普遍特征——4V

1.1.3大数据的来源

1.1.4大数据的处理过程

任务1.2搭建Hadoop环境

1.2.1认识Hadoop生态体系

1.2.2Hadoop环境的搭建

1.2.3Hadoop平台的初步体验

任务1.3认识Spark

1.3.1初识Spark

1.3.2Spark中的运行框架与过程

1.3.3Spark与Hadoop的比较

任务1.4搭建Spark环境

1.4.1Spark部署模式

1.4.2Spark本地模式环境搭建

1.4.3Spark的简单使用

1.4.4VirtualBox中导入虚拟机

项目小结

课后练习

能力拓展

项目二编写Scala程序处理4S店数据

项目概述

项目演示

思维导图

任务2.1Scala的安装与体验

2.1.1Scala简介

2.1.2Scala的特性

2.1.3Scala的下载与安装

2.1.4轻松编写个Scala程序

2.1.5在网页上编写Scala程序

任务2.2查找并输出店铺的相关信息

2.2.1数据类型

2.2.2变量与常量

2.2.3Scala中的运算符

2.2.4if条件语句

2.2.5Scala中的函数

2.2.6使用函数查询4S店信息

任务2.3统计广州4S店的数量

2.3.1for循环

2.3.2while、do...while循环

2.3.3数组

2.3.4使用循环统计广州4S店的数量

任务2.4分组统计4s店信息

2.4.1元组

……

内容摘要

Spark是当前主流的大数据计算框架,本书较为全面地介绍了Spark的基本知识。按照“项目驱动、任务导向”的理念,全书设计了七个项目,分别是搭建Spark环境、编写Scala程序处理4S店数据、Spark RDD分析交通违章记录、Spark SQL处理结构化学生信息、Spark编程进阶、Spark Streaming处理流数据及Spark ML实现电影推荐。


为了使读者迅速掌握Spark的基本知识,本书提供了大量编程实例及配套资源,包括源代码、软件、数据集、虚拟机、习题答案等;另外,为了进一步降低入门门槛,本书还提供了配置好开发环境的Ubuntu虚拟机,读者可通过使用Virtual Box等工具导入后,迅速开始Spark相关知识的学习,省却了大量的环境配置等工作。


本书既可作为大数据、计算机、软件工程、信息管理等相关专业的教材,也可以作为大数据技术爱好者的自学用书。



   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP