• Spark大数据分析技术(Scala版)
21年品牌 40万+商家 超1.5亿件商品

Spark大数据分析技术(Scala版)

全新正版 极速发货

23.25 6.0折 39 全新

库存4件

广东广州
认证卖家担保交易快速发货售后保障

作者曹洁|责编:董瑞

出版社北京航空航天大学

ISBN9787512433854

出版时间2021-01

装帧其他

开本其他

定价39元

货号31055207

上书时间2024-05-25

谢岳书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第1章  Spark概述
  1.1  认识Spark
    1.1.1  Spark的产生背景
    1.1.2  Spark的优点
    1.1.3  Spark应用场景
    1.1.4  Spark生态系统
  1.2  Spark运行机制
    1.2.1  Spark基本概念
    1.2.2  Spark运行架构
    1.2.3  Spark应用执行的基本流程
  1.3  Spark的安装及配置
    1.3.1  Spark安装的基础环境
    1.3.2  下载安装文件
    1.3.3  单机模式配置
    1.3.4  伪分布式模式配置
  1.4  Spark Scala编程
    1.4.1  启动Spark Shell
    1.4.2  退出Spark Shell
  1.5  Spark Python编程
  习题
第2章  Scala基础编程
  2.1  Scala特性
  2.2  Windows环境下的Scala安装
    2.2.1  jdk安装与环境变量配置
    2.2.2  Scala安装
  2.3  声明常量和变量
    2.3.1  声明常量
    2.3.2  声明变量
  2.4  字符串
    2.4.1  基本数据类型
    2.4.2  运算符
    2.4.3  字符串对象的常用方法
  2.5  Scala控制结构
    2.5.1  条件表达式
    2.5.2  if…else选择结构
    2.5.3  编写Scala脚本
    2.5.4  循环
  2.6  Scala数组
    2.6.1  数组的分类
    2.6.2  遍历数组
    2.6.3  数组转换
    2.6.4  数组对象的常用方法
  2.7  列表
    2.7.1  不可变列表(List)创建
    2.7.2  不可变列表(List)操作
    2.7.3  可变列表ListBuffer
  2.8  集合
    2.8.1  不可变集合
    2.8.2  可变集合
  2.9  映射
    2.9.1  不可变映射
    2.9.2  可变映射
  2.10  元组
    2.10.1  元组常用操作
    2.10.2  拉链操作
  2.11  Scala函数
    2.11.1  函数定义
    2.11.2  匿名函数
    2.11.3  高阶函数
  2.12  Scala模式匹配
  2.13  Scala类
    2.13.1  class类
    2.13.2  object对象
  2.14  Scala读写文件
    2.14.1  读取文件
    2.14.2  写入文件
  习题
第3章  基于Scala的Spark编程
  3.1  RDD创建
    3.1.1  使用程序中数据集创建RDD
    3.1.2  使用文本文件创建RDD
    3.1.3  使用JSON文件创建RDD
    3.1.4  使用CSV文件创建RDD
  3.2  RDD操作
    3.2.1  转换(Transformation)操作
    3.2.2  行动(Action)操作
  3.3  RDD属性
  3.4  RDD持久化
  3.5  使用Scala语言编写Spark应用程序
    3.5.1  安装sbt
    3.5.2  编写词频统计Scala应用程序
    3.5.3  用sbt打包Scala应用程序
    3.5.4  通过spark-submit运行程序
  习题
第4章  Windows环境下的Spark综合编程
  4.1  Windows环境下Spark与Hadoop安装
    4.1.1  Windows环境下Spark安装
    4.1.2  Windows环境下Hadoop安装
  4.2  用Intellij IDEA搭建Spark开发环境
    4.2.1  下载与安装Intellij IDEA
    4.2.2  Scala插件安装与使用
    4.2.3  全局JDK和SDK设置
    4.2.4  Maven安装与项目开发
    4.2.5  本地Spark应用开发
  4.3  数据分区
    4.3.1  HashPartitioner(哈希分区)
    4.3.2  RangePartitioner(范围分区)
  4.4  Spark编程实现学生考试信息分析
  习题
第5章  Spark SQL结构化数据处理
  5.1  Spark SQL概述
  5.2  DataFrame的创建
    5.2.1  使用parquet格式文件创建DataFrame
    5.2.2  使用JSON格式文件创建DataFrame
    5.2.3  使用RDD创建DataFrame
  5.3  DataFrame的保存
    5.3.1  write()方法保存DataFrame
    5.3.2  write.format()方法保存DataFrame
    5.3.3  先转化成RDD再保存到文件中
  5.4  DataFrame的常用操作
    5.4.1  展示数据
    5.4.2  筛选
    5.4.3  排序
    5.4.4  汇总与聚合
    5.4.5  统计
    5.4.6  合并
    5.4.7  连接
  5.5  Spark SQL实战——波士顿房价数据分析
    5.5.1  波士顿房价数据集
    5.5.2  数据集的数据结构分析
    5.5.3  相关性分析
  习题
第6章  Spark Streaming流计算
  6.1  流计算概述
    6.1.1  流数据概述
    6.1.2  批处理与流处理
  6.2  Spark Streaming运行原理
    6.2.1  Spark Streaming概述
    6.2.2  Spark Streaming运行原理
  6.3  Spark Streaming编程模型
    6.3.1  编写Spark Streaming程序的步骤
    6.3.2  创建StreamingContext对象
  6.4  定义DStream的输入数据源
    6.4.1  定义DStream的输入数据源为文件流
    6.4.2  定义DStream的输入数据源为套接字流
    6.4.3  定义DStream的输入数据源为RDD队列流
  6.5  操作DStream
    6.5.1  无状态转换操作
    6.5.2  有状态转换操作
    6.5.3  输出操作
  6.6  Spark Streaming的启动与停止
  习题
第7章  Spark GraphX图计算
  7.1  图计算概述
    7.1.1  图结构
    7.1.2  图计算应用
    7.1.3  GraphX概述
  7.2  Graphx图计算模型
    7.2.1  属性图
    7.2.2  GraphX图存储模式
    7.2.3  Graphx图计算模型
    7.2.4  GraphX架构
  7.3 

内容摘要
 本书系统介绍了Spark大数据技术的相关知识,内容包括Spark概述、Scala基础
编程、基于Scala的Spark编程、Windows环境下的Spark综合编程、SparkSQL结构化数据处理、
SparkStreaming流计算、
SparkGraphX图计算、
SparkMLlib机器学习。本书还给出了Spark大数据相关技术的许多编程示例与详细注解。
本书可作为高等院校计算机、软件工程、数据科学与大数据技术、智能科学与技术、人工智能等专业的大数据课程教材,也可供相关技术人员参考。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP