• Spark大数据分析技术(Scala版) 曹洁 北京航空航天大学出版社 9787512433854
21年品牌 40万+商家 超1.5亿件商品

Spark大数据分析技术(Scala版) 曹洁 北京航空航天大学出版社 9787512433854

正版旧书 里面部分笔记 内容完好 可正常使用 旧书不附带光盘

9.75 九品

库存12件

江西南昌
认证卖家担保交易快速发货售后保障

作者曹洁

出版社北京航空航天大学出版社

ISBN9787512433854

出版时间2021-01

装帧线装

货号4511936

上书时间2024-03-14

有路官方旗舰店

八年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
商品描述
温馨提示:亲!旧书库存变动比较快,有时难免会有断货的情况,为保证您的利益,拍前请务必联系卖家咨询库存情况!谢谢!
书名:Spark大数据分析技术(Scala版)
编号:4511936
ISBN:9787512433854[十位:]
作者:曹洁
出版社:北京航空航天大学出版社
出版日期:2021年01月
页数:0
定价:39.00 元
参考重量:0.210Kg
-------------------------
新旧程度:6-9成新左右,不影响阅读,详细情况请咨询店主
如图书附带、磁带、学习卡等请咨询店主是否齐全* 图书目录 *
第1章 Spark概述 1 1.1 认识Spark 1 1.1.1 Spark的产生背景 1 1.1.2 Spark的优点 2 1.1.3 Spark应用场景 2 1.1.4 Spark生态系统 3 1.2 Spark运行机制 4 1.2.1 Spark基本概念 4 1.2.2 Spark运行架构 6 1.2.3 Spark应用执行的基本流程 7 1.3 Spark的安装及配置 8 1.3.1 Spark安装的基础环境 8 1.3.2 下载安装文件 8 1.3.3 单机模式配置 9 1.3.4 伪分布式模式配置 9 1.4 Spark Scala编程 11 1.4.1 启动Spark Shell 11 1.4.2 退出Spark Shell 12 1.5 Spark Python编程 12 习 题 13 第2章 Scala基础编程 14 2.1 Scala特性 14 2.2 Windows环境下的Scala安装 14 2.2.1 jdk安装与环境变量配置 14 2.2.2 Scala安装 15 2.3 声明常量和变量 16 2.3.1 声明常量 16 2.3.2 声明变量 17 2.4 字符串 18 2.4.1 基本数据类型 18 2.4.2 运算符 19 2.4.3 字符串对象的常用方法 20 2.5 Scala控制结构 23 2.5.1 条件表达式 23 2.5.2 ifelse选择结构 24 2.5.3 编写Scala脚本 25 2.5.4 循 环 25 2.6 Scala数组 27 2.6.1 数组的分类 27 2.6.2 遍历数组 28 2.6.3 数组转换 29 2.6.4 数组对象的常用方法 30 2.7 列 表 32 2.7.1 不可变列表(List)创建 32 2.7.2 不可变列表(List)操作 33 2.7.3 可变列表ListBuffer 36 2.8 集 合 37 2.8.1 不可变集合 38 2.8.2 可变集合 40 2.9 映 射 40 2.9.1 不可变映射 41 2.9.2 可变映射 42 2.10 元 组 44 2.10.1 元组常用操作 45 2.10.2 拉链操作 45 2.11 Scala函数 46 2.11.1 函数定义 46 2.11.2 匿名函数 47 2.11.3 高阶函数 47 2.12 Scala模式匹配 48 2.13 Scala类 50 2.13.1 class类 50 2.13.2 object对象 51 2.14 Scala读写文件 53 2.14.1 读取文件 53 2.14.2 写入文件 54 习 题 54 第3章 基于Scala的Spark编程 56 3.1 RDD创建 56 3.1.1 使用程序中数据集创建RDD 57 3.1.2 使用文本文件创建RDD 57 3.1.3 使用JSON文件创建RDD 59 3.1.4 使用CSV文件创建RDD 61 3.2 RDD操作 62 3.2.1 转换(Transformation)操作 62 3.2.2 行动(Action)操作 69 3.3 RDD属性 72 3.4 RDD持久化 74 3.5 使用Scala语言编写Spark应用程序 75 3.5.1 安装sbt 75 3.5.2 编写词频统计Scala应用程序 76 3.5.3 用sbt打包Scala应用程序 77 3.5.4 通过spark submit运行程序 77 习 题 78 第4章 Windows环境下的Spark综合编程 79 4.1 Windows环境下Spark与Hadoop安装 79 4.1.1 Windows环境下Spark安装 79 4.1.2 Windows环境下Hadoop安装 79 4.2 用Intellij IDEA 搭建Spark开发环境 80 4.2.1 下载与安装Intellij IDEA 81 4.2.2 Scala插件安装与使用 82 4.2.3 全局JDK和SDK设置 87 4.2.4 Maven安装与项目开发 89 4.2.5 本地Spark应用开发 91 4.3 数据分区 94 4.3.1 HashPartitioner(哈希分区) 95 4.3.2 RangePartitioner(范围分区) 95 4.4 Spark编程实现学生考试信息分析 96 习 题 98 第5章 Spark SQL结构化数据处理 99 5.1 Spark SQL概述 99 5.2 DataFrame的创建 99 5.2.1 使用parquet格式文件创建DataFrame 100 5.2.2 使用JSON 格式文件创建DataFrame 101 5.2.3 使用RDD创建DataFrame 102 5.3 DataFrame的保存 103 5.3.1 write()方法保存DataFrame 103 5.3.2 write.format()方法保存DataFrame 103 5.3.3 先转化成RDD再保存到文件中 103 5.4 DataFrame的常用操作 104 5.4.1 展示数据 104 5.4.2 筛 选 107 5.4.3 排 序 109 5.4.4 汇总与聚合 110 5.4.5 统 计 113 5.4.6 合 并 113 5.4.7 连 接 114 5.5 Spark SQL实战———波士顿房价数据分析 116 5.5.1 波士顿房价数据集 116 5.5.2 数据集的数据结构分析 117 5.5.3 相关性分析 119 习 题 119 第6章 Spark Streaming流计算 120 6.1 流计算概述 120 6.1.1 流数据概述 120 6.1.2 批处理与流处理 120 6.2 Spark Streaming运行原理 121 6.2.1 Spark Streaming概述 121 6.2.2 Spark Streaming运行原理 121 6.3 Spark Streaming编程模型 122 6.3.1 编写Spark Streaming程序的步骤 122 6.3.2 创建StreamingContext对象 122 6.4 定义DStream 的输入数据源 124 6.4.1 定义DStream 的输入数据源为文件流 124 6.4.2 定义DStream 的输入数据源为套接字流 125 6.4.3 定义DStream 的输入数据源为RDD队列流 130 6.5 操作DStream 131 6.5.1 无状态转换操作 131 6.5.2 有状态转换操作 134 6.5.3 输出操作 135 6.6 Spark Streaming的启动与停止 135 习 题 136 第7章 Spark GraphX 图计算 137 7.1 图计算概述 137 7.1.1 图结构 137 7.1.2 图计算应用 137 7.1.3 GraphX概述 138 7.2 GraphX图计算模型 139 7.2.1 属性图 139 7.2.2 GraphX图存储模式 141 7.2.3 GraphX图计算模型 143 7.2.4 GraphX架构 144 7.3 GraphX属性图的创建 145 7.3.1 使用顶点RDD和边RDD构建图 145 7.3.2 使用边的集合的RDD构建图 146 7.3.3 使用边源点和目的点的元组集合RDD构建图 147 7.4 属性图操作 148 7.4.1 图的属性操作 149 7.4.2 图的视图操作 150 7.4.3 图的缓存操作 153 7.4.4 图的顶点和边属性变换 153 7.4.5 图的关联与聚合操作 155 7.4.6 图的结构操作 156 习 题 157 第8章 Spark MLlib机器学习 158 8.1 MLlib机器学习库概述 158 8.1.1 机器学习简介 158 8.1.2 MLlib概述 159 8.2 MLlib基本数据类型 160 8.2.1 本地向量 160 8.2.2 带标签的点 161 8.2.3 本地矩阵 162 8.3 基本统计 163 8.3.1 汇总统计 163 8.3.2 相关性分析 164 8.3.3 分层抽样 165 8.3.4 假设检验 166 8.3.5 随机数生成 169 8.3.6 核密度估计 169 8.4 特征提取和转换 170 8.4.1 特征提取 170 8.4.2 特征转换 172 8.5 分类和回归算法 177 8.5.1 分类原理 177 8.5.2 朴素贝叶斯分类算法 178 8.5.3 决策树分类算法 180 8.5.4 逻辑回归算法 186 8.6 聚类算法 189 8.6.1 聚类概述 189 8.6.2 K均值聚类算法 190 8.7 协同过滤推荐算法 192 8.7.1 协同过滤推荐原理 192 8.7.2 ALS交替*小二乘协同过滤推荐 193 习 题 195 参考文献 196
  • Spark大数据分析技术(Scala版) 曹洁 北京航空航天大学出版社 9787512433854

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP