• Spark原理、机制及应用 9787111529286 刘驰主编 机械工业出版社
21年品牌 40万+商家 超1.5亿件商品

Spark原理、机制及应用 9787111529286 刘驰主编 机械工业出版社

当天发货,全新正版书。

19.6 4.0折 49 全新

库存25件

北京通州
认证卖家担保交易快速发货售后保障

作者刘驰主编

出版社机械工业出版社

ISBN9787111529286

出版时间2015-09

装帧平装

开本16开

定价49元

货号8678037

上书时间2024-07-07

白湘云书社

十四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
刘驰,博士,现任北京理工大学软件学院教授,软件服务工程系系主任。入选“北京理工大学杰出中青年支持与发展计划”。主持了国家自然科学基金、工信部电子商务集成试点工程等多项国家省部级重点项目。分别于清华大学和英国帝国理工学院获得学士和博士学位,后历任德国电信研究院(柏林)博士后研究员、美国IBMTJWatson研究中心研究员和IBM中国研究院研究主管。研究方向为:物联网、云计算和大数据技术。

目录
前言

第一篇概念篇

第1章Spark概述

1.1Spark初见

1.1.1Spark的发展史及近况

1.1.2Spark的特点

1.1.3Spark的作用

1.1.4Spark的体系结构

1.1.5Spark的发展趋势

1.2Spark框架

1.2.1批处理框架

1.2.2流处理框架

1.3Spark的生态系统

1.4Spark的数据存储

1.5本章小结

第2章Spark环境配置

2.1Spark运行环境配置

2.1.1先决条件

2.1.2下载与运行Spark

2.1.3使用交互式Shell

2.1.4搭建SparkStandalone集群

2.2Spark开发环境配置

2.2.1Spark独立应用程序

2.2.2构建IDE开发环境

2.3Spark编译环境配置

2.3.1使用Maven编译项目源码

2.3.2使用IDEA搭建源码编译与阅读环境

2.4本章小结

第二篇开发篇

第3章Spark核心开发

3.1Spark编程模型概述

3.2SparkContext

3.2.1SparkContext的作用

3.2.2SparkContext的创建

3.2.3使用Shell

3.2.4应用实践

3.3RDD简介

3.3.1RDD创建

3.3.2RDD转换操作

3.3.3RDD动作操作

3.3.4RDD惰性计算

3.3.5RDD持久化

3.3.6RDD检查点

3.4共享变量

3.4.1广播变量

3.4.2累加器

3.5Spark核心开发实践

3.5.1单值型Trasnformation算子

3.5.2键值对型Transformation算子

3.5.3Action算子

3.6本章小结

第4章Spark四大应用技术框架

4.1SparkSQL

4.1.1SparkSQL入门

4.1.2数据源

4.1.3性能调优

4.1.4分布式SQL引擎

4.1.5Shark迁移至SparkSQL指南

4.1.6Hive的兼容性

4.1.7SparkSQL数据类型

4.2SparkStreaming

4.2.1SparkStreaming简介

4.2.2入门实例

4.2.3基本概念

4.3SparkGraphX

4.3.1SparkGraphX简介

4.3.2属性图

4.3.3图操作

4.3.4PregelAPI

4.3.5图构造器

4.3.6顶点与边相关RDD

4.3.7最优化表示

4.3.8图算法

4.3.9Ex锄ple

4.4SparkMllib

4.4.1SparkMllib简介

4.4.2数据类型

4.4.3基本统计分析

4.4.4分类与回归

4.4.5协同过滤

4.4.6聚类

4.4.7降维

4.4.8特征提取与转换

4.4.9频繁模式挖掘

4.4.10最优化算法

4.4.11导出PMMl模式

4.5SparkR

4.5.1SparkRDataFrame

4.5.2DataFrame的相关操作

4.5.3从SparkR运行SQL查询

第5章Spark系统配置与调优

5.1Spark运行监控

5.2Spark配置参数

5.2.1应用属性

5.2.2运行环境属性

5.2.3Shuffle操作属性

5.2.4压缩与序列化属性

5.2.5数据序列化

5.3内存调优

5.3.1调整数据结构

5.3.2序列化RDD存储

5.3.3GC

5.4其他调优

5.4.1并行度

5.4.2Reduce任务

5.4.3广播变量

5.4.4数据本地化

5.4.5网络通信调优

5.4.6磁盘空间优化

5.4.7任务执行速度“倾斜”

5.5本童小结

第三篇机制篇

第6章RDD内部结构

6.1RDD接口

6.2分区

6.2.1分区接口

6.2.2分区个数

6.2.3分区内部的记录个数

6.3依赖关系

6.3.1依赖与RDD

6.3.2依赖分类

6.3.3窄依赖

6.3.4Shuffle依赖

6.3.5依赖与容错机制

6.3.6依赖与并行计算

6.4计算函数

6.4.1compute方法

6.4.2iterator方法

6.5分区器

6.5.1哈希分区器

6.5.2范围分区器

6.5.3默认分区器

6.6持久化

6.7检查点

6.8本章小结

第7章Spark调度机制

7.1调度基础

7.1.1基本概念

7.1.2通信框架

7.2集群资源调度

7.2.1集群部署图

7.2.2集群资源注册

7.2.3集群资源申请与分配

7.3DAG调度

7.3.1DAG调度通信机制

7.3.2作业处理流程

7.3.3阶段划分

7.4任务调度

7.4.1任务分类与执行

7.4.2任务划分与提交

7.4.3任务调度算法

7.4.4任务调度相关类

7.4.5任务分配

7.4.6任务接收与执行

7.5本章小结

第8章Shuffle过程

8.1与HadoopShuffle过程的区别

8.1.1MR模型的Shuffle过程

8.1.2聚合器

8.1.3哈希Shuffle与排序Shuffle

8.1.4Spark的Shufne过程

8.2Shume写过程

8.2.1哈希Shuffle写过程

8.2.2排序Shuffle写过程

8.3Shume读过程

8.4本章小结

第四篇应用篇

第9章视频娱乐领域

9.1腾讯公司在Hadoop和Spark平台上的应用

9.1.1公司背景特点

9.1.2业务需求

9.1.3解决方案

9.1.4方案效果

9.1.5小结

9.2Spotify公司在Hadoop和Spark平台AlS算法的运行时间对比

9.2.1公司背景特点

9.2.2业务需求

9.2.3解决方案

9.2.4方案效果

9.2.5小结

9.3本章小结

第10章电商领域

10.1淘宝公司在Spark平台上对GraphX与Bagel的运行效果对比

10.1.1公司背景特点

10.1.2业务需求

10.1.3解决方案

10.1.4方案效果

10.1.5小结

10.2Yahoo!关于Hive与Shark的应用

10.2.1公司背景特点

10.2.2业务需求

10.2.3解决方案

10.2.4方案效果

10.2.5小结

10.3本章小结

第11章电信领域

11.1Telefonica应用Spark和Cassandra方案解决多用户事务查询

11.1.1公司背景特点

11.1.2业务需求

11.1.3解决方案

11.1.4方案效果

11.1.5小结

11.2NTTDATA对SparkonYARN架构各项性能测试分析

11.2.1公司背景特点

11.2.2业务需求

11.2.3解决方案

11.2.4方案效果

11.2.5小结

11.3本章小结

第12章零售领域

12.1EuclidAnalysis基于Spark的地理位置分析服务

12.1.1公司背景特点

12.1.2业务需求

12.1.3解决方案

12.1.4方案效果

12.1.5小结

12.2Graphflow应用SparkMllib进行实时个性化推荐

12.2.1公司背景特点

12.2.2业务需求

12.2.3解决方案

12.2.4方案效果

12.2.5小结

12.3本章小结

第13章其他领域

13.1Uber基于Spark的私家车搭乘服务

13.1.1公司背景特点

13.1.2业务需求

13.1.3解决方案

13.1.4方案效果

13.1.5小结

13.2PubMatic应用Spark提供广告服务

13.2.1公司背景特点

13.2.2业务需求

13.2.3解决方案

13.2.4方案效果

13.2.5小结

13.3本章小结

内容摘要
 《Spark(原理机制及应用)》以Spark1.4为基础,详细介绍了spark技术概况、内部机制和应用情况。作者刘驰结合国内外众多资料和项目经验,力求
深入浅出地讲解spark技术的生态应用和发展状况,选取了Sparksumm“中的典型案例进行解析,为读者全国展现spark技术在业界的应用情况。
本书适合spark技术初学者、spark技术爱好者、
spark运维工程师和开源软件爱好者,也可以作为相关培训学校和大专院校相关专业的教学用书。

精彩内容
本书是一本以Spark1.4为基础,详细介绍了Spark技术的概况、内部机制和企业界的应用情况。作者结合靠前外众多资料和项目经验,力求深入浅出地讲解Spark技术的生态应用和发展状况,此外还选取了SparkSummit中的典型案例进行解析,为读者全面展现Spark技术在企业界的应用情况。本书适合Spark技术初学者、Spark技术爱好者、Spark运维工程师和开源软件爱好者,也可以作为相关培训学校和大专院校相关专业的教学用书。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP