Spark大数据分析技术
正版新书 新华官方库房直发 可开电子发票
¥
44.25
7.5折
¥
59
全新
库存3件
作者曹洁编著
出版社清华大学出版社
ISBN9787302625520
出版时间2023-03
版次1
装帧平装
开本16开
纸张胶版纸
页数280页
字数406千字
定价59元
货号SC:9787302625520
上书时间2024-09-16
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
主编推荐:
内容系统全面:全面介绍Spark3.2.0的生态组件。
原理浅显易懂:理论实践结合案例丰富注释详尽。
大数据可视化:WordCloud、PyeCharts、Plotly。
算法代码实现:使用Python实现书中所有算法。
配套资源丰富:配有教学课件、数据集和源代码。
内容简介:
本书系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、Spark RDD编程、Spark SQL结构化数据处理、HBase分布式数据库、Spark Streaming流计算、Spark MLlib机器学习、数据可视化。
本书可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程、数据科学与大数据技术、人工智能等专业的大数据课程教材,也可供从事大数据开发和研究工作的工程师和科技工作者参考。
目录:
第1章 大数据技术概述
1.1 大数据的基本概念
1.1.1 大数据的定义
1.1.2 大数据的特征
1.1.3 大数据思维
1.2 代表性大数据技术
1.2.1 Hadoop
1.2.2 Spark
1.2.3 Flink
1.3 大数据编程语言
1.4 在线资源
1.5 拓展阅读——三次信息化浪潮的启示
1.6 习题
第2章 Spark大数据处理框架
2.1 Spark概述
2.1.1 Spark的产生背景
2.1.2 Spark的优点
2.1.3 Spark的应用场景
2.1.4 Spark的生态系统
2.2 Spark运行机制
2.2.1 Spark基本概念
2.2.2 Spark运行架构
2.3 在VirtualBox上安装Linux集群
2.3.1 Master节点的安装
2.3.2 虚拟机克隆安装Slavel节点
2.4 Hadoop安装前的准备工作
2.4.1 创建hadoop用户和更新APT
2.4.2 安装SSH、配置SSH无密码登录
2.4.3 安装Java环境
2.4.4 Linux系统下Scala版本的Eclipse的安装与配置
2.4.5 Eclipse环境下Java程序开发实例
2.5 Hadoop的安装与配置
2.5.1 下载Hadoop安装文件
2.5.2 Hadoop单机模式配置
2.5.3 Hadoop伪分布式模式配置...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价