• Spark大数据分析技术
21年品牌 40万+商家 超1.5亿件商品

Spark大数据分析技术

21.66 3.7折 59 九五品

仅1件

天津武清
认证卖家担保交易快速发货售后保障

作者曹洁 著,张尧学

出版社清华大学出版社

ISBN9787302625520

出版时间2023-03

版次1

装帧平装

开本16开

纸张胶版纸

页数260页

字数99999千字

定价59元

上书时间2024-05-07

鲁是特

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:Spark大数据分析技术
定价:59.00元
作者:曹洁 著,张尧学
出版社:清华大学出版社
出版日期:2023-03-01
ISBN:9787302625520
字数:406000
页码:260
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
内容系统全面:全面介绍Spark3.2.0的生态组件。原理浅显易懂:理论实践结合案例丰富注释详尽。大数据可视化:WordCloud、PyeCharts、Plotly。算法代码实现:使用Python实现书中所有算法。配套资源丰富:配有教学课件、数据集和源代码。
内容提要
《Spark大数据分析技术(Python版 微课版)/面向新工科专业建设计算机系列教材》特色:  循序渐进讲解Spark大数据全流程处理相关技术,配备大量的实例。  《Spark大数据分析技术(Python版 微课版)/面向新工科专业建设计算机系列教材》内容丰富,涵盖了Spark大数据处理框架、SparkRDD编程、SparkSQL结构化数据处理、HBase分布式数据库、SparkStreaming流计算、SparkMLlib机器学习、数据可视化等内容。  《Spark大数据分析技术(Python版 微课版)/面向新工科专业建设计算机系列教材》注重Spark各生态组件原理剖析与算法的Python代码实现相结合,做到理论与实践并重。  《Spark大数据分析技术(Python版 微课版)/面向新工科专业建设计算机系列教材》系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、Spark RDD编程、Spark SQL结构化数据处理、HBase分布式数据库、Spark Streaming流计算、Spark MLlib机器学习、数据可视化。  《Spark大数据分析技术(Python版 微课版)/面向新工科专业建设计算机系列教材》可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程、数据科学与大数据技术、人工智能等专业的大数据课程教材,也可供从事大数据开发和研究工作的工程师和科技工作者参考。
目录
章 大数据技术概述1.1 大数据的基本概念1.1.1 大数据的定义1.1.2 大数据的特征1.1.3 大数据思维1.2 代表性大数据技术1.2.1 Hadoop1.2.2 Spark1.2.3 Flink1.3 大数据编程语言1.4 在线资源1.5 拓展阅读——三次信息化浪潮的启示1.6 习题第2章 Spark大数据处理框架2.1 Spark概述2.1.1 Spark的产生背景2.1.2 Spark的优点2.1.3 Spark的应用场景2.1.4 Spark的生态系统2.2 Spark运行机制2.2.1 Spark基本概念2.2.2 Spark运行架构2.3 在VirtualBox上安装Linux集群2.3.1 Master节点的安装2.3.2 虚拟机克隆安装Slavel节点2.4 Hadoop安装前的准备工作2.4.1 创建hadoop用户和更新APT2.4.2 安装SSH、配置SSH无密码登录2.4.3 安装Java环境2.4.4 Linux系统下Scala版本的Eclipse的安装与配置2.4.5 Eclipse环境下Java程序开发实例2.5 Hadoop的安装与配置2.5.1 下载Hadoop安装文件2.5.2 Hadoop单机模式配置2.5.3 Hadoop伪分布式模式配置2.5.4 Hadoop分布式模式配置2.6 Spark的安装与配置2.6.1 下载Spark安装文件2.6.2 单机模式配置2.6.3 伪分布式模式配置2.7 使用PySpark编写Python代码2.8 安装pip工具和常用的数据分析库2.9 安装Anaconda和配置Jupyter Notebook2.9.1 安装Anaconda2.9.2 配置Jupyter Notebook2.9.3 运行Jupyter Notebook2.9.4 配置Jupyter Notebook实现和PySpark交互2.9.5 为Anaconda安装扩展库2.10 拓展阅读——Spark诞生的启示2.11  习题……第3章 Spark RDD编程第4章 Spark SQL结构化数据处理第5章 HBase分布式数据库第6章 Spark Streaming流计算第7章 Spark MLlib机器学习第8章 数据可视化参考文献
作者介绍
曹洁,博士,毕业于同济大学计算机软件与理论专业;研究方向为大数据技术、并行分布式处理等。在《软件学报》《电子学报》《计算机研究与发展》《通信学报》等核心期刊上发表学术论文十余篇;主讲Python语言程序设计、大数据技术、大数据分析等课程;主编出版7《Python语言程序设计》《Python数据挖掘技术及应用》《Hadoop+Spark大数据技术》等多本省部级规划教材。
序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP