• 大数据原理及实践
21年品牌 40万+商家 超1.5亿件商品

大数据原理及实践

正版保障 假一赔十 电子发票

26.19 6.7折 39 全新

库存10件

湖北武汉
认证卖家担保交易快速发货售后保障

作者张晓燕 ... [等] 主编

出版社上海财经大学出版社

ISBN9787564239091

出版时间2023-03

装帧平装

开本其他

定价39元

货号4326360

上书时间2024-12-30

瀚东书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
商品简介

目录
本书分为八章。首章介绍Hadoop生态系统及其发展历程。大家可以通过此章内容了解到Hadoop是一个开放的生态系统, 里面有很多项目组成, 包括数据采集类的项目、数据处理类的项目和数据可视化类的项目等; 第二章介绍Hadoop的核心组件, 包括HDFS、MapReduce和Yarn, 通过此章的学习。大家可以了解到Hadoop三大核心组件的基本组成及运行原理; 第三章介绍Hadoop集群环境的搭建。第四章主要介绍Hadoop生态系统中非常常用、非常实用又简单易用的Hive组件, 介绍其原理及安装方法; 第五章主要介绍Hive的使用, 了解Hive中DDL和DML语法知识 (通过前面五章的学习。大家可以独立搭建Hadoop集群, 并上传文件到HDFS中, 并且利用MapReduce或者Hive对数据文件进行统计分析); 第六章进入Hadoop生态系统中内存计算的学习, 选用Spark组件, 着重介绍Spark的内存计算的原理及运行模式; 第七章介绍Spark的编程及SparkSQL的使用。通过这两部分的学习, 大家可以完成Spark的安装部署, 了解Spark的适用场合, 学会Spark编程和SparkSQL对数据进行分析; 第八章为SparkMLLib的内容。通过这一章的学习, 大家可以利用SparkMLLib完成较复杂的一些数据分析, 例如分类、聚类和关联分析等。

内容摘要
近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。人们把这种大规模数据称为“海量数据”。
本书针对社会需求,为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。通过系统的讲解大规模数据的存储及处理等基础知识,使学生了解分布式数据处理系统的基本思想、原理及架构;通过实际案例分析及实践,使学生掌握大数据存储及处理的技术方法,最终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。
本书大致目录:第一章,第一章,Hadoop生态系统介绍;第二章,Hadoop基本原理及环境搭建;第三章,HDFS基本操作及MapReduce编程;第四章,数据仓库HIVE的基本原理及应用;第五章,SPARK基本原理及应用;第六章,综合案例。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP