• hadoop大数据分布式计算框架——与应用 数据库 作者 新华正版
  • hadoop大数据分布式计算框架——与应用 数据库 作者 新华正版
21年品牌 40万+商家 超1.5亿件商品

hadoop大数据分布式计算框架——与应用 数据库 作者 新华正版

41.43 6.4折 65 全新

库存3件

河北保定
认证卖家担保交易快速发货售后保障

作者作者

出版社经济科学出版社

ISBN9787521845655

出版时间2023-09

版次1

装帧平装

开本16

页数360页

字数381千字

定价65元

货号xhwx_1203104840

上书时间2024-06-30

浩子书屋

八年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
目录:

章 hadoop大数据分布式计算框架概述

1.1 大数据基础

1.2 hadoop概述

1.3 hadoop关键技术

1.4 hadoop的优势与不足

1.5 本章小结

本章题

本章主要参文献

第2章 hadoop大数据分布式环境

2.1 大数据linux基础

2.2 hadoop系统部署方式

2.3 hadoop3.x环境搭建

2.4 本章小结

本章题

本章主要参文献

第3章 hadoop分布式文件系统

3.1 集群与分布式文件系统

3.2 hdfs架构和组件

3.3 hdfs的高可用机制

3.4 hdfs的数据读写

3.5 hdfs联邦机制

3.6 本章小结

本章题

本章主要参文献

第4章 分布式调度系统yarn

4.1 yarn分布式资源管理

4.2 yarn体系结构

4.3 yarn作业调度

4.4 yarn特

4.5 yarn的应用实践

4.6 本章小结

本章题

本章主要参文献

第5章 mapreduce分布式计算框架

5.1 mapreduce概述

5.2 mapreduce工作

5.3 shuffle过程

5.4 mapreduce设计模式

5.5 mapreduce的应用实践

5.6 mapreduce优化

5.7 本章小结

本章题

本章主要参文献

第6章 分布式大数据分析项目案例

6.1 项目背景

6.2 功能需求

6.3 系统设计

6.4 项目实施

6.5 本章小结

本章题

内容简介:

讨论大数据技术时,首先需要了解大数据的基本处理流程,主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在,互联网、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等,每时每刻都在不断产生数据。这些分散在各处的数据,需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析,因为对于来源众多、类型多样的数据而言,数据缺失和语义模糊等问题是不可避的,因而必须采取相应的措施有效解决这些问题,这需要一个被称为“数据预处理”的过程,把数据变成一个可用的。数据预处理以后,会被存放到文件系统或数据库系统中进行存储与管理,然后采用数据挖掘工具对数据进行处理分析,后采用可视化工具为用户呈现结果。在整个数据处理过程中,还必须注意隐私保护和数据安全等问题。
因此,从数据分析全流程的角度,大数据技术主要包括数据采集与预处理、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容。

作者简介:

讨论大数据技术时,首先需要了解大数据的基本处理流程,主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在,互联网、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等,每时每刻都在不断产生数据。这些分散在各处的数据,需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析,因为对于来源众多、类型多样的数据而言,数据缺失和语义模糊等问题是不可避的,因而必须采取相应的措施有效解决这些问题,这需要一个被称为“数据预处理”的过程,把数据变成一个可用的。数据预处理以后,会被存放到文件系统或数据库系统中进行存储与管理,然后采用数据挖掘工具对数据进行处理分析,后采用可视化工具为用户呈现结果。在整个数据处理过程中,还必须注意隐私保护和数据安全等问题。因此,从数据分析全流程的角度,大数据技术主要包括数据采集与预处理、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP