• 大数据技术科普
21年品牌 40万+商家 超1.5亿件商品

大数据技术科普

正版新书 新华官方库房直发 可开电子发票

20.17 6.3折 32 全新

库存4件

江苏南京
认证卖家担保交易快速发货售后保障

作者靳大尉主编

出版社西安电子科技大学出版社

ISBN9787560668178

出版时间2023-06

版次1

装帧平装

开本16开

纸张胶版纸

页数132页

字数147千字

定价32元

货号SC:9787560668178

上书时间2024-06-27

文源文化

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
内容简介:
本书是大数据技术普及系列读物之一,主要涉及大数据采集、分布式文件存储和非关系型数据管理等内容。全书共6章,每章一个专题,按照大数据运用流程,从网页和日志文件两种常用的大数据采集方法入手,介绍了分布式文件存储、NoSQL数据库基础理论和4种NoSQL数据库技术。针对特定技术选择了一款最典型的产品进行诠释,先后对Python语言中的Requests和BeautifulSoup包,Hadoop生态中的Flume、HDFS和HBase,以及Redis、MongoDB和Neo4j等产品进行了介绍。在每章结构上,按照要做什么(需求背景)、是什么(产品功能和特性)、为什么(体系结构/数据模型)和怎么做(基本操作) 4个方面递进展开,内容相对独立,方便读者根据自身需要选择章节进行阅读。全书内容相对浅显,具有较强的可读性,适合对大数据技术感兴趣,希望从技术和产品层面对大数据采集、存储和管理进行初步学习的读者阅读。
目录:
第1章大数据采集

1.1概述

1.2网页数据的爬取

1.2.1网络爬虫概述.

1.2.2网络爬虫的实现

1.2.3网页爬取策略

1.3日志文件的采集

1.3.1Apache软件组织

1.3.2文件采集工具Flume

1.3.3实验:Flume的使用方法

小结

第2章分布式文件存储

2.1Hadoop概述

2.1.1Hadoop的诞生与发展

2.1.2Hadoop生态系统

2.1.3Hadoop版本演进

2.1.4Hadoop的发行版本

2.2HDFS分布式文件系统

……

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP