大数据技术科普 2——大数据采集、存储与管理
新华书店全新正版,极速发货,假一罚十,可开电子发票,请放心购买。
¥
17.54
5.5折
¥
32
全新
仅1件
作者靳大尉
出版社西安电子科技大学出版社
ISBN9787560668178
出版时间2023-06
装帧平装
开本16开
定价32元
货号1202987784
上书时间2024-10-18
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1章大数据采集
1.1概述
1.2网页数据的爬取
1.2.1网络爬虫概述.
1.2.2网络爬虫的实现
1.2.3网页爬取策略
1.3日志文件的采集
1.3.1Apache软件组织
1.3.2文件采集工具Flume
1.3.3实验:Flume的使用方法
小结
第2章分布式文件存储
2.1Hadoop概述
2.1.1Hadoop的诞生与发展
2.1.2Hadoop生态系统
2.1.3Hadoop版本演进
2.1.4Hadoop的发行版本
2.2HDFS分布式文件系统
……
内容摘要
本书是大数据技术普及系列读物之一,主要涉及大数据采集、分布式文件存储和非关系型数据管理等内容。全书共6章,每章一个专题,按照大数据运用流程,从网页和日志文件两种常用的大数据采集方法入手,介绍了分布式文件存储、NoSQL数据库基础理论和4种NoSQL数据库技术。针对特定技术选择了一款最典型的产品进行诠释,先后对Python语言中的Requests和BeautifulSoup包,Hadoop生态中的Flume、HDFS和HBase,以及Redis、MongoDB和Neo4j等产品进行了介绍。在每章结构上,按照要做什么(需求背景)、是什么(产品功能和特性)、为什么(体系结构/数据模型)和怎么做(基本操作) 4个方面递进展开,内容相对独立,方便读者根据自身需要选择章节进行阅读。全书内容相对浅显,具有较强的可读性,适合对大数据技术感兴趣,希望从技术和产品层面对大数据采集、存储和管理进行初步学习的读者阅读。
— 没有更多了 —
以下为对购买帮助不大的评价