大数据技术科普
正版新书 新华官方库房直发 可开电子发票
¥
22.4
7.0折
¥
32
全新
库存4件
作者靳大尉主编
出版社西安电子科技大学出版社
ISBN9787560668178
出版时间2023-06
版次1
装帧平装
开本16开
纸张胶版纸
页数132页
字数147千字
定价32元
货号SC:9787560668178
上书时间2024-10-31
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
本书是大数据技术普及系列读物之一,主要涉及大数据采集、分布式文件存储和非关系型数据管理等内容。全书共6章,每章一个专题,按照大数据运用流程,从网页和日志文件两种常用的大数据采集方法入手,介绍了分布式文件存储、NoSQL数据库基础理论和4种NoSQL数据库技术。针对特定技术选择了一款最典型的产品进行诠释,先后对Python语言中的Requests和BeautifulSoup包,Hadoop生态中的Flume、HDFS和HBase,以及Redis、MongoDB和Neo4j等产品进行了介绍。在每章结构上,按照要做什么(需求背景)、是什么(产品功能和特性)、为什么(体系结构/数据模型)和怎么做(基本操作) 4个方面递进展开,内容相对独立,方便读者根据自身需要选择章节进行阅读。全书内容相对浅显,具有较强的可读性,适合对大数据技术感兴趣,希望从技术和产品层面对大数据采集、存储和管理进行初步学习的读者阅读。
目录:
第1章大数据采集
1.1概述
1.2网页数据的爬取
1.2.1网络爬虫概述.
1.2.2网络爬虫的实现
1.2.3网页爬取策略
1.3日志文件的采集
1.3.1Apache软件组织
1.3.2文件采集工具Flume
1.3.3实验:Flume的使用方法
小结
第2章分布式文件存储
2.1Hadoop概述
2.1.1Hadoop的诞生与发展
2.1.2Hadoop生态系统
2.1.3Hadoop版本演进
2.1.4Hadoop的发行版本
2.2HDFS分布式文件系统
……
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价