数据采集与预处理
正版新书 新华官方库房直发 可开电子发票
¥
29.86
7.5折
¥
39.8
全新
库存4件
作者米洪,张鸰主编
出版社人民邮电出版社
ISBN9787115519153
出版时间2019-11
版次1
装帧平装
开本16开
纸张胶版纸
页数176页
字数381千字
定价39.8元
货号SC:9787115519153
上书时间2024-09-16
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。
本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机应用技术、大数据技术与应用、软件技术、云计算技术与应用等计算机相关专业的教材,也可作为大数据分析、云计算应用领域技术人员的参考用书。
目录:
项目1
数据采集与预处理准备1
学习目标1
项目描述1
任务1认识数据采集技术,熟悉数据采集平台1
任务描述1
任务目标2
知识准备2
任务实施10
任务2认识数据预处理技术13
任务描述13
任务目标13
知识准备13
任务实施19
项目2
网络爬虫实践24
学习目标24
项目描述24
任务1使用urllib爬取北京公交线路信息24
任务描述24
任务目标25
知识准备25
任务实施48
任务2使用Selenium爬取淘宝网站信息58
任务描述58
任务目标58
知识准备58
任务实施69
任务3使用Scrapy爬取北京公交信息75
任务描述75
任务目标75
知识准备75
任务实施78
任务4创新与拓展86
任务描述86
任务目标86
项目3
日志数据采集实践87
学习目标87
项目描述87
任务1Flume的安装和配置87
任务描述87
任务目标88
知识准备88
任务实施95
任务2Flume采集数据上传到集群105
任务描述105
任务目标106
知识准备106
任务实施110
任务3创新与拓展118
任务描述118
任务目标118
项目4
数据预处理实践119
学习目标119
项目描述119
任务1用P
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价