大数据采集与预处理
正版全新 可开发票
¥
45.47
6.6折
¥
69
全新
库存47件
作者主编李俊翰, 武春岭
出版社机械工业出版社
ISBN9787111757917
出版时间2024-07
装帧平装
开本其他
定价69元
货号4658686
上书时间2024-09-27
商品详情
- 品相描述:全新
- 商品描述
-
目录
本书共分两部分: 第一部分是网络数据采集与预处理的基础理论实践, 包括任务1-任务6, 主要讲解如何使用Python编写网络数据采集和预处理程序, 内容包括Python环境搭建, Python基础语法、语句与函数, 网络基础知识, 常用网络数据采集与预处理库、解析库, 数据持久化保存, 以及requests库、numpy库、pandas库、Selenium技术、ChromeDriver技术和Scrapy技术的应用方式。第二部分是网络数据采集与预处理的综合案例, 包括任务7-任务9, 主要讲解requests库数据采集与ECharts可视化技术相结合以展示数据, 并持久化保存数据、预处理数据的应用案例; Selenium和ChromeDriver技术相结合模拟登录, 采集动态和静态数据, 并持久化保存数据和预处理数据的应用案例; Hadoop平台的Flume日志数据采集应用案例, 充分呈现了大数据采集与预处理主流技术、可视化技术的主要功能和特点。
内容摘要
本书共分两部分:第一部分是网络数据采集与预处理的基础理论实践,包括任务1~任务6,主要讲解如何使用Python编写网络数据采集和预处理程序,内容包括Python环境搭建,Python基础语法、语句与函数,网络基础知识,常用网络数据采集与预处理库、解析库,数据持久化保存,以及requests库、numpy库、pandas库、Selenium技术、ChromeDriver技术和Scrapy技术的应用方式。第二部分是网络数据采集与预处理的综合案例,包括任务7~任务9,主要讲解requests库数据采集与ECharts可视化技术相结合以展示数据,并持久化保存数据、预处理数据的应用案例;Selenium和ChromeDriver技术相结合模拟登录,采集动态和静态数据,并持久化保存数据和预处理数据的应用案例;Hadoop平台的Flume日志数据采集应用案例,充分呈现了大数据采集与预处理主流技术、可视化技术的主要功能和特点。
本书可作为高等职业院校、职业本科院校大数据技术及相关专业的教材,也可作为有一定Python编程经验并且对数据采集与预处理技术感兴趣的工程技术人员的参考用书。
主编推荐
·可作为高等职业院校、职业本科院校大数据技术及相关专业的教材
·从基础的Python环境搭建、网络基础知识入手,结合实例,由浅入深地讲解了常用爬虫库和解析库、数据持久化保存、requests库操作、Selenium和ChromeDriver操作、Scrapy爬虫框架的基本原理和操作网络爬虫的常用技术和方法,以及通过Flask和ECharts实现数据可视化的方法等内容。
·提供了爬虫案例和源代码,以便读者能够更加直观和快速地学会爬虫的编写技巧。
— 没有更多了 —
以下为对购买帮助不大的评价