网络爬虫进化论——从Excel爬虫到Python爬虫
¥
44.45
5.6折
¥
79
全新
仅1件
作者曹鉴华
出版社水利水电出版社
出版时间2020-11
版次1
装帧其他
货号R4库 10-21
上书时间2024-10-22
商品详情
- 品相描述:全新
图书标准信息
-
作者
曹鉴华
-
出版社
水利水电出版社
-
出版时间
2020-11
-
版次
1
-
ISBN
9787517090465
-
定价
79.00元
-
装帧
其他
-
开本
其他
-
纸张
胶版纸
-
页数
352页
-
字数
570千字
- 【内容简介】
-
本书主要通过对 Excel 爬虫和 Python 爬虫的对比,介绍使用 Excel 和Python 实现网络数据爬取的相关内容和方法。书中按照学习的递进层次分为基础篇、Excel 爬虫篇和 Python 爬虫篇三部分内容,基础篇包括网络爬虫基础、网页和网站基础、网页开发者工具和 Python 编程基础等内容,Excel 爬虫篇包括使用 Excel的 PowerQuery 模块实现网络表格数据采集和相关案例实践等内容,Python 爬虫篇包括网络爬虫初体验、各种第三方库的使用详解、Python 爬虫案例、Scrapy 框架和对比爬取福布斯榜单案例等内容。
本书结构紧凑、内容翔实、图文并茂、案例丰富,适合对网络数据爬取感兴趣的读者,对从事数据科学、大数据相关工程的技术人员也具有一定的参考价值。
- 【目录】
-
基础篇
章初识爬虫
1.1什么是网络爬虫
1.1.1对比搜索理解网络爬虫
1.1.2网络爬虫的基本流程
1.1.3了解爬虫历史
1.2如何学网络爬虫
1.2.1学新技术的自信
1.2.2网页基础知识学
1.2.3掌握必要的爬虫技术
1.3正道爬虫——技术无边,律有界
1.3.1爬虫只是数据的搬运工
1.3.2遵守君子协议爬取数据
案例1.1解读官网robots.txt协议
案例1.2解读统计局官网robots.txt协议
案例1.3解读‘什么值得买‘robots.txt协议
1.3.3恶意爬虫前车之鉴
1.3.4合合规快乐爬虫
……
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价