网络爬虫进化论 从Excel爬虫到Python爬虫
全新正版 假一赔十 可开发票
¥
39.51
5.0折
¥
79
全新
库存5件
作者曹鉴华
出版社中国水利水电出版社
ISBN9787517090465
出版时间2021-01
装帧平装
开本16开
定价79元
货号1202298777
上书时间2024-09-02
商品详情
- 品相描述:全新
- 商品描述
-
目录
基础篇
第1章初识爬虫
1.1什么是网络爬虫
1.1.1对比搜索理解网络爬虫
1.1.2网络爬虫的基本流程
1.1.3了解爬虫历史
1.2如何学习网络爬虫
1.2.1学习新技术的自信
1.2.2网页基础知识学习
1.2.3掌握必要的爬虫技术
1.3正道爬虫——技术无边,法律有界
1.3.1爬虫只是数据的搬运工
1.3.2遵守君子协议爬取数据
案例1.1解读京东官网robots.txt协议
案例1.2解读国家统计局官网robots.txt协议
案例1.3解读"什么值得买"网站robots.txt协议
1.3.3恶意爬虫前车之鉴
1.3.4合法合规快乐爬虫
……
内容摘要
本书主要通过对Excel爬虫和Python爬虫的对比,介绍使用Excel和Python实现网络数据爬取的相关内容和方法。书中按照学习的递进层次分为基础篇、Excel爬虫篇和Python爬虫篇三部分内容,基础篇包括网络爬虫基础、网页和网站基础、网页开发者工具和Python编程基础等内容,Excel爬虫篇包括使用Excel的PowerQuery模块实现网络表格数据采集和相关案例实践等内容,Python爬虫篇包括网络爬虫初体验、各种第三方库的使用详解、Python爬虫案例、Scrapy框架和对比爬取福布斯榜单案例等内容。本书结构紧凑、内容翔实、图文并茂、案例丰富,适合对网络数据爬取感兴趣的读者,对从事数据科学、大数据相关工程的技术人员也具有一定的参考价值。
— 没有更多了 —
以下为对购买帮助不大的评价