Python网络爬虫框架Scrapy从入门到精通
正版新书 新华官方库房直发 可开电子发票
¥
50.57
6.4折
¥
79
全新
库存6件
作者张颖
出版社北京大学出版社
ISBN9787301320228
出版时间2021-04
版次1
装帧平装
开本16开
纸张胶版纸
页数292页
字数414千字
定价79元
货号SC:9787301320228
上书时间2024-11-08
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
张颖,“清颖设计”微信公众号创始人,现任上海懂得网络科技有限公司技术部主管,从事编程开发十余年,熟悉Python的方方面面,尤其擅长Python爬虫和数据分析。
主编推荐:
(1)系统:全流程讲解Scrapy的原理和实战,依次击破编程难点。
(2)经典:凝聚笔者十多年的Scrapy使用经验,无私奉献设计秘籍。
(3)深入:浅入深出地介绍爬虫原理、数据爬取、数据保存、数据分析和测试等技术。并且,所有案例都配有对应的代码,拿来就用。
内容简介:
本书从Python主流框架Scrapy的简介及网络爬虫知识讲起,逐步深入到Scrapy进阶实战。本书从实战出发,根据不同需求,有针对性地讲解了静态网页、动态网页、App应用是如何爬取所需数据,以及Scrapy是如何部署分布式爬取,最后还介绍了用Scrapy+Pandas是如何进行数据分析及数据展示,让读者不但可以系统地学习Scrapy编程的相关知识,而且还能对Scrapy应用开发有更为深入的理解。
本书分为12章,涵盖的主要内容有Scrapy框架简介;Scrapy网络爬虫知识介绍;Scrapy开发环境的搭建;Scrapy架构及编程;Scrapy进阶;实战项目:Scrapy静态网页的爬取;实战项目:Scrapy动态网页的爬取;实战项目:Scrapy爬取App应用数据;Scrapy的分布式部署与爬取;分布式的实战项目;用Selenium框架测试网站;用Scrapy+Pandas进行数据分析。
本书内容通俗易懂,实例典型,实用性强,特别适合学习Python主流框架Scrapy的入门读者和进阶读者阅读,也适合数据分析与挖掘技术的初学者阅读,还适合相关培训机构的师生阅读。
目录:
第1章Scrapy框架简介
1.1Scrapy简介2
1.2关于本书:目标和用途2
1.3进行自动化数据爬取的重要性3
1.4掌握自动化测试的重要性3
1.5合理规划,开发高质量的应用4
1.6网络数据的采集法律与道德约束5
1.7本章小结5
第2章Scrapy网络爬虫知识介绍
2.1爬虫的作用7
2.2爬虫推荐的前端知识9
2.3爬虫经常用的Python语法26
2.4本章小结44
第3章Scrapy开发环境的搭建
3.1安装Python47
3.2数据库的安装50
3.3安装Scrapy56
3.4本章小结60
第4章Scrapy架构及编程
4.1Scrapy架构及目录源码分析62
4.2Scrapy项目的创建和管理67
4.3PyCharm如何调试Scrapy72
4.4Scrapy的组件77
4.5Scrapy的数据流78
4.6数据存储78
4.7Scrapy如何定义中间件80
4.8Scrapy其他方法的使用82
4.9本章小结83
第5章Scrapy进阶
5.1理解Scrapy性能85
5.2编写Spider的逻辑93
5.3Item和Pipeline95
5.4数据库存储98
5.5Scrapy集成随机User-Agent和代理IP100
5.6突破反爬技术102
5.7图片和文件下载103
5.8如何部署爬虫108
5.
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价