• 精通Python爬虫框架Scrapy
21年品牌 40万+商家 超1.5亿件商品

精通Python爬虫框架Scrapy

48.6 7.0折 69.8 全新

库存7件

四川成都
认证卖家担保交易快速发货售后保障

作者(美)迪米特里奥斯·考奇斯-劳卡斯

出版社人民邮电出版社

ISBN9787115474209

出版时间2018-02

装帧平装

开本16开

定价69.8元

货号1202833330

上书时间2024-07-03

聚合博文书店

十年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
Dimitrios Kouzis-Loukas作为一位软件开发人员,已经拥有超过15年的经验。同时,他还使用自己掌握的知识和技能,向广大读者讲授如何编写软件。
他学习并掌握了多门学科,包括数学、物理学以及微电子学。他对这些学科的透彻理解,提高了自身的标准,而不只是“实用的解决方案”。他知道真正的解决方案应当是像物理学规律一样确定,像ECC内存一样健壮,像数学一样通用。
Dimitrios目前正在使用新的数据中心技术开发低延迟、高可用的分布式系统。他是语言无关论者,不过对Python、C++和Java略有偏好。他对开源软硬件有着坚定的信念,他希望他的贡献能够造福于各个社区和全人类。

目录
第1章Scrapy简介1

1.1初识Scrapy1

1.2喜欢Scrapy的更多理由2

1.3关于本书:目标和用途3

1.4掌握自动化数据爬取的重要性4

1.4.1开发健壮且高质量的应用,并提供合理规划4

1.4.2快速开发高质量可行产品5

1.4.3Google不会使用表单,爬取才能扩大规模6

1.4.4发现并融入你的生态系统7

1.5在充满爬虫的世界里做一个好公民7

1.6Scrapy不是什么8

1.7本章小结9

第2章理解HTML和XPath10

2.1HTML、DOM树表示以及XPath10

2.1.1URL11

2.1.2HTML文档11

2.1.3树表示法13

2.1.4你会在屏幕上看到什么14

2.2使用XPath选择HTML元素15

2.2.1有用的XPath表达式16

2.2.2使用Chrome获取XPath表达式19

2.2.3常见任务示例20

2.2.4预见变化21

2.3本章小结22

第3章爬虫基础23

3.1安装Scrapy24

3.1.1MacOS24

3.1.2Windows25

3.1.3Linux25

3.1.4新源码安装26

3.1.5升级Scrapy26

3.1.6Vagrant:本书中运行示例的官方方式27

3.2UR2IM——基本抓取流程28

3.2.1URL29

3.2.2请求和响应31

3.2.3Item31

3.3一个Scrapy项目37

3.3.1声明item38

3.3.2编写爬虫40

3.3.3填充item43

3.3.4保存文件45

3.3.5清理——item装载器与管理字段47

3.3.6创建contract50

3.4抽取更多的URL53

3.4.1使用爬虫实现双向爬取56

3.4.2使用CrawlSpider实现双向爬取59

3.5本章小结61

……

内容摘要
Scrapy是使用Python开发的一个快速、高层次的屏幕抓取和Web抓取框架,用于抓Web站点并从页面中提取结构化的数据。《精通Python爬虫框架Scrapy》以Scrapy1.0版本为基础,讲解了Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求。

本书共11章,其内容涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取。本书附录还提供了各种软件的安装与故障排除等内容。

本书适合软件开发人员、数据科学家,以及对自然语言处理和机器学习感兴趣的人阅读。

主编推荐
1.内容丰富,涵盖Scrapy基础知识+实际应用,深入讲解爬虫专业人员的秘密
2.作者具有15年以上的软件开发经验,能将知识点清晰、有条理地呈现给读者,有效传授爬虫技能
3.在学习完本书后,你将对数据爬取胸有成竹,并将数据应用在自己的应用程序中

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP