• Python爬虫实战进阶
  • Python爬虫实战进阶
  • Python爬虫实战进阶
  • Python爬虫实战进阶
  • Python爬虫实战进阶
21年品牌 40万+商家 超1.5亿件商品

Python爬虫实战进阶

全新正版 极速发货

54.96 6.2折 89 全新

仅1件

广东广州
认证卖家担保交易快速发货售后保障

作者李科均|责编:安妮//李燕

出版社清华大学

ISBN9787302627661

出版时间2023-05

装帧平装

开本其他

定价89元

货号31743540

上书时间2024-08-28

书香美美

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第1章  Scrapy框架
  1.1  关于Scrapy
    1.1.1  Serapy简介
    1.1.2  Scrapy安装
  1.2  Scrapy基础
    1.2.1  Scrapy测试流程
    1.2.2  Scrapy开发流程
    1.2.3  Scrapy框架架构
    1.2.4  Request对象和Response对象
    1.2.5  HTML页面解析
    1.2.6  HTML页面泛解析
  1.3  爬虫组件
    1.3.1  基础爬虫
    1.3.2  通用爬虫
  1.4  中间件组件
    1.4.1  爬虫中间件
    1.4.2  下载中间件
    1.4.3  随机UserAgent中间件
    1.4.4  Selenium中间件
    1.4.5  pyppeteer中间件
  1.5  数据管道组件
    1.5.1  自定义Pipeline
    1.5.2  文件下载Pipeline
    1.5.3  文件下载案例
  1.6  数据导出器组件
    1.6.1  内置数据导出器
    1.6.2  自定义数据导出器
  1.7  分布式Scrapy
    1.7.1  分布式架构
    1.7.2  分布式通信队列
    1.7.3  分布式爬虫
    1.7.4  分布式调度
    1.7.5  分布式去重
    1.7.6  自定义去重组件
    1.7.7  基本开发流程
  1.8  Scrapy参考手册
    1.8.1  常用命令
    1.8.2  常用配置项
  1.9  案例:使用Scrapy获取商品信息
    1.9.1  项目需求
    1.9.2  项目分析
    1.9.3  编码实现
    1.9.4  容器化部署
第2章  异步爬虫
  2.1  异步I/O与协程
    2.1.1  迭代器与生成器
    2.1.2  yield from关键字
    2.1.3  Python协程原理
  2.2  asyncio异步框架
    2.2.1  创建可等待对象

内容摘要
本书主要满足网络爬虫从业者提升技术能力的需求
。本书共9章,涉及经典爬虫框架Scrapy的架构、异步爬虫的原理及其实现、异步自动化浏览器控制库pyppeteer的使用、当下流
行的反爬虫原理及其处理方案、基于常用通信中间件的分布式爬虫框架开发、
Python常用的编码和加密的应用、针对前端深入的JavaScript分析策略和安全策略、网络搜索引擎的原理和技术实现,并在最后一章创建了一个垂直领域的搜索引擎系统。
本书面向网络爬虫开发的初、中级开发人员,以及对网络爬虫有一定基础的兴趣爱好者。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP