消息首页搜索举报

【包邮】 Python网络爬虫实例教程【正版九新】

九品消毒塑封

14.7 3.0折 49.8 九五品

仅1件

天津宝坻

认证卖家担保交易快速发货售后保障

作者齐文光

出版社人民邮电出版社

ISBN9787115484659

出版时间2018-08

装帧其他

开本16开

定价49.8元

货号9787115484659

上书时间2024-11-23

文渊文化传媒

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 15小时
好评率暂无

最新上架

【包邮】沟通的八张面孔【正版九新】 ¥14.10

【包邮】从东江纵队到两广纵队【正版九新】 ¥14.80

【包邮】藤本月季·玫瑰12月栽培笔记【正版九新】 ¥14.10

【包邮】发现！蔚蓝大海的秘密/科学真好玩爆笑漫画书·第2辑【正版九新】 ¥13.80

【包邮】婴幼儿行为心理学【正版九新】 ¥14.20

【包邮】宇宙职业选手 2 【正版九新】 ¥14.20

【包邮】小鹰逆风飞行【正版九新】 ¥12.70

【包邮】你转身之后【正版九新】 ¥14.60

【包邮】手术室护理实践指南（第4版/配盘）【正版九新】 ¥14.60

商品详情

品相描述：九五品

商品描述: 作者简介
齐文光，原中国网通山东分公司数据中心工程师爱好python编程，善于编写爬虫和利用python进行数据分析和可视化，对于机器学习和深度学习也有深入研究。

目录
第1章  网络爬虫概述
  1.1  认识网络爬虫
    1.1.1  网络爬虫的含义
    1.1.2  网络爬虫的主要类型
    1.1.3  简单网络爬虫的架构
    1.1.4  网络爬虫的应用场景
  1.2  Python网络爬虫技术概况
    1.2.1  Python中实现HTTP请求
    1.2.2  Python中实现网页解析
    1.2.3  Python爬虫框架
  1.3  搭建开发环境
    1.3.1  代码运行环境
    1.3.2  开发编辑器
  1.4  本章小结及要求
第2章  爬虫基础
  2.1  认识HTTP请求
    2.1.1  HTTP请求的含义
    2.1.2  HTTP请求信息
  2.2  爬虫基础——Requests库入门
    2.2.1  Requests库的安装
    2.2.2  Requests库的请求方法
    2.2.3  Requests库的响应对象
    2.2.4  响应状态码
    2.2.5  定制请求头部
    2.2.6  重定向与超时
    2.2.7  传递URL参数
  2.3  爬虫基础——Urllib库基础
    2.3.1  Urllib 库简介
    2.3.2  发送GET请求
    2.3.3  模拟浏览器发送请求
    2.3.4  POST发送一个请求
    2.3.5  URL解析
  2.4  本章小结及要求
第3章  网页解析基础
  3.1  网页解析概述
    3.1.1  常用网页解析工具
    3.1.2  HTML源码简介
  3.2  XPath语法基础
    3.2.1  Lxml库的安装
    3.2.2  XPath语法基础——通过路径查找元素
    3.2.3  通过属性查找元素
    3.2.4  提取属性值
    3.2.5  XPath的高级用法
  3.3  抓取百度首页实例
  3.4  Beautiful Soup库和正则表达式
    3.4.1  Beautiful Soup简介
    3.4.2  Beautiful Soup基本用法
    3.4.3  Beautiful Soup标准选择器
    3.4.4  正则表达式
  3.5  本章小结及要求
第4章  基础爬虫实例
  4.1  Q房网爬虫实例
    4.1.1  网站页面分析
    4.1.2  编写Q房网二手房房源爬虫代码
    4.1.3  保存爬取到的信息
  4.2  多层页面的爬取
    4.2.1  爬取详情页面分析
    4.2.2  编写爬取详情页面的代码
  4.3  下载房源图片和实现多线程爬虫
    4.3.1  下载房源图片
    4.3.2  实现简单多线程爬虫
  4.4  本章小结及要求
第5章  Requests模拟登录
  5.1  使用Cookies登录网站
    5.1.1  网站的保持登录机制
    5.1.2  登录豆瓣网站
  5.2  模拟登录网站
    5.2.1  豆瓣网站的登录分析
    5.2.2  Requests会话对象
    5.2.3  编写Requests登录豆瓣网站的代码
  5.3  验证码的处理
    5.3.1  带验证码的网站登录分析
    5.3.2  验证码的识别和处理
    5.3.3  编写带验证码的豆瓣网站登录代码
  5.4  本章小结及要求
第6章  认识和应对反爬虫
  6.1  常用的网站反爬虫策略及应对措施
    6.1.1  常用的网站反爬虫策略
    6.1.2  应对网站反爬虫的措施
  6.2  使用IP代理的方法
    6.2.1  Requests中使用代理IP
    6.2.2  获取免费代理IP
  6.3  使用IP代理爬取微信文章
    6.3.1  分析微信文章的搜索页面及其URL的构造特点
    6.3.2  编写爬虫代码
  6.4  本章小结及要求
第7章  动态网页的抓取
  7.1  动态网页及其爬取方法
    7.1.1  动态网页的含义
    7.1.2  动态网页的爬取办法
  7.2  动态网页的爬取技巧
    7.2.1  链家经纪人页面分析
    7.2.2  链家经纪人爬虫实现
  7.3  Selenium库的安装与使用
    7.3.1  Selenium库的安装
    7.3.2  chromedriver的安装和使用
    7.3.3  Selenium的简单使用
  7.4  爬取新浪微博网站
    7.4.1  新浪微博网站爬取分析
    7.4.2  新浪微博网站爬虫实现
    7.4.3  爬虫的简单去重
    7.4.4  使用Chrome浏览器的headless模式
  7.5  本章小结及要求
第8章  动态网页与应对反爬虫综合实例
  8.1  拉勾网网站分析
    8.1.1  拉勾网网站页面初步分析
    8.1.2  解析json数据和招聘岗位详情页分析
  8.2  拉勾网爬虫实现
    8.2.1  拉勾网爬虫的初步实现
    8.2.2  拉勾网爬虫的进一步完善
  8.3  探索拉勾网反爬虫机制
  8.4  本章小结及要求
第9章  Scrapy爬虫框架基础
  9.1  Scrapy爬虫框架简介与安装
    9.1.1  Scrapy爬虫框架简介
    9.1.2  Scrapy爬虫框架的安装
  9.2  Scrapy目录结构和简单爬虫实例
    9.2.1  Scrapy目录结构
    9.2.2  百度爬虫实现
    9.2.3  Scrapy选择器
  9.3  Scrapy命令行工具、选择器、数据容器
    9.3.1  Scrapy常用命令行工具
    9.3.2  Scrapy选择器高级应用
    9.3.3  Scrapy数据容器
  9.4  本章小结及要求
第10章  BasicSpider类和图片下载
  10.1  BasicSpider类
    10.1.1  Scrapy的爬虫类和模板
    10.1.2  BasicSpider类简介
  10.2  爬取我爱我家二手房房源数据
    10.2.1  我爱我家网站分析
    10.2.2  我爱我家爬虫项目实现
    10.2.3  数据的快捷输出
  10.3  图片下载和翻页的另一种方法
    10.3.1  Scrapy图片下载简介
    10.3.2  我爱我家房源图片下载
    10.3.3  翻页的另一种

内容摘要
齐文光编著的《Python网络爬虫实例教程(视频讲解版)》共16章，详细介绍爬虫的基础知识、编写简单定向爬虫和使用Scrapy爬虫框架。第1～3章介绍爬虫的基础知识和网页解析基础；第4～8章用实例演示编写定向爬虫、模拟登录、应对反爬虫和爬取动态
网页等；第9章介绍Scrapy基础知识；第10、第11章讲解两个最常用的Scrapy爬虫类；第12、第13章讲解Scrapy应对反爬虫、向网站提交数据和登录网站的方法；第14章用实例演示存储数据到数据库；第15章简
单讲解爬虫去重、分布式爬虫编写和爬虫部署；第16章为综合实例，并且简单介绍爬取数据的分析。本书运用大量实例为读者演示编写爬虫的技巧，每一章都包含本章小结及要求，以帮助读者巩固所学内容。
本书面向对爬虫技术感兴趣的读者，介绍使用Python语言编写爬虫的各种技巧和方法。对希望深入学习Python编程的初学者，本书也很适合作为进阶读物。

— 没有更多了 —

【包邮】 Python网络爬虫实例教程 【正版九新】

文渊文化传媒

商品详情

【包邮】 Python网络爬虫实例教程【正版九新】