• 【包邮】 玩转Python网络爬虫 【正版九新】
21年品牌 40万+商家 超1.5亿件商品

【包邮】 玩转Python网络爬虫 【正版九新】

九品消毒塑封

19.3 2.8折 69 九五品

仅1件

天津宝坻
认证卖家担保交易快速发货售后保障

作者黄永祥

出版社清华大学出版社

ISBN9787302503286

出版时间2018-08

装帧其他

开本16开

定价69元

货号9787302503286

上书时间2024-11-22

文渊文化传媒

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
作者简介
黄永祥,信息管理与信息系统专业学士,曾从事过系统开发和自动化开发,精通B/S和C/S自动化测试技术,多年网络爬虫开发经验,对反爬虫机制有独到的见解,精通Flask、Django等Web框架并有丰富的网站开发经验。曾就职于广州易点科技有限公司,担任Python开发工程师,目前就职于广东数据集成有限公司。热爱分享和新技术的探索,在CSDN上发表多篇Python技术文章。

目录
第1章  理解网络爬虫
  1.1  爬虫的定义
  1.2  爬虫的类型
  1.3  爬虫的原理
  1.4  爬虫的搜索策略
  1.5  反爬虫技术及解决方案
  1.6  本章小结
第2章  爬虫开发基础
  2.1  HTTP与HTTPS
  2.2  请求头
  2.3  Cookies
  2.4  HTML
  2.5  JavaScript
  2.6  JSON
  2.7  Ajax
  2.8  本章小结
第3章  Chrome分析网站
  3.1  Chrome开发工具
  3.2  Elements标签
  3.3  Network标签
  3.4  分析QQ音乐
  3.5  本章小结
第4章  Fiddler抓包工具
  4.1  Fiddler介绍
  4.2  Fiddler安装配置
  4.3  Fiddler抓取手机应用
  4.4  Toolbar工具栏
  4.5  Web Session列表
  4.6  View选项视图
  4.7  Quickexec命令行
  4.8  本章小结
第5章  Urllib数据抓取
  5.1  Urllib简介
  5.2  发送请求
  5.3  复杂的请求
  5.4  代理IP
  5.5  使用Cookies
  5.6  证书验证
  5.7  数据处理
  5.8  本章小结
第6章  Requests数据抓取
  6.1  Requests简介及安装
  6.2  请求方式
  6.3  复杂的请求方式
  6.4  下载与上传
  6.5  本章小结
第7章  验证码识别
  7.1  验证码类型
  7.2  OCR技术
  7.3  第三方平台

内容摘要
\"本书站在初学者的角度,从原理到实践,循序渐进地讲述了使用Python开发网络爬虫的核心技术。全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识,分别是网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网络做全面分析;数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识;数据清洗主要介绍字符串操作、正则和BeautifulSoup的使用;数据入库分别讲述了MySQL和MongoDB的操作,通过ORM框架SQLAlchemy实现数据持久化,实现企业级开发。实战篇深入讲解了分布式爬虫、爬虫软件开发与应用、12306抢票程序和微博爬取,所举示例均来自于开发实践,可帮助读者快速提升技能,开发实际项目。框架篇主要讲述Scrapy的基础知识,并通过爬取QQ音乐为实例,让读者深层次了解Scrapy的使用。
本书内容丰富,注重实战,适用于从零开始学习网络爬虫的初学者,或者是已经有一些网络爬虫编写经验,但希望更加全面、深入理解Python爬虫的开发人员。\"

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP