• python爬虫与反爬虫开发从入门到精通 编程语言 刘延林 新华正版
  • python爬虫与反爬虫开发从入门到精通 编程语言 刘延林 新华正版
21年品牌 40万+商家 超1.5亿件商品

python爬虫与反爬虫开发从入门到精通 编程语言 刘延林 新华正版

66.2 6.7折 99 全新

库存8件

河北保定
认证卖家担保交易快速发货售后保障

作者刘延林

出版社北京大学出版社

ISBN9787301322697

出版时间2021-08

版次1

装帧平装

开本16

页数384页

字数601千字

定价99元

货号xhwx_1202448894

上书时间2024-12-15

浩子书屋

九年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
主编:

爬虫工程师不容错过的教程:以爬虫之攻取反爬虫之盾,如何在对立统一中寻求技术突破?python爬虫与反爬虫,攻兼备,见招拆招。

目录:

篇  基础篇

章  爬虫与反爬虫开发环境搭建

1.1  python 3环境搭建

1.1.1  下载python 3安装包

1.1.2  安装python

1.1.3  pip包管理工具

1.2  pycharm的安装与基本使用

1.2.1  安装pycharm

1.2.2  创建python项目

1.2.3  debug调试代码

1.2.4  创建venv虚拟环境

1.3  tesseract-ocr

1.3.1  下载

1.3.2  安装

1.3.3  配置环境变量

1.4  mitmproxy

1.4.1  下载

1.4.2  安装

1.4.3  安装ssl

1.5.1  下载k

1.5.2  安装

1.5.3  测试是否安装成功

本章小结

第2章  爬虫与反爬虫通用基础知识

2.1  网页基础

2.1.1  网页的组成

2.1.2  网页的类型

2.2  网络传输协议

2.2.1  认识

2.2.2  s

2.2.3  与s请求过程示例

2.3  session和cookies

2.3.1  cookie

2.3.2  session

2.3.3  session和cookie的区别

2.3.4  常见误区

2.4  nginx服务器

2.4.1  nginx信号

2.4.2  反向代理

2.4.3  nginx中实现反向代理

2.5  代理ip

2.5.1  

2.5.2  分类

2.5.3  获取途径

2.6  接概念

2.7  新手问答

本章小结

第3章  python编程基础

3.1  python的基础语法

3.1.1  个python程序

3.1.2  运行程序

3.1.3  注释

3.1.4  行与缩进

3.1.5  多行语句

3.1.6  import与from…import导入模块

3.1.7  变量

3.2  基本数据类型

3.2.1  number

3.2.2  string

3.2.3  list

3.2.4  tuple

3.2.5  dictionary

3.2.6  set

3.2.7  布尔类型

3.3  流程控制

3.3.1  条件控制

3.3.2  循环

3.3.3  range()函数

3.3.4  break和continue语句

3.3.5  pass

3.4  函数

3.4.1  定义一个函数

3.4.2  调用函数

3.5  文件作

3.5.1  txt文件读写

3.5.2  csv文件读写

3.6  面向对象

3.6.1  类

3.6.2  类对象

3.6.3  类方法

3.6.4  继承

3.7  多线程

3.7.1  threa

3.7.2  多线程装饰器封装

3.8  新手实训

3.9  新手问答

本章小结

第2篇  爬虫篇

第4章  网络爬虫快速入门

4.1  爬虫的基本结构及工作流程

4.2  urllib网络请求库

4.2.1  请求一个简单的网页

4.2.2  设置请求超时

4.2.3  使用data参数提交数据

4.2.4  request

4.3  requests网络请求库

4.3.1  requests模块的安装

4.3.2  请求个网页

4.3.3  get和t请求

4.3.4  参数提交

4.4  urllib3网络请求库

4.4.1  发起请求

4.4.2  响应内容

4.4.3  查询参数

4.4.4  表单数据

4.4.5  提交json数据

4.5  tman接测试工具

4.5.1  请求接

4.5.2  常用功能介绍

4.6  新手实训

4.7  新手问答

本章小结

第5章  xpath匹配网页数据

5.1  安装xpath

5.2  xpath的基础语法

5.3  在python中使用xpath匹配数据

5.3.1  根据class属进行匹配

5.3.2  根据id属进行匹配

5.3.3  根据name属进行匹配

5.4  xpath表达式

5.5  扩展补充知识点

5.5.1  selector

5.5.2  beautifulsoup

5.6  新手实训

5.7  新手问答

本章小结

第6章  re正则匹配数据

6.1  re.pile函数

6.2  re.match函数

6.3  re.search函数

6.4  re.match与re.search的区别

6.5  检索和替换

6.6  findall函数

6.7  常见正则表达式写法

6.8  新手实训

6.9  新手问答

本章小结

第7章  websocket数据抓取

7.1  websocket通信

7.2  使用aiowebsocket获取数据

7.2.1  安装aiowebsocket

7.2.2  分析websocket请求

7.2.3  编写代码获取数据

7.3  新手实训

7.4  新手问答

本章小结

第8章  scrapy爬虫框架应用与开发

8.1  scrapy框架的基本架构

8.1.1  scrapy的基本组件

8.1.2  工作

8.2  安装scrapy

8.3  创建项目

8.4  定义item

8.5  编写个spider

8.6  运行爬虫

8.7  提取item

8.8  在shell中尝试selector选择器

8.9  提取数据

8.10  使用item

8.11  itempipeline

8.12  将item写入json文件

8.13  新手实训

8.14  新手问答

本章小结

第3篇  反爬虫篇

内容简介:

随着网络技术的迅展,如何有效地提取并利用信息,以及如何有效地止信息被爬取,己成为一个巨大的挑战。本书从零开始系统地介绍了python网络爬虫与反爬虫的开发与实战技能,全书共分为4篇,具体内容安排如下。
    篇:基础篇(~3章)。系统地讲解了python爬虫与反爬虫开发环境的搭建、爬虫与反爬虫通用基础知识、python编程基础。
    第2篇:爬虫篇(第4~8章)。这部分讲解了网络爬虫的相关知识与技能,主要包括网络爬虫快速入门、xpath匹配网页数据、re正则匹配数据、webocket数据抓取、crapy爬虫框架应用与开发等。
    第3篇:反爬虫篇(第9~16章)。这部分讲解了网络反爬虫的相关知识与技能,主要包括爬虫与反爬虫的区别与认识、反爬header信息校验、反爬ip、反爬动态渲染页面、反爬文本混淆、反爬特征识别、反爬验证码识别、反爬app数据抓取等。
    第4篇:实战篇(7章)。本篇主要列举了4个案例,综合讲解python爬虫与反爬虫项目的实战应用。
    本书从零基础开始讲解,系统全面,案例丰富,注重实战,既适合python序员和爬虫爱好者阅读学,也可以作为广大职业院校相关专业的教材或参用书。

作者简介:

刘延林,云镜团队创始人,拥有多年网络爬虫开发经验,著有python网络爬虫开发从入门到精通,擅长python网络爬虫、web、数据挖掘与分析、网络安全、产品研发等领域。

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP