Python网络爬虫
全新正版 极速发货
¥
26.87
5.5折
¥
49
全新
库存4件
作者耿兴隆,胡钟月,周祥 编
出版社电子工业出版社
ISBN9787121438103
出版时间2023-03
装帧平装
开本16开
定价49元
货号1202833350
上书时间2024-11-13
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
耿兴隆,男,副教授,硕士研究生,现任职于河北软件职业技术学院,负责产教融合实训基地实训室。曾赴赴加拿大圣劳伦斯学院深度访问和研修。主持多个省级、校级研究课题。
目录
项目一Python基础认知1
任务一Python概述1
一、Python简介1
二、安装Python2
三、安装PyCharm6
四、Python语法规范11
任务二Python命令的组成13
一、基本符号14
二、常量与变量16
三、数据类型19
四、功能符号24
任务三程序结构26
一、表达式语句26
二、顺序结构27
三、选择结构28
四、循环结构30
五、条件表达式31
六、程序的流程控制32
项目实战33
实战输出百度网址33
项目二网络爬虫基础认知35
任务一网络爬虫概述35
一、网络爬虫的基本原理36
二、网络爬虫系统框架37
三、爬行策略37
四、网络爬虫的分类38
五、开源网络爬虫框架/项目39
任务二HTTP41
一、HTTP的工作原理41
二、Urllib模块库42
三、URL定义43
四、URL编码设置47
任务三网页请求过程50
一、发送请求报文51
二、返回响应52
三、HTTP消息53
项目实战54
实战一搜索商品网址54
实战二搜索食品价格网址56
项目三Urllib请求模块库的应用58
任务一发送网页请求58
一、基本HTTP请求58
二、Request网络请求66
三、设置请求头67
四、Handler方法发送请求69
五、设置代理IP71
六、身份验证73
任务二网页下载77
一、网页结构77
二、写入网页文件77
三、网页文件下载79
项目实战82
实战一下载Python学习网址82
实战二下载公司网页HTML文件85
项目四安装Urllib3请求模块库并发送请求87
任务一安装Urllib3请求模块库87
一、安装Anaconda87
二、安装Urllib3模块库92
任务二发送请求95
一、创建代理对象96
二、请求方法98
三、定义请求头99
四、设置代理IP101
五、自动重试102
六、重定向103
项目实战104
……
内容摘要
本书基于Python3.10,以项目教学的方式,循序渐进地介绍Python网络爬虫的基本原理和具体应用的方法与技巧。
全书分7个项目,具体内容包括:Python基础认知、网络爬虫基础认知、Urlib请求模块库的应用、安装UrllibB3请求模块库并发送请求、Requests请求模块库的应用、解析网页、Scrapy爬虫框架等。
本书实例丰富、内容翔实、操作方法简单易学,不仅适合作为职业院校计算机与软件工程相关专业的教材,也可作为从事数据分析相关工作的专业人士的参考用书。
本书附有电子资料,内容为书中所有实例的源文件、相关资源及实例操作过程录屏动画,供读者在学习中使用。
— 没有更多了 —
以下为对购买帮助不大的评价