Python网络爬虫从入门到精通
新华书店全新正版,极速发货,假一罚十,可开电子发票,请放心购买。
¥
61.32
6.1折
¥
99.8
全新
仅1件
作者明日科技著
出版社清华大学出版社
ISBN9787302567004
出版时间2021-06
装帧平装
开本16开
定价99.8元
货号1202355293
上书时间2024-11-15
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
明日科技,全称是吉林省明日科技有限公司,是一家专业从事软件开发、教育培训以及软件开发教育资源整合的高科技公司,其编写的教材非常注重选取软件开发中的必需、常用内容,同时也很注重内容的易学、方便性以及相关知识的拓展性,深受读者喜爱。其教材多次荣获“全行业优秀畅销品种”“全国高校出版社优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。
目录
第1篇基础知识第1章初识网络爬虫21.1网络爬虫概述21.2网络爬虫的分类21.3网络爬虫的基本原理31.4搭建开发环境41.4.1安装Anaconda41.4.2PyCharm的下载与安装71.4.3配置PyCharm91.4.4测试PyCharm131.5小结15第2章了解Web前端162.1HTTP基本原理162.1.1HTTP协议162.1.2HTTP与Web服务器162.1.3浏览器中的请求和响应182.2HTML语言192.2.1什么是HTML192.2.2标签、元素、结构概述192.2.3HTML的基本标签212.3CSS层叠样式表222.3.1CSS概述222.3.2属性选择器232.3.3类和ID选择器242.4JavaScript动态脚本语言242.5小结27第3章请求模块urllib283.1urllib简介283.2使用urlopen()方法发送请求283.2.1发送GET请求293.2.2发送POST请求303.2.3设置网络超时313.3复杂的网络请求323.3.1设置请求头323.3.2Cookies的获取与设置343.3.3设置代理IP393.4异常处理403.5解析链接413.5.1拆分URL423.5.2组合URL433.5.3连接URL443.5.4URL的编码与解码453.5.5URL参数的转换463.6小结47第4章请求模块urllib3484.1urllib3简介484.2发送网络请求494.2.1GET请求494.2.2POST请求504.2.3重试请求514.2.4处理响应内容514.3复杂请求的发送534.3.1设置请求头534.3.2设置超时544.3.3设置代理554.4上传文件564.5小结57第5章请求模块requests585.1请求方式585.1.1GET请求595.1.2对响应结果进行utf-8编码595.1.3爬取二进制数据605.1.4GET(带参)请求615.1.5POST请求625.2复杂的网络请求635.2.1添加请求头headers635.2.2验证Cookies645.2.3会话请求655.2.4验证请求665.2.5网络超时与异常675.2.6上传文件685.3代理服务695.3.1代理的应用695.3.2获取免费的代理IP705.3.3检测代理IP是否有效715.4小结72第6章高级网络请求模块736.1Requests-Cache的安装与测试736.2缓存的应用746.3强大的Requests-HTML模块766.3.1使用Requests-HTML实现网络请求766.3.2数据的提取786.3.3获取动态加载的数据826.4小结85第2篇核心技术第7章正则表达式887.1正则表达式基础887.1.1行定位符887.1.2元字符897.1.3限定符897.1.4字符类907.1.5排除字符907.1.6选择字符907.1.7转义字符917.1.8分组917.1.9在Python中使用正则表达式语法917.2使用match()进行匹配927.2.1匹配是否以指定字符串开头937.2.2匹配任意开头的字符串947.2.3匹配多个字符串947.2.4获取部分内容947.2.5匹配指定首尾的字符串957.3使用search()进行匹配957.3.1获取第一匹配值967.3.2可选匹配967.3.3匹配字符串边界977.4使用findall()进行匹配977.4.1匹配所有指定字符开头字符串987.4.2贪婪匹配987.4.3非贪婪匹配997.5字符串处理1007.5.1替换字符串1007.5.2分割字符串1017.6案例
内容摘要
《Python网络爬虫从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python实现网络爬虫开发应该掌握的技术。全书共分19章,内容包括初识网络爬虫、了解Web前端、请求模块urllib、请求模块urllib3、请求模块requests、高级网络请求模块、正则表达式、XPath解析、解析数据的BeautifulSoup、爬取动态渲染的信息、多线程与多进程爬虫、数据处理、数据存储、数据可视化、App抓包工具、识别验证码、Scrapy爬虫框架、Scrapy_Redis分布式爬虫、数据侦探。书中所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,读者可轻松领会网络爬虫程序开发的精髓,快速提高开发技能。
— 没有更多了 —
以下为对购买帮助不大的评价