• Python爬虫从菜鸟高 清华大学 9787302640516 编者:李宁|责编:钟志芳
21年品牌 40万+商家 超1.5亿件商品

Python爬虫从菜鸟高 清华大学 9787302640516 编者:李宁|责编:钟志芳

新华书店全新正版书籍图书 保证_可开发票_极速发货支持7天无理由

77 6.5折 119 全新

库存2件

浙江嘉兴
认证卖家担保交易快速发货售后保障

作者编者:李宁|责编:钟志芳

出版社清华大学

ISBN9787302640516

出版时间2023-09

装帧平装

开本其他

定价119元

货号31873113

上书时间2024-08-02

學源图书专营店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第一篇  基础知识
  第1章  开发环境配置
  6分钟
    1.1  搭建Python编程环境
      1.1.1  获取Python安装包
      1.1.2  安装Windows版的Python开发包
      1.1.3  安装macOS版的Python开发包
      1.1.4  安装Linux版的Python开发包
    1.2  安装AnacondaPython开发环境
    1.3  消除PythonREPL中的错误和警告
    1.4  安装PyCharm
    1.5  配置PyCharm
    1.6  小结
  第2章  爬虫基础
  10分钟
    2.1  HTTP基础
      2.1.1  URI和URL
      2.1.2  超文本
      2.1.3  HTTP与HTTPS
      2.1.4  HTTP的请求过程
      2.1.5  请求
      2.1.6  响应
    2.2  网页基础
      2.2.1  HTML基础
      2.2.2  CSS基础
      2.2.3  CSS选择器
      2.2.4  JavaScript
    2.3  爬虫的基本原理
      2.3.1  爬虫的分类
      2.3.2  爬虫抓取数据的方式和手段
    2.4  Session与Cookie
      2.4.1  静态页面和动态页面
      2.4.2  无状态HTTP与Cookie
      2.4.3  利用Session和Cookie保持状态
      2.4.4  查看网站的Cookie
      2.4.5  HTTP状态何时会失效
    2.5  项目实战:抓取所有的网络资源
      实例2.1  基于递归算法的爬虫的代码
    2.6  项目实战:抓取博客文章列表
      实例2.2  抓取博客园首页文章列表的爬虫
    2.7  小结
第二篇  网络库
  第3章  网络库urllib
  39分钟
    3.1  urllib简介
    3.2  发送请求与获得响应
      3.2.1  用urlopen函数发送HTTPGET请求
      实例3.1  使用HTTPResponse读取响应数据
      3.2.2  用urlopen函数发送HTTPPOST请求
      实例3.2  使用urlopen函数发送HTTPPOST请求,并获得返回数据

内容摘要
 本书从实战角度系统论述了Python爬虫技术的核心知识,并通过大量的真实项目帮助读者深入掌握Python爬虫技术及其实现。本书提供了大量实战案例,演绎采用各种技术编写Python爬虫的方式。读者可以任意组合使用这些技术,完成非常复杂的爬虫应用。
本书共20章,分为五篇。第一篇:基础知识(第1~2章),主要包括Python编程环境的搭建、IDE的安装和使用、HTTP的基础知识、网页基础(HTML、
CSS、JavaScript)、爬虫的基本原理、Session、
Cookie。第二篇:网络库(第3~5章),主要包括网络库urllib、urllib3和requests的核心使用方法,例如,发送HTTP请求、处理超时、
设置HTTP请求头、处理中文字符、搭建和使用代理、
解析链接、Robots协议等。
第三篇:解析库(第6~9章),主要包括3个常用解析库(lxml、BeautifulSoup和pyquery)的使用方法,同时介绍了多种用于分析HTML代码的技术,例如,正则表达式、XPath、CSS选择器、方法选择器等。第四篇:数据存储(第10~11章),主要包括Python中数据存储的解决方案,如文件存储和SQLite数据库。第五篇:爬虫高级应用(第12~20章),主要包括Python爬虫的一些高级技术,如抓取异步数据、Selenium、
Splash、抓取移动App数据、Appium、多线程爬虫、
爬虫框架Scrapy、通过OpenCV技术识别验证码;最后给出一个综合的实战案例,该案例综合了Python爬虫、数据存储、PyQt、多线程、数据可视化、Web等多种技术实现一个可视化爬虫。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP