消息首页搜索举报

Python网络爬虫案例实战

正版新书新华官方库房直发可开电子发票

62.3 7.0折 89 全新

库存7件

湖北武汉

认证卖家担保交易快速发货售后保障

作者李晓东编著

出版社清华大学出版社

ISBN9787302562283

出版时间2021-01

版次1

装帧平装

开本16开

纸张胶版纸

页数376页

字数573千字

定价89元

货号SC:9787302562283

上书时间2024-10-27

沈成书店

十二年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 13小时
好评率暂无

最新上架

幼儿美术教育与活动指导 ¥29.49

急诊急救口袋书自救与救人 ¥44.88

2013年全国注册咨询工程师(投资)执业资格考试临考冲刺9套题宏观经济政策与发展 ¥15.36

月亮与六便士 ¥24.50

商业银行经营管理(第2版) ¥44.25

云计算环境下移动Agent系统信任安全与资源分配研究 ¥20.30

俄语报刊阅读：教学理论与实践 ¥36.26

历年真题汇编(综合知识 ¥17.92

财政与金融 ¥41.25

商品详情

品相描述：全新: 全新正版提供发票

商品描述: 主编推荐:
"（1）以案例项目为主线讲述Python爬虫开发中所需的知识和技能
（2）具有超强的实用性，项目随着图书内容的推进不断趋于工程化
（3）书中给出了80多个实例让读者理解概念、原理和算法
"
内容简介:
《Python网络爬虫案例实战》介绍如何利用Python开发网络爬虫，实用性较强。《Python网络爬虫案例实战》以案例项目为驱动，由浅入深地讲解爬虫开发中所需要的知识和技能。从静态网站到动态网站，从单机爬虫到分布式爬虫，既包含基础知识点，又讲解了关键问题和重难点问题，包含从入门到进阶的所有知识。《Python网络爬虫案例实战》主要包括爬虫网络概述、Web前端、静态网络抓取、动态网页抓取、解析网页、Python并发、数据库、反爬虫、乱码问题、登录与验证码、采集服务器、基础爬虫、App爬取、分布式爬虫、爬虫的综合实战等内容。《Python网络爬虫案例实战》适合Python初学者，也适合研究Python的广大科研人员、学者、工程技术人员。
摘要:
        第3章
    CHAPTER 3
    静态网页爬取
    在网站设计中，纯粹HTML(标准通用标记语言下的一个应用)格式的网页通常被称为“静态网页”。静态网页是相对于动态网页而言的，是指没有后台数据库、不含程序和不可交互的网页。静态网页的更新相对比较麻烦，适用于一般更新较少的展示型网站。容易让人产生误解的是静态页面都是HTML这类页面，实际上静态也不是接近静态，它也可以出现各种动态的效果，如GIF格式的动画、Flash、滚动字幕等。
    在网络爬虫中，静态网页的数据比较容易获取，因为所有数据都呈现在网页的HTML代码中。相对而言，使用AJAX动态加载网络的数据不一定会出现在HTML代码中，这就给爬虫增加了困难。
    在静态网页中，有一个强大的Requests库能够让我们方便地发送HTTP请求，这个库功能完善，而且操作非常简单。
    3.1Requests的安装
    在Windows系统下，Requests库可以通过pip安装。打开cmd或terminal，输入：
    pip install requests
    即可完成安装，可以输入 import requests 命令来试试是否安装成功，如图31所示即显示安装成功。
    图31成功安装Requests
    在Requests中，最常用的功能就是获取某个网页内容。现在使用Requests获取个人博客主页的内容。
    >>> import requests
    >>> r = requests.get('http://www.zhidaow.com')# 发送请求
    >>> r.status_code# 返回码
    200
    >>> r.headers［'content-type'］  # 返回头部信息
    'text/html; charset=utf-8'
    >>> r.encoding  # 编码信息
    'utf-8'
    >>> r.text #内容部分(PS，由于编码问题，建议这里使用r.content)
    '＼n＼n＼n  ＼n

— 没有更多了 —

Python网络爬虫案例实战

沈成书店

商品详情

相关推荐