Python爬虫开发与项目实战 范传辉 编著 新华文轩网络书店 正版图书
编程语言 全面剖析爬虫技术的实现原理 利用Python的强大功能从任意网站爬取数据 新华书店全新正版书籍
¥
54.01
6.8折
¥
79
全新
库存3件
作者 范传辉 著
出版社 机械工业出版社
出版时间 2017-06
版次 1
装帧 平装
货号 1201520444
上书时间 2019-08-16
商品详情
品相描述:全新
新华文轩网络书店 全新正版书籍
商品描述
随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生。范传辉编著的《Python爬虫开发与项目实战》从基本的爬虫原理开始讲解,通过介绍Pthvon编程语言和Web前端基础知识引领读者入门,之后介绍动态爬虫原理以及Scrapy爬虫框架,很后介绍大规模数据下分布式爬虫的设计以及PySpider爬虫框架等。 本书主要特点: 由浅入深,从Pvthon和Web前端基础开始讲起,逐步加深难度,层层递进。 内容详实,从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,方便读者完成进阶。 实用性强,本书共有9个爬虫项目,以系统的实战项目为驱动,由浅及深地讲解爬虫开发中所需的知识和技能。 难点详析,对js加密的分析、反爬虫措施的突破、去重方案的设计、分布式爬虫的开发进行了细致的讲解。
图书标准信息
作者
范传辉 著
出版社
机械工业出版社
出版时间
2017-06
版次
1
ISBN
9787111563877
定价
79.00元
装帧
平装
开本
16开
纸张
胶版纸
页数
423页
【内容简介】
随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生,本书从基本的爬虫原理开始讲解,通过介绍Pthyon编程语言和Web前端基础知识引领读者入门,之后介绍动态爬虫原理以及Scrapy爬虫框架,最后介绍大规模数据下分布式爬虫的设计以及PySpider爬虫框架等。 主要特点: l 由浅入深,从Python和Web前端基础开始讲起,逐步加深难度,层层递进。 l 内容详实,从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,方便读者完成进阶。 l 实用性强,本书共有9个爬虫项目,以系统的实战项目为驱动,由浅及深地讲解爬虫开发中所需的知识和技能。 难点详析,对js加密的分析、反爬虫措施的突破、去重方案的设计、分布式爬虫的开发进行了细致的讲解。
【作者简介】
范传辉,资深网虫,Python开发者,参与开发了多项网络应用,在实际开发中积累了丰富的实战经验,并善于总结,贡献了多篇技术文章广受好评。研究兴趣是网络安全、爬虫技术、数据分析、驱动开发等技术。
【目录】
前言 基础篇 章 回顾python编程 1.1 安装python 1.1.1 windows上安装python 1.1.2 ubuntu上的python 1.2 搭建开发环境 1.2.1 eclie+pydev 1.2.2 pycharm 1.3 io编程 1.3.1 文件读写 1.3.2 作文件和 1.3.3 序列化作 1.4 进程和线程 1.4.1 多进程 1.4.2 多线程 1.4.3 协程 1.4.4 分布式进程 1.5 网络编程 1.5.1 tcp编程 1.5.2 udp编程 1.6 小结 第2章 web前端基础 2.1 w3c标准 2.1.1 html 2.1.2 css 2.1.3 javascript 2.1.4 xpath 2.1.5 json 2.2 标准 2.2.1 请求过程 2.2.2 码含义 2.2.3 头部信息 2.2.4 cookie管理 2.2.5 请求方式 2.3 小结 第3章 初识网络爬虫 3.1 网络爬虫概述 3.1.1 网络爬虫及其应用 3.1.2 网络爬虫结构 …… 第4章 html解析大法 第5章 数据存储(无数据库版) 第6章 实战项目:基础爬虫 第7章 实战项目:简单分布式爬虫 中级篇 第8章 数据存储(数据库版) 第9章 动态抓取 0章 web端协议分析 1章 终端协议分析 2章 初窥scrapy爬虫框架 3章 深入scrapy爬虫框架 4章 实战项目:scrapy爬虫 深入篇 5章 增量式爬虫 6章 分布式爬虫与scrapy 7章 实战项目:scrapy分布式爬虫 8章 人化pyspider爬虫框架
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价