• 大数据采集与爬虫
21年品牌 40万+商家 超1.5亿件商品

大数据采集与爬虫

全新正版 极速发货

23.73 5.3折 45 全新

库存4件

广东广州
认证卖家担保交易快速发货售后保障

作者李俊翰;付雯

出版社机械工业出版社

ISBN9787111651260

出版时间2020-05

装帧平装

开本16开

定价45元

货号1202075556

上书时间2024-06-07

徐小智的书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
目录前言任务1Python环境搭建1.1任务描述1.2Python概述1.3Python编程环境搭建1.3.1在Windows操作系统下安装Python1.3.2在Linux操作系统下安装Python1.3.3在MacOS操作系统下安装Python1.4安装集成开发环境PyCharm1.4.1PyCharm概述1.4.2PyCharm的安装和运行1.5Python的数据类型1.5.1整型1.5.2浮点型1.5.3字符串类型1.5.4列表类型1.5.5集合类型1.5.6字典类型1.5.7元组类型1.6Python语句与函数1.6.1条件判断语句1.6.2循环语句1.6.3自定义函数1.7任务实现1.8小结1.9习题任务2实现简单数据采集2.1任务描述2.2网络爬虫基础知识2.2.1网络爬虫概述2.2.2使用网络爬虫的风险2.2.3Python爬虫的工作过程2.3网络基础知识2.3.1HTML2.3.2URI和URL2.3.3HTTP2.3.4Request和Response2.4requests库的安装及使用2.4.1requests库概述2.4.2requests库的安装2.4.3requests库的基本用法2.5lxml库和BeautifulSoup库的安装及使用2.5.1lxml库概述2.5.2BeautifulSoup库概述2.5.3lxml库和BeautifulSoup库的安装2.5.4lxml库和BeautifulSoup库的基本用法2.6任务实现2.7小结2.8习题任务3存储数据3.1任务描述3.2MySQL的安装及使用3.2.1MySQL概述3.2.2MySQL的安装3.2.3MySQL的操作3.3PyMySQL的使用3.4CSV和JSON格式3.4.1CSV格式概述3.4.2输出CSV文件头部3.4.3使用Python读取CSV文件数据3.4.4使用Python向CSV文件写入数据3.4.5JSON格式概述3.4.6使用Python读取JSON文件数据3.4.7使用Python向JSON文件写入数据3.5任务实现3.6小结3.7习题任务4使用WebAPI采集数据4.1任务描述4.2GitHub4.2.1GitHub概述4.2.2GitHub的基本用法4.3WebAPI4.3.1WebAPI概述4.3.2GitHub开放API的数据特点4.3.3GitHub的API请求数据4.3.4获取API的响应数据4.3.5处理API的响应数据4.4任务实现4.5小结4.6习题任务5使用AJAX采集数据5.1任务描述5.2AJAX5.2.1AJAX的起源5.2.2AJAX概述5.2.3AJAX的特点5.2.4静态数据5.2.5动态数据5.2.6分析AJAX采集的数据5.2.7提取AJAX采集的数据5.3任务实现5.4小结5.5习题任务6主流验证码解析6.1验证码概述6.2自定义图形验证码解析6.2.1任务描述6.2.2图形验证码概述6.2.3tesserocr库概述6.2.4tesserocr库的安装6.2.5自定义图形验证码的生成6.2.6使用tesserocr库解析自定义图形验证码6.2.7任务实现6.3滑动验证码解析6.3.1任务描述6.3.2滑动验证码概述6.3.3ChromeDriver概述6.3.4ChromeDriver的安装6.3.5Selenium概述6.3.6Selenium的安装6.3.7Selenium和ChromeDriver的基本用法6.3.8任务实现6.4点击式验证码解析6.4.1任务描述6.4.2点击式验证码概述6.4.3聚合数据平台接口概述6.4.4任务实现6.5小结6.6习题任务7模拟登录7.1使用Selenium和ChromeDriver实现模拟登录7.1.1任务描述7.1.2GET概述7.1.3GET的基本用法7.1.4POST概述7.1.5POST的基本用法7.1.6GET和POST的区别7.1.7任务实现7.2使用Cookie实现模拟登录7.2.1任务描述7.2.2Cookie概述7.2.3Session概述7.2.4Cookie和Session的区别7.2.5任务实现——使用Cookie模拟登录7.2.6任务实现——使用requests库实现用Cookie和Session模拟登录7.3小结7.4习题任务8使用Scrapy爬虫框架采集数据8.1任务描述8.2Scrapy8.2.1Scrapy概述8.2.2Scrapy的工作原理8.3Scrapy的安装8.3.1在Windows操作系统下安装Scrapy8.3.2在Linux操作系统下安装Scrapy8.4Scrapy各组件的用法8.4.1Selector类8.4.2Spider类8.4.3下载器中间件8.4.4条目管道8.4.5网络爬虫中间件8.5任务实现8.6小结8.7习题任务9综合案例9.1任务描述9.2页面分析9.3模拟登录9.4获取静态数据9.5获取动态数据9.6数据持久化保存9.7小结

内容摘要
《大数据采集与爬虫》主要讲解了如何使用Python编写网络爬虫程序,内容包括Python环境搭建、Python的基础语法、爬虫基础知识、网络基础知识、常用爬虫库和解析库、数据持久化存储、WebAPI和异步数据抓取技术、Selenium和ChromeDriver的用法,以及Scrapy爬虫框架的基本原理和操作。*后介绍了一个网络爬虫的综合案例,以巩固前面所学的知识。《大数据采集与爬虫》适合作为高等职业院校大数据技术与应用专业的教材,也适合有一定Python编程经验并且对爬虫技术感兴趣的读者阅读。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP