消息首页搜索举报

网络爬虫技术

新华书店全新正版书籍图书保证_可开发票_极速发货支持7天无理由

48.5 5.4折 89 全新

库存2件

浙江嘉兴

认证卖家担保交易快速发货售后保障

作者编者:吴月萍|

出版社北京理工大学

ISBN9787576331578

出版时间2024-05

装帧其他

开本其他

定价89元

货号32100242

上书时间2024-09-25

學源图书专营店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 9小时
好评率暂无

最新上架

汗青堂丛书008北京的城墙与城门(精) ¥52.50

敦煌舞创始人高金荣画传/新中国舞蹈发展史舞蹈人物研究丛书 ¥29.00

新托福写作真经总纲 ¥19.70

奥数教程能力测试(高中第2分册配奥数教程第7版) ¥13.20

文心雕龙(精)/中华经典名著全本全注全译丛书 ¥21.60

彩云为裳(精) ¥13.60

观呼吸(平静的堂课) ¥18.40

中国文学史(修订本2)/高等学校文科教材 ¥7.70

三十只鸟儿正飞过 ¥14.50

商品详情

品相描述：全新

商品描述: 目录
项目1  网页构造的认识
  任务1.1  认识网络爬虫
    1.1.1  大数据与网络爬虫
    1.1.2  编程环境及工具包
  任务1.2  网页构造
    1.2.1  HTTP和HTTPS
    1.2.2  HTML和CSS
    1.2.3  Session和Cookie
    1.2.4  多线程和多进程
项目2  静态网页爬取
  任务2.1  实现HTTP请求
    2.1.1  Requests库的使用
    2.1.2  HTTPX库的使用
    2.1.3  任务实施
  任务2.2  解析网页数据
    2.2.1  BeautifulSoup库的使用
    2.2.2  lxml库的使用
    2.2.3  正则表达式
    2.2.4  Parsel库的使用
    2.2.5  任务实施
  任务2.3  基础爬虫案例分析与实战
项目3  数据存储
  任务3.1  存储到文件
    3.1.1  存储为文本文件
    3.1.2  存储为CSV文件
    3.1.3  存储为JSON文件
    3.1.4  任务实施
  任务3.2  存储到数据库
    3.2.1  存储到MySQL数据库
    3.2.2  存储到MongoDB数据库
    3.2.3  任务实施
  任务3.3  中间件使用
    3.3.1  Redis的使用
    3.3.2  Kafka的使用
    3.3.3  RabbitMQ的使用
    3.3.4  任务实施
项目4  动态网页爬取
  任务4.1  逆向分析爬取
    4.1.1  Ajax与数据爬取
    4.1.2  网站加密与JavaScript Hook
    4.1.3  PyExecJS库的使用
    4.1.4  任务实施
  任务4.2  使用Selenium模拟浏览器
    4.2.1  Selenium爬虫应用
    4.2.2  任务实施
  任务4.3  动态网站分析与爬虫案例实战
项目5  反爬限制技术
  任务5.1  图片校验码
    5.1.1  OCR技术的使用
    5.1.2  手机验证码的处理技术
  任务5.2  账号限制
  任务5.3  IP限制
  任务5.4  反爬分析与爬虫案例实战
项目6  Scrapy爬虫框架
  任务6.1  初探Scrapy
    6.1.1  Scrapy框架入门
    6.1.2  Spider的使用
    6.1.3  Selector的使用
    6.1.4  任务实施
  任务6.2  Scrapy拓展
    6.2.1  对接Selenium的应用
    6.2.2  对接Splash的应用
    6.2.3  任务实施
  任务6.3  Scrapy爬虫案例实战
附录  爬虫的法律法规

内容摘要
本书是一本专注于介绍如何通过技术实现爬取有用数据的书籍，内容包括网页构造的认识、静态网页的爬取、数据存储、动态网页爬取、反爬限制技术、Scrapy爬虫框架。本书注重实践，适合用作应用型本科、高职院校等计算机相关专业的专业核心课的教材，或软件开
发、大数据、人工智能等相关行业从业人员的技术性参
考书籍。

— 没有更多了 —