大数据采集与爬虫9787576325201
正版图书,可开发票,请放心购买。
¥
35.38
5.4折
¥
65
全新
库存2件
作者编者:孔令勇|
出版社北京理工大学
ISBN9787576325201
出版时间2023-06
装帧其他
开本其他
定价65元
货号32061807
上书时间2024-07-29
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
孔令勇,男,2014.9―2020.10重庆市永川职业教育中心党委委员、副校长;2020.10―重庆市永川职业教育中心党委书记、校长。参加了重庆市教委的重点课题《职业教育产教融合研究》;牵头开展了重庆市科协组织的《中职教师发展现状与需求研究》。曾在《科学咨询》《重庆文理学院校报》《永川观察》上发表了论文;参与《中职计算机应用专业》教材编写;参与重庆市职业教育有关政策、规划的起草等。
目录
项目一 爬虫与网页
任务一 使用requests模块爬取网页状态
任务二 在浏览器中查看网页状态
任务三 爬取在IIS中发布的网页内容
任务四 爬取网页标签的内容
任务五 爬取网页多个标签的所有文本
任务六 根据标签类名爬取网页标签内容
任务七 用getall()方法爬取网页标签内容
任务八 爬取网页中所有超链接的网址
任务九 爬取网页中超链接目标的标题
任务十 爬取网页中所有标签
项目二 文本类网站的爬虫
任务一 爬取网页特定区域的内容
任务二 爬取网页两个特定区域的内容并分别保存于两个文件中
任务三 爬取网页招聘信息
任务四 爬取两个网页内容合并保存
任务五 从网页爬取商品销售信息并排序保存
任务六 爬取网站的小说文本
内容摘要
\"全书收集了大数据采集与爬虫相关的编程案例,分4个单元进行讲解,包括单元一爬虫与网页、单元二文本类网站的爬虫、单元三图片资源的爬虫、单元四JupyterNotebook(anaconda3)爬虫编程基础,共讲解了28个编程案例。本书案例内容包括爬虫程序的工作原理,从网站爬取收集有需要的代码、文字、图片等资源的技能,讲解以案例应用的形式呈现,并把技能应用结合案例实现过程,以效果目标引领编程,同时,注重理论知识贯穿于案例中。在讲解技能应用技巧的实现过程中,帮助学员掌握大数据采集与爬虫的技术,同时提高相关专业理论知识点的认识与理解。
本书可作为计算机相关专业学习的教材,也适用零基础的计算机爱好者自学用书。\"
— 没有更多了 —
以下为对购买帮助不大的评价