网络爬虫进化论(从Excel爬虫到Python爬虫)
正版保障 假一赔十 可开发票
¥
49.99
6.3折
¥
79
全新
库存3件
作者曹鉴华著
出版社中国水利水电出版社
ISBN9787517090465
出版时间2021-01
装帧平装
开本16开
定价79元
货号10925912
上书时间2024-08-30
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
曹鉴华,湖北恩施人,博士研究生毕业,现在天津科技大学计算机科学与信息工程学院任职,大数据专业带头人,主要从事模式识别、机器学习、油气地质大数据方面的研究,具有多年系统软件开发经验。
目录
基础篇
视频讲解:289分钟
第1章 初识爬虫
1.1 什么是网络爬虫
1.1.1 对比搜索理解网络爬虫
1.1.2 网络爬虫的基本流程
1.1.3 了解爬虫历史
1.2 如何学习网络爬虫
1.2.1 学习新技术的自信
1.2.2 网页基础知识学习
1.2.3 掌握必要的爬虫技术
1.3 正道爬虫——技术无边,法律有界
1.3.1 爬虫只是数据的搬运工
1.3.2 遵守君子协议爬取数据
【案例1.1】解读京东官网robots.txt协议
【案例1.2】解读国家统计局官网robots.txt协议
【案例1.3】解读“什么值得买”网站robots.txt协议
1.3.3 恶意爬虫前车之鉴
1.3.4 合法合规快乐爬虫
1.4 爬虫工具——Excel和Python
1.4.1 Excel软件
1.4.2 Python软件
1.5 本章小结
第2章 网站基础知识
2.1 网页基础入门
2.1.1 认识网页
2.1.2 网页功能区域划分
2.1.3 网页的基本元素
2.1.4 HTML标记
2.2 开始动手写网页
2.2.1 选择网页开发工具
2.2.2 选择浏览器
2.2.3 网页开发入门实战
【案例2.1】编写一个显示文本内容的网页
【案例2.2】编写一个显示表格内容的网页
【案例2.3】编写一个显示图片和超链接的网页
【案例2.4】编写一个无序列表显示内容的网页
【案例2.5】编写一个用户登录表单的网页
2.2.4 网页开发进阶实战
【案例2.6】完成网页文本和图片显示样式的设置
【案例2.7】完成网页表格及显示内容样式的设置
【案例2.8】使用class类名完成HTML代码与CSS样式分离的设置
【案例2.9】导入CSS文件实现HTML代码与CSS样式分离的设置
【案例2.10】插入Javascript脚本实现弹窗显示helloworld
【案例2.11】导入Javascript脚本文件,实现弹窗显示helloworld
……
Excel爬虫篇
Python爬虫篇
附录 网络爬虫工具概要参考表
后记
内容摘要
本书主要通过对Excel爬虫和Python爬虫的对比,介绍使用Excel和Python实现网络数据爬取的相关内容和方法。书中按照学习的递进层次分为基础篇、Excel爬虫篇和Python爬虫篇三部分内容,基础篇包括网络爬虫基础、网页和网站基础、网页开发者工具和Python编程基础等内容,Excel爬虫篇包括使用Excel的PowerQuery模块实现网络表格数据采集和相关案例实践等内容,Python爬虫篇包括网络爬虫初体验、各种第三方库的使用详解、Python爬虫案例、Scrapy框架和对比爬取福布斯榜单案例等内容。本书结构紧凑、内容翔实、图文并茂、案例丰富,适合对网络数据爬取感兴趣的读者,对从事数据科学、大数据相关工程的技术人员也具有一定的参考价值。
精彩内容
数据是有价值的,尤其在如今的大数据时代。拥有数据就是拥有不菲的资产,就像有了一座矿山一样。你或许有疑问,亦或变得更加好奇:从哪里获得数据?如何获得数据? 其实如果你仔细关注的话,每天从起床拿起手机开始到晚上睡觉前放下手机,你的各种点击记录就已经被记录在互联网上了。这些个人的点击记录汇聚在一起,就会成为海量的消费数据。 那么,我们如何获取数据并将其化为己用呢? 对于特定网站的已有数据,我们可用excel简单爬取,对就是excel。 不满足于简单爬取?没关系,我们有升级后的大爬虫——python。 想迅速、合法地获取到想要的数据,做出完美的数据表?请阅读《从excel爬虫到python爬虫》。
媒体评论
数据是有价值的,尤其在如今的大数据时代。拥有数据就是拥有不菲的资产,就像有了一座矿山一样。你或许有疑问,亦或变得更加好奇:从哪里获得数据?如何获得数据?
其实如果你仔细关注的话,每天从起床拿起手机开始到晚上睡觉前放下手机,你的各种点击记录就已经被记录在互联网上了。这些个人的点击记录汇聚在一起,就会成为海量的消费数据。
那么,我们如何获取数据并将其化为己用呢?
1.对于特定网站的已有数据,我们可用Excel简单爬取,对,就是我们常用的那个Excel。
2.不满足于简单爬取?没关系,我们有升级后的大爬虫——Python。
想迅速、合法地获取到想要的数据,做出完美的数据表?请阅读《网络爬虫进化论——从Excel爬虫到Python爬虫》
— 没有更多了 —
以下为对购买帮助不大的评价