零基础学Python网络爬虫案例实战全流程详解 入门与提高篇
正版新书 新华官方库房直发 可开电子发票
¥
62.37
6.3折
¥
99
全新
仅1件
作者王宇韬,吴子湛编著
出版社机械工业出版社
ISBN9787111683681
出版时间2023-05
版次1
装帧平装
开本16开
纸张胶版纸
页数344页
定价99元
货号SC:9787111683681
上书时间2024-11-30
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
网络爬虫是当今获取数据不可或缺的重要手段。本书讲解了Python爬虫的基础知识和推荐技能,帮助零基础的读者快速入门并熟练使用爬虫。全书共8章。第1章讲解Python开发环境的安装与配置以及Python的基础语法知识。第2章讲解如何运用Requests库和Selenium库获取网页源代码。第3章讲解如何运用正则表达式和BeautifulSoup库解析和提取数据。第4章深入讲解Selenium库在商业实战中的进阶应用。第5讲解爬虫数据的处理与可视化。第6章讲解爬虫数据结构化利器pandas库,以及如何通过Python在MySQL数据库中读写数据。第7章讲解如何运用多线程和多进程技术提高爬虫效率。第8章讲解如何运用IP代理应对网站的反爬机制。本书对于编程新手来说非常友好,从Python基础到爬虫原理再到实战应用,循序渐进地帮助读者打好基础。对于有一定Python爬虫基础的读者,本书也针对实战中常见的疑点和难点提供了解决技巧。
目录:
第1章Python基础
1.1Python快速上手
1.1.1安装Python
1.1.2编写第一个Python程序
1.1.3PyCharm的安装与使用
1.1.4JupyterNotebook的使用
1.2Python语法基础知识
1.2.1变量、行、缩进与注释
1.2.2数据类型:数字与字符串
1.2.3数据类型:列表与字典、元组与集合
1.2.4运算符
1.3Python语句
1.3.1if条件语句
1.3.2for循环语句
1.3.3while循环语句
1.3.4try/except异常处理语句
1.4函数与库
1.4.1函数的定义与调用
1.4.2函数的返回值与变量的作用域
1.4.3常用内置函数介绍
1.4.4库的导入与安装
课后习题
第2章爬虫第一步:获取网页源代码
2.1爬虫核心库1:Requests库
2.1.1如何查看网页源代码
2.1.2用Requests库获取网页源代码:百度新闻
2.1.3Requests库的“软肋”
2.2爬虫核心库2:Selenium库
2.2.1模拟浏览器及Selenium库的安装
2.2.2用Selenium库获取网页源代码:新浪财经股票信息
2.3网页结构分析
2.3.1网页结构基础
2.3.2网页结构进阶
课后习题
第3章爬虫第二步:数据解析与提取
3.1用正则表达式解析和提取数据
3.1.1正
...
— 没有更多了 —
以下为对购买帮助不大的评价