全新正版 计算传播学与网络爬虫 徐健 9787030698551 科学出版社
本店所售图书,保证正版新书,有个别图片和实书封面不一样,以实书封面为准,最快当天,一般隔天发货。支持7天无理由退换货.开票联系客服
¥
20.68
5.2折
¥
39.8
全新
库存2件
作者徐健
出版社科学出版社
ISBN9787030698551
出版时间2021-10
装帧平装
开本16开
定价39.8元
货号31387423
上书时间2023-04-15
商品详情
- 品相描述:全新
- 商品描述
-
商品简介
本书详细介绍了计算传播学与网络爬虫技术的应用,由浅入深地介绍了计算传播学与网络爬虫的概念、发展与应用,重点介绍了八爪鱼网络爬虫工具。本书内容包括导论、网络爬虫概念综述、网络爬虫技术原理、八爪鱼软件概述,以及4个与计算传播学相关的实战案例。本书体系完整、内容丰富,尤为注重实战教学。
本书可以作为普通高校计算传播学的基础教材,也可作为职业培训教育机构的教材及相关技术人员的参考书。
目录
第1章 导论
1.1 计算传播学概述
1.1.1 计算传播学的发展
1.1.2 计算传播学的概念
1.1.3 计算传播学的基本内容
1.1.4 计算传播学的应用
1.2 大数据与人工智能
1.2.1 大数据的概念与发展历程
1.2.2 人工智能的概念与发展历程
1.2.3 大数据和人工智能与计算传播学的关系
1.3 计算传播学与网络爬虫的关系
本章小结
第2章 网络爬虫概念综述
2.1 网络爬虫简介
2.1.1 概念与作用
2.1.2 应用场景
2.2 反爬虫技术
2.3 网络爬虫的算法分析
2.3.1 深度优先搜索算法
2.3.2 广度优先搜索算法
2.3.3 很好优先搜索算法
2.4 网络爬虫种类
2.4.1 通用网络爬虫
2.4.2 主题网络爬虫
2.4.3 增量式网络爬虫
2.4.4 深层网络爬虫
2.5 网络爬虫工具
2.5.1 八爪鱼
2.5.2 Python
2.5.3 Puppeteer
本章小结
第3章 网络爬虫技术原理
3.1 Chrome开发者工具
3.1.1 Elements面板
3.1.2 Network面板
3.2 网址分析
3.2.1 HTTP介绍
3.2.2 URL地址分析
3.3 网页构成
3.3.1 HTML
3.3.2 CSS与JavaScript
3.3.3 网页类型
3.4 模拟登录与验证码
3.4.1 模拟登录场景介绍
3.4.2 登录信息与Cookie简介
3.4.3 模拟登录验证处理
3.5 代理
3.5.1 IP地址
3.5.2 代理的作用
3.5.3 代理的获取与使用
3.5.4 使用八爪鱼软件设置代理IP地址
3.6 解析网页内容
3.6.1 XPath介绍
3.6.2 XPath实例
本章小结
第4章 八爪鱼软件概述
4.1 八爪鱼软件简介
4.1.1 八爪鱼功能介绍
4.1.2 八爪鱼工作界面介绍
4.2 采集模式
4.2.1 模板采集模式
4.2.2 智能模式
4.2.3 自定义模式
4.3 步骤参数设置
4.3.1 打开网页
4.3.2 点击元素
4.3.3 提取数据
4.3.4 循环
4.3.5 判断条件
4.3.6 输入文本
4.3.7 识别验证码
4.3.8 切换下拉选项
4.3.9 移动鼠标到元素上
本章小结
第5章 基于关键字的新闻网页爬取
5.1 新闻简介
5.1.1 新闻的价值
5.1.2 新闻的特点
5.1.3 新闻的作用
5.2 新闻网页采集需求分析
5.2.1 人民网简介
5.2.2 需求介绍
5.3 新闻网页采集流程设计
5.3.1 新建任务
5.3.2 搜索
5.3.3 自动识别搜索页
5.3.4 自动识别详情页
5.3.5 字段介绍
5.3.6 采集设置
5.4 新闻网页采集数据结果
本章小结
第6章 基于关键字的微信公众号爬取
6.1 微信公众号简介
6.1.1 微信公众号的作用
6.1.2 微信公众号与新媒体传播
6.2 微信公众号采集需求分析
6.3 微信公众号采集流程设计
6.3.1 新建任务
6.3.2 登录
6.3.3 关键字列表循环
6.3.4 设置翻页循环
6.3.5 循环列表
6.3.6 点击进入正文
6.3.7 获取正文信息
6.3.8 采集设置
6.4 微信公众号采集数据结果查看
本章小结
第7章 微博博文评论爬取
7.1 微博简介
7.1.1 微博的传播特征
7.1.2 微博的作用
7.2 微博评论采集需求分析
7.2.1 微博可获取数据
7.2.2 网址分析
7.2.3 流程与步骤
7.3 微博评论采集流程设计
7.3.1 新建任务
7.3.2 判断是否要登录
7.3.3 循环翻页
7.3.4 循环列表
7.3.5 获取正文信息
7.3.6 启动采集
7.4 微博评论采集数据结果查看
本章小结
第8章 网络舆情热点数据的获取与追踪
8.1 背景说明
8.1.1 舆情热点发展的过程
8.1.2 舆情热点的获取
8.2 热点数据采集需求分析
8.2.1 百度指数
8.2.2 百度搜索风云榜
8.3 热点数据采集流程设计
8.3.1 百度指数
8.3.2 百度搜索风云榜
8.4 热点数据采集数据结果查看
本章小结
参考文献
— 没有更多了 —
以下为对购买帮助不大的评价