消息首页搜索举报

社交媒体虚假信息检测基础及模型

正版保障假一赔十可开发票

62.92 6.4折 98 全新

仅1件

广东广州

认证卖家担保交易快速发货售后保障

作者徐凡,黄琪

出版社科学出版社

ISBN9787030727138

出版时间2022-10

装帧其他

开本其他

定价98元

货号11749412

上书时间2024-09-18

灵感书店

三年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 10小时
好评率暂无

最新上架

四十年新闻摄影：图片社时代 ¥41.99

真实的木心 ¥32.01

网络安全设计与运营 ¥31.46

彩陶甘肃:美冠世界的彩陶之乡 ¥41.43

易经杂说 ¥28.76

计算机网络 ¥50.72

小学语文学习任务的设计与教学:四年级 ¥34.15

城市更新规划 ¥35.31

电力互感器术语使用手册 ¥46.74

商品详情

品相描述：全新

商品描述

前言

第一篇基础篇

第1章社交媒体虚假信息检测概述 3

1.1 引言 3

1.2 社交媒体概述 3

1.3 虚假信息概述 4

1.3.1 背景 4

1.3.2 术语定义 4

1.4 虚假信息检测计算模型综述 6

1.4.1 传统机器学习模型 6

1.4.2 深度学习模型 8

1.5 评测指标 10

1.6 本章小结 10

参考文献 11

第2章相关技术 16

2.1 引言 16

2.2 传统机器学习模型 16

2.2.1 支持向量机 16

2.2.2 互信息和点互信息 18

2.2.3 决策树 19

2.2.4 主题模型 20

2.2.5 词频-逆文档频率 20

2.3 深度学习技术 21

2.3.1 词向量 21

2.3.2 word2vec和GLOVE模型 22

2.3.3 循环神经网络 23

2.3.4 卷积神经网络 24

2.3.5 BERT 模型 25

2.3.6 对抗生成网络 26

2.3.7 图神经网络 26

2.4 本章小结 27

参考文献 27

第二篇模型篇

第3章融合语义的虚假信息检测模型 31

3.1 引言 31

3.2 基于主题的谣言检测模型 31

3.2.1 背景 31

3.2.2 算法模型 32

3.2.3 实验分析 33

3.3 基于全局语义信息的谣言检测模型 44

3.3.1 背景 44

3.3.2 算法模型 46

3.3.3 实验分析 51

3.4 本章小结 56

参考文献 57

第4章融合知识的虚假信息检测模型 60

4.1 引言 60

4.2 基于世界知识的虚假新闻检测模型 60

4.2.1 背景 60

4.2.2 算法模型 61

4.2.3 实验分析 63

4.3 基于语言知识的虚假新闻检测模型 66

4.3.1 背景 66

4.3.2 算法模型 67

4.3.3 实验分析 73

4.4 本章小结 77

参考文献 78

第5章融合传播的虚假信息检测模型 80

5.1 引言 80

5.2 基于时空结构的谣言检测模型 81

5.2.1 背景 81

5.2.2 算法模型 82

5.2.3 实验分析 87

5.3 本章小结 93

参考文献 93

第6章融合用户的虚假信息检测模型 95

6.1 引言 95

6.2 基于用户行为的谣言检测模型 96

6.2.1 背景 96

6.2.2 算法模型 97

6.2.3 实验分析 102

6.3 本章小结 106

参考文献 106

第7章多元信息融合的虚假信息检测模型 110

7.1 引言 110

7.2 基于多元信息融合和推理的虚假新闻检测模型 110

7.2.1 背景 110

7.2.2 算法模型 112

7.2.3 实验分析 117

7.3 本章小结 121

参考文献 121

第8章总结与展望 125

8.1 本书总结 125

8.2 未来展望 125

8.2.1 多模态虚假信息检测 125

8.2.2 多元信息融合检测 126

8.2.3 虚假信息早期检测 126

8.3 结束语 126

附录A 虚假信息检测常用数据集资源 127

附录B 虚假信息检测开源代码资源 129

内容摘要

第一篇基础篇

第1章社交媒体虚假信息检测概述

1.1 引言

本章首先介绍社交媒体虚假信息检测的相关概念，然后针对国内外该领域有代表性计算模型进行综述，*后介绍常用的算法性能评测指标。

1.2 社交媒体概述

社交媒体指互联网上基于用户关系的内容生产与交换平台。社交媒体是人们彼此之间用来分享意见、见解、经验和观点的工具和平台，现阶段主要包括社交网站、微博、微信、博客、论坛、博客等 ①。社交媒体打破了现实世界与虚拟世界之间的界限，同时也提供了从海量数据中挖掘人类行为模式，进而对人类个体进行全面剖析和理解 [1]的机遇。

当前，人们已进入自媒体和微信息时代，正所谓“人人都有麦克风、时时刻刻都发言”。随着互联网和移动互联网技术的高速发展和普及，社交媒体已经成为重要的信息集散地和人们获取信息的重要渠道。社交媒体已成为人们快速寻找信息和获取新闻的一种主流平台。如在推特上的月活跃用户多达 4亿人次，且在推特上过去两年的时间里月活跃用户一直呈增长趋势。而整个社交媒体上的月活跃用户多达 32亿。根据国际数据公司发布的《数据时代 2025》报告 ②，全球每年产生的互联网数据将从 2018年的 33 zeta byte(泽字节)增长到 175 zeta byte。据统计，推特用户每天要发送 5亿条信息 ③。由此可见，人们在互联网中发布了海量的社交媒体数据。

1.3 虚假信息概述

1.3.1 背景

很显然，人们能够以极低的成本在互联网中发布包括新闻、推特、微博等多种形式的社交媒体数据。然而，这些海量信息也成为滋生虚假信息的温床。虚假信息是指故意传播的虚假或不准确的信息，从而达到误导或欺骗他人的目的 [2]。互联网中散布的大量虚假信息不仅加剧社会恐慌和引发社会信任危机，而且会损害国家形象和扭曲人们的意识形态，给人们日常工作和生活带来显著的负面影响。路透社发布了 2019年*新数字新闻报告 [3]，其提到在采样的 38个国家中，各国人民对互联网中信息的真假仍然表现出不同程度的担忧，其中巴西人民怀疑假信息率高达 85%，南非达 70%，墨西哥达 68%，法国达 67%。虽然德国和荷兰相对较低，但也分别各占 38%和 31%。由此可见，互联网中虚假信息的传播已经影响到人们的日常生活，有时甚至会直接或间接危害国家的利益。

正如美国著名作家马克吐温所言：当真相还在穿鞋，谎言已经跑遍半个世界。这从侧面说明了谣言等虚假信息的散布是重大的社会和心理问题，同时也体现出辟谣的难度和滞后性。在社交媒体上，文字和图片类型的虚假新闻内容更新快、扩散速度快，传统的依赖于领域专家辟谣的一些检测平台 (比如： Snopes①、Politifact②、 Factcheck③)在时效性和覆盖度方面已经严重不足。因此，如何利用计算机技术设计高效准确的社交媒体虚假信息自动检测模型和平台成为亟须解决的问题。

1.3.2 术语定义

目前，学术上关于虚假信息这一概念并没有公认的定义，很多文献也没有区分虚假信息 (disinformation)、误报信息(misinformation)、谣言(rumor)、恶作剧(hoax)和虚假新闻 (fake news)等几个非常相近的概念。然而，清晰的定义有助于后续的语料库构建和计算模型研究。因此，本书从代表性文献角度来分析虚假信息及其密切相关的几个术语的定义、联系和区别。为清晰起见，表 1.1列出了代表性文献关于虚假信息、误报信息、谣言、恶作剧和虚假新闻几个相近术语的解释，我们可以从信息的可靠性 (authenticity)和意图性(intention)两个方面区分这些相近术语。根据表 1.1的归纳，其中虚假信息、误报信息、恶作剧和虚假新闻均具有虚假的可靠性，而谣言的可靠性则未知；类似地，虚假信息、恶作剧和虚假新闻通常具有不好的意图性，而误报信息和谣言的意图性则未知。

表1.1 代表性文献关于虚假信息等相近术语的定义

图 1.1更清晰地显示了这几个术语间的关系。其中，菱形判断中坏意图 (bad intention)代表信息中是否包含有不好的意图；虚假新闻是一种特殊的恶作剧，也是虚假信息一种更具体的形式。

图 1.1虚假信息相关术语间关系

1.4 虚假信息检测计算模型综述

本节将从传统机器学习和深度学习计算模型方面阐述虚假信息检测的国内外研究现状。

1.4.1 传统机器学习模型

虚假信息检测的传统机器学习方法主要包含三大类：基于特征工程的方法、基于传播路径的方法、基于图模型的方法。

1. 基于特征工程的方法

代表性的特征工程方法涉及的特征包含用户及情感特征、语义特征、外部知识特征 3大类，具体如下。

1)用户及情感特征

用户特征对于虚假信息检测比较重要，它可以指明用户的类型 (如一般用户、权威机构用户等 )。一般而言，权威机构用户发布的信息相对比较真实。文献 [9]有效地分析了信息发布者的党派关系 (party affiliations)、当前工作 (current job)、家乡(home state)、历史不正确称述 (historical counts of inaccurate statements)等元信息，然后利用这些信息进行虚假新闻检测。文献[10]抽取出用户标识、用户所在地和证据等特征，并利用 SVM(support vector machine，支持向量机 )分类器对谣言加以检测。文献 [11]结合用户-类别(自由派和保守派 )等信息，利用贝叶斯分类器进行谣言检测。文献[12]抽取用户平均年龄、平均朋友数、用户描述等特征，利用决策树分类器检测虚假新闻。

此外，用户在写文章时所表达的情感特征(如褒义和贬义)同样有助于虚假信息检测，因为真实和虚假信息往往具有不同的情感表达方式。

— 没有更多了 —