网络文本分类与应用
全新正版 假一赔十 可开发票
¥
42.26
5.3折
¥
79
全新
库存3件
作者陈念,杨永超 著
出版社中国水利水电出版社
ISBN9787517086956
出版时间2020-09
装帧平装
开本16开
定价79元
货号1202138086
上书时间2024-12-07
商品详情
- 品相描述:全新
- 商品描述
-
目录
前言
第1章 绪论 1
1.1 智能语言处理 1
1.1.1 NLP与文本处理 1
1.1.2 文本信息抽取 3
1.2 网络文本分类应用 6
1.2.1 常见的应用领域 6
1.2.2 相关技术领域 11
1.3 文本分类步骤 15
1.3.1 文本预处理 15
1.3.2 文本分词 18
1.3.3 特征选择 18
1.3.4 数值化表示 19
1.3.5 分类器分类 21
1.4 本章小结 27
第2章 文本预处理 28
2.1 预处理环节 28
2.1.1 标记化 28
2.1.2 规范化 29
2.2 分词技术应用 33
2.2.1 常见应用领域 33
2.2.2 应用中涉及的主要问题 36
2.3 中文分词方法 40
2.3.1 基于词典匹配的分词 40
2.3.2 基于统计的序列标注技术 43
2.3.3 基于深度学习的分词 53
2.4 分词工具 54
2.4.1 Python中文分词工具 54
2.4.2 java中文分词工具 55
2.5 本章小结 57
第3章 特征表示与降维 58
3.1 文本表示模型 58
3.1.1 One-hot独热模型 58
3.1.2 向量空间模型 59
3.1.3 主题模型 60
3.1.4 神经网络语言模型 67
3.2 特征空间降维 78
3.2.1 特征选择 79
3.2.2 特征提取 83
3.3 小结 85
第4章 文本分类算法 86
4.1 基于规则的算法 87
4.1.1 决策树算法 87
4.1.2 基于粗糙集理论的算法 92
4.2 基于统计的算法 93
4.2.1 Rocchio算法 94
4.2.2 k最近邻算法 95
4.2.3 朴素贝叶斯算法 97
4.2.4 Logistic回归算法 102
4.2.5 Softmax 回归算法 105
4.2.6 支持向量机 106
4.3 神经网络算法 113
4.3.1 神经网络概述 113
4.3.2 BP神经网络 115
4.4 集成学习算法 118
4.4.1 Bagging算法 119
4.4.2 Boosting算法 120
4.5 分类算法评价指标 122
4.6 本章小结 126
第5章 多标签文本分类技术 127
5.1 多标签文本分类问题描述 128
5.2 多标签文本分类算法 129
5.2.1 问题转换法 129
5.2.2 算法适应法 132
5.3 多标签文本分类常用的评价方法 155
5.4 本章小结 159
第6章 短文本分类及应用 161
6.1 背景与意义 161
6.2 当前研究现状 163
6.2.1 特征挖掘与表示 163
6.2.2 分类算法 165
6.3 基于LDA的主题分类 166
6.3.1 LDA模型概述 166
6.3.2 LDA模型原理 167
6.3.3 LDA参数估计 170
6.3.4 主题挖掘与处理 176
6.4 微博文本主题分类 183
6.4.1 文本预处理 184
6.4.2 LDA建模 186
6.5 本章小结 189
参考文献 191
内容摘要
本书是作者在多年科学研究的基础上整理完善而成的,是自然语言处理技术在文本分类领域应用的综述和总结,本书专业性较强,注重对技术理论依据和解决思路的精细讲解,读者可通过对本书的学习了解和掌握人工智能相关技术在网络文本处理时的实现方法和操作流程。本书的内容包括:文本预处理、特征表示与降维、文本分类算法、多标签文本分类技术、分类与应用等。每个章节里对关键的知识点进行细致讲解,并通过举例叙述的方式强化相关理论的直观印象,将理论阐述和实例演示紧密联系起来,方便初学者对深奥枯涩理论知识的理解和掌握,本书对提高学生理论联系实际的能力具有较大帮助。本书可作为本科院校智能科学与技术、计算机科学与技术等专业的教材,也可供从事自然语言处理研究的人员进行参考。
— 没有更多了 —
以下为对购买帮助不大的评价