基于半监督与集成学习的文本分类方法
正版 实拍 无笔记划线 二次塑封
¥
35
九品
仅1件
作者唐焕玲 著
出版社电子工业出版社
出版时间2013-08
版次1
装帧平装
货号E
上书时间2024-12-26
商品详情
- 品相描述:九品
图书标准信息
-
作者
唐焕玲 著
-
出版社
电子工业出版社
-
出版时间
2013-08
-
版次
1
-
ISBN
9787121212567
-
定价
29.00元
-
装帧
平装
-
开本
32开
-
纸张
胶版纸
-
页数
188页
-
字数
205千字
-
正文语种
简体中文
- 【内容简介】
-
文本分类技术广泛应用于新闻媒体、网络期刊文献、数字图书馆、互联网等领域,是人类处理海量文本信息的重要手段。
《基于半监督与集成学习的文本分类方法》重点探讨了利用信息论中的评估函数量化特征权值的方法;基于权值调整改进Co-training的算法;利用互信息或CHI统计量构造特征独立模型,进行特征子集划分的方法;基于投票熵维护样本权重的BoostVE分类模型;融合半监督学习和集成学习的SemiBoost-CR分类模型。
其中特征选择和权值调整方法、基于特征独立模型划分特征子集的方法适用于文本分类,其他算法不仅适用于文本分类,对机器学习和数据挖掘的其他研究也有较大的参考价值和借鉴作用。
- 【作者简介】
-
山东工商学院计算机科学与技术学院
- 【目录】
-
第1章绪论
1.1研究背景及意义
1.1.1数据挖掘和文本挖掘
1.1.2文本分类及其面临的问题
1.2国内外相关研究
1.2.1半监督学习
1.2.2集成学习
1.3本书内容组织
第2章文本分类技术概述
2.1文本分类预处理
2.2文本的表示
2.3特征选择
2.3.1初始特征选择
2.3.2特征选择算法
2.4文本分类算法
2.4.1质心向量分类算法
2.4.2K近邻分类算法
2.4.3贝叶斯分类算法
2.4.4关联规则分类算法
2.4.5支持向量机
2.4.6其他分类算法
2.5实验数据集
2.6分类模型的评估方法
2.7本章小结
第3章TEF-WA权值调整技术
3.1特征选择存在的问题
3.2TEF-WA权值调整技术
3.2.1TEF-WA权值调整的基本思想
3.2.2各种评估函数的TEF-WA权值调整
3.3实验结果与分析
3.3.1TEF-WA权值调整的有效性
3.3.2不同评估函数的权值调整
3.3.3评估比较
3.4本章小结
第4章结合TEF-WA技术的Co-training改进算法
4.1Co-training算法及其存在的问题
4.2基于TEF-WA的特征多视图
4.2.1TEF-WA技术
4.2.2基于TEF-WA的特征多视图
4.3基分类器间的差异性评估
4.4TV-SC算法与TV-DC算法
4.5实验结果及其分析
4.6本章小结
第5章基于特征独立模型的Co-training改进算法
5.1特征独立模型
5.1.1基于条件互信息的相互独立性
5.1.2基于条件2统计量的相互独立性
5.1.3特征独立模型
5.2特征子集划分算法PMID
5.3基于MID-Model的改进算法SC-PMID
5.4实验结果及其分析
5.4.1PMID-MI与PART-Rnd的实验比较
5.4.2PMID-CHI与PART-Rnd的实验比较
5.4.3PMID-MI、PMID-CHI和PART-Rnd的实验比较
5.4.4SC-PMID-MI、SC-PMID-CHI和SC-PART-Rnd的
实验比较
5.5本章小结
第6章基于投票信息熵和多视图的AdaBoost改进算法
6.1AdaBoost算法
6.1.1AdaBoost算法描述
6.1.2AdaBoost提升NB文本分类器的问题
6.2利用特征评估函数构造多视图
6.3基于投票信息熵的样本权重维护新策略
6.3.1投票信息熵
6.3.2基于投票信息熵的样本权重维护新策略
6.3.3样本权重对NB文本分类器的扰动
6.4BoostVE算法
6.4.1BoostVE算法描述
6.4.2BoostVE算法的最小训练错误上界
6.5实验结果及其分析
6.5.1参数对BoostVE算法性能的影响
6.5.2BoostVE算法与AdaBoost-MV算法、
AdaBoost算法的实验比较
6.5.3BoostVE算法提升NB文本分类器的有效性
6.6本章小结
第7章结合半监督学习的SemiBoost-CR分类模型
7.1SemiBoost-CR模型的目标函数
7.2未标注样本的置信度
7.2.1基于K近邻的置信度
7.2.2基于最大差距的置信度
7.3基于置信度的重取样策略
7.4样本权重维护策略
7.5SemiBoost-CR分类算法
7.6实验结果及其分析
7.6.1未标注近邻样本对置信度conf1的影响
7.6.2两种置信度方法conf1和conf2的实验比较
7.6.3topN和bottomN对SemiBoost-CR模型的影响
7.7本章小结
第8章文本自动分类系统SECTCS
8.1系统简介
8.2系统总体结构
8.3系统的用户界面
8.4实验数据集
8.5本章小结
结束语
参考文献
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价