消息首页搜索举报

基于半监督与集成学习的文本分类方法

正版实拍无笔记划线二次塑封

35 九品

仅1件

湖北武汉

认证卖家担保交易快速发货售后保障

作者唐焕玲著

出版社电子工业出版社

出版时间2013-08

版次1

装帧平装

货号E

上书时间2024-12-26

中一书苑

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 3小时
好评率暂无

最新上架

短视频内容算法：如何在算法推荐时代引爆短视频 ¥10.00

雨雪霏霏：婆罗洲童年记事 ¥30.00

谦词敬词婉词词典 ¥15.00

信用衍生品：原理、定价及应用 ¥20.00

CRM基础教程 ¥15.00

高性能计算应用概览 ¥25.00

道德图 ¥125.00

燃烧吧！动漫简笔画入门教程（色铅笔篇） ¥13.00

没有孩子是差生：50个问题学生的教育案例 ¥1.00

商品详情

品相描述：九品

图书标准信息

作者唐焕玲著
出版社电子工业出版社
出版时间 2013-08
版次 1
ISBN 9787121212567
定价 29.00元
装帧平装
开本 32开
纸张胶版纸
页数 188页
字数 205千字
正文语种简体中文

【内容简介】: 　　文本分类技术广泛应用于新闻媒体、网络期刊文献、数字图书馆、互联网等领域，是人类处理海量文本信息的重要手段。　
　　《基于半监督与集成学习的文本分类方法》重点探讨了利用信息论中的评估函数量化特征权值的方法；基于权值调整改进Co-training的算法；利用互信息或CHI统计量构造特征独立模型，进行特征子集划分的方法；基于投票熵维护样本权重的BoostVE分类模型；融合半监督学习和集成学习的SemiBoost-CR分类模型。
　　其中特征选择和权值调整方法、基于特征独立模型划分特征子集的方法适用于文本分类，其他算法不仅适用于文本分类，对机器学习和数据挖掘的其他研究也有较大的参考价值和借鉴作用。
【作者简介】: 山东工商学院计算机科学与技术学院
【目录】: 第1章绪论
1.1研究背景及意义
1.1.1数据挖掘和文本挖掘
1.1.2文本分类及其面临的问题
1.2国内外相关研究
1.2.1半监督学习
1.2.2集成学习
1.3本书内容组织

第2章文本分类技术概述
2.1文本分类预处理
2.2文本的表示
2.3特征选择
2.3.1初始特征选择
2.3.2特征选择算法
2.4文本分类算法
2.4.1质心向量分类算法
2.4.2K近邻分类算法
2.4.3贝叶斯分类算法
2.4.4关联规则分类算法
2.4.5支持向量机
2.4.6其他分类算法
2.5实验数据集
2.6分类模型的评估方法
2.7本章小结

第3章TEF-WA权值调整技术
3.1特征选择存在的问题
3.2TEF-WA权值调整技术
3.2.1TEF-WA权值调整的基本思想
3.2.2各种评估函数的TEF-WA权值调整
3.3实验结果与分析
3.3.1TEF-WA权值调整的有效性
3.3.2不同评估函数的权值调整
3.3.3评估比较
3.4本章小结

第4章结合TEF-WA技术的Co-training改进算法
4.1Co-training算法及其存在的问题
4.2基于TEF-WA的特征多视图
4.2.1TEF-WA技术
4.2.2基于TEF-WA的特征多视图
4.3基分类器间的差异性评估
4.4TV-SC算法与TV-DC算法
4.5实验结果及其分析
4.6本章小结

第5章基于特征独立模型的Co-training改进算法
5.1特征独立模型
5.1.1基于条件互信息的相互独立性
5.1.2基于条件2统计量的相互独立性
5.1.3特征独立模型
5.2特征子集划分算法PMID
5.3基于MID-Model的改进算法SC-PMID
5.4实验结果及其分析
5.4.1PMID-MI与PART-Rnd的实验比较
5.4.2PMID-CHI与PART-Rnd的实验比较
5.4.3PMID-MI、PMID-CHI和PART-Rnd的实验比较
5.4.4SC-PMID-MI、SC-PMID-CHI和SC-PART-Rnd的
实验比较
5.5本章小结

第6章基于投票信息熵和多视图的AdaBoost改进算法
6.1AdaBoost算法
6.1.1AdaBoost算法描述
6.1.2AdaBoost提升NB文本分类器的问题
6.2利用特征评估函数构造多视图
6.3基于投票信息熵的样本权重维护新策略
6.3.1投票信息熵
6.3.2基于投票信息熵的样本权重维护新策略
6.3.3样本权重对NB文本分类器的扰动
6.4BoostVE算法
6.4.1BoostVE算法描述
6.4.2BoostVE算法的最小训练错误上界
6.5实验结果及其分析
6.5.1参数对BoostVE算法性能的影响
6.5.2BoostVE算法与AdaBoost-MV算法、
AdaBoost算法的实验比较
6.5.3BoostVE算法提升NB文本分类器的有效性
6.6本章小结

第7章结合半监督学习的SemiBoost-CR分类模型
7.1SemiBoost-CR模型的目标函数
7.2未标注样本的置信度
7.2.1基于K近邻的置信度
7.2.2基于最大差距的置信度
7.3基于置信度的重取样策略
7.4样本权重维护策略
7.5SemiBoost-CR分类算法
7.6实验结果及其分析
7.6.1未标注近邻样本对置信度conf1的影响
7.6.2两种置信度方法conf1和conf2的实验比较
7.6.3topN和bottomN对SemiBoost-CR模型的影响
7.7本章小结

第8章文本自动分类系统SECTCS
8.1系统简介
8.2系统总体结构
8.3系统的用户界面
8.4实验数据集
8.5本章小结
结束语
参考文献

点击展开点击收起

— 没有更多了 —

基于半监督与集成学习的文本分类方法

中一书苑

商品详情

图书标准信息

相关推荐