• 基于半监督与集成学习的文本分类方法
  • 基于半监督与集成学习的文本分类方法
  • 基于半监督与集成学习的文本分类方法
  • 基于半监督与集成学习的文本分类方法
21年品牌 40万+商家 超1.5亿件商品

基于半监督与集成学习的文本分类方法

正版 实拍 无笔记划线 二次塑封

35 九品

仅1件

湖北武汉
认证卖家担保交易快速发货售后保障

作者唐焕玲 著

出版社电子工业出版社

出版时间2013-08

版次1

装帧平装

货号E

上书时间2024-12-26

中一书苑

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
图书标准信息
  • 作者 唐焕玲 著
  • 出版社 电子工业出版社
  • 出版时间 2013-08
  • 版次 1
  • ISBN 9787121212567
  • 定价 29.00元
  • 装帧 平装
  • 开本 32开
  • 纸张 胶版纸
  • 页数 188页
  • 字数 205千字
  • 正文语种 简体中文
【内容简介】
  文本分类技术广泛应用于新闻媒体、网络期刊文献、数字图书馆、互联网等领域,是人类处理海量文本信息的重要手段。 
  《基于半监督与集成学习的文本分类方法》重点探讨了利用信息论中的评估函数量化特征权值的方法;基于权值调整改进Co-training的算法;利用互信息或CHI统计量构造特征独立模型,进行特征子集划分的方法;基于投票熵维护样本权重的BoostVE分类模型;融合半监督学习和集成学习的SemiBoost-CR分类模型。
  其中特征选择和权值调整方法、基于特征独立模型划分特征子集的方法适用于文本分类,其他算法不仅适用于文本分类,对机器学习和数据挖掘的其他研究也有较大的参考价值和借鉴作用。
【作者简介】
山东工商学院计算机科学与技术学院
【目录】
第1章绪论
1.1研究背景及意义
1.1.1数据挖掘和文本挖掘
1.1.2文本分类及其面临的问题
1.2国内外相关研究
1.2.1半监督学习
1.2.2集成学习
1.3本书内容组织

第2章文本分类技术概述
2.1文本分类预处理
2.2文本的表示
2.3特征选择
2.3.1初始特征选择
2.3.2特征选择算法
2.4文本分类算法
2.4.1质心向量分类算法
2.4.2K近邻分类算法
2.4.3贝叶斯分类算法
2.4.4关联规则分类算法
2.4.5支持向量机
2.4.6其他分类算法
2.5实验数据集
2.6分类模型的评估方法
2.7本章小结

第3章TEF-WA权值调整技术
3.1特征选择存在的问题
3.2TEF-WA权值调整技术
3.2.1TEF-WA权值调整的基本思想
3.2.2各种评估函数的TEF-WA权值调整
3.3实验结果与分析
3.3.1TEF-WA权值调整的有效性
3.3.2不同评估函数的权值调整
3.3.3评估比较
3.4本章小结

第4章结合TEF-WA技术的Co-training改进算法
4.1Co-training算法及其存在的问题
4.2基于TEF-WA的特征多视图
4.2.1TEF-WA技术
4.2.2基于TEF-WA的特征多视图
4.3基分类器间的差异性评估
4.4TV-SC算法与TV-DC算法
4.5实验结果及其分析
4.6本章小结

第5章基于特征独立模型的Co-training改进算法
5.1特征独立模型
5.1.1基于条件互信息的相互独立性
5.1.2基于条件2统计量的相互独立性
5.1.3特征独立模型
5.2特征子集划分算法PMID
5.3基于MID-Model的改进算法SC-PMID
5.4实验结果及其分析
5.4.1PMID-MI与PART-Rnd的实验比较
5.4.2PMID-CHI与PART-Rnd的实验比较
5.4.3PMID-MI、PMID-CHI和PART-Rnd的实验比较
5.4.4SC-PMID-MI、SC-PMID-CHI和SC-PART-Rnd的
实验比较
5.5本章小结

第6章基于投票信息熵和多视图的AdaBoost改进算法
6.1AdaBoost算法
6.1.1AdaBoost算法描述
6.1.2AdaBoost提升NB文本分类器的问题
6.2利用特征评估函数构造多视图
6.3基于投票信息熵的样本权重维护新策略
6.3.1投票信息熵
6.3.2基于投票信息熵的样本权重维护新策略
6.3.3样本权重对NB文本分类器的扰动
6.4BoostVE算法
6.4.1BoostVE算法描述
6.4.2BoostVE算法的最小训练错误上界
6.5实验结果及其分析
6.5.1参数对BoostVE算法性能的影响
6.5.2BoostVE算法与AdaBoost-MV算法、
AdaBoost算法的实验比较
6.5.3BoostVE算法提升NB文本分类器的有效性
6.6本章小结

第7章结合半监督学习的SemiBoost-CR分类模型
7.1SemiBoost-CR模型的目标函数
7.2未标注样本的置信度
7.2.1基于K近邻的置信度
7.2.2基于最大差距的置信度
7.3基于置信度的重取样策略
7.4样本权重维护策略
7.5SemiBoost-CR分类算法
7.6实验结果及其分析
7.6.1未标注近邻样本对置信度conf1的影响
7.6.2两种置信度方法conf1和conf2的实验比较
7.6.3topN和bottomN对SemiBoost-CR模型的影响
7.7本章小结

第8章文本自动分类系统SECTCS
8.1系统简介
8.2系统总体结构
8.3系统的用户界面
8.4实验数据集
8.5本章小结
结束语
参考文献
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP