文本挖掘
①一般下午5点前订单,当日发货,开发票联系客服②教材,学习,考试类书默认有笔记(或做过)③其他类书一般无笔记,提前与客服沟通好再下单,否则本店不承担责任)④部分图书籍采用标准图片,可能存在不同印次不同封面,内容一致⑤出版时间过长的书都可能有自然发黄现象。
¥
36.75
7.5折
¥
49
九品
库存2件
作者[美]迈克尔·W.贝瑞|[美]雅克布·柯岗
出版社机械工业出版社
ISBN9787111570509
出版时间2019-01
装帧其他
开本16开
定价49元
货号1145261895872790537
上书时间2024-11-12
商品详情
- 品相描述:九品
- 商品描述
-
作者简介
迈克尔?W.贝瑞(MichaeI W.Berry),美国田纳西大学讲席教授,计算机与电气工程学院副院长。贝瑞教授是美国工业与应用数学学会(SIAM)2003年、2004年会议联合主席。研究兴趣包括:信息检索、数据挖掘和文本挖掘、计算科学、生物信息学和并行计算等。
目录
目 录
译者序
原书序
第1 章 独立文档的关键词的自动提取 1
1. 1 简介 1
1. 1. 1 关键词提取方法 1
1. 2 快速自动关键词提取 3
1. 2. 1 候选关键词 3
1. 2. 2 关键词得分 4
1. 2. 3 邻接关键词 5
1. 2. 4 提取关键词 5
1. 3 基准评估 6
1. 3. 1 准确率和召回率评估 6
1. 3. 2 效率评估 7
1. 4 停用词列表生成 9
1. 5 新闻消息的评估 12
1. 5. 1 MPQA 语料库 12
1. 5. 2 从新闻消息中提取关键词 12
1. 6 总结 15
参考文献 16
第2 章 利用数学方法进行多语言文档聚类 17
2. 1 简介 17
2. 2 背景 17
2. 3 实验设置 18
2. 4 多语言LSA 20
2. 5 Tucker1 方法 21
2. 6 PARAFAC2 方法 23
2. 7 词对齐的LSA 24
2. 8 潜在形态语义分析(LMSA) 26
2. 9 词对齐的LMSA 27
2. 10 对技术和结果的讨论 27
参考文献 29
第3 章 使用机器学习算法对基于内容的垃圾邮件进行分类 31
3. 1 简介 31
3. 2 机器学习算法 32
3. 2. 1 朴素贝叶斯 33
3. 2. 2 LogitBoost 33
3. 2. 3 支持向量机 34
3. 2. 4 增广的潜在语义索引空间 35
3. 2. 5 径向基函数网络 36
3. 3 数据预处理 37
3. 3. 1 特征选择 37
3. 3. 2 信息表示 39
3. 4 邮件分类的评估 39
3. 5 实验 40
3. 5. 1 使用PU1 的实验 40
3. 5. 2 使用ZH1 的实验 42
3. 6 分类器特点 43
3. 7 结束语 45
参考文献 45
第4 章 利用非负矩阵分解研究邮件分类问题 47
4. 1 简介 47
4. 1. 1 相关工作 48
4. 1. 2 概要 49
4. 2 研究背景 49
4. 2. 1 非负矩阵分解 49
4. 2. 2 计算NMF 的算法 50
4. 2. 3 数据集 52
4. 2. 4 解释 52
4. 3 基于特征排序的NMF 初始化 54
4. 3. 1 特征子集选择 54
4. 3. 2 FS 初始化 55
4. 4 基于NMF 的分类方法 57
4. 4. 1 使用基础特征分类 58
4. 4. 2 基于NMF 的一般化LSI 59
4. 5 结束语 65
参考文献 66
第5 章 使用k ̄均值算法进行约束聚类 68
5. 1 简介 68
5. 2 表示法和古典k ̄均值算法 69
5. 3 具有布莱格曼散度的k ̄均值约束聚类算法 70
5. 3. 1 具有“不能链接” 约束关系的二次k ̄均值聚类 70
5. 3. 2 “必须链接” 约束关系的移除 73
5. 3. 3 使用布莱格曼散度进行聚类 75
5. 4 smoka 类型约束聚类 77
5. 5 球形k ̄均值约束聚类 79
5. 5. 1 仅有“不能链接” 约束关系的球形k ̄均值聚类算法 80
内容摘要
本书呈现了文本挖掘领域先进的算法,同时从学术界和产业界的角度介绍了文本挖掘。本书涉及的业界学者跨越多个国家,来自多个机构: 大学、企业和政府实验室。本书介绍了文本挖掘在多个领域中的自动文本分析和挖掘计算模型,这些领域包括: 机器学习、知识发现、自然语言处理和信息检索等。
本书适合作为人工智、机器学习和自然语言处理等领域相关人员的教科书和参考书。同时,也适合研究人员和从业人员阅读。
— 没有更多了 —
以下为对购买帮助不大的评价