消息首页搜索举报

【现货速发】文本挖掘

全新正版书籍，24小时发货，可开发票。

25.3 5.2折 49 全新

库存4件

天津津南

认证卖家担保交易快速发货售后保障

作者[美]迈克尔•W. 贝瑞（Michael W. Berry）雅克布•柯岗（Jacob Kogan）

出版社机械工业出版社

ISBN9787111570509

出版时间2019-01

装帧平装

开本16开

定价49元

货号26488736

上书时间2024-11-24

易安居书舍

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 13小时
好评率暂无

最新上架

【现货速发】农地生产效率研究：以黄淮海地区为例 ¥35.00

【现货速发】失物招领 ¥27.70

【现货速发】词律 ¥212.20

【现货速发】全图解!：全图解!真账实操教你学税务处理 ¥25.30

【现货速发】风中的寻找与等待 ¥14.10

【现货速发】美国对华贸易政策政治经济学研究 ¥18.80

【现货速发】舌尖上的爱情 ¥35.00

【现货速发】四川特色小镇发展报告.2017（2017版） ¥46.70

【现货速发】日涉园集 ¥64.80

商品详情

品相描述：全新

商品描述: 导语摘要
本书呈现了文本挖掘领域先进的算法，同时从学术界和产业界的角度介绍了文本挖掘。本
书涉及的业界学者跨越多个国家，来自多个机构: 大学､企业和政府实验室。本书介绍了文本挖掘在多个领域中的自动文本分析和挖掘计算模型，这些领域包括: 机器学习､知识发现､自然语言处理和信息检索等。
本书适合作为人工智能､机器学习和自然语言处理等领域相关人员的教科书和参考书。同
时，也适合研究人员和从业人员阅读。

作者简介
迈克尔？W.贝瑞(MichaeI W.Berry)，美国田纳西大学讲席教授，计算机与电气工程学院副院长。贝瑞教授是美国工业与应用数学学会(SIAM)2003年、2004年会议联合主席。研究兴趣包括：信息检索、数据挖掘和文本挖掘、计算科学、生物信息学和并行计算等。

目录
目  录
译者序
原书序
第1 章独立文档的关键词的自动提取                      1
1. 1 简介                                    1
  1. 1. 1 关键词提取方法                             1
1. 2 快速自动关键词提取                             3
  1. 2. 1 候选关键词                               3
  1. 2. 2 关键词得分                               4
  1. 2. 3 邻接关键词                               5
  1. 2. 4 提取关键词                               5
1. 3 基准评估                                  6
  1. 3. 1 准确率和召回率评估                           6
  1. 3. 2 效率评估                                7
1. 4 停用词列表生成                               9
1. 5 新闻消息的评估                              12
  1. 5. 1 MPQA 语料库                              12
  1. 5. 2 从新闻消息中提取关键词                        12
1. 6 总结                                   15
参考文献                                    16
第2 章利用数学方法进行多语言文档聚类                   17
2. 1 简介                                   17
2. 2 背景                                   17
2. 3 实验设置                                 18
2. 4 多语言LSA                                 20
2. 5 Tucker1 方法                                21
2. 6 PARAFAC2 方法                              23
2. 7 词对齐的LSA                                24
2. 8 潜在形态语义分析(LMSA)                          26
2. 9 词对齐的LMSA                               27
2. 10 对技术和结果的讨论                            27
参考文献                                    29
第3 章使用机器学习算法对基于内容的垃圾邮件进行分类           31
3. 1 简介                                   31
3. 2 机器学习算法                               32
  3. 2. 1 朴素贝叶斯                              33
  3. 2. 2 LogitBoost                                33
  3. 2. 3 支持向量机                              34
  3. 2. 4 增广的潜在语义索引空间                        35
  3. 2. 5 径向基函数网络                            36
3. 3 数据预处理                                37
  3. 3. 1 特征选择                               37
  3. 3. 2 信息表示                               39
3. 4 邮件分类的评估                              39
3. 5 实验                                   40
  3. 5. 1 使用PU1 的实验                            40
  3. 5. 2 使用ZH1 的实验                            42
3. 6 分类器特点                                43
3. 7 结束语                                  45
参考文献                                    45
第4 章利用非负矩阵分解研究邮件分类问题                  47
4. 1 简介                                   47
  4. 1. 1 相关工作                               48
  4. 1. 2 概要                                 49
4. 2 研究背景                                 49
  4. 2. 1 非负矩阵分解                             49
  4. 2. 2 计算NMF 的算法                            50
  4. 2. 3 数据集                                52
  4. 2. 4 解释                                 52
4. 3 基于特征排序的NMF 初始化                         54
  4. 3. 1 特征子集选择                             54
  4. 3. 2 FS 初始化                               55
4. 4 基于NMF 的分类方法                            57
  4. 4. 1 使用基础特征分类                           58
  4. 4. 2 基于NMF 的一般化LSI                          59
4. 5 结束语                                  65
参考文献                                    66
第5 章使用k￣均值算法进行约束聚类                     68
5. 1 简介                                   68
5. 2 表示法和古典k￣均值算法                          69
5. 3 具有布莱格曼散度的k￣均值约束聚类算法                   70
  5. 3. 1 具有“不能链接” 约束关系的二次k￣均值聚类               70
5. 3. 2 “必须链接” 约束关系的移除                       73
5. 3. 3 使用布莱格曼散度进行聚类                       75
5. 4 smoka 类型约束聚类                             77
5. 5 球形k￣均值约束聚类                            79
  5. 5. 1 仅有“不能链接” 约束关系的球形k￣均值聚类算法             80
  5. 5. 2 具有

内容摘要
本书呈现了文本挖掘领域先进的算法，同时从学术界和产业界的角度介绍了文本挖掘。本
书涉及的业界学者跨越多个国家，来自多个机构: 大学､企业和政府实验室。本书介绍了文本挖掘在多个领域中的自动文本分析和挖掘计算模型，这些领域包括: 机器学习､知识发现､自然语言处理和信息检索等。
本书适合作为人工智能､机器学习和自然语言处理等领域相关人员的教科书和参考书。同
时，也适合研究人员和从业人员阅读。

— 没有更多了 —