• 文本挖掘
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

文本挖掘

17.1 3.5折 49 全新

库存3件

河北保定
认证卖家担保交易快速发货售后保障

作者Kogan 著;Michael、W.Berry、Jacob、文卫东 译

出版社机械工业出版社

出版时间2019-01

版次1

装帧平装

上书时间2024-12-18

中国博海书店

十二年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 Kogan 著;Michael、W.Berry、Jacob、文卫东 译
  • 出版社 机械工业出版社
  • 出版时间 2019-01
  • 版次 1
  • ISBN 9787111570509
  • 定价 49.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 167页
  • 字数 222千字
  • 丛书 大数据丛书
【内容简介】
本书呈现了文本挖掘领域先进的算法,同时从学术界和产业界的角度介绍了文本挖掘。本 

书涉及的业界学者跨越多个国家,来自多个机构: 大学?企业和政府实验室。本书介绍了文本挖掘在多个领域中的自动文本分析和挖掘计算模型,这些领域包括: 机器学习?知识发现?自然语言处理和信息检索等。 

本书适合作为人工智能?机器学习和自然语言处理等领域相关人员的教科书和参考书。同 

时,也适合研究人员和从业人员阅读。
【作者简介】


迈克尔?w.贝瑞(michaei w.berry),美国田纳西大学讲席教授,计算机与电气工程学院副院长。贝瑞教授是美国与应用数学学会(iam)2003年、2004年会议联合。研究兴趣包括:信息检索、数据挖掘和文本挖掘、计算科学、生物信息学和并行计算等。
【目录】
目 录 

译者序 

原书序 

第1 章 独立文档的关键词的自动提取 1 

 1. 1 简介 1 

 1. 1. 1 关键词提取方法 1 

 1. 2 快速自动关键词提取 3 

 1. 2. 1 候选关键词 3 

 1. 2. 2 关键词得分 4 

 1. 2. 3 邻接关键词 5 

 1. 2. 4 提取关键词 5 

 1. 3 基准评估 6 

 1. 3. 1 准确率和召回率评估 6 

 1. 3. 2 效率评估 7 

 1. 4 停用词列表生成 9 

 1. 5 新闻消息的评估 12 

 1. 5. 1 MPQA 语料库 12 

 1. 5. 2 从新闻消息中提取关键词 12 

 1. 6 总结 15 

 参考文献 16 

第2 章 利用数学方法进行多语言文档聚类 17 

 2. 1 简介 17 

 2. 2 背景 17 

 2. 3 实验设置 18 

 2. 4 多语言LSA 20 

 2. 5 Tucker1 方法 21 

 2. 6 PARAFAC2 方法 23 

 2. 7 词对齐的LSA 24 

 2. 8 潜在形态语义分析(LMSA) 26 

 2. 9 词对齐的LMSA 27 

 2. 10 对技术和结果的讨论 27 

 参考文献 29 

第3 章 使用机器学习算法对基于内容的垃圾邮件进行分类 31 

 3. 1 简介 31 

3. 2 机器学习算法 32 

 3. 2. 1 朴素贝叶斯 33 

 3. 2. 2 LogitBoost 33 

 3. 2. 3 支持向量机 34 

 3. 2. 4 增广的潜在语义索引空间 35 

 3. 2. 5 径向基函数网络 36 

 3. 3 数据预处理 37 

 3. 3. 1 特征选择 37 

 3. 3. 2 信息表示 39 

 3. 4 邮件分类的评估 39 

 3. 5 实验 40 

 3. 5. 1 使用PU1 的实验 40 

 3. 5. 2 使用ZH1 的实验 42 

 3. 6 分类器特点 43 

 3. 7 结束语 45 

 参考文献 45 

第4 章 利用非负矩阵分解研究邮件分类问题 47 

 4. 1 简介 47 

 4. 1. 1 相关工作 48 

 4. 1. 2 概要 49 

 4. 2 研究背景 49 

 4. 2. 1 非负矩阵分解 49 

 4. 2. 2 计算NMF 的算法 50 

 4. 2. 3 数据集 52 

 4. 2. 4 解释 52 

 4. 3 基于特征排序的NMF 初始化 54 

 4. 3. 1 特征子集选择 54 

 4. 3. 2 FS 初始化 55 

 4. 4 基于NMF 的分类方法 57 

 4. 4. 1 使用基础特征分类 58 

 4. 4. 2 基于NMF 的一般化LSI 59 

 4. 5 结束语 65 

 参考文献 66 

第5 章 使用k ̄均值算法进行约束聚类 68 

 5. 1 简介 68 

 5. 2 表示法和古典k ̄均值算法 69 

 5. 3 具有布莱格曼散度的k ̄均值约束聚类算法 70 

 5. 3. 1 具有“不能链接” 约束关系的二次k ̄均值聚类 70 

5. 3. 2 “必须链接” 约束关系的移除 73 

5. 3. 3 使用布莱格曼散度进行聚类 75 

 5. 4 smoka 类型约束聚类 77 

 5. 5 球形k ̄均值约束聚类 79 

 5. 5. 1 仅有“不能链接” 约束关系的球形k ̄均值聚类算法 80 

 5. 5. 2 具有
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP