231403|正版(特价书)现货Java自然语言处理 智能系统与技术丛书 计算机 JAVA程序设计 NLP自然语言处理技术教程书籍 自然语言文
9787111592112
¥
21.9
全新
库存999件
作者理查德M.里斯(Richard M. Reese)
出版社机械工业出版社
ISBN9787111592112
出版时间2010-01
装帧平装
货号565567338263
上书时间2023-04-25
商品详情
- 品相描述:全新
- 商品描述
-
书 名: java自然语言处理 图书定价: 59元 作 者: (美)理查德M.里斯(Richard M. Reese) 出 版 社: 机械工业出版社 出版日期: 2018-03-01 ISBN 号: 9787111592112 开 本: 16开 页 数: 0 版 次: 1-1 Richard M. Reese曾就职于学术界和工业界。他曾在电信和航天工业领域工作17年,期间曾担任研发、软件开发、监督和培训等多个职位。他目前任教于塔尔顿州立大学,运用他多年来积累的行业经验来完善他的课程。
Richard曾出版过关于Java和C的书籍,他使用简洁易用的方法讨论主题,这些书籍包括《EJB 3.1 Cookbook》,有关Java 7和Java 8的新功能、Java认证以及jMonkey引擎,以及一本关于C指针的书。
我要感谢我的女儿詹妮弗,因她发表了很多评论,并做出很大贡献。她的付出是无价的。
审校者简介
Suryaprakash C. V.自2009年开始工作于NLP领域,他先后毕业于物理学及计算机科学专业。后来,他有机会进入他喜欢的领域(自然语言处理)工作。
目前,他在Senseforth Technologies公司担任技术顾问。
我要感谢同事们支持我的事业和工作。这在审稿过程中给了我很大帮助。
Evan Dempsey是一名爱尔兰Waterford的软件开发人员,当他不再因兴趣与利益从事黑客工作后,他爱上了精酿啤酒、Common Lisp,并继续从事机器学习的前沿研究。他是许多开源项目的贡献者。
Anil Omanwar是一个充满活力的人,他对于最热门的技术趋势和研究充满激情。他拥有超过8年的认知计算研究经验,先后从事过自然语言处理、机器学习、信息可视化等领域,下一个主要研究领域是文本分析。
他精通各种领域下的情感分析、问卷反馈、文本聚类、短语提取等技术,这些领域包括生命科学、制造业、零售业、电子商务、酒店业、客户关系,银行业和社交媒体等。
他目前与IBM实验室合作,主要项目为生命科学领域的NLP与IBM Watson。他的研究目标是能够自动化关键手动步骤,并协助领域专家优化人机功能。
在业余时间,他喜欢公益、徒步、摄影和旅行。他随时准备迎接技术挑战。
Amitabh Sharma是一名职业软件工程师。他曾在电信和商业分析领域的企业应用方面做过大量工作。他的工作专注于面向服务的架构、数据仓库和语言等,如Java、Python等。
译者序
作者简介
审校者简介
前言
第1章 NLP简介 1
1.1 什么是NLP 2
1.2 为何使用NLP 3
1.3 NLP的难点 4
1.4 NLP工具汇总 5
1.4.1 Apache OpenNLP 6
1.4.2 Stanford NLP 7
1.4.3 LingPipe 9
1.4.4 GATE 10
1.4.5 UIMA 10
1.5 文本处理概览 10
1.5.1 文本分词 11
1.5.2 文本断句 12
1.5.3 人物识别 14
1.5.4 词性判断 16
1.5.5 文本分类 17
1.5.6 关系提取 18
1.5.7 方法组合 20
1.6 理解NLP模型 20
1.6.1 明确目标 20
1.6.2 选择模型 21
1.6.3 构建、训练模型 21
1.6.4 验证模型 22
1.6.5 使用模型 22
1.7 准备数据 22
1.8 本章小结 24
第2章 文本分词 25
2.1 理解文本分词 25
2.2 什么是分词 26
2.3 一些简单的Java分词器 28
2.3.1 使用Scanner类 29
2.3.2 使用split方法 30
2.3.3 使用BreakIterator类 31
2.3.4 使用StreamTokenizer类 32
2.3.5 使用StringTokenizer类 34
2.3.6 使用Java核心分词法的性能考虑 34
2.4 NLP分词器的API 34
2.4.1 使用OpenNLPTokenizer类分词器 35
2.4.2 使用Stanford分词器 37
2.4.3 训练分词器进行文本分词 41
2.4.4 分词器的比较 44
2.5 理解标准化处理 45
2.5.1 转换为小写字母 45
2.5.2 去除停用词 46
2.5.3 词干化 49
2.5.4 词形还原 51
2.5.5 使用流水线进行标准化处理 54
2.6 本章小结 55
第3章 文本断句 56
3.1 SBD方法 56
3.2 SBD难在何处 57
3.3 理解LingPipe的HeuristicSen-tenceModel类的SBD规则 59
3.4 简单的Java SBD 60
3.4.1 使用正则表达式 60
3.4.2 使用BreakIterator类 62
3.5 使用NLP API 63
3.5.1 使用OpenNLP 64
3.5.2 使用Stanford API 66
3.5.3 使用LingPipe 74
3.6 训练文本断句模型 78
3.6.1 使用训练好的模型 80
3.6.2 使用SentenceDetector-Evaluator类评估模型 81
3.7 本章小结 82
第4章 人物识别 83
4.1 NER难在何处 84
4.2 NER的方法 84
4.2.1 列表和正则表达式 85
4.2.2 统计分类器 85
4.3 使用正则表达式进行NER 86
4.3.1 使用Java的正则表达式来寻找实体 86
4.3.2 使用LingPipe的RegEx-Chunker类 88
4.4 使用NLP API 89
4.4.1 使用OpenNLP进行NER 89
4.4.2 使用Stanford API进行NER 95
4.4.3 使用LingPipe进行NER 96
4.5 训练模型 100
4.6 本章小结 103
第5章 词性判断 104
5.1 词性标注 104
5.1.1 词性标注器的重要性 107
5.1.2 词性标注难在何处 107
5.2 使用NLP API 109
5.2.1 使用OpenNLP词性标注器 110
5.2.2 使用Stanford词性标注器 118
5.2.3 使用LingPipe词性标注器 125
5.2.4 训练OpenNLP词性标注模型 129
5.3 本章小结 131
第6章 文本分类 132
6.1 文本分类问题 132
6.2 情感分析介绍 134
6.3 文本分类技术 135
6.4 使用API进行文本分类 136
6.4.1 OpenNLP的使用 136
6.4.2 Stanford API的使用 140
6.4.3 使用LingPipe进行文本分类 145
6.5 本章小结 152
第7章 关系提取 153
7.1 关系类型 154
7.2 理解解析树 155
7.3 关系提取的应用 156
7.4 关系提取 159
7.5 使用NLP API 159
7.5.1 OpenNLP的使用 159
7.5.2 使用Stanford API 162
7.5.3 判断共指消解的实体 166
7.6 问答系统的关系提取 168
7.6.1 判断单词依赖关系 169
7.6.2 判断问题类型 170
7.6.3 搜索答案 171
7.7 本章小结 173
第8章 方法组合 174
8.1 准备数据 175
8.1.1 使用Boilerpipe从HTML中提取文本 175
8.1.2 使用POI从Word文档中提取文本 177
8.1.3 使用PDFBox从PDF文档中提取文本 181
8.2 流水线 182
8.2.1 使用Stanford流水线 182
8.2.2 在Standford流水线中使用多核处理器 187
8.3 创建一个文本搜索的流水线 188
8.4 本章小结 193 本店所售图书均为正版书籍'
— 没有更多了 —
以下为对购买帮助不大的评价