消息首页搜索举报

计算机科学丛书·多语自然语言处理：从原理到实践

4 九品

仅1件

北京昌平

认证卖家担保交易快速发货售后保障

作者[美]Daniel、Imed Zitouni 编；史晓东、陈毅东译

出版社机械工业出版社

出版时间2015-03

版次1

装帧平装

货号17C

上书时间2024-11-21

好运书店

十四年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 7小时
好评率暂无

最新上架

唐宫美人天下【上下】 ¥6.00

欲望之源 ¥8.00

卧底经济学 ¥3.00

高位出局 ¥3.00

陌生人群：一部经济生活的自然史 ¥3.00

可怕的抗生素 ¥11.00

冯德全早教方案5：玩得好学得好 ¥3.00

中医文化对谈录 ¥3.00

骑鹅旅行记（小学语文教材“快乐读书吧”推荐书目） ¥5.00

商品详情

品相描述：九品

图书标准信息

作者 [美]Daniel、Imed Zitouni 编；史晓东、陈毅东译
出版社机械工业出版社
出版时间 2015-03
版次 1
ISBN 9787111484912
定价 99.00元
装帧平装
开本 16开
纸张胶版纸
页数 448页
正文语种简体中文
丛书计算机科学丛书

【内容简介】: 　　《计算机科学丛书·多语自然语言处理：从原理到实践》是第一本全面阐述如何构建健壮和准确多语种自然语言处理系统的图书，由两位资深专家编辑，集合了该领域众多尖端进展以及从广泛的研究和产业实践中总结的实用解决方案。第一部分介绍现代自然语言处理的核心概念和理论基础，展示了现今理解单词和文件结构、分析语法、建模语言、识别蕴含和检测冗余。第二部分彻底阐述与构建真实应用有关的实际考量，包括信息抽取、机器翻译、信息检索/搜索，总结、问答、提炼、处理流水线等。
【作者简介】: 　　nielM.Bikel现为Google公司高级研究科学家，正在开发用于自然语言处理和语音识别的新方法。在IBM工作期间，他为IBM的GALE多语种信息抽取和自动应答系统构架了拦截系统。在宾夕法尼亚大学攻读博士后期间，他建造了第一个可扩展的多语种语法分析引擎。

　　ImedZitouni现为微软公司高级研究员。2004~2012年，他是IBM公司高级研究科学家，领导IBM公司的阿拉伯语信息抽取和数据资源工作组。在此之前，他还曾领导DIALOCA的语音/自然语言处理组和Bell实验室/阿尔卡特朗讯的语言建模和呼叫路由工作。他的研究涉及机器翻译、自然语言处理和口语对话系统。"
【目录】: 出版者的话
译者序
前言
关于作者
第一部分理论
第1章找出词的结构
1.1词及其部件
1.1.1词元
1.1.2词形
1.1.3词素
1.1.4类型学
1.2问题和挑战
1.2.1不规则性
1.2.2歧义性
1.2.3能产性
1.3形态模型
1.3.1查词典
1.3.2有限状态形态
1.3.3基于合一的形态
1.3.4函数式形态
1.3.5形态归纳
1.4总结
第2章找出文档的结构
2.1概述
2.1.1句子边界检测
2.1.2主题边界检测
2.2方法
2.2.1生成序列分类方法
2.2.2判别性局部分类方法
2.2.3判别性序列分类方法
2.2.4混合方法
2.2.5句子分割的全局建模扩展
2.3方法的复杂度
2.4方法的性能
2.5特征
2.5.1同时用于文本与语音的特征
2.5.2只用于文本的特征
2.5.3语音特征
2.6处理阶段
2.7讨论
2.8总结
第3章句法
3.1自然语言分析
3.2树库：句法分析的数据驱动方法
3.3句法结构的表示
3.3.1使用依存图的句法分析
3.3.2使用短语结构树的句法分析
3.4分析算法
3.4.1移进归约分析
3.4.2超图和线图分析
3.4.3最小生成树和依存分析
3.5分析中的歧义消解模型
3.5.1概率上下文无关文法
3.5.2句法分析的生成模型
3.5.3句法分析的判别模型
3.6多语言问题：什么是词元
3.6.1词元切分、实例和编码
3.6.2分词
3.6.3形态学
3.7总结
第4章语义分析
4.1概述
4.2语义解释
4.2.1结构歧义
4.2.2词义
4.2.3实体与事件消解
4.2.4谓词论元结构
4.2.5意义表示
4.3系统范式
4.4词义
4.4.1资源
4.4.2系统
4.4.3软件
4.5谓词论元结构
4.5.1资源
4.5.2系统
4.5.3软件
4.6意义表示
4.6.1资源
4.6.2系统
4.6.3软件
4.7总结
4.7.1词义消歧
4.7.2谓词论元结构
4.7.3意义表示
第5章语言模型
5.1概述
5.2n元模型
5.3语言模型评价
5.4参数估计
5.4.1最大似然估计和平滑
5.4.2贝叶斯参数估计
5.4.3大规模语言模型
5.5语言模型适应
5.6语言模型的类型
5.6.1基于类的语言模型
5.6.2变长语言模型
5.6.3判别式语言模型
5.6.4基于句法的语言模型
5.6.5最大熵语言模型
5.6.6因子化语言模型
5.6.7其他基于树的语言模型
5.6.8基于主题的贝叶斯语言模型
5.6.9神经网络语言模型
5.7特定语言建模问题
5.7.1形态丰富语言的建模
5.7.2亚词单元的选择
5.7.3形态类别建模
5.7.4无分词语言
5.7.5口语与书面语言
5.8多语言和跨语言建模
5.8.1多语言建模
5.8.2跨语言建模
5.9总结
第6章文本蕴涵识别
6.1概述
6.2文本识别蕴涵任务
6.2.1问题定义
6.2.2RTE的挑战
6.2.3评估文本蕴涵系统性能
6.2.4文本蕴涵解决方案的应用
6.2.5其他语言中的RTE研究
6.3文本蕴涵识别的框架
6.3.1要求
6.3.2分析
6.3.3有用的组件
6.3.4通用模型
6.3.5实现
6.3.6对齐
6.3.7推理
6.3.8训练
6.4案例分析
6.4.1抽取语篇约束
6.4.2基于编辑距离的RTE
6.4.3基于转换的方法
6.4.4逻辑表示及推理
6.4.5独立于蕴涵学习对齐
6.4.6在RTE中利用多对齐
6.4.7自然逻辑
6.4.8句法树核
6.4.9使用有限依存上下文的全局相似度
6.4.10RTE的潜在对齐推理
6.5RTE的进一步研究
6.5.1改进分析器
6.5.2发明或解决新问题
6.5.3开发知识库
6.5.4更好的RTE评价
6.6有用资源
6.6.1文献
6.6.2知识库
6.6.3自然语言处理包
6.7总结
第7章多语情感与主观性分析
7.1概述
7.2定义
7.3英语中的情感及主观性分析
7.3.1词典
7.3.2语料库
7.3.3工具
7.4词级和短语级标注
7.4.1基于字典的方法
7.4.2基于语料库的方法
7.5句子级标注
7.5.1基于字典
7.5.2基于语料库
7.6文档级标注
7.6.1基于字典
7.6.2基于语料库
7.7什么有效，什么无效
7.7.1最佳情况：已有人工标注的语料库
7.7.2次优情形：基于语料库的跨语言映射
7.7.3第三优情形：孳衍词典
7.7.4第四优情形：翻译词典
7.7.5各种可行方法的比较
7.8总结

第二部分实践
第8章实体检测和追踪
8.1概述
8.2提及检测
8.2.1数据驱动的分类
8.2.2搜索提及
8.2.3提及检测特征
8.2.4提及检测实验
8.3共指消解
8.3.1Bell树的构建
8.3.2共指模型：链接和引入模型
8.3.3最大熵链接模型
8.3.4共指消解实验
8.4总结
第9章关系和事件
9.1概述
9.2关系与事件
9.3关系类别
9.4将关系抽取视为分类
9.4.1算法
9.4.2特征
9.4.3分类器
9.5关系抽取的其他方法
9.5.1无监督和半监督方法
9.5.2核方法
9.5.3实体和关系检测的联合方法
9.6事件
9.7事件抽取方法
9.8超句
9.9事件匹配
9.10事件抽取的未来方向
9.11总结
第10章机器翻译
10.1机器翻译现状
10.2机器翻译评测
10.2.1人工评测
10.2.2自动评测
10.2.3WER、BLEU、METEOR等
10.3词对齐
10.3.1共现
10.3.2IBM模型
10.3.3期望最大化
10.3.4对齐模型
10.3.5对称化
10.3.6作为机器学习问题的词对齐
10.4基于短语的翻译模型
10.4.1模型
10.4.2训练
10.4.3解码
10.4.4立方剪枝
10.4.5对数线性模型和参数调节
10.4.6控制模型的大小
10.5基于树的翻译模型
10.5.1层次短语翻译模型
10.5.2线图解码
10.5.3基于句法的模型
10.6语言学挑战
10.6.1译词选择
10.6.2形态学
10.6.3词序
10.7工具和数据资源
10.7.1基本工具
10.7.2机器翻译系统
10.7.3平行语料
10.8未来的方向
10.9总结
第11章跨语言信息检索
11.1概述
11.2文档预处理
11.2.1文档句法和编码
11.2.2词元化
11.2.3规范化
11.2.4预处理最佳实践
11.3单语信息检索
11.3.1文档表示
11.3.2索引结构
11.3.3检索模型
11.3.4查询扩展
11.3.5文档先验模型
11.3.6模型选择的最佳实践
11.4CLIR
11.4.1基于翻译的方法
11.4.2机器翻译
11.4.3中间语言文档表示
11.4.4最佳实践
11.5多语言信息检索
11.5.1语言识别
11.5.2MLIR的索引建立
11.5.3翻译查询串
11.5.4聚合模型
11.5.5最佳实践
11.6信息检索的评价
11.6.1建立实验环境
11.6.2相关性评估
11.6.3评价指标
11.6.4已有数据集
11.6.5最佳实践
11.7工具、软件和资源
11.8总结
第12章多语自动文摘
12.1概述
12.2自动文摘方法
12.2.1传统方法
12.2.2基于图的方法
12.2.3学习如何做摘要
12.2.4多语自动摘要
12.3评测
12.3.1人工评价
12.3.2自动评价
12.3.3自动文摘评测系统的近期发展
12.3.4多语自动文摘的自动评测方法
12.4如何搭建自动文摘系统
12.4.1材料
12.4.2工具
12.4.3说明
12.5评测竞赛和数据集
12.5.1评测竞赛
12.5.2数据集
12.6总结
第13章问答系统
13.1概述和历史
13.2架构
13.3源获取和预处理
13.4问题分析
13.5搜索及候选抽取
13.5.1非结构化资源搜索
13.5.2非结构化源文本的候选抽取
13.5.3结构化源文本的候选抽取
13.6回答评分
13.6.1方法概述
13.6.2证据结合
13.6.3扩展到列表型问题
13.7跨语言问答
13.8案例研究
13.9评测
13.9.1评测任务
13.9.2判断答案正确性
13.9.3性能度量
13.10当前和未来的挑战
13.11总结和进一步阅读
第14章提炼
14.1概述
14.2示例
14.3相关性和冗余性
14.4RosettaConsortium提炼系统
14.4.1文档和语料库准备
14.4.2索引
14.4.3查询回答
14.5其他提炼方法
14.5.1系统架构
14.5.2相关度
14.5.3冗余
14.5.4多模态提炼
14.5.5跨语言提炼
14.6评测和指标
14.7总结
第15章口语对话系统
15.1概述
15.2口语对话系统
15.2.1语音识别和理解
15.2.2语音生成
15.2.3对话管理器
15.2.4语音用户接口
15.3对话形式
15.4自然语言呼叫路由选择
15.5三代对话应用
15.6持续的改进循环
15.7口语句子的转录和标注
15.8口语对话系统的本地化
15.8.1呼叫流程本地化
15.8.2提示本地化
15.8.3文法的本地化
15.8.4源端数据
15.8.5训练
15.8.6测试
15.9总结
第16章聚合自然语言处理引擎
16.1概述
16.2聚合语音和NLP引擎架构的期望属性
16.2.1灵活的分布式组件化
16.2.2计算效率
16.2.3数据操作功能
16.2.4鲁棒性处理
16.3聚合的架构
16.3.1UIMA
16.3.2GATE
16.3.3InfoSphereStreams
16.4案例研究
16.4.1GALE互操作性演示系统
16.4.2跨语言自动语言开发系统
16.4.3实时翻译服务
16.5经验教训
16.5.1分割涉及延迟和精度之间的权衡
16.5.2联合优化与互操作性
16.5.3数据模型需要使用约定
16.5.4性能评估的挑战
16.5.5引擎的前向波训练
16.6总结
16.7UIMA样本代码
索引