• 汉语最长名词短语识别研究
21年品牌 40万+商家 超1.5亿件商品

汉语最长名词短语识别研究

正版保障 假一赔十 电子发票

29.15 6.1折 48 全新

库存36件

湖北武汉
认证卖家担保交易快速发货售后保障

作者钱小飞著

出版社上海大学出版社

ISBN9787567146549

出版时间2023-01

装帧其他

开本其他

定价48元

货号4323958

上书时间2024-11-12

瀚东书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
本书定义了多层级的最长名词短语, 系统地描写了汉语最长名词短语的结构、功能和线性特征, 分析了其结构复杂性和识别难点问题, 提出基于归约的表层最长名词短语识别方法和基于语言知识评价的系统集成方法, 进一步使用分层识别策略和基本名词块提升的方法识别了内层最长名词短语, 对汉语最长名词短语进行了系统性分析实践。

内容摘要

第一章

面向应用的最长名词短语研究

第一节汉语自动句法分析的难点问题

自动句法分析是中文信息处理领域诸多应用技术的基础,如机器翻译、人机对话系统等。但完全句法分析技术在处理大规模真实语料时遇到了较大的困难。按照PARSE-VAL评测体系,目前英语

句法分析的F值可达90%以上,汉语则徘徊在80%左右(李帅克等,2022)。这一体系基于短语进行评价,若按照句子的完整结构和关系进行评价,则又要低很多。可以说,在今天词法分析已经能够基本达到应用要求的情况下,句法分析技术已经成为制约中文信息处理技术发展的瓶颈。

20世纪90年代中后期,国内引进英语浅层句法分析的思想,展开了组块识别与分析研究。由于底层句法歧义在很大程度上影响了句法分析的效果,浅层句法分析主张从识别句子中某些简单的组块开始,在充分化解底层歧义的基础上,逐步完成句法分析的任务。它把一个句子的完整分析过程划分为三个部分,即组块识别、组块间依存关系的识别以及组块内部的结构分析,并着力于组块的识别和内部结构分析。浅层句法分析的思想是句法分析技术的进步,特别适合用于分析缺乏形态变化、底层歧义较多的汉语句子,成为汉语句法分析技术的重要发展趋势。

国际上,浅层句法分析任务经历了单一短语的识别、覆盖较广的组块识别、结构复杂的小句识别等发展阶段,而国内研究多集中在基本块,特别是简单名词短语的识别分析取得了较多的成果;较为复杂的语块,如功能块、复杂名词短语识别也受到了一定的关注,但分析效果还有进一步提升的空间。

在浅层句法分析的研究过程中,名词短语引起了研究者的特别关注。一方面,名词短语编码了实体和概念,这些实体和概念是理解文本的基础;另一方面,名词短语承担着句子中的论元角色,也是语义关系分析的基础。

自然语言处理研究者对名词短语进行了新的分类,提出两种具有较高处理价值的名词短语,一种是基本名词短语,一种是最长名词短语。相比较而言,最长名词短语的内部结构复杂多样,既有较为简单的名词短语,也包含类似英语定语从句的范畴,识别和分析的难度更大。

近20年来,随着统计方法加入,最长名词短语识别任务取得了较大的进展,统计机器学习模型逐步成为主要方法。但是,也面临着研究的瓶颈。面对一种较为复杂的句法结构,以往的研究(王月颖,2007;代翠等,2008)在机器学习策略上并没有太大区别;影响机器学习的诸多因素并不清楚,对于不同结构的识别表现不甚明了,如何分析这些因素,针对这些因素制定合理的识别策略,都是值得深入探讨的问题。

显然,结构复杂的最长名词短语识别需要语言学知识的支持。然而,在本体语言学研究中,语法研究的重点是动词,名词重在语义研究。因此,汉语动词短语的句法研究取得了丰硕的成果,名词短语的相关研究却相对较少,主要集中在静态结构的描写以及定语语序等理论研究方面,而动态结构构造规律和分布状况还没有得到充分描写。譬如,“的”是汉语中出现频率最高的词,也是语法研究的热点问题。几乎所有的词类和句法结构都能够进入含“的”名词短语,这些结构是如何嵌套的,主体模式是什么,分布比例如何,本体语言学很少从这一角度展开描写,但是其是名词短语识别的重要参考数据。



精彩内容

名词短语的正确识别能够有效地提高机器翻译、信息抽取、自动句法分析等自然语言处理系统的性能。本书定义了多层级的最长名词短语,系统地描写了汉语最长名词短语的结构、功能和线性特征,分析了其结构复杂性和识别难点问题,提出基于归约的表层最长名词短语识别方法和基于语言知识评价的系统集成方法,进一步使用分层识别策略和基本名词块提升的方法识别了内层最长名词短语,对汉语最长名词短语进行了系统性分析实践。



   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP