基于修辞结构树库的篇章衔接标记研究
全新正版 极速发货
¥
25.64
4.4折
¥
58
全新
库存4件
作者乐明
出版社世界图书出版公司
ISBN9787519258788
出版时间2019-01
装帧平装
开本16开
定价58元
货号1201874628
上书时间2024-08-05
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
乐明,浙江大学副教授、“求是青年学者”。曾师从冯志伟研究员,于2006年获中国传媒大学语言学及应用语言学博士,研究方向为计算语言学。2011年在美国新墨西哥大学语言学系访问,师从Joan Bybee教授,研究方向为语法化理论。已发表多篇AHCI/CSSCI/SCI/SSCI语言学论文,负责完成国家社科基金青年项目一项及省部级项目两项。
目前主要的研究方向是语言资源的开发和利用,重点关注关联词语和人称代词在各类自然语篇中的分布和功能,通过制定详细的工作手册和标注规范,指导篇章语料库的构建以及目标词语在,语料库中的多维度标注,在此基础上用进行量化的语言学本体研究。
目录
缩略语
章 篇章连贯研究概论
1.1 研究对象
1.2 研究背景
1.2.1 篇章连贯的理论研究
1.2.2 篇章剖析技术的发展
1.2.3 标注篇章语料库的开发
1.2.4 中文信息处理的相关研究
1.3 研究问题
1.4 研究方法及主要成果
1.5 本书结构
第二章 研究方法
2.1 语料库设计
2.2 语料标注
2.2.1 标注理据
2.2.2 标注原则
2.2.3 标注格式
2.2.4 标注手段
2.2.5 标注质量的控制和检验
2.3 统计分析和机器学习
2.3.1 描述性统计
2.3.2 推断性统计
2.3.3 机器学习
2.4 小结
第三章 构建汉语篇章修辞结构树库
3.1 修辞结构理论
3.1.1 内容简介
3.1.2 应用情况
3.1.3 主要争议
3.1.4 与汉语传统理论的比较
3.2 构建汉语篇章语料库
3.2.1 语料选择
3.2.2 语料预处理
3.3 汉语篇章基本单元切分
3.3.1 篇章基本单元的定义
3.3.2 切分的方法
3.3.3 自动切分的形式标记
3.3.4 自动切分的处理结果
3.4 汉语篇章修辞关系集的设定
3.4.1 基于特征的定义方法
3.4.2 汉语修辞关系集的简化分类
3.4.3 一些说明
3.5 修辞关系标注及篇章修辞结构树的构造
3.5.1 分号句层级及以上的修辞结构标注
3.5.2 逗号子句层级的修辞结构标注
3.6 工具和流程
3.7 质量控制和检验
3.8 小结
第四章 标注篇章衔接标记特征
4.1 标注对象
4.2 理论框架
4.2.1 连接词
4.2.2 指代词
4.2.3 语气词
4.2.4 标点符号
4.3 自动标注
4.4 人工标注
4.4.1 标注内容(通用部分)
4.4.2 软件工具
4.4.3 标注流程和质量控制
4.5 统计分析和参数选择
4.6 小结
第五章 数据分析
5.1 财经评论语料库篇章结构特点
5.1.1 修辞结构树特征
5.1.2 分号句层级上的RR概率分布
5.1.3 小结
5.2 但、但是
5.2.1 前人成果
5.2.2 标注方案
5.2.3 数据结果
5.2.4 讨论
5.2.5 小结
5.3 这、那
5.3.1 前人成果
5.3.2 标注方案
5.3.3 数据结果
5.3.4 讨论
5.3.5 小结
5.4 吗、?
5.4.1 前人成果
5.4.2 标注方案
5.4.3 数据结果
5.4.4 讨论
5.4.5 小结
第六章 应用测试——以“因为”为例
6.1 研究背景
6.2 任务分析
6.3 学习工具
6.4 数据处理、结果及讨论
6.5 小结
第七章 讨论
7.1 修辞结构树的理论和工程价值
7.1.1 修辞结构树和修辞关系的性质
7.1.2 修辞结构的层级同质性
7.1.3 修辞结构树与依存句法树
7.2 对RR与DCM的理解
7.2.1 RR的多义性和模糊性
7.2.2 DCM的变异和多义性
7.2.3 RR与DcM问的多对多映射
7.2.4 多义性、多因分析与多任务学习
7.3 对语料库人工标注的理解
7.3.1 人T标注的准确性和挑战
7.3.2 一致性指标的解读
7.3.3 可能的解决方案
7.4 数据挖掘技术在语言工程和理论研究的应用
第八章 结语
第九章 附录
9.1 中文RR关系集(按中文名称排序)
9.2 中文RR定义及示例(按英文名称排序)
9.2.1 addition-n(附力口-n)
9.2.2 addition-s(附力n-s)
9.2.3 antithesis-s(转折-s)
9.2.4 attribution-m(引述-m)
9.2.5 attribution-S(弓I述-S)
9.2.6 background-S(背景-S)
9.2.7 circumstance-S(环境-S)
9.2.8 concession-n(让步-n)
9.2.9 concession-S(让步-S)
9.2.10 condition-S(条件-S)
9.2.11 conjunction-m(并列-m)
9.2.12 contrast-m(对立-m)
9.2.13 disjunction-m(析取-n1)
9.2.14 elaboration-S(详述-S)
9.2.15 enablement-S(使能-S)
9.2.16 evaluation-m(评价-m)
9.2.17 evaluation-n(评价-n)
9.2.18 evaluation-S(评价-S)
9.2.19 evidence-S(证据-S)
9.2.20 interpretation-n(解释-n)
9.2.21 interpretation-S(解释-S)
9.2.22 joint-Ill(联接-111)
9.2.23 justify-n(论证-n)
9.2.24 justify-S(论证-S)
9.2.25 list-m(罗列-U1)
9.2.26 means-S(方式-S)
9.2.27 motivation-S(动机-S)
9.2.28 nonvolitional-cause-S(非意愿性原因-S,NVC)
9.2.29 nonvolitional-cause-result-m(非意愿性冈果-m,NCR)
9.2.30 nonvolitional-result-S(非意愿性结果-S,NVR)
9.2.31 otherwise-S(否则-S)
9.2.32 preparation-S(准备-S)
9.2.33 purpose-S(目的-S)
9.2.34 question-m(问答-m)
9.2.35 question-S(问答-S)
9.2.36 restatement-S(重述-S)
9.2.37 same-unit-ITI(同一单元-m)
9.2.38 sequence-ml(主观语用序列-Hi)
9.2.39 sequence-m2(客观语义序列-n1)
9.2.40 solution-m(解答-111)
9.2.41 solution-n(解答-n)
9.2.42 solution-S(解答-S)
9.2.43 summalT-S(总结-S)
9.2.44 topic-eonnnent-tit(话题一评论-m)
9.2.45 unconditional-S(无条件-S)
9.2.46 unless-s(除非-S)
9.2.47 volitional-casue-S(意愿性原因-S,VC)
9.2.48 volitional-cause-result-m(意愿性因果-1TI,VCR)
9.2.49 volitional-result-S(意愿性结果-s,VR)
9.2.50 777一S(未知关系)
9.3汉语RR标注关系优选协议及相关说明(2.0)
9.4 CRST-DT树形构造规范(2017.6)
缩略语
章 篇章连贯研究概论
1.1 研究对象
1.2 研究背景
1.2.1 篇章连贯的理论研究
1.2.2 篇章剖析技术的发展
1.2.3 标注篇章语料库的开发
1.2.4 中文信息处理的相关研究
1.3 研究问题
1.4 研究方法及主要成果
1.5 本书结构
第二章 研究方法
2.1 语料库设计
2.2 语料标注
2.2.1 标注理据
2.2.2 标注原则
2.2.3 标注格式
2.2.4 标注手段
2.2.5 标注质量的控制和检验
2.3 统计分析和机器学习
2.3.1 描述性统计
2.3.2 推断性统计
2.3.3 机器学习
2.4 小结
第三章 构建汉语篇章修辞结构树库
3.1 修辞结构理论
3.1.1 内容简介
3.1.2 应用情况
3.1.3 主要争议
3.1.4 与汉语传统理论的比较
3.2 构建汉语篇章语料库
3.2.1 语料选择
3.2.2 语料预处理
3.3 汉语篇章基本单元切分
3.3.1 篇章基本单元的定义
3.3.2 切分的方法
3.3.3 自动切分的形式标记
3.3.4 自动切分的处理结果
3.4 汉语篇章修辞关系集的设定
3.4.1 基于特征的定义方法
3.4.2 汉语修辞关系集的简化分类
3.4.3 一些说明
3.5 修辞关系标注及篇章修辞结构树的构造
3.5.1 分号句层级及以上的修辞结构标注
3.5.2 逗号子句层级的修辞结构标注
3.6 工具和流程
3.7 质量控制和检验
3.8 小结
第四章 标注篇章衔接标记特征
4.1 标注对象
4.2 理论框架
4.2.1 连接词
4.2.2 指代词
4.2.3 语气词
4.2.4 标点符号
4.3 自动标注
4.4 人工标注
4.4.1 标注内容(通用部分)
4.4.2 软件工具
4.4.3 标注流程和质量控制
4.5 统计分析和参数选择
4.6 小结
第五章 数据分析
5.1 财经评论语料库篇章结构特点
5.1.1 修辞结构树特征
5.1.2 分号句层级上的RR概率分布
5.1.3 小结
5.2 但、但是
5.2.1 前人成果
5.2.2 标注方案
5.2.3 数据结果
5.2.4 讨论
5.2.5 小结
5.3 这、那
5.3.1 前人成果
5.3.2 标注方案
5.3.3 数据结果
5.3.4 讨论
5.3.5 小结
5.4 吗、?
5.4.1 前人成果
5.4.2 标注方案
5.4.3 数据结果
5.4.4 讨论
5.4.5 小结
第六章 应用测试——以“因为”为例
6.1 研究背景
6.2 任务分析
6.3 学习工具
6.4 数据处理、结果及讨论
6.5 小结
第七章 讨论
7.1 修辞结构树的理论和工程价值
7.1.1 修辞结构树和修辞关系的性质
7.1.2 修辞结构的层级同质性
7.1.3 修辞结构树与依存句法树
7.2 对RR与DCM的理解
7.2.1 RR的多义性和模糊性
7.2.2 DCM的变异和多义性
7.2.3 RR与DcM问的多对多映射
7.2.4 多义性、多因分析与多任务学习
7.3 对语料库人工标注的理解
7.3.1 人T标注的准确性和挑战
7.3.2 一致性指标的解读
7.3.3 可能的解决方案
7.4 数据挖掘技术在语言工程和理论研究的应用
第八章 结语
第九章 附录
9.1 中文RR关系集(按中文名称排序)
9.2 中文RR定义及示例(按英文名称排序)
9.2.1 addition-n(附力口-n)
9.2.2 addition-s(附力n-s)
9.2.3 antithesis-s(转折-s)
9.2.4 attribution-m(引述-m)
9.2.5 attribution-S(弓I述-S)
9.2.6 background-S(背景-S)
9.2.7 circumstance-S(环境-S)
9.2.8 concession-n(让步-n)
9.2.9 concession-S(让步-S)
9.2.10 condition-S(条件-S)
9.2.11 conjunction-m(并列-m)
9.2.12 contrast-m(对立-m)
9.2.13 disjunction-m(析取-n1)
9.2.14 elaboration-S(详述-S)
9.2.15 enablement-S(使能-S)
9.2.16 evaluation-m(评价-m)
9.2.17 evaluation-n(评价-n)
9.2.18 evaluation-S(评价-S)
9.2.19 evidence-S(证据-S)
9.2.20 interpretation-n(解释-n)
9.2.21 interpretation-S(解释-S)
9.2.22 joint-Ill(联接-111)
9.2.23 justify-n(论证-n)
9.2.24 justify-S(论证-S)
9.2.25 list-m(罗列-U1)
9.2.26 means-S(方式-S)
9.2.27 motivation-S(动机-S)
9.2.28 nonvolitional-cause-S(非意愿性原因-S,NVC)
9.2.29 nonvolitional-cause-result-m(非意愿性冈果-m,NCR)
9.2.30 nonvolitional-result-S(非意愿性结果-S,NVR)
9.2.31 otherwise-S(否则-S)
9.2.32 preparation-S(准备-S)
9.2.33 purpose-S(目的-S)
9.2.34 question-m(问答-m)
9.2.35 question-S(问答-S)
9.2.36 restatement-S(重述-S)
9.2.37 same-unit-ITI(同一单元-m)
9.2.38 sequence-ml(主观语用序列-Hi)
9.2.39 sequence-m2(客观语义序列-n1)
9.2.40 solution-m(解答-111)
9.2.41 solution-n(解答-n)
9.2.42 solution-S(解答-S)
9.2.43 summalT-S(总结-S)
9.2.44 topic-eonnnent-tit(话题一评论-m)
9.2.45 unconditional-S(无条件-S)
9.2.46 unless-s(除非-S)
9.2.47 volitional-casue-S(意愿性原因-S,VC)
9.2.48 volitional-cause-result-m(意愿性因果-1TI,VCR)
9.2.49 volitional-result-S(意愿性结果-s,VR)
9.2.50 777一S(未知关系)
9.3汉语RR标注关系优选协议及相关说明(2.0)
9.4 CRST-DT树形构造规范(2017.6)
9.4.1 树形选择
9.4.2 N的确定
9.4.3 非树结构的处理
9.5 标注样例(CJPL2224725)
9.5.1 原文
9.5.2 标注结果
参考文献
索 引
后记.4.1 树形选择
9.4.2 N的确定
9.4.3 非树结构的处理
9.5 标注样例(CJPL2224725)
9.5.1 原文
9.5.2 标注结果
参考文献
索 引
后记
内容摘要
本文定量考察汉语常见篇章衔接标记在书面话语中的连贯用法。首先根据修辞结构理论(Rhetorical Structure Theory,RST),设立了汉语修辞关系集以及关系优选协议,按标注流程开发出汉语财经评论修辞结构树库。接着为各类衔接标记在该篇章语料库中的分布和用法设立多个特征变量,展开形式、句法、语义和语用标注。随后利用树库和标注语料,对特定衔接标记展开深入的个案分析,探讨其篇章分布与语用连贯作用之间的相关性。很后尝试利用衔接标记及其所在篇章单元的形式特征,通过机器学习方法来自动判定所在篇章单元间的修辞连贯关系,测试结果较令人满意。本文很后也讨论了对人工标注质量的理解,以及数据挖掘技术在语言学研究中的应用前景。
— 没有更多了 —
以下为对购买帮助不大的评价