汉语口语语篇库(建构与标注)
¥
61.74
4.9折
¥
126
全新
库存56件
作者李爱军
出版社中国社会科学出版社
ISBN9787520375696
出版时间2020-09
装帧平装
开本16开
定价126元
货号11074653
上书时间2024-12-13
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
李爱军,中国社会科学院语言研究所副所长,研究员,博士生导师 ,《中国语音学报》副主编;中语言学会语音学分会副主席; ORIENTIAL-COCOSDA中国代表;中国声学学会语言、听觉和音乐声学分会委员;中国中文信息学会理事;中国中文信息学会语音信息处理委员会委员。专业方向和研究领域是语音学。多年来一直从事面向语音合成、语音分析和语音数据库的研究工作,参加或主持了国家863项目、973项目、国家社会科学基金重点项目、国家自然科学基金项目,以及欧盟和美国自然科学基金项目。
目录
第一章 引言
第一节 语言与言语
第二节 复杂场景中口语语篇的特点
第三节 语音与语言资源建设
第四节 章节安排
第五节 致谢
第二章 术语与理论基础
第一节 引用规范和基本术语
一 规范性引用文件
二 术语
第二节 语篇分析相关理论简述
一 语言学理论基础
二 互动语言学
三 言语行为理论
四 语境理论
五 话语标记
六 情感理论与情感表示
七 语调与韵律
第三节 汉语口语语篇研究
一 汉语语调
二 汉语口语语篇的多层级结构与标注体系
第四节 本章小结
第三章 语音库规范
第一节 语音库的元数据
第二节 语音库制作
一 语音库规范的制定
二 语音库收集工作准备
三 语音库收集
四 后期处理
五 语音库标注
六 发音词典
七 文档
八 语料库评测
九 语音库分发
第三节 法律与伦理问题
第四节 本章小结
第四章 语音库的语音基础标注规范
第一节 音字转写规范
第二节 汉语音段标注规范SAMPA
一 音段标注符号
二 音段层级标注
第三节 语音韵律标注
一 韵律标注原则
二 韵律标注系统
第四节 小结
第五章 面向自然口语语篇的依存语法标注
第一节 依存语法简介
第二节 汉语依存语法相关研究
一 依存分析工具比较
二 两种标注体系比较
第三节 基于自然口语的依存语法标注
第六章 面向自然口语语篇的修辞结构标注
第一节 修辞结构理论简介
一 修辞关系集定义
二 最小篇章单元的切分
三 标注工具
第二节 修辞关系集
一 英文修辞关系集
二 中文修辞关系集
第三节 基于自然口语的修辞结构标注
第四节 本章小结
第七章 基于互动意图的对话言语行为和情感标注
第一节 发音人信息标注
第二节 话轮切分和话轮转换的功能标注
第三节 话语标记的功能分类与标注
第四节 功能语段切分
第五节 对话行为标注
一 对话行为标注的层级结构
二 对话行为标注格式
三 对话行为(DA)标注集
四 口语对话的应答交互行为标注规范
五 邻接对定义与标注
六 主题定义与标注
第六节 情感语音标注
第七节 标注实例
第八章 语音识别语料库RASC863
第一节 背景
第二节 语音库制作过程和一般规范
第三节 方言口音普通话语音库RASC;863制作介绍
一 方言区和发音人
二 录音语料
三 录音设备和录音软件
四 数据存储
五 语料库标注规范
六 法律声明
七 语料库评价和分发规范
第四节 连续汉语语音识别语音库RASC863的朗读语料设计
一 三音子搭配模型及个数统计
二 语料挑选设计
三 挑选文本分析
第五节 RASC863语音标注规范
一 标注软件以及标注文件格式
二 语音标注内容
三 标注规范
第六节 即兴口语语言学单元统计
第七节 本章小结
第九章 具有深度言语信息标注的口语语篇库Discourse-CASS
第一节 口语语篇库Discourse-CASS的基本信息
一 Discourse-CASS数据库采集方法
二 朗读语篇库(ASCCD)
三 自然口语对话库(CADCC)
四 各种真实场景对话库
第二节 基于Discourse-CASS多层级标注信息统计
一 不同场景对话语料基本信息
二 不同场景对话语料的基本语言学标注信息统计
三 不同场景对话中韵律单元统计
四 不同场景对话中各种语言学单元的时长统计
五 不同场景对话中言语行为功能与形式标注统计
六 不同场景对话情感态度标注统计
第三节 本章小结
附录
内容摘要
本书面向新一代语音认知智能技术,在语音学和其他语言学研究成果基础上,对口语语篇进行结构和功能的描述和表示(representation),建立汉语口语语篇的多层级标注规范,为语音研究和应用提供重要的理论和数据支撑。本书适用于语音学、口语信息处理、语言教学等方向的学生、研究人员学习和研究,也可作为数据公司专业标注人员的参考资料。
精彩内容
语音数据库的建设是语音研究及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中,语音数据的标注是语音数据库建设的核心。面向特定应用的语音数据的深度标注,往往体现了语音学和语言学的研究成果,是言语工程的最好结合点。本书的目的是面向新一代语言认知智能技术,在语音学和语言学的研究成果基础上,对实际言语交际产生的口语语篇进行结构和功能的描述与表示,整合语音和自然语言处理领域的标注规范,建立汉语口语语篇的多层级标注规范,通过对海量中文口语语篇信息的深度标注,为研究提供重要的理论和数据支撑。
媒体评论
语音数据库的建设是语音研究及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中,语音数据的标注是语音数据库建设的核心。面向特定应用的语音数据的深度标注,往往体现了语音学和语言学的研究成果,是言语工程的最好结合点。本书旨在面向新一代语言认知智能技术,在语音学和语言学的研究成果基础上,对实际言语交际产生的口语语篇进行结构和功能的描述与表示,整合语音和自然语言处理领域的标注规范,建立汉语口语语篇的多层级标注规范。
— 没有更多了 —
以下为对购买帮助不大的评价