内容提要 口语翻译(Spoken Language Translation, SLT)是指让计算机实现从一种语言的语音到另一种语言的语音自动翻译的过程。其理想目标是,让计算机像人一样充当持不同语言的说话人之间的翻译角色。会议演讲、交谈(通过电话、网络或面对面)、广播等场景下的话语翻译都是口语翻译应用的重要领域。由于多数情况下说话人的话语都以口语风格为主,人们尤其希望翻译系统可以接受并实现任意口语化的、自由交谈式的对话语音直接翻译。本书全面、系统地介绍了SLT项目研究的主要成果,内容包括语言处理与语料收集、语言覆盖性、语音处理和系统评估等各个方面,其中语言处理部分是本书的主要内容。 目录 导读PrefaceAcknowledgements 1 IntroductionPart 1 Language Processing and Corpora 2 Translation Using the Core Language Engine 3 Grammar Specialisation 4 Choosing among Interpretations 5 The TreeBanker 6 Acquisition of Lexical Entries 7 Spelling and Morphology 8 Corpora and Data CollectionPart 2 Linguistic Coverage 9 English Coverage 10 French Coverage 11 Swedish Coverage 12 Transfer Coverage 13 Rational Reuse of Linguistic DataPart 3 Speech Processing 14 Speech Recognition 15 Acoustic Modelling 16 Language Modelling for Multilingual Speech Translation 17 Porting a Recogniser to a New Language 18 Multiple Dialects and Languages 19 Common Speech/Language IssuePart 4 Evaluation and Conclusions 20 Evaluation 21 ConclusionsReferencesIndex 作者介绍 棒性和系统的自适应能力。同书面语相比,口语的声学特性有一定的特殊性,这类语音的基频、时长、幅度等特征都随表达内容、感情色彩等不同,变化的范围比朗读语音大得多,同时还有非语声信号和噪声,充分研究这些特性,建立精细的声学模型非常重要。而且,讲话人往往是在较强的背景噪声或多讲话人环境下发音的,如果是电话自动语音翻译系统,还存在通讯干扰等其他因素的影响,因此,提高语音识别在不同说话人、不同声学环境及通道条件下的鲁棒性,在口语翻译系统中尤其重要。另外,在语言学层面,口语句子中含有大量的修正、重复、口头语、省略等非规范语言现象,研究这些特征,对语言模型进行完善,包括建模、算法和训练等各个方面,将有助于提高语音识别的正确率。 (2)翻译方法有待于进一步研究。尽管统计翻译方法具有较高的鲁棒性,但是,对非规范语言现象和噪声的处理能力仍然十分有限,而且这种方法与训练语料的规模和质量密切相关。统计方法与规则方法的结合一直是人们所追求的,但是具体如何融合,多翻译引擎以什么样的集成方式可以获得好的系统性能,统计模型赖以训练的语料规模达到多大才算充分,非语言信息(手势、表情、说话人角色等)如何融人翻译模型等,诸多问题都远远没有得到解决。 …… 序言
以下为对购买帮助不大的评价