语料库词典学
全新正版 极速发货
¥
11.29
3.2折
¥
35
全新
库存7件
作者李德俊 著
出版社译林出版社
ISBN9787544751421
出版时间2015-01
装帧平装
开本16开
定价35元
货号1201124888
上书时间2024-08-08
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
李德俊,1967年生,南京大学文学博士。现为解放军靠前关系学院教授,博士研究生导师,南京大学双语词典研究中心兼职研究员,曾于2010年至2011年在英国曼彻斯特大学访学。主要研究兴趣为语料库语言学和词典学,能熟练使用VB和VC等计算机不错语言编程。近年来,共主持并完成了国家社会科学基金项目两项;出版译著3本。专著《平行语料库与积极型汉英词典的研编》获江苏省第十一届哲学社会科学很好成果二等奖。2006年以来,在《外国语》、《现代外语》等靠前非常不错和核心期刊上发表论文10多篇。
目录
前言2
章引论1
1.1什么是语料库词典学1
1.1.1词典学学科地位的日益巩固2
1.1.1.1词典学的语言学传统2
1.1.1.2词典学的跨学科研究4
1.1.2语料库词典学的兴起8
1.2语料库词典学的研究对象10
第二章基于语料库的词典理论研究12
2.1基于语料库和语料库驱动12
2.1.1基于语料库12
2.1.2语料库驱动14
2.1.3小结15
2.2短语学16
2.2.1定义16
2.2.2短语学的研究范围16
2.2.3短语与搭配18
2.2.3.1搭配的多面性19
2.2.3.2短语与搭配的关系20
2.2.4短语学的发展史20
2.2.5短语的识别方法22
2.2.6对词典学的启示23
2.3搭配的统计识别研究27
2.3.1标准分Z值测量法29
2.3.2互信息MI值测量法29
2.3.3统计校验t检验法30
2.3.4搭配统计方法存在的问题31
2.4词义的理解与重现32
2.4.1语料库词典学的词义研究理论基础33
2.4.1.1语言哲学对意义的论述33
2.4.1.2语言学家对意义的分类34
2.4.1.3词义的组成36
2.4.2词义的理解38
2.4.3词典重现词义的手段40
2.4.4短语驱动词典学43
第三章基于语料库的词典编纂研究51
3.1词典立目51
3.1.1立目的要求51
3.1.2立目自动化与挑战54
3.1.3立目工具的基本要求55
3.2词典释义57
3.2.1语料库与单语词典释义58
3.2.2语料库与双语词典释义60
3.3词典配例64
3.3.1语料库配例的优势64
3.3.2语料库配例方法65
3.3.2.1配例的难点65
3.3.2.2提高配例效率的方法67
3.4义项选择与频度排序68
3.4.1新义项的发掘68
3.4.1.1基于索引行的分析方法68
3.4.1.2基于SQL的索引行自动筛选70
3.4.2义项的频度排序71
3.4.2.1平行语料库与频度排序71
3.4.2.2基于SQL检索排序存在的问题73
第四章词典语料库建设研究75
4.1词典语料库的特点75
4.1.1词典语料库的选材特点75
4.1.2词典语料库的规模特点75
4.2词典语料库建设76
4.2.1语料库建设的首要问题:代表性76
4.2.1.1.语料结构和组成76
4.2.1.2语料库及样本大小78
4.2.1.3抽样方法81
4.2.1.4样本的规模86
4.2.2语料库建设及检索系统开发的必要性87
4.2.3词典语料库的建设步骤88
4.2.3.1规划88
4.2.3.2设计89
4.2.3.3选材91
4.2.3.4建库92
4.2.3.5加工93
4.2.4对齐模块的研制97
4.2.4.1句子、段落和句段97
4.2.4.2自动对齐模块AutoAligner99
4.2.5基于语料库的词典编纂平台开发100
4.2.5.1设计思想和目的100
4.2.5.2系统结构框架102
4.2.5.3功能实现103
4.2.6个人语料库管理模块108
4.3小结109
第五章用VB开发词典编纂系统111
5.1基本概念111
5.2数据库113
5.2.1数据库基本概念113
5.2.2SQL语法及常用语句114
5.3VB开发环境116
5.4初级词典编纂系统开发117
5.4.1基本功能117
5.4.2系统运行界面118
5.4.3系统使用对象与控件118
5.4.4程序设计与代码119
第六章专题研究122
6.1搭配语义研究122
6.1.1搭配与词义122
6.1.2语料库与词典搭配研究125
6.1.3小结135
6.2英汉词汇对等研究136
6.2.1等值论及其对双语词典研编的意义136
6.2.2完全对等和零对等的语料库考察137
6.2.2.1完全对等的语料库考察138
6.2.2.2零对等的语料库考察141
6.2.3小结144
6.3基于平行语料库的上下义词对比研究146
6.3.1引论146
6.3.2英汉语上下义词对比研究的意义147
6.3.2.1汉语的词汇层次147
6.3.2.2上义词的交际意义148
6.3.3上下义词对比研究的方法149
6.3.3.1问卷调查的实施方法149
6.3.3.2语料库的方法150
6.3.4问卷调查的数据和语料库的数据150
6.3.4.1问卷调查的数据150
6.3.4.2语料库的数据152
6.3.5数据分析154
6.3.5.1英汉语上下义关系词在中不错层次上具有高度对应性154
6.3.5.2上义词的对应空位及其补偿手段155
6.3.6余论:研究方法的比较157
参考文献164
主要参考词典173
汉英对照词汇表174
英汉对照术语表179
索引184
附录185
内容摘要
《语料库词典学:理论与方法探索》从语言研究的词汇转向出发,讨论了语料库词典学的理论基础和未来研究方向。语料库词典学具有跨学科的特征,本书在详细论述技术现状的同时,还讨论了存在的问题及解决方案。此外,作者还专门介绍了如何使用计算机不错语言开发基于语料库的词典编纂系统。本书不仅可资语言学和词典学领域的师生研读,也是自然语言处理、机器翻译等语言工程领域有价值的参考书。
精彩内容
前 言
词典研编与语料库的结合可谓历史悠久,早期词典编纂过程中使用的“卡片”可视为现代“语料”的前身。早在1747年,英语词典编纂的鼻祖约翰逊(Samuel Johnson)就发表了《英语词典规划》(Plan of an English Dictionary),将前人收集资料的好方法作了总结。他所编的英语词典所含引证和说明达15万条以上,可见其所收集的资料库规模已相当可观。《牛津英语词典》(Oxford English Dictionary, OED)于1928年完成,所用的引证有400多万条,卡片1100多万张。《韦氏新国际英语词典》(Webster’s New International Dictionary)第二版的编写参照了100多万条引证,第三版于1961年付印时,新旧引证共达1000多万条。
利用真实语言资料进行研究,也一直是词汇学家和语法学家的传统做法。英语语法大师叶斯柏森(Otto Jesperson)在编写《英语语法大全》时,所使用的卡片数目多达30至40万张。20世纪40年代,美国的语言学家博厄斯(Franz Boas)在研究美洲印第安语言时就使用了语料库的方法,后来的结构主义语言学家更是如此。
今天,语料库被视为现代语言学的3种主要研究方法之一,而在词典研编领域,不仅词典编纂离不开语料库,基于语料库的各项理论研究也正在如火如荼地进行。从国外的词典研编来看,语料库方法已经逐渐成为主流。近年来出版的大型英语词典基本都采用了语料库辅助词典编纂(Corpus-aided Dictionary Compilation,CADIC)的手段。
基于语料库的词典编纂技术研究是语料库词典学的主要研究对象之一,基于语料库的词典学理论研究以及词典语料库建设的研究是语料库词典学的另外两个主要研究领域。
词典学是关于词汇研究的学问,词义的理解和重现是词典学的核心研究内容。
汉语的词义研究从《尔雅》和《说文解字》开始,虽然说汉语的词义研究已经有很长的历史,但是,我国的词汇研究一直发展缓慢,直到上个世纪50年代,词汇研究还主要在“训诂”的范围内进行,真正意义上的汉语词汇(包括词义)研究从改革开放后才开始。改革开放以来,我国出版了一系列的词汇学和词汇语义学著作,这些著作研究了汉语词汇的系统性、词汇的社会性、词的内部形式、词的语义分类、词的搭配、词义和语素义的关系、语义场、义素分析、词汇应用等。虽然可以说汉语的词汇研究进入了新的发展阶段,但除了词汇应用研究之外,在词汇研究的大多数领域,研究方法依然较为传统,基于大规模语料的定量分析方法还没有真正开始。
与词汇研究密切相关的汉语词典编纂也主要依靠内省的方法,这集中表现在释义和义项处理上。
内省法明显的缺点是主观性,因为个人的语感或直觉并不总是正确的,而且当自己的语感与其他人的语感发生冲突的时候,也难以找到一个衡量正误的标准。由于内省法的缺点,国外有学者称这样的词典编纂为“扶手椅上的词典编纂”(armchair lexicography)。
与汉语单语词典相比,我国汉英词典编纂存在的问题更为严重。从目前出版的汉英词典来看,由于落后的编纂方法和对汉语词典的过分依赖,词典的编码功能普遍较低。
语料库语言学为词典编纂提供了全新的方法,基于语料库的方法(corpus-based method)和语料库驱动的方法相互结合(corpus-driven method)使传统的演绎法和归纳法合二为一。语料库与词典研编在国外的成功证明了语料库的技术手段对于词典研编的重要性。语料库方法依靠计算机强大的检索、索引和统计功能,在词义研究方面具有内省和人工检索无法比拟的优势。
词义与语境关系密切,语料库方法通过文本索引重现语境。语料库可以提供大量的释义选项和例证选项供词典编纂人员参考,这些基于大规模真实文本的语料经过词典编纂人员的合理加工后成为词典的现实释义和例证。由于它们来源于真实文本,因此在真实性、科学性和可插入性方面都具有很大的优势,有利于使用者在具体的语境里生成正确的目的语。
短语驱动词典学(phraseology-driven lexicography)的研究表明,由短语构成的小语境是最重要的言内语境。语料库词典学的释义和配例等都可以围绕短语展开。
统计功能是语料库的另一个强项,通过统计校验可以使英汉语之间在某一层面上的“联结模式”(association patterns)凸显出来。统计手段还是研究搭配和用法的有效方法,通过互信息值、Z值等可以衡量搭配词的搭配力。同时,统计手段还对义项的排序、常用词的常用度衡量等有不可或缺的作用。
对于汉英双语词典来说,平行语料库具有单语库无法比拟的优势。双语词典解决的是在具体的使用环境中该如何选择目的语进行表达。双语词典的释义其实就是从源语到目的语的翻译。基于平行语料库的英汉词汇对比研究对双语词典具有重要意义。
语料库词典学具有一定的跨学科性质和技术性,它与信息科学、计算语言学等具有互动关系。由于作者水平所限,书中难免有疏漏或浅薄之处,恳请广大同仁指正。
— 没有更多了 —
以下为对购买帮助不大的评价