作者简介
江铭虎,1962年生,电子工程博士,现任清华大学计算语言学教授、博士生导师,清华大学心理学与认知科学中心兼职教授。研究领域为自然语言处理、语言认知。主持国家社会科学重大基金、国家自然科学基金(面上基金2项、重点基金2级课题2项)、国家重点研发计划重点专项2级课题和教育部优秀教师资助计划等项目,在国内一级学术刊物(A类/B类)发表论文近30篇,在国际主流学术刊物发表SCI/SSCI论文50余篇(其中一/二区论文30余篇),累积SCI影响因子180。出版《语言信息处理》《脑与语言认知》《语言的ERP脑电认知》《自然语言处理》《文学作品的统计分析》和《语言、脑进化与认知》等中文著作或教材,与他人合作在德国出版英文专著3部。为清华大学本科生和研究生主讲《脑与语言认知》《实验语音学》《脑认知与深度学习》《自然语言处理》等课程;他是科技部重大专项、国家自然科学基金、国家社会科学基金、中国博士后基金、教育部博士点基金、北京市科技冬奥会专项课题、北京市科技新星计划以及国家自然科学奖、国家科技进步奖、国家百千万人才工程、教育部长江学者、北京市科技进步奖、教育部高等学校科学研究优秀成果奖(人文社科)等项目或奖项的评审专家。此外,他于1998年获海峡两岸交大四校优秀博士论文奖,2000年获全国优秀博士后论文奖,2004年获清华大学学术新人奖,2010年获IEEE Award。1998~2000年在清华大学计算机系做博士后研究,2001年在比利时鲁汶大学(荷兰语)电机系做博士后研究。2005年在德国海德堡大学医学院交叉学科计算中心任客座教授。
目录
第一篇 网络小说的计量统计和分析
第1章 引言
1.1 研究对象
1.2 计算风格学研究现状
1.2.1 计算风格学的诞生
1.2.2 计算机辅助分析在文学研究中的应用
1.2.3 计算风格学应用的广泛领域
1.2.4 计算风格学选取的重要特征
1.3 网络小说研究现状
1.3.1 网络文学兴起的背景
1.3.2 网络小说的研究概况
1.3.3 网络小说的类型化趋势
1.3.4 网络小说的性别分化
1.3.5 定量分析在网络文学作品研究中的应用
1.4 猫腻和天下归元小说研究概况
1.5 研究目的和意义
1.5.1 研究目的
1.5.2 研究意义
1.6 研究方法
1.6.1 描述统计
1.6.2 假设检验
1.6.3 数据处理
1.6.4 文本聚类
1.7 文本选择与预处理
1.7.1 猫腻和天下归元代表作品
1.7.2 男频和女频类型参照作品
1.8 本篇的章节安排
第2章 基于长度和标点的量化分析
2.1 段长
2.2 句子和分句长
2.3 词长
2.4 标点
2.4.1 破折号
2.4.2 感叹号
2.4.3 逗号和分号
2.4.4 冒号和引号
2.4.5 省略号
2.5 本章小结
2.5.1 基于长度的文本风格比较
2.5.2 基于标点的文本风格差异
第3章 词类分析:猫腻的沉稳和天下归元的灵动
3.1 总体描述
3.1.1 词汇丰富度
3.1.2 词汇频率差异性检验
3.1.3 网络流行词
……
第二篇 茅盾文学奖作品的计量统计和分析
第三篇 日本近代文学小说计算风格分析与比较
附录
后记
内容摘要
《文学作品的统计分析》一书,主要阐述了文学作品通过提取段落、句子、标点、词汇、词性等层面的特征量,运用数理统计、假设检验、文本聚类等方法,研究不同文学作品的作家在文学风格、用词习惯和审美倾向的差异。通过量化的手段,采用语料库统计、文本聚类、成分分析等统计学的方法研究异同。该成果的统计实验,集趣味性、新颖性、知识性和综合性于一体。本书可作为从事计算机语言、计量语言学、数字人文等领域的科研人员和高校师生的参考用书。
主编推荐
计算机技术与人文学科交叉的数字人文,通过对大规模文本语料的特征提取及训练,分析其中的语言使用规律,以便于词汇的关联分析、句子的解读及文本内容的分析,其关键的支持技术是文本聚类与分类分析、主题分类、知识库(知识图谱)与搜索引擎,以及机器(深度)学习。跨学科的协作为人文学科研究带来了数字技术和新方法, 推动了数字文化的发展。
精彩内容
《文学作品的统计分析》一书,主要阐述了文学作品通过提取段落、句子、标点、词汇、词性等层面的特征量,运用数理统计、假设检验、文本聚类等方法,研究不同文学作品的作家在文学风格、用词习惯和审美倾向的差异。通过量化的手段,采用语料库统计、文本聚类、成分分析等统计学的方法研究异同。该成果的统计实验,集趣味性、新颖性、知识性和综合性于一体。本书可作为从事计算机语言、计量语言学、数字人文等领域的科研人员和高校师生的参考用书。
以下为对购买帮助不大的评价