作者简介: 作者简介 加布·伊格纳托(Gabe Ignatow) 社会学副教授,2007年起任教于北得克萨斯州大学(UNT)。研究方向为社会学理论、文本挖掘和分析、新媒体以及信息政策。 目前与计算机科学和统计学领域的专家合作,将文本挖掘和主题模型技术应用于社会科学研究。1990年以来,加布一直致力于文本的混合分析方法,并在以下期刊发表了研究成果:Social Forces,Sociological Forum,Poetics,Journal for the Theory of Social Behaviour,Journal of Computer-Mediated Communication。共发表或出版三十余篇论文和图书章节,担任以下期刊的编委会成员:Sociological Forum、Journal for the Theory of Social Behaviour和Studies in Media and Communication。 曾担任北得克萨斯州大学社会学系研究生项目副主任和本科生项目主任,耶鲁大学文化社会学中心理事会成员。研究生项目搜索引擎公司GradTrek的联合创始人和首席执行官。
拉达·米哈尔恰(Rada Mihalcea) 密歇根大学计算机科学与工程专业教授,研究兴趣为计算语言学,尤其是词汇语义学、多语自然语言处理和计算社会科学。担任以下期刊的编委:Computational Linguistics,Language Resources and Evaluation,Natural Language Engineering,Research on Language and Computation,IEEE Transactions on Affective Computing以及Transactions of the Association ... 主编推荐: 在大数据时代,海量的文本数据成为发现新知识、新观点、新规则的金矿,对于社科研究者,学习文本挖掘的必要性已经越来越凸显。大数据涵盖了社会生活中存在的大量的、有趣的语言和社会现象,但文本挖掘的新手研究者往往会感到无从下手,而本书能够为这类群体提供一个便捷的研究起点。 内容简介: 本书概括性地介绍了文本挖掘的几种主要方法、方法论基础,文本挖掘的主要形式,以及如何根据研究的目的进行观点挖掘、信息抽取、主题分析,书中还介绍了三十余种用于文本挖掘和分析软件。本书写给计划使用网络工具和数据开展研究的本科生和研究生,首先引导读者在研究初期考虑伦理、哲学和逻辑问题,随后概述文本挖掘、文本分析以及社会科学和计算语言学领域的研究方法。适用以下领域:人类学、传播学、计算机科学、教育学、语言学、市场营销学、政治学、心理学和社会学。 目录: 第一部分 基础入门
以下为对购买帮助不大的评价