• 文本挖掘概论:研究设计、数据收集与分析
21年品牌 40万+商家 超1.5亿件商品

文本挖掘概论:研究设计、数据收集与分析

批量上传,套装书可能不全,下单前咨询在线客服! 正版书 !!!

30.31 4.5折 68 全新

库存41件

四川成都
认证卖家担保交易快速发货售后保障

作者加布·伊格纳托,拉达·米哈尔恰

出版社重庆大学出版社

ISBN9787568939089

出版时间2023-09

四部分类子部>艺术>书画

装帧平装

开本16开

定价68元

货号29630440

上书时间2024-10-21

百叶图书

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
导语摘要

本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬虫、策略性数据选择、数据抽样、特定的文本分析和文本挖掘方法以及研究报告的撰写。除了技术性内容,本书还讨论了基于文本的社会科学研究设计面临的伦理和哲学问题。同时,书中还提供了各种学科的具体案例,方便来自不同领域的文本挖掘研究者理解和学习。



作者简介

加布·伊格纳托(Gabe Ignatow)


社会学副教授,2007年起任教于北得克萨斯州大学(UNT)。研究方向为社会学理论、文本挖掘和分析、新媒体以及信息政策。


目前与计算机科学和统计学领域的专家合作,将文本挖掘和主题模型技术应用于社会科学研究。1990年以来,加布一直致力于文本的混合分析方法,并在以下期刊发表了研究成果:Social Forces,Sociological Forum,Poetics,Journal for the Theory of Social Behaviour,Journal of Computer-Mediated Communication。共发表或出版三十余篇论文和图书章节,担任以下期刊的编委会成员:Sociological Forum、Journal for the Theory of Social Behaviour和Studies in Media and Communication。


曾担任北得克萨斯州大学社会学系研究生项目副主任和本科生项目主任,耶鲁大学文化社会学中心理事会成员。研究生项目搜索引擎公司GradTrek的联合创始人和首席执行官。


 


拉达·米哈尔恰(Rada Mihalcea)


密歇根大学计算机科学与工程专业教授,研究兴趣为计算语言学,尤其是词汇语义学、多语自然语言处理和计算社会科学。担任以下期刊的编委:Computational Linguistics,Language Resources and Evaluation,Natural Language Engineering,Research on Language and Computation,IEEE Transactions on Affective Computing以及Transactions of the Association for Computational Linguistics。


2015年计算语言学协会北美分会(NAACL)会议主席,2011年计算语言学协会会议联合项目主席,2009年自然语言处理中的经验方法会议联合项目主席。曾获2008年美国国家科学基金会CAREER奖和2009年美国青年科学家与工程师总统奖。2013年,获得家乡罗马尼亚克卢日-纳波卡颁发的“荣誉公民”称号。


 


译者简介


汪顺玉


二级教授,博士,博士生导师,“西外学者”领军学者,西安外国语大学研究生院院长。先后主持国家社科重点项目、jiaoyu部人文社科项目、省市级哲学社会科学规划课题、教改重点课题、教育考试院课题等 10 余项。在《外语教学》《英语研究》《重庆大学学报》《上海科技翻译》《天津外国语大学学报》等刊物发表学术论文 30 余篇,出版学术专著、译著、教材 8 部。学术兴趣包括语言测试与评价、学术翻译、话语研究、社会研究方法等。


陈瑞哲


西安外国语大学在读博士,西安邮电大学人文与外国语学院讲师。发表学术论文10余篇,出版书籍5部,译著2部。曾获陕西省第十五次哲学社会科学优秀成果奖二等奖,陕西高等学校人文社会科学研究优秀成果三等奖。研究兴趣为文本挖掘和话语分析。


 



目录

第一部分 基础入门


第1章 文本挖掘和文本分析


第2章 数据获取


第3章 研究伦理


第4章 哲学和逻辑基础


第二部分 研究设计和基础工具


第5章 研究设计


第6章 网络抓取和网络爬虫


第三部分 文本挖掘基础


第7章 词汇资源


第8章 基础文本处理


第9章 监督学习


第四部分 人文社会科学与文本分析


第10章 叙事分析


第11章 主题分析


第12章 隐喻分析


第五部分 计算机科学与文本挖掘


第13章 文本分类


第14章 观点挖掘


第15章 信息抽取


第16章 主题模型


第六部分 写作和展示


第17章 成果撰写和展示


附录A 数据资源


附录B 文本处理和清洗软件


附录C 文本分析软件


附录D 质性数据分析软件


附录E 观点挖掘软件


附录F 索引和关键词频软件


附录G 可视化软件


附录H 统计工具


附录I 网络资源


术语表


参考文献



内容摘要

本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬虫、策略性数据选择、数据抽样、特定的文本分析和文本挖掘方法以及研究报告的撰写。除了技术性内容,本书还讨论了基于文本的社会科学研究设计面临的伦理和哲学问题。同时,书中还提供了各种学科的具体案例,方便来自不同领域的文本挖掘研究者理解和学习。



主编推荐

加布·伊格纳托(Gabe Ignatow)

社会学副教授,2007年起任教于北得克萨斯州大学(UNT)。研究方向为社会学理论、文本挖掘和分析、新媒体以及信息政策。

目前与计算机科学和统计学领域的专家合作,将文本挖掘和主题模型技术应用于社会科学研究。1990年以来,加布一直致力于文本的混合分析方法,并在以下期刊发表了研究成果:Social Forces,Sociological Forum,Poetics,Journal for the Theory of Social Behaviour,Journal of Computer-Mediated Communication。共发表或出版三十余篇论文和图书章节,担任以下期刊的编委会成员:Sociological Forum、Journal for the Theory of Social Behaviour和Studies in Media and Communication。

曾担任北得克萨斯州大学社会学系研究生项目副主任和本科生项目主任,耶鲁大学文化社会学中心理事会成员。研究生项目搜索引擎公司GradTrek的联合创始人和首席执行官。

 

拉达·米哈尔恰(Rada Mihalcea)

密歇根大学计算机科学与工程专业教授,研究兴趣为计算语言学,尤其是词汇语义学、多语自然语言处理和计算社会科学。担任以下期刊的编委:Computational Linguistics,Language Resources and Evaluation,Natural Language Engineering,Research on Language and Computation,IEEE Transactions on Affective Computing以及Transactions of the Association for Computational Linguistics。

2015年计算语言学协会北美分会(NAACL)会议主席,2011年计算语言学协会会议联合项目主席,2009年自然语言处理中的经验方法会议联合项目主席。曾获2008年美国国家科学基金会CAREER奖和2009年美国青年科学家与工程师总统奖。2013年,获得家乡罗马尼亚克卢日-纳波卡颁发的“荣誉公民”称号。

 

译者简介

汪顺玉

二级教授,博士,博士生导师,“西外学者”领军学者,西安外国语大学研究生院院长。先后主持国家社科重点项目、jiaoyu部人文社科项目、省市级哲学社会科学规划课题、教改重点课题、教育考试院课题等 10 余项。在《外语教学》《英语研究》《重庆大学学报》《上海科技翻译》《天津外国语大学学报》等刊物发表学术论文 30 余篇,出版学术专著、译著、教材 8 部。学术兴趣包括语言测试与评价、学术翻译、话语研究、社会研究方法等。

陈瑞哲

西安外国语大学在读博士,西安邮电大学人文与外国语学院讲师。发表学术论文10余篇,出版书籍5部,译著2部。曾获陕西省第十五次哲学社会科学优秀成果奖二等奖,陕西高等学校人文社会科学研究优秀成果三等奖。研究兴趣为文本挖掘和话语分析。

 



   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP