全新正版现货,以书名为准,放心购买,购书咨询18931383650朱老师
¥ 55.17 7.1折 ¥ 78 全新
库存7件
作者鲍贵
出版社东南大学出版社
ISBN9787576609417
出版时间2023-11
装帧平装
开本16开
定价78元
货号29665575
上书时间2024-10-18
这部著作包括十一章内容,遵循由易到难、循序渐进的原则。第一章是R语言入门,第二章介绍字符串处理。第三章介绍常见的文本统计方法,包括统计文本词数、句子数和平均句长、绘制词频表以及词频分布图。
第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法,包括传统的类符-形符比和平均分段类符-形符比等。第五章同第四章一样利用R数据包koRpus,重点介绍文本可读性多种测量方法和一种听力文本难易度的测量方法,包括自动化可读性指数(ARI)和Flesch阅读难易度等。
第六章聚焦于n元组和关键词提取方法,内容包括文本词语关键性检验方法(如卡方检验和似然比检验)、比较学生故事复述文本与原文本中使用的关键词以及比较美国总统就职演说文本中的关键词等。第七章介绍两种特殊形式的n元组,即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量,包括余弦相似度、Jaccard相似度、欧式距离、Minkowski距离和潜在语义分析等。第九章着重介绍基于整洁文本的自然语言处理技术,是本著作内容最为丰富的一章,包括整洁数据的特征和整洁数据包tidyr的使用等。第十章介绍中文自然语言处理技术,包括调用jiebaR包时如何通过自定义词典进行分词、调用jiebaR包开展基础统计分析,计算文本长度、句子数和平均句长以及绘制高频词分布条形图等。第十一章是本书的最后一章,介绍如何对文本词汇开展词类标注和句法成分依存分析,包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。
这部著作包括十一章内容,遵循由易到难、循序渐进的原则。第一章是R语言入门,第二章介绍字符串处理。第三章介绍常见的文本统计方法,包括统计文本词数、句子数和平均句长、绘制词频表以及词频分布图。
第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法,包括传统的类符-形符比和平均分段类符-形符比等。第五章同第四章一样利用R数据包koRpus,重点介绍文本可读性多种测量方法和一种听力文本难易度的测量方法,包括自动化可读性指数(ARI)和Flesch阅读难易度等。
第六章聚焦于n元组和关键词提取方法,内容包括文本词语关键性检验方法(如卡方检验和似然比检验)、比较学生故事复述文本与原文本中使用的关键词以及比较美国总统就职演说文本中的关键词等。第七章介绍两种特殊形式的n元组,即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量,包括余弦相似度、Jaccard相似度、欧式距离、Minkowski距离和潜在语义分析等。第九章着重介绍基于整洁文本的自然语言处理技术,是本著作内容最为丰富的一章,包括整洁数据的特征和整洁数据包tidyr的使用等。第十章介绍中文自然语言处理技术,包括调用jiebaR包时如何通过自定义词典进行分词、调用jiebaR包开展基础统计分析,计算文本长度、句子数和平均句长以及绘制高频词分布条形图等。第十一章是本书的最后一章,介绍如何对文本词汇开展词类标注和句法成分依存分析,包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。
正版现货新书 自然之声 虫语 9787571013479 唐志远
全新北京
¥ 159.60
正版现货新书 自信的觉醒 9787505753488 R法
全新北京
¥ 24.59
正版现货新书 R语言 9787565442797 陈新丰著
全新北京
¥ 32.08
正版现货新书 R城寓言 9787567557659 上官南华
全新北京
¥ 28.35
正版现货新书 学习R 9787115351708 [美]Richard Cotton
全新北京
¥ 40.68
正版现货新书 自然四记 9787301241622 徐仁修
全新北京
¥ 19.85
正版现货新书 空山语 9787570225071 宗晶
全新北京
¥ 20.82
正版现货新书 同归 9787557021061 语笑阑珊
全新北京
¥ 21.95
正版现货新书 语解 9787510807091 钱穆
全新北京
¥ 17.41
正版现货新书 皋兰夜语 9787547313633 雷达
全新北京
¥ 14.74
— 没有更多了 —
以下为对购买帮助不大的评价