• 正版现货新书 R自然语言处理导论 9787576609417 鲍贵
21年品牌 40万+商家 超1.5亿件商品

正版现货新书 R自然语言处理导论 9787576609417 鲍贵

全新正版现货,以书名为准,放心购买,购书咨询18931383650朱老师

55.17 7.1折 78 全新

库存7件

北京丰台
认证卖家担保交易快速发货售后保障

作者鲍贵

出版社东南大学出版社

ISBN9787576609417

出版时间2023-11

装帧平装

开本16开

定价78元

货号29665575

上书时间2024-10-18

黎明书店

十五年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
导语摘要

这部著作包括十一章内容,遵循由易到难、循序渐进的原则。第一章是R语言入门,第二章介绍字符串处理。第三章介绍常见的文本统计方法,包括统计文本词数、句子数和平均句长、绘制词频表以及词频分布图。
第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法,包括传统的类符-形符比和平均分段类符-形符比等。第五章同第四章一样利用R数据包koRpus,重点介绍文本可读性多种测量方法和一种听力文本难易度的测量方法,包括自动化可读性指数(ARI)和Flesch阅读难易度等。
第六章聚焦于n元组和关键词提取方法,内容包括文本词语关键性检验方法(如卡方检验和似然比检验)、比较学生故事复述文本与原文本中使用的关键词以及比较美国总统就职演说文本中的关键词等。第七章介绍两种特殊形式的n元组,即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量,包括余弦相似度、Jaccard相似度、欧式距离、Minkowski距离和潜在语义分析等。第九章着重介绍基于整洁文本的自然语言处理技术,是本著作内容最为丰富的一章,包括整洁数据的特征和整洁数据包tidyr的使用等。第十章介绍中文自然语言处理技术,包括调用jiebaR包时如何通过自定义词典进行分词、调用jiebaR包开展基础统计分析,计算文本长度、句子数和平均句长以及绘制高频词分布条形图等。第十一章是本书的最后一章,介绍如何对文本词汇开展词类标注和句法成分依存分析,包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。



目录



内容摘要

这部著作包括十一章内容,遵循由易到难、循序渐进的原则。第一章是R语言入门,第二章介绍字符串处理。第三章介绍常见的文本统计方法,包括统计文本词数、句子数和平均句长、绘制词频表以及词频分布图。
第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法,包括传统的类符-形符比和平均分段类符-形符比等。第五章同第四章一样利用R数据包koRpus,重点介绍文本可读性多种测量方法和一种听力文本难易度的测量方法,包括自动化可读性指数(ARI)和Flesch阅读难易度等。
第六章聚焦于n元组和关键词提取方法,内容包括文本词语关键性检验方法(如卡方检验和似然比检验)、比较学生故事复述文本与原文本中使用的关键词以及比较美国总统就职演说文本中的关键词等。第七章介绍两种特殊形式的n元组,即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量,包括余弦相似度、Jaccard相似度、欧式距离、Minkowski距离和潜在语义分析等。第九章着重介绍基于整洁文本的自然语言处理技术,是本著作内容最为丰富的一章,包括整洁数据的特征和整洁数据包tidyr的使用等。第十章介绍中文自然语言处理技术,包括调用jiebaR包时如何通过自定义词典进行分词、调用jiebaR包开展基础统计分析,计算文本长度、句子数和平均句长以及绘制高频词分布条形图等。第十一章是本书的最后一章,介绍如何对文本词汇开展词类标注和句法成分依存分析,包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。



   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP