消息首页搜索举报

正版现货新书 R自然语言处理导论 9787576609417 鲍贵

全新正版现货，以书名为准，放心购买，购书咨询18931383650朱老师

56.25 7.2折 78 全新

库存7件

北京丰台

认证卖家担保交易快速发货售后保障

作者鲍贵

出版社东南大学出版社

ISBN9787576609417

出版时间2023-11

装帧平装

开本16开

定价78元

货号29665575

上书时间2024-10-18

黎明书店

十五年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 9小时
好评率暂无

最新上架

正版现货新书霍大同精神分析讨论班·卷：精神器官解剖学与一、二阶人格结构的形成(2004- 9787100235532 霍大同讲授邹静记录谷建岭刘瑾秦雪梅整理著

正版现货新书上水船：王逊与现代中国的艺术理想 9787108078773 王涵口述段牛斗、王瑀整理著宋林鞠编

正版现货新书舌尖上的观察：中食行业50舆情案例述评（2021—2022） 9787515029696 张永建董国用郭良利斌编著著

正版现货新书可视化大数据 9787313293787 赵林著 ¥56.15

正版现货新书时刻人文·跨太平洋的华人改良与（1898—1918） 9787547325070 陈忠平著

正版现货新书堀与宫村. 05-06 9787513358040 (日) HERO 著

商品详情

品相描述：全新

商品描述

导语摘要

这部著作包括十一章内容，遵循由易到难、循序渐进的原则。第一章是R语言入门，第二章介绍字符串处理。第三章介绍常见的文本统计方法，包括统计文本词数、句子数和平均句长、绘制词频表以及词频分布图。
第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法，包括传统的类符-形符比和平均分段类符-形符比等。第五章同第四章一样利用R数据包koRpus，重点介绍文本可读性多种测量方法和一种听力文本难易度的测量方法，包括自动化可读性指数（ARI）和Flesch阅读难易度等。
第六章聚焦于n元组和关键词提取方法，内容包括文本词语关键性检验方法（如卡方检验和似然比检验）、比较学生故事复述文本与原文本中使用的关键词以及比较美国总统就职演说文本中的关键词等。第七章介绍两种特殊形式的n元组，即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量，包括余弦相似度、Jaccard相似度、欧式距离、Minkowski距离和潜在语义分析等。第九章着重介绍基于整洁文本的自然语言处理技术，是本著作内容最为丰富的一章，包括整洁数据的特征和整洁数据包tidyr的使用等。第十章介绍中文自然语言处理技术，包括调用jiebaR包时如何通过自定义词典进行分词、调用jiebaR包开展基础统计分析，计算文本长度、句子数和平均句长以及绘制高频词分布条形图等。第十一章是本书的最后一章，介绍如何对文本词汇开展词类标注和句法成分依存分析，包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。

内容摘要