• 自然语言处理Python进阶/智能系统与技术丛书
  • 自然语言处理Python进阶/智能系统与技术丛书
21年品牌 40万+商家 超1.5亿件商品

自然语言处理Python进阶/智能系统与技术丛书

正版现货 可开具图书发票 下单后当天即可发货

42.27 7.2折 59 全新

库存2件

山西太原
认证卖家担保交易快速发货售后保障

作者(印度)克里希纳·巴夫萨//纳雷什·库马尔//普拉塔普·丹蒂|译者:陈钰枫

出版社机械工业

ISBN9787111616436

出版时间2019-02

装帧其他

开本其他

定价59元

货号30456412

上书时间2024-09-27

A365书库

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
译者序
前言
作者简介
审校者简介
第1章  语料库和WordNet
  1.1  引言
  1.2  访问内置语料库
  1.3  下载外部语料库,加载并访问
  1.4  计算布朗语料库中三种不同类别的特殊疑问词
  1.5  探讨网络文本和聊天文本的词频分布
  1.6  使用WordNet进行词义消歧
  1.7  选择两个不同的同义词集,使用WordNet探讨上位词和下位词的概念
  1.8  基于WordNet计算名词、动词、形容词和副词的平均多义性
第2章  针对原始文本,获取源数据和规范化
  2.1  引言
  2.2  字符串操作的重要性
  2.3  深入实践字符串操作
  2.4  在Python中读取PDF文件
  2.5  在Python中读取Word文件
  2.6  使用PDF、DOCX和纯文本文件,创建用户自定义的语料库
  2.7  读取RSS信息源的内容
  2.8  使用BeautifulSoup解析HTML
第3章  预处理
  3.1  引言
  3.2  分词——学习使用NLTK内置的分词器
  3.3  词干提取——学习使用NLTK内置的词干提取器
  3.4  词形还原——学习使用NLTK中的WordnetLemmatizer函数
  3.5  停用词——学习使用停用词语料库及其应用
  3.6  编辑距离——编写计算两个字符串之间编辑距离的算法
  3.7  处理两篇短文并提取共有词汇
第4章  正则表达式
  4.1  引言
  4.2  正则表达式——学习使用*、+和?
  4.3  正则表达式——学习使用$和^,以及如何在单词内部(非开头与结尾处)进行模式匹配
  4.4  匹配多个字符串和子字符串
  4.5  学习创建日期正则表达式和一组字符集合或字符范围
  4.6  查找句子中所有长度为5的单词,并进行缩写
  4.7  学习编写基于正则表达式的分词器
  4.8  学习编写基于正则表达式的词干提取器
第5章  词性标注和文法
  5.1  引言
  5.2  使用内置的词性标注器
  5.3  编写你的词性标注器
  5.4  训练你的词性标注器
  5.5  学习编写你的文法
  5.6  编写基于概率的上下文无关文法
  5.7  编写递归的上下文无关文法
第6章  分块、句法分析、依存分析
  6.1  引言
  6.2  使用内置的分块器  6.3  编写你的简单分块器  6.4  训练分块器

内容摘要
这本书将从一个实用的角度让你从头开始理解和实现NLP解决方案,将从访问内置数据源和创建自己的数据源开始带你踏上一段旅程。到时候将可以编写复杂的NLP解决方案,包括文本规范化、预处理、词性标注、句法解析等。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP