• 基于NLP的内容理解
21年品牌 40万+商家 超1.5亿件商品

基于NLP的内容理解

正版新书 新华官方库房直发 可开电子发票

62.37 6.3折 99 全新

库存4件

江苏南京
认证卖家担保交易快速发货售后保障

作者李明琦,谷雪,孟子尧

出版社机械工业出版社

ISBN9787111720690

出版时间2023-03

版次1

装帧平装

开本16开

纸张胶版纸

页数252页

定价99元

货号SC:9787111720690

上书时间2024-12-23

文源文化

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
主编推荐:
(1)作者背景资深:作者是资深AI技术专家,BAT高级算法工程师。(2)作者经验丰富:作者在NLP、内容理解等领域有多年实践经验。(3)解决6大难题:为内容重复理解、内容通顺度识别及纠正、内容质量、标签体系构建、文本摘要生成、文本纠错6大内容理解难题提供基于NLP的解决方案。(4)结合业务场景:所有内容、技术、算法均从实际业务场景出发,从问题的角度拆解问题。(5)大量NLP算法:书中系统讲解了可用于内容理解的各种NLP算法的原理和使用。(6)包含大量案例:以实战为导向,用案例贯穿全书。
内容简介:
这是一本讲述如何用NLP技术进行文本内容理解的著作,也是一本系统讲解NLP算法的著作,是作者在NLP和内容理解领域多年经验的总结。

本书结合内容理解的实际业务场景,系统全面、循序渐进地讲解了各种NLP算法以及如何用这些算法高效地解决内容理解方面的难题,主要包括如下几个方面的内容:

(1)文本特征表示

文本特征表示是NLP的基石,也是内容理解的基础环节,本书详细讲解了离散型表示方法和分布型表示方法等特征表示方法及其应用场景,还讲解了词向量的评判标准。

(2)内容重复理解

详细讲解了标题重复、段落重复、文章重复的识别方法和去重算法。

(3)内容通顺度识别及纠正

详细讲解了内容通顺度的识别方法以及纠正不通顺内容的方法。

(4)内容质量

详细讲解了多种内容质量相关的算法,以及如何搭建高质量的知识问答体系的流程。

(5)标签体系构建

详细讲解了针对内容理解的标签体系的建设流程和方法,以及多种相关算法。

(6)文本摘要生成

详细讲解了抽取式文本摘要和生成式文本摘要两种流行的文本摘要生成方法,以及文本摘要的常用数据集和文本摘要评价方法。

(7)文本纠错

详细讲解了文本纠错的传统方法、深度学习方法、工业界解决方案,以及常用的文本纠错工具的安装和使用。

目录:
前言

第1章 文本特征表示 1

1.1 语料与语料预处理 1

1.1.1 语料和语料库 1

1.1.2 语料预处理 2

1.2 文本特征表示方法 6

1.2.1 离散型特征表示方法 6

1.2.2 分布型特征表示方法 13

1.3 词向量的评判标准 29

1.3.1 内部评估 29

1.3.2 外在评估 31

1.4 本章小结 34

第2章 内容重复理解 35

2.1 标题重复 35

2.1.1 标题符号规整化处理 36

2.1.2 Jieba分词 39

2.1.3 LAC分词 43

2.1.4 基于分词及字符串等方式进行重复识别 45

2.2 段落重复识别实例 47

2.2.1 段落重复识别 47

2.2.2 基于N-gram算法进行内容去重 48

2.2.3 平滑处理技术 54

2.3 基于相似度计算的文章判重 57

2.3.1 文本相似度计算任务的分析 57

2.3.2 距离度量方式 58

2.3.3 基于SimHash算法进行文本重复检测 62

2.4 本章小结 66

第3章 内容通顺度识别及纠正 67

3.1 数据增强 67

3.2 基于FastText算法的句子通顺度识别 73

3.2.1 CBOW模型 74

3.2.2 FastText算法原理 75

3.2.3 FastText算法实战 81

3.3 基于TextCNN算法的分类任务实现 93

3.3.1 专
...

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP