• 自然语言处理入门
21年品牌 40万+商家 超1.5亿件商品

自然语言处理入门

正版保障 假一赔十 可开发票

31.46 6.4折 49 全新

库存42件

广东广州
认证卖家担保交易快速发货售后保障

作者李洋,李实主编

出版社清华大学出版社

ISBN9787302644484

出版时间2024-01

装帧平装

开本其他

定价49元

货号14844774

上书时间2024-06-09

灵感书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
李洋,副教授,硕士生导师。2017年博士毕业于哈尔滨工业大学计算机应用技术专业,主要研究方向为自然语言处理、社交网络挖掘。中国计算机学会会员,CCF YOCSEF哈尔滨2021-2022副主席,主持国家自然科学基金、黑龙江省自然科学基金面上项目,黑龙江省博士后基金面上项目。累计发表SCI/EI检索论文十余篇,其中包括ACM Transactions on Intelligent Systems and Technology(ACM TIST)、Neurocomputing、Bioinformatics等国际期刊。目前担任国际期刊Knowledge-Based Systems(KBS), Neurocomputing, ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP)等的审稿人。

目录
第1章 中文分词……………………………………………………………………………… 1 1.1 中文分词中的基本问题 …………………………………………………………… 1 1.1.1 中文分词规范问题………………………………………………………… 1 1.1.2 歧义切分问题……………………………………………………………… 2 1.1.3 未登录词识别问题………………………………………………………… 2 1.2 基于词表的分词算法 ……………………………………………………………… 3 1.2.1 正向优选匹配算法………………………………………………………… 3 1.2.2 逆向优选匹配算法………………………………………………………… 4 1.2.3 双向优选匹配算法………………………………………………………… 5 1.3 基于统计模型的分词算法 ………………………………………………………… 5 1.4 基于序列标注的分词算法 ………………………………………………………… 7 1.4.1 基于 HMM 的分词方法 ………………………………………………… 7 1.4.2 基于 CRF的分词方法…………………………………………………… 10 1.4.3 基于 Bi-LSTM-CRF的中文分词方法 ………………………………… 11 参考文献 ………………………………………………………………………………… 14 第2章 命名实体识别 ……………………………………………………………………… 15 2.1 基于 CRF的命名实体识别 ……………………………………………………… 16 2.1.1 CRF基本概念 …………………………………………………………… 16 2.1.2 命名实体识别任务 ……………………………………………………… 19 2.2 基于 Bi-LSTM-CRF的命名实体识别 …………………………………………… 22 2.2.1 RNN ……………………………………………………………………… 22 2.2.2 LSTM 网络 ……………………………………………………………… 23 2.2.3 双向 LSTM 网络 ………………………………………………………… 25 2.2.4 Bi-LSTM-CRF ………………………………………………………… 25 2.3 注意力机制………………………………………………………………………… 26 参考文献 ………………………………………………………………………………… 28 Ⅳ 第3章 关系抽取 …………………………………………………………………………… 30 3.1 实体关系抽取定义………………………………………………………………… 31 3.2 实体关系抽取框架………………………………………………………………… 33 3.3 评测方法…………………………………………………………………………… 33 3.4 有监督实体关系抽取方法………………………………………………………… 34 3.5 半监督实体关系抽取方法………………………………………………………… 37 3.6 远程监督实体关系抽取方法……………………………………………………… 39 参考文献 ………………………………………………………………………………… 41 第4章 词向量技术 ………………………………………………………………………… 43 4.1 One-Hot词向量技术 …………………………………………………………… 43 4.2 Word2Vec词向量技术 …………………………………………………………… 44 4.2.1 CBOW 模型 ……………………………………………………………… 44 4.2.2 Skip-Gram 模型 ………………………………………………………… 45 4.2.3 优化方法 ………………………………………………………………… 45 4.3 BERT 词向量嵌入………………………………………………………………… 46 4.3.1 注意力机制 ……………………………………………………………… 46 4.3.2 Transformer …………………………………………………………… 49 4.3.3 BERT …………………………………………………………………… 51 4.3.4 基于 BERT 的衍生模型 ………………………………………………… 52 参考文献 ………………………………………………………………………………… 53 第5章 关键词提取 ………………………………………………………………………… 55 5.1 TextRank关键词提取算法 ……………………………………………………… 55 5.1.1 基于图的排序算法 ……………………………………………………… 55 5.1.2 基于图的排序算法的拓展运用 ………………………………………… 57 5.1.3 基于图的排序算法在关键词提取中的运用 …………………………… 58 5.1.4 TextRank算法 ………………………………………………………… 59 5.2 TF-IDF关键词提取算法 ………………………………………………………… 59 5.3 LDA 与 PLSA 关键词提取算法 ………………………………………………… 60 5.3.1 相关基础知识 …………………………………………………………… 60 5.3.2 PLSA 模型 ……………………………………………………………… 65 5.3.3 LDA 模型 ………………………………………………………………… 69 参考文献 ………………………………………………………………………………… 73 第6章 文本分类 …………………………………………………………………………… 74 6.1 文本分类概述……………………………………………………………………… 74 6.2 文本表示…………………………………………………………………………… 75 Ⅴ 6.2.1 离散式表示 ……………………………………………………………… 75 6.2.2 分布式表示 ……………………………………………………………… 78 6.3 文本特征提取……………………………………………………………………… 82 6.3.1 基于 DF的特征提取法 ………………………………………………… 82 6.3.2 信息增益法 ……………………………………………………………… 82 6.3.3 χ2 统计量 ………………………………………………………………… 83 6.3.4 互信息法 ………………………………………………………………… 83 6.4 特征权重计算方法………………………………………………………………… 84 6.5 分类器构建………………………………………………………………………… 86 6.5.1 朴素贝叶斯分类器 ……………………………………………………… 86 6.5.2 SVM 分类器……………………………………………………………… 88 6.5.3 基于神经网络的分类器 ………………………………………………… 92 6.6 文本分类评价指标………………………………………………………………… 94 参考文献 ………………………………………………………………………………… 95 第7章 知识图谱 …………………………………………………………………………… 97 7.1 知识图谱概述……………………………………………………………………… 97 7.1.1 知识图谱的介绍 ………………………………………………………… 97 7.1.2 知识图谱基本概念 ……………………………………………………… 97 7.1.3 知识表示与存储………………………………………………………… 100 7.2 知识图谱构建 …………………………………………………………………… 102 7.2.1 知识抽取………………………………………………………………… 103 7.2.2 知识融合………………………………………………………………… 110 7.2.3 知识加工………………………………………………………………… 111 7.2.4 知识更新………………………………………………………………… 113 7.3 知识图谱补全 …………………………………………………………………… 114 7.3.1 知识图谱补全简介……………………………………………………… 114 7.3.2 表示学习的相关理论…………………………………………………… 115 7.3.3 知识图谱补全(表示学习)……………………………………………… 116 7.4 知识图谱应用 …………………………………………………………………… 118 7.4.1 通用和领域知识图谱…………………………………………………… 118 7.4.2 语义集成………………………………………………………………… 118 7.4.3 语义搜索………………………………………………………………… 119 7.4.4 基于知识的问答………………………………………………………… 119 参考文献………………………………………………………………………………… 119 第8章 机器阅读理解……………………………………………………………………… 123 8.1 机器阅读理解概述 ……………………………………………………………… 123 8.1.1 机器阅读理解任务……………………………………………………… 123 Ⅵ 8.1.2 机器阅读理解发展……………………………………………………… 124 8.2 数据集以及测评方式 …………………………………………………………… 125 8.2.1 数据集…………………………………………………………………… 125 8.2.2 测评方式………………………………………………………………… 128 8.3 模型 ……………………………………………………………………………… 130 8.3.1 模型架构………………………………………………………………… 130 8.3.2 预训练模型……………………………………………………………… 134 8.4 应用以及未来 …………………………………………………………………… 136 8.4.1 智能客服………………………………………………………………… 136 8.4.2 搜索引擎………………………………………………………………… 136 8.4.3 教育……………………………………………………………………… 137 8.4.4 机器阅读理解面临的挑战……………………………………………… 137 参考文献………………………………………………………………………………… 138 第9章 自动文摘和文本生成……………………………………………………………… 141 9.1 自动文摘概述 …………………………………………………………………… 141 9.1.1 自动文摘任务…………………………………………………………… 141 9.1.2 自动文摘发展及分类…………………………………………………… 142 9.2 生成式摘要 ……………………………………………………………………… 145 9.2.1 问题与方法……………………………………………………………… 145 9.2.2 文摘评测………………………………………………………………… 148 9.3 自动文本生成 …………………………………………………………………… 149 9.3.1 自动文本生成概述……………………………………………………… 149 9.3.2 基于主题的文本生成…………………………………………………… 150 9.3.3 自动文本生成技术评测………………………………………………… 154 参考文献………………………………………………………………………………… 155 第10章 对话系统 ………………………………………………………………………… 158 10.1 问题理解 ……………………………………………………………………… 159 10.1.1 意图识别 …………………………………………………………… 160 10.1.2 槽填充 ……………………………………………………………… 161 10.2 对话状态管理 ………………………………………………………………… 163 10.2.1 对话状态跟踪 ……………………………………………………… 163 10.2.2 对话策略 …………………………………………………………… 165 10.3 答句生成 ……………………………………………………………………… 166 参考文献 ……………………………………………………………………………… 169

内容摘要
自然语言处理的目标是使计算机能够像人类一样理解语言。近年来,自然语言处理作为一门学科发展迅速,得到了越来越广泛的应用。本书从基本概念出发,对自然语言基础任务进行介绍,首先介绍自然语言处理基础的词法、句子以及篇章级任务:中文分词、命名实体识别、关系抽取、词向量技术、关键词提取和文本分类,然后介绍近年来广泛应用的知识图谱、机器阅读理解、自动文摘、文本生成、对话系统等内容以期读者能够对自然语言处理各个部分的研究内容和技术手段有更加深入的理解。

本书可作为高等院校相关专业本科生及研究生对于自然语言处理领域学习的入门教材。

主编推荐
"(1)以自然语言处理的基本概念为切入点,逐步拓展到自然语言的基础任务。内容讲解循序渐进,深入浅出。 (2)每章遵循先介绍基本概念再引出应用实例的方式,符合初学者学习的认识规律,易于读者学习和掌握。 (3)向新技术发展,接轨新工科教育理念,突显自然语言处理的热门应用,教学配备资料齐全。"

精彩内容
自然语言处理的目标是使计算机能够像人类一样理解语言。近年来,自然语言处理作为一门学科发展迅速,得到了越来越广泛的应用。本书从基本概念出发,对自然语言基础任务进行介绍,首先介绍自然语言处理基础的词法、句子以及篇章级任务:中文分词、命名实体识别、关系抽取、词向量技术、关键词提取和文本分类,然后介绍近年来广泛应用的知识图谱、机器阅读理解、自动文摘、文本生成、对话系统等内容以期读者能够对自然语言处理各个部分的研究内容和技术手段有更加深入的理解。

 本书可作为高等院校相关专业本科生及研究生对于自然语言处理领域学习的入门教材。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP