基于混合方法的自然语言处理:神经网络模型与知识图谱的结合
①全新正版,现货速发,7天无理由退换货②天津、成都、无锡、广东等多仓就近发货,订单最迟48小时内发出③无法指定快递④可开电子发票,不清楚的请咨询客服。
¥
70.5
7.1折
¥
99
全新
库存2件
作者[西]何塞·曼努埃尔·戈麦斯-佩雷斯;[西]罗纳德·德诺;[西]安德烈·加西亚-席尔瓦
出版社机械工业出版社
ISBN9787111690696
出版时间2021-09
装帧其他
开本16开
定价99元
货号31263808
上书时间2024-10-12
商品详情
- 品相描述:全新
- 商品描述
-
目录
推荐序一<br/>推荐序二<br/>译者序<br/>前言<br/>第一部分 预备知识和构建模块<br/>第1章 混合自然语言处理简介2<br/>1.1 知识图谱、嵌入和语言模型简史2<br/>1.2 自然语言处理中知识图谱和神经网络方法的结合4<br/>第2章 单词、意义和知识图谱嵌入6<br/>2.1 引言6<br/>2.2 分布式单词表示6<br/>2.3 词嵌入7<br/>2.4 意义和概念嵌入8<br/>2.5 知识图谱嵌入9<br/>2.6 本章小结13<br/>第3章 理解词嵌入和语言模型14<br/>3.1 引言14<br/>3.2 语言模型15<br/>3.2.1 统计语言模型15<br/>3.2.2 神经语言模型16<br/>3.3 NLP迁移学习的预训练模型微调16<br/>3.3.1 ELMo16<br/>3.3.2 GPT17<br/>3.3.3 BERT17<br/>3.4 机器人检测中预训练语言模型的微调18<br/>3.4.1 实验结果与讨论21<br/>3.4.2 使用Transformer库对BERT进行微调21<br/>3.5 本章小结27<br/>第4章 从文本中捕获意义作为词嵌入28<br/>4.1 引言28<br/>4.2 下载一个小文本语料库29<br/>4.3 一种学习词嵌入的算法29<br/>4.4 使用Swivel prep生成共现矩阵30<br/>4.5 从共现矩阵中学习嵌入31<br/>4.6 读取并检查存储的二进制嵌入32<br/>4.7 练习:从古腾堡工程中创建词嵌入33<br/>4.7.1 下载语料库并进行预处理33<br/>4.7.2 学习嵌入34<br/>4.7.3 检查嵌入34<br/>4.8 本章小结34<br/>第5章 捕获知识图谱嵌入35<br/>5.1 引言35<br/>5.2 知识图谱嵌入35<br/>5.3 为WordNet创建嵌入37<br/>5.3.1 选择嵌入算法:HolE37<br/>5.3.2 将WordNet知识图谱转换为所需输入39<br/>5.3.3 学习嵌入44<br/>5.3.4 检查嵌入结果44<br/>5.4 练习47<br/>5.4.1 练习:在自己的知识图谱上训练嵌入47<br/>5.4.2 练习:检查WordNet 3.0的预计算嵌入47<br/>5.5 本章小结48<br/>第二部分 神经网络与知识图谱的结合<br/>第6章 从文本语料库、知识图谱和语言模型中构建混合表达50<br/>6.1 引言50<br/>6.2 准备工作和说明51<br/>6.3 Vecsigrafo的概念及构建方式 51<br/>6.4 实现53<br/>6.5 训练Vecsigrafo54<br/>6.5.1 标记化和词义消歧56<br/>6.5.2 词汇表和共现矩阵58<br/>6.5.3 从共现矩阵学习嵌入62<br/>6.5.4 检查嵌入64<br/>6.6 练习:探索一个预先计算好的Vecsigrafo66<br/>6.7 从Vecsigrafo到Transigrafo68<br/>6.7.1 安装设置70<br/>6.7.2 训练Transigrafo71<br/>6.7.3 扩展知识图谱的覆盖范围73<br/>6.7.4 评估 Transigrafo73<br/>6.7.5 检查Transigrafo中的义项嵌入 75<br/>6.7.6 探索Transigrafo嵌入的稳定性77<br/>6.7.7 额外的反思81<br/>6.8 本章小结81<br/>第7章 质量评估82<br/>7.1 引言82<br/>7.2 评估方法的概述83<br/>7.3 练习1:评估单词和概念嵌入84<br/>7.3.1 可视化探索84<br/>7.3.2 内在评估85<br/>7.3.3 词汇预测图87<br/>7.3.4 外在评估90<br/>7.4 练习2:评价通过嵌入获取的关系知识90<br/>7.4.1 下载embrela项目91<br/>7.4.2 下载生成的数据集91<br/>7.4.3 加载待评估的嵌入92<br/>7.4.4 学习模型94<br/>7.4.5 分析模型的结果94<br/>7.4.6 数据预处理:合并且增加字段 96<br/>7.4.7 计算范围阈值和偏差数据集检测97<br/>7.4.8 发现统计上有意义的模型99<br/>7.4.9 关系型知识的评估结论101<br/>7.5 案例研究:评估和对比Vecsigrafo嵌入101<br/>7.5.1 比较研究101<br/>7.5.2 讨论111<br/>7.6 本章小结114<br/>第8章 利用Vecsigrafo捕获词法、语法和语义信息116<br/>8.1 引言116<br/>8.2 方法118<br/>8.2.1 Vecsigrafo:基于语料的单词–概念嵌入118<br/>8.2.2 联合嵌入空间119<br/>8.2.3 嵌入的评估119<br/>8.3 评估120<br/>8.3.1 数据集121<br/>8.3.2 单词相似度121<br/>8.3.3 类比推理124<br/>8.3.4 单词预测125<br/>8.3.5 科学文档的分类127<br/>8.4 讨论129<br/>8.5 练习:使用surface form对科学文献进行分类130<br/>8.5.1 导入所需的库130<br/>8.5.2 下载surface form的词嵌入和SciGraph论文131<br/>8.5.3 读取并准备分类数据集131<br/>8.5.4 surface form的词嵌入133<br/>8.5.5 创建嵌入层134<br/>8.5.6 训练一个卷积神经网络134<br/>8.6 本章小结136<br/>第9章 知识图谱的词嵌入空间对齐与应用137<br/>9.1 引言137<br/>9.2 概述及可能的应用138<br/>9.2.1 知识图谱的补全139<br/>9.2.2 超越多语言性:跨模态的词嵌入139<br/>9.3 词嵌入空间的对齐技术140<br/>9.3.1 线性对齐140<br/>9.3.2 非线性对齐146<br/>9.4 练习:寻找古代英语和现代英语的对应146<br/>9.4.1 下载小型文本语料库146<br/>9.4.2 学习基于老莎士比亚语料库的Swivel词嵌入147<br/>9.4.3 在WordNet之上加载UMBC的Vecsigrafo149<br/>9.4.4 练习的结论149<br/>9.5 本章小结150<br/>第三部分 应用<br/>第10章 一种虚假信息分析的混合方法152<br/>10.1 引言152<br/>10.2 虚假信息检测153<br/>10.2.1 定义和背景153<br/>10.2.2 技术方法155<br/>10.3 应用:构建断言数据库156<br/>10.3.1 训练一个语义断言编码器156<br/>10.3.2 创建嵌入的一个语义索引并进行探索165<br/>10.3.3 以STS-B开发数据集填充索引165<br/>10.3.4 为一个断言数据集创建另一个索引166<br/>10.3.5 加载数据集到一个Pandas的DataFrame167<br/>10.3.6 构建一个断言数据库的总结171<br/>10.4 应用:假新闻和欺骗性语言检测171<br/>10.4.1 使用深度学习的基本文档分类172<br/>10.4.2 使用HolE的嵌入176<br/>10.4.3 使用Vecsigrafo UMBC WNet的嵌入178<br/>10.4.4 HoLE和UMBC嵌入的结合179<br/>10.4.5 讨论与结果180<br/>10.5 通过一个知识图谱得到传播虚假信息的评分182<br/>10.5.1 Data Commons Claim-Review的知识图谱 182<br/>10.5.2 不可信度评分的传播187<br/>10.6 本章小结190<br/>第11章 科学领域中文本与视觉信息的联合学习191<br/>11.1 引言191<br/>11.2 图例–标题对应分析的模型与架构193<br/>11.3 数据集195<br/>11.4 评估图例–标题的对应分析任务195<br/>11.5 图例–标题的对应分析与图像–句子匹配的对比197<br/>11.6 标题与图例的分类199<br/>11.7 教科书问答的多模态机器理解200<br/>11.8 图例–标题对应分析的练习201<br/>11.8.1 预备步骤201<br/>11.8.2 图例–标题的对应分析203<br/>11.8.3 图像–句子匹配216<br/>11.8.4 标题/图例分类219<br/>11.8.5 教科书问答223<br/>11.9 本章小结228<br/>第12章 展望自然语言处理的未来229<br/>12.1 最终的评论、想法和愿景229<br/>12.2 趋势是什么?社会各界的意见231<br/>参考文献238
内容摘要
本书分为三个部分:基于知识图谱和神经网络的构建部分;结合知识图谱和神经网络的混合体系结构;实际应用部分。在三个部分中,主题通常是独立的,允许读者快速、轻松地阅读所需的信息。本书的两个特点是实用性和拥有前沿信息。书中准确地演示了如何创建和使用上下文表示,对意义嵌入和知识图谱嵌入有着明确的处理方法,解释了使用它们的语言模型和Transformer体系结构。
— 没有更多了 —
以下为对购买帮助不大的评价