• 视觉语言交互中的视觉推理研究
  • 视觉语言交互中的视觉推理研究
  • 视觉语言交互中的视觉推理研究
  • 视觉语言交互中的视觉推理研究
  • 视觉语言交互中的视觉推理研究
21年品牌 40万+商家 超1.5亿件商品

视觉语言交互中的视觉推理研究

全新正版 极速发货

20.62 4.2折 49 全新

库存6件

广东广州
认证卖家担保交易快速发货售后保障

作者牛玉磊

出版社机械工业出版社

ISBN9787111723035

出版时间2023-03

装帧平装

开本32开

定价49元

货号1202837105

上书时间2024-06-11

曲奇书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
丛书序

推荐序I

推荐序II

导师序

摘要

ABSTRACT

插图索引

表格索引

第1章 引言

1.1 研究背景 1

1.2 研究现状 5

1.2.1 指称语理解 6

1.2.2 视觉对话 8

1.2.3 视觉问答 11

1.3 研究内容与贡献 14

1.4 组织结构 17

第2章 单轮交互情形下的指称语理解

2.1 研究概述 20

2.2 相关工作 23

2.3 变分背景框架 26

2.3.1 问题表述 26

2.3.2 指称语理解 29

2.3.3 指称语生成 31

2.3.4 模型实现 32

2.4 实验结果 40

2.4.1 实验设置 40

2.4.2 指称语理解实验结果 44

2.4.3 指称语生成实验结果 55

2.5 小结 57

第3章 多轮交互情形下的视觉对话

3.1 研究概述 60

3.2 相关工作 64

3.3 预备知识 66

3.4 递归视觉注意力模型 66

3.4.1 判别模块 68

3.4.2 匹配模块 69

3.4.3 注意力模块 72

3.5 其他模块 73

3.5.1 语言特征表示 73

3.5.2 视觉特征表示 75

3.5.3 特征优化与融合 76

3.5.4 非线性映射 78

3.5.5 Gumbel离散采样 79

3.6 实验结果 80

3.6.1 实验设置 80

3.6.2 实现细节 82

3.6.3 对比方法 82

3.6.4 实验结果分析 85

3.7 小结 93

第4章 知识偏差情形下的视觉问答

4.1 研究概述 96

4.2 相关工作 101

4.3 预备知识 104

4.3.1 因果图 105

4.3.2 反事实表示 105

4.3.3 因果效应 106

4.4 基于简化因果图的反事实视觉问答 107

4.4.1 反事实视觉问答框架 108

4.4.2 技术实现 110

4.5 基于接近因果图的反事实视觉问答 115

4.5.1 反事实视觉问答框架 115

4.5.2 技术实现 116

……

内容摘要
本书聚焦于视觉语言领域的视觉推理研究问题。视觉语言是计算机视觉与自然语言处理的交叉领域,对机器的感知和认知能力均有较高的要求。随着深度学习的发展和计算能力的提高,机器的感知能力得到了显著提升,于是研究者们开始探索机器的认知能力,尤其是推理能力。本书从知识建模和知识推断两方面入手,对视觉语言交互任务中的视觉推理问题进行研究。其中,知识建模指通过模型的构建,从视觉媒介和自然语言中提取视觉与语言知识并,进行特征表示;知识推断指机器对视觉和语言两个模态的知识进行综合考虑,并进行无偏的推断与估计。本书的适读人群为视觉语言、视觉推理领域的科研工作者或对相关领域感兴趣的研究人员。

主编推荐
适读人群 :研究生、科研人员、从业者等◆中国计算机领域具有重要突破或重要创新的博士研究生科研成果◆2021年度CCF优秀博士学位论文奖◆知识建模和知识推断两个方面◆单轮交互和多轮交互两个场景◆去除直接因果效应,克服模型对语言偏差的依赖

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP