• 视觉问答 理论与实践 吴琦 等 著 王鑫,聂婕,朱文武 译 新华文轩网络书店 正版图书
21年品牌 40万+商家 超1.5亿件商品

视觉问答 理论与实践 吴琦 等 著 王鑫,聂婕,朱文武 译 新华文轩网络书店 正版图书

图形图像 新华书店全新正版书籍

79.47 6.7折 118 全新

库存37件

江苏无锡
认证卖家担保交易快速发货售后保障

作者吴琦 等

出版社电子工业出版社

ISBN9787121475313

出版时间2024-07

版次1

装帧平装

开本16开

页数244页

字数341千字

定价118元

货号1203353738

上书时间2024-08-22

新华文轩网络书店

十四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
新华文轩网络书店 全新正版书籍
商品描述
视觉问答任务要求机器根据指定的视觉图像内容,对单轮或多轮的自然语言问题进行作答。其本质上是一个多学科的研究问题,涉及计算机视觉、自然语言处理、知识表示与推理等。本书共5部分,第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术,包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外,概述基于图像的其他视觉问答任务,例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解,它们是视觉问答任务的扩展。第5部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。 
本书既可以作为视觉问答领域关键模型的综述,也可作为计算机视觉和自然语言处理领域的研究人员,尤其是专注于视觉问答的研究人员和学生的教材。 

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

新华文轩网络书店 全新正版书籍
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP