深度学习视频理解
¥
41.25
3.2折
¥
128
九五品
仅1件
作者张皓 著
出版社电子工业出版社
ISBN9787121419805
出版时间2021-10
版次1
装帧平装
开本16开
纸张胶版纸
定价128元
上书时间2024-12-03
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:深度学习视频理解
定价:128.00元
作者:张皓 著
出版社:电子工业出版社
出版日期:2021-10-01
ISBN:9787121419805
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
内容提要
视频理解是计算机视觉和深度学习的一个重要分支。本书对视频理解的3个重要领域进行介绍,对于每个领域,本书不仅解释了相关算法的原理,还梳理了算法演进的脉络。全书共分6章,章简要介绍视频行业的发展历程;第2章回顾经典图像分类模型和RNN;第3章和第4章介绍动作识别的重要算法;第5章介绍时序动作定位的重要算法;第6章介绍视频Embedding的重要算法。最后总结了常用的一些视频处理工具。本书既适合高等院校人工智能相关专业的本科生和研究生阅读,也可供视频理解、推荐系统、搜索引擎和计算广告等领域的研究人员和从业者参考。
目录
章 绪论 11.1 引言 11.2 本书内容 51.3 本章小结 15第2章 经典网络结构回顾 162.1 经典图像分类网络 162.1.1 LetNet-5 162.1.2 AlexNet 182.1.3 VGGNet 222.1.4 GoogLeNet 242.1.5 InceptioV2/V3 272.1.6 ResNet 282.1.7 preResNet 312.1.8 WRN 322.1.9 随机深度网络 332.1.10 DenseNet 352.1.11 ResNeXt 362.1.12 SENet 392.1.13 MobileNet 412.1.14 MobileNet V2/V3 442.1.15 ShuffleNet 462.1.16 ShuffleNet V2 492.2 RNN、LSTM和GRU 51第3章 基于2D卷积的动作识别 623.1 平均汇合 623.2 NetVLAD和NeXtVLAD 643.3 利用RNN融合各帧特征 773.4 利用3D卷积融合各帧特征 813.5 双流法 873.6 时序稀疏采样 953.7 利用iDT轨迹 104第4章 基于3D卷积的动作识别 1104.1 3D卷积基础网络结构 1104.2 I3D 1184.4 TSM 1354.5 3D卷积 + RNN 1374.6 ARTNet 1394.7 Non-Local 1414.8 SlowFast 1484.9 3D卷积神经网络超参数设计 152第5章 时序动作定位 1595.1 基于滑动窗的算法 1605.2 基于候选时序区间的算法 1715.3 自底向上的时序动作定位算法 1835.4 对时序结构信息建模的算法 1975.5 逐帧预测的算法 2025.6 单阶段算法 208第6章 视频Embedding 2196.1 基于视频内容的无监督 Embedding 2206.2 Word2Vec 2296.2.1 CBOW和Skip-Gram 2296.2.2 分层 Softmax 2346.2.3 负采样 2396.3 Item2Vec 2476.3.1 Item2Vec 基本形式 2476.3.2 Item2Vec的改进 2496.4 基于图的随机游走 2526.5 结合一二阶相似度 2576.6 基于图的邻居结点 2656.7 基于多种信息学习视频Embedding 274附录A 视频处理常用工具 281参考文献 296
作者介绍
序言
— 没有更多了 —
以下为对购买帮助不大的评价