PyTorch计算机视觉实战:目标检测、图像处理与深度学习
闪电发货·正版保障·假一赔十·电子发票·七天退换无忧
¥
88.65
5.9折
¥
149
全新
库存2件
作者[印]V·基肖尔·阿耶德瓦拉(V Kishore Ayyadevara),[印]耶什万斯·雷迪(Yeshwanth Reddy)
出版社机械工业
ISBN9787111733393
出版时间2023-09
装帧平装
开本16开
定价149元
货号31856369
上书时间2025-04-02
商品详情
- 品相描述:全新
- 商品描述
-
目录
CONTENTS<br />目 录<br />译者序<br />前言<br />第一部分 面向计算机视觉的<br />深度学习基础知识<br />第1章 人工神经网络基础 2<br />1.1 比较人工智能与传统机器学习 3<br />1.2 人工神经网络的构建模块 4<br />1.3 实现前向传播 6<br />1.3.1 计算隐藏层的值 6<br />1.3.2 应用激活函数 7<br />1.3.3 计算输出层的值 9<br />1.3.4 计算损失值 9<br />1.3.5 前向传播的代码 11<br />1.4 实现反向传播 14<br />1.4.1 梯度下降的代码 15<br />1.4.2 使用链式法则实现<br />反向传播 17<br />1.5 整合前向传播与反向传播 20<br />1.6 理解学习率的影响 22<br />1.7 总结神经网络的训练过程 28<br />1.8 小结 29<br />1.9 课后习题 29<br />第2章 PyTorch基础 30<br />2.1 安装PyTorch 30<br />2.2 PyTorch张量 32<br />2.2.1 初始化张量 33<br />2.2.2 张量运算 34<br />2.2.3 张量对象的自动梯度 37<br />2.2.4 PyTorch的张量较<br />NumPy的ndarrays<br />的优势 38<br />2.3 使用PyTorch构建神经网络 39<br />2.3.1 数据集、数据加载器和<br />批大小 45<br />2.3.2 预测新的数据点 48<br />2.3.3 实现自定义损失函数 49<br />2.3.4 获取中间层的值 50<br />2.4 使用序贯方法构建神经网络 51<br />2.5 保存并加载PyTorch模型 54<br />2.5.1 state dict 54<br />2.5.2 保存 55<br />2.5.3 加载 55<br />2.6 小结 55<br />2.7 课后习题 56<br />第3章 使用PyTorch构建深度<br />神经网络 57<br />3.1 表示图像 57<br />3.2 为什么要使用神经网络进行<br />图像分析 62<br />3.3 为图像分类准备数据 64<br />3.4 训练神经网络 66<br />3.5 缩放数据集以提升模型准确度 71<br />3.6 理解不同批大小的影响 74<br />3.6.1 批大小为32 75<br />3.6.2 批大小为10 000 79<br />3.7 理解不同损失优化器的影响 80<br />3.8 理解不同学习率的影响 83<br />3.8.1 学习率对缩放数据集<br />的影响 83<br />3.8.2 不同学习率对非缩放<br />数据集的影响 88<br />3.9 理解不同学习率衰减的影响 90<br />3.10 构建更深的神经网络 93<br />3.11 理解不同批归一化的影响 94<br />3.11.1 没有批归一化的非常小<br />的输入值 96<br />3.11.2 经过批归一化的非常小<br />的输入值 98<br />3.12 过拟合的概念 100<br />3.12.1 添加dropout的影响 100<br />3.12.2 正则化的影响 102<br />3.13 小结 106<br />3.14 课后习题 106<br />第二部分 物体分类与目标检测<br />第4章 卷积神经网络 108<br />4.1 传统深度神经网络的问题 108<br />4.2 CNN的构建模块 111<br />4.2.1 卷积 112<br />4.2.2 滤波器 113<br />4.2.3 步长和填充 114<br />4.2.4 池化 115<br />4.2.5 整合各个构建模块 116<br />4.2.6 卷积和池化的图像平移<br />不变性原理 117<br />4.3 实现CNN 117<br />4.3.1 使用PyTorch构建基于<br />CNN的架构 118<br />4.3.2 基于Python的前向传播 121<br />4.4 使用深度CNN分类图像 123<br />4.5 实现数据增强 127<br />4.5.1 图像增强 127<br />4.5.2 对一批图像执行数据增强<br />及collate_fn的必要性 137<br />4.5.3 用于图像平移的数据<br />增强 140<br />4.6 特征学习结果的可视化 143<br />4.7 构建对真实图像进行分类<br />的CNN 153<br />4.8 小结 161<br />4.9 课后习题 162<br />第5章 面向图像分类的迁移学习 163<br />5.1 迁移学习简介 163<br />5.2 理解VGG16架构 164<br />5.3 理解ResNet架构 174<br />5.4 实现人脸关键点检测 178<br />5.5 多任务学习—实现年龄估计<br />和性别分类 186<br />5.6 torch_snippets库简介 195<br />5.7 小结 200<br />5.8 课后习题 200<br />第6章 图像分类的实战技术 201<br />6.1 生成CAM 201<br />6.2 数据增强和批归一化 207<br />6.3 模型实现的实践要点 212<br />6.3.1 处理不平衡数据 212<br />6.3.2 分类图像中目标的大小 213<br />6.3.3 训练数据和验证数据<br />之间的差异 213<br />6.3.4 扁平层中的节点数 214<br />6.3.5 图像的大小 214<br />6.3.6 使用OpenCV实用程序 214<br />6.4 小结 215<br />6.5 课后习题 215<br />第7章 目标检测基础 216<br />7.1 目标检测简介 216<br />7.2 为训练图像样本创建真值 217<br />7.3 理解区域建议 220<br />7.3.1 使用SelectiveSearch<br />生成区域建议 221<br />7.3.2 实现用于生成区域建议<br />的SelectiveSearch 222<br />7.4 理解IoU 224<br />7.5 非极大抑制 226<br />7.6 mAP 226<br />7.7 训练基于R-CNN的定制目标<br />检测器 227<br />7.7.1 R-CNN的工作细节 227<br />7.7.2 基于定制数据集实现<br />R-CNN目标检测模型 228<br />7.8 训练基于Fast R-CNN的定制<br />目标检测器 241<br />7.8.1 Fast R-CNN的工作细节 242<br />7.8.2 基于定制数据集实现Fast R-CNN目标检测模型 242<br />7.9 小结 249<br />7.10 课后习题 249<br />第8章 目标检测进阶 250<br />8.1 现代目标检测算法的组成 250<br />8.1.1 锚盒 250<br />8.1.2 区域建议网络 252<br />8.2 基于定制数据集训练Faster <br />R-CNN 254<br />8.3 YOLO的工作细节 260<br />8.4 基于定制数据集训练YOLO 265<br />8.4.1 安装Darknet 265<br />8.4.2 设置数据集格式 267<br />8.4.3 配置架构 268<br />8.4.4 训练和测试模型 269<br />8.5 SSD模型的工作细节 270<br />8.6 基于定制数据集训练SSD<br />模型 274<br />8.7 小结 278<br />8.8 课后习题 278<br />第9章 图像分割 279<br />9.1 探索U-Net架构 279<br />9.2 使用U-Net实现语义分割 283<br />9.3 探索Mask R-CNN架构 288<br />9.3.1 RoI对齐 290<br />9.3.2 掩码头部 291<br />9.4 使用Mask R-CNN实现实例<br />分割 292<br />9.5 小结 305<br />9.6 课后习题 306<br />第10章 目标检测与分割的应用 307<br />10.1 多目标实例分割 307<br /> 10.1.1 获取和准备数据 308<br /> 10.1.2 训练用于实例分割的<br />模型 312<br /> 10.1.3 对新图像进行推断 313<br />10.2 人体姿态检测 315<br />10.3 人群计数 316<br />10.4 图像着色 325<br />10.5 面向点云的三维目标检测 330<br /> 10.5.1 理论 330<br /> 10.5.2 训练YOLO模型实现<br />三维目标检测 334<br />10.6 小结 337<br />第三部分 图像处理<br />第11章 自编码器与图像处理 340<br />11.1 理解自编码器 340<br />11.2 理解卷积自编码器 346<br />11.3 理解变分自编码器 351<br /> 11.3.1 VAE的工作机制 352<br /> 11.3.2 KL散度 353<br /> 11.3.3 构建VAE模型 353<br />11.4 图像对抗性攻击 357<br />11.5 图像风格迁移 360<br />11.6 生成深度虚拟图像 366<br />11.7 小结 375<br />11.8 课后习题 375<br />第12章 基于GAN的图像生成 376<br />12.1 GAN模型简介 376<br />12.2 使用GAN生成手写数字 378<br />12.3 使用DCGAN生成人脸图像 383<br />12.4 实现条件GAN模型 391<br />12.5 小结 399<br />12.6 课后习题 400<br />第13章 高级GAN图像处理 401<br />13.1 使用Pix2Pix GAN模型 401<br />13.2 使用CycleGAN模型 410<br />13.3 在定制图像上使用StyleGAN<br />模型 418<br />13.4 超分辨率GAN 426<br /> 13.4.1 架构 427<br /> 13.4.2 编码SRGAN 428<br />13.5 小结 429<br />13.6 课后习题 430<br />第四部分 计算机视觉与其他技术<br />第14章 使用小样本进行模型训练 432<br />14.1 实现零样本学习 432<br />14.2 实现小样本学习 437<br /> 14.2.1 构建Siamese网络 438<br /> 14.2.2 原型网络的工作细节 444<br /> 14.2.3 关系网络的工作细节 445<br />14.3 小结 446<br />14.4 课后习题 446<br />第15章 计算机视觉与NLP 447<br />15.1 RNN模型简介 447<br /> 15.1.1 RNN架构的应用场景 448<br /> 15.1.2 探索RNN的结构 449<br /> 15.1.3 为什么需要存储记忆 449<br />15.2 LSTM架构简介 450<br /> 15.2.1 LSTM的工作细节 451<br /> 15.2.2 使用PyTorch实现<br />LSTM 453<br />15.3 生成图像标题 453<br />15.4 转录手写图像 465<br /> 15.4.1 CTC损失的工作细节 466<br /> 15.4.2 计算CTC损失值 467<br /> 15.4.3 手写转录的代码实现 468<br />15.5 使用DETR进行目标检测 476<br /> 15.5.1 transformer的工作细节 476<br /> 15.5.2 DETR的工作细节 479<br /> 15.5.3 目标检测的代码实现 482<br />15.6 小结 485<br />15.7 课后习题 485<br />第16章 计算机视觉与强化学习 486<br />16.1 强化学习基础知识 486<br /> 16.1.1 计算状态价值 487<br /> 16.1.2 计算状态–行为价值 488<br />16.2 实现Q学习 489<br /> 16.2.1 Q值 489<br /> 16.2.2 了解Gym环境 490<br /> 16.2.3 构建Q表 491<br /> 16.2.4 探索–利用机制 493<br />16.3 实现深度Q学习 495<br />16.4 目标固定的深度Q学习 501<br />16.5 实现自动驾驶智能体 508<br /> 16.5.1 安装CARLA环境 508<br /> 16.5.2 训练自动驾驶智能体 511<br />16.6 小结 518<br />16.7 课后习题 519<br />第17章 模型的实际应用部署 520<br />17.1 API基础知识 520<br />17.2 在本地服务器上创建API并<br />进行预测 521<br /> 17.2.1 安装API模块和依赖项 522<br /> 17.2.2 图像分类器的支持组件 522<br />17.3 将API部署到云端 525<br /> 17.3.1 Docker镜像与Docker<br />容器 526<br /> 17.3.2 创建Docker容器 526<br /> 17.3.3 在云端发布并运行<br />Docker容器 530<br />17.4 小结 535<br />第18章 使用OpenCV实用程序<br />进行图像分析 536<br />18.1 图像中的单词检测 536<br />18.2 图像中的车道线检测 542<br />18.3 基于颜色的目标检测 544<br />18.4 构建全景图像 546<br />18.5 图像中的车牌检测 550<br />18.6 小结 552<br />附录 课后习题答案 554<br />
内容摘要
本书基于真实数据集,全面系统地阐述现代计算机视觉实用技术、方法和实践,涵盖50多个计算机视觉问题。全书分为四部分:di一部分(第1~3章)介绍神经网络和PyTorch的基础知识,以及如何使用PyTorch构建并训练神经网络,包括输入数据缩放、批归一化、超参数调整等;第二部分(第4~10章)介绍如何使用卷积神经网络、迁移学习等技术解决更复杂的视觉相关问题,包括图像分类、目标检测和图像分割等;第三部分(第11~13章)介绍各种图像处理技术,包括自编码器模型和各种类型的GAN模型;第四部分(第14~18章)探讨将计算机视觉技术与NLP、强化学习和OpenCV等技术相结合来解决传统问题的新方法。本书内容丰富新颖,语言文字表述清晰,应用实例讲解详细,图例直观形象,适合PyTorch初中级读者及计算机视觉相关技术人员阅读。
主编推荐
深度学习是近年来计算机视觉应用在多个方面取得进步的驱动力。本书以实践为驱动,结合具体应用场景,基于真实数据集全面系统地介绍如何使用PyTorch解决50多个计算机视觉问题。 首先,你将学习使用NumPy和PyTorch从头开始构建神经网络(NN),并了解调整神经网络超参数的很好实践。然后,你将学习如何使用卷积神经网络(CNN)和迁移学习完成图像分类任务,并且理解其中的工作原理。随后,你将学习二维和三维多目标检测、图像分割、人体姿态估计等多个实际任务,并使用R-CNN、Fast R-CNN、Faster R-CNN、SSD、YOLO、U-Net、Mask R-CNN、Detectron2等框架实现这些任务。在自编码器和GAN部分,本书将指导你学习面部表情替换、面部图像生成和面部表情处理技术。之后,你将学习如何将计算机视觉与NLP技术(LSTM、transformer等)和强化学习技术(深度Q学习等)相结合,实现OCR、图像标题生成、目标检测和汽车自动驾驶智能体等应用。最后,你将学习如何将神经网络模型部署到AWS云等实际应用场景。
— 没有更多了 —
可以
很好