全新正版 急速发货
¥ 42 7.1折 ¥ 59 全新
库存65件
作者李轩涯、曹焯然、计湘婷
出版社清华大学出版社
ISBN9787302641773
出版时间2023-12
装帧平装
开本16开
定价59元
货号29671686
上书时间2024-11-25
计算机视觉是人工智能的重要分支领域,随着人工智能的飞速发展,计算机视觉在人们生活中的应用也越来越广泛,从教育、安防、交通到智能家居等方方面面都有应用。然而,在实际应用中,我们需要了解如何将计算机视觉技术应用到具体场景中,这也是本书的重点所在。
本书不仅涵盖了计算机视觉领域的核心技术,而且着重介绍了计算机视觉在实际应用中的具体实现。在深度学习框架的选择上,本书采用百度开源的PaddlePaddle深度学习框架(飞桨),其作为一个易用、高效、灵活、可扩展的深度学习框架,能够帮助读者更好地理解计算机视觉技术的应用和实现。
本书共6章。第1章介绍Python基础。通过九九乘法表、随机数生成与排序等6个Python实践,帮助初学者快速掌握Python的相关语法,为后续章节的学习做铺垫。
第2章介绍图像分类。图像分类是计算机视觉领域的经典任务,是指给定输入图像,需要输出预测的图像所属类别。本章主要基于不同的分类模型,如VGG、ResNet,并在不同的数据集上完成分类任务。
第3章介绍目标检测。目标检测指需要找到图像中所有感兴趣的目标,并输出它们的类别和位置,这也是计算机视觉领域的核心任务。本章需要基于不同的检测模型,例如Faster RCNN以及YOLOV3,完成瓷砖瑕疵和昆虫等检测。
第4章介绍图像分割。图像分割是图像理解的重要组成部分,需要在像素级上完成图像分类的任务。通过学习本章,读者将了解典型的分割模型在不同分割任务上的效果。
第5章介绍视频分类。视频分类相比于图像分类更为复杂,是指给定一个视频片段,根据其中包含的内容进行分类。本章将了解3个不同的视频分类模型。
第6章介绍图像生成。图像生成指从现有的数据集中生成新图像的任务。本章主要介绍通过不同的生成对抗模型来完成衣服生成、人脸图像生成以及图像风格迁移等任务。
本书从实践出发,提供了大量的代码示例和案例研究,能够帮助读者深入理解计算机视觉的核心概念和技术,并快速上手实际应用。希望通过阅读本书,读者能够了解并掌握计算机视觉的基本技能并提高在实践中的能力。在编写本书的过程中,感谢PaddlePaddle社区,免费的GPU算力、完善的API文档以及丰富的产研实践为广大读者提供了极其便利的开发实践环境。还要感谢读者的支持和反馈,期待您在学习本书的过程中有所收获。
扫码即可下载本书的源代码及数据:
编者
2023年8月
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。 本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。
第1章Python基础
1.1实践一: 九九乘法表
1.2实践二: 随机数生成与排序
1.3实践三: 批量文件遍历、复制、重命名
1.4实践四: 图像直方图统计
1.5实践五: 数据统计分析及可视化
1.6实践六: 图像预处理
第2章图像分类
2.1实践一: 基于深度神经网络的宝石分类
2.2实践二: 基于卷积神经网络的美食识别
2.3实践三: 基于VGG系列网络的场景图像分类
2.4实践四: 基于ResNet系列模型的车辆图像分类实践
2.5实践五: 基于Vision Transformer的CIFAR10分类
第3章目标检测
3.1实践一: 基于Faster RCNN模型的瓷砖瑕疵检测(两阶段目标检测)
3.2实践二: 基于YOLOV3/PPYOLO模型的昆虫检测(一阶段目标检测)
3.3实践三: 基于DETR模型的目标检测
第4章图像分割
4.1实践一: 基于UNet/DeepLabV3 Plus模型的宠物图像分割
4.2实践二: 基于PaddleSeg的人像视频分割
4.3实践三: 基于PSPNet模型的人体图像分割
4.4实践四: 基于SwinUNet模型的医学图像分割
第5章视频分类
5.1实践一: 基于TSN模型的视频分类
5.2实践二: 基于ECO模型的视频分类
5.3实践三: 基于TimeSformer模型的视频分类
第6章图像生成
6.1实践一: 基于GAN模型的时尚衣服生成
6.2实践二: 基于PaddleGAN的图像超分辨率
6.3实践三: 基于DCGAN模型的人脸图像生成
6.4实践四: 基于Pix2Pix模型的图像翻译
6.5实践五: 基于CycleGAN模型的图像风格迁移
参考文献
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。 本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用,理论翔实,实用性极强。
— 没有更多了 —
以下为对购买帮助不大的评价