作者简介
田丰,上海大学上海电影学院副教授,博士研究生导师,讲授《数字图像处理》等课程。主持国家社科基金艺术学一般项目、国家艺术基金传播交流推广项目、上海市科委项目和上海市经信委项目多项。2018年作为导演完成“VR头显的人眼视觉矫正”科普短视频的策划、编写、创作,并在东方明珠移动电视上累计放映80分钟。
目录
第1章数字图像基础 1
1.1 数字图像处理的概念 1
1.2 数字图像处理的应用 2
1.3 图像数字化的概念 2
1.4 图像采样与量化 3
1.5 直方图 6
1.6 读取、显示和保存图像案例 9
第2章 空域处理 12
2.1 点运算 12
2.2 代数运算 14
2.3 仿射变换 16
第3章 频域处理 33
3.1 二维离散傅里叶变换 33
3.2 快速傅里叶变换 35
3.3 傅里叶变换中的高频低频分量 36
3.4 离散余弦变换 42
3.5 卷积定理 44
3.6 滤波器设计 50
3.7 卷积函数案例 53
3.8 中值滤波与维纳滤波 55
第4章 图像边缘检测 57
4.1 边缘的定义 57
4.2 灰度阈值法分割 57
4.3 边缘检测案例 58
第5章 图像压缩与编码 62
5.1 图像压缩概述 62
5.2 图像编码 64
5.3 图像压缩与传输模型 66
5.4 常见无损编码方式 67
第6章 数学形态学 75
6.1 数学形态学的步骤与优势 75
6.2 与数学形态学相关的集合的基本概念 75
6.3 膨胀和腐蚀 76
6.4 开运算和闭运算 80
6.5 基本的形态学算法应用 82
6.6 灰度形态学 83
第7章 特征识别基础 86
7.1 霍夫变换 86
7.2 拉东变换 89
第8章 人工智能理论基础 92
8.1 人工智能的定义与发展 92
8.2 机器学习概述 93
8.3 线性回归 94
8.4 感知机与前馈神经网络 97
8.5 线性判别分析 100
8.6 决策树 103
8.7 朴素贝叶斯 107
8.8 K近邻算法 110
8.9 支持向量机 112
8.10 聚类 117
第9章 神经网络的简单实现 121
9.1 Python环境配置 121
9.2 数学函数库Numpy 124
9.3 神经网络框架Pytorch 129
9.4 卷积神经网络 133
9.5 手写数字识别 143
9.6 多分类任务 147
第10章 光流网络 151
10.1 光流计算原理 151
10.2 Lucas Kanade光流估计算法 152
10.3 Farneback稠密光流 156
10.4 光流数据集FlyingChairs 158
10.5 FlowNet网络 159
10.6 FlowNet2.0网络 166
第11章 生成对抗网络 171
11.1 生成对抗网络概述 171
11.2 利用生成对抗网络进行超分辨率图像生成 179
11.3 利用生成对抗网络进行图像风格迁移 181
第12章 神经网络综合应用 185
12.1 着色网络 185
12.2 ArtLine图像线框提取 187
12.3 人体姿态估计 189
参考文献 199
内容摘要
第1章
数字图像基础
人类通过五官接收外界信息感知世界。通常情况下,七成以上的信息是通过视觉系统获取的。图像处理技术是对图像信号进行处理的技术。目前的图像处理技术主要是利用计算机对数字图像进行处理。
本章介绍图像处理技术的基础概念,图像数字化,直方图的基本概念和实验设计,并提供一组程序参考。本章中的内容是后续大部分内容的基础。
1.1数字图像处理的概念
1)图像的概念
图像作为人类视觉系统的基础,是人类用于感知世界的重要信息源。广义而言,图像是所有的光学等信息的合集,例如报刊书籍上的页面信息、影视作品中的画面等。随着探测器的发展,部分人眼无法感受到的非可见光范畴内的光波信号等也可以进行获取,例如红外线、紫外线、射线等,利用特殊的感知器获取这一类不可见信号的结果也可以视为图像。
2)模拟图像
模拟图像是利用一定方法获取到实际物质世界中光学信息后的结果。通常而言,这一类记录图像的方式都是利用物理及化学反应等方式直接记录光学信息,最常见的便是胶
片等。
模拟图像本身的信息量极大,以普通的平面图像为例,模拟图像在二维坐标系中虽然是有限范围,但是在范围内可以进行无限细分。由于是物理方式记录,通常记录中不存在分辨率等影响,因此在传统影视摄像或者一些特殊领域内,可以利用极小的胶片放大出极高分辨率的图像。然而这种利用物理方式记录的信息,处理及保存都具有较高难度,这一点也导致模拟图像在发展中逐渐衰落、退出主流舞台的原因。
3)数字图像
数字图像是对模拟图像进行数字化后的结果。数字图像是将模拟图像中原本可进行无限细分的信息进行调整,转换为一个有限元素的矩阵进行保存。这样的操作模式让数字图像可以在计算机中进行储存。因此,数字图像在图像信息上水远小于模拟图像,尽管如此,可以利用计算机进行储存传输处理的特性使得数字图像逐渐流行。同时,随着感知器以及计算机技术的发展,数字图像的分辨率逐渐提升,对于人眼这个利用视觉细胞对光学信号进行感知的系统而言,数字图像已经可以达到模拟图像所能取得的信息程度,当前世界上最为主要的图像都是以数字图像为基础。
4)数字图像处理
数字图像处理,是对数字图像进行处理,将图像转变为有限二维矩阵,利用计算机对矩阵内的数据进行处理获取信息或者对图像进行强化等,比起利用物理方式对模拟信号处理更为便利,操作的方式也更加多样化,这一领域也成为计算机科学中的一大分支。
数字图像处理主要可以分为两类。
第一类是对数字图像的内容进行分析,例如对图像中的场景、文字、人脸信息等进行识别,随后反映出所需要的信息。这一类技术常见于需要对图像内容进行提取的情况。这种处理情况下,输入的内容是数字图像,而输出的内容可能是一段文字,也可能是匹配结果的反馈,或者内容的坐标等。
第二类是对图像本身进行处理,例如提升分辨率、增强画面内容、去除不必要的冗余信息等。这一类技术目前常见于图像处理软件或者流媒体处理中。在这种处理情况下,输入的内容是数字图像,输出的内容也是数字图像。
1.2数字图像处理的应用
早期的计算机满足不了图像处理的要求,直到20世纪80年代,随着高速计算机和大规模集成电路的发展,图像处理技术趋于成熟,得到了广泛应用,90年代开始,数字图像处理的应用涉及人类生活的各个方面。图像压缩和多媒体技术的突破和发展、文本和图像分析和理解、文字和图像识别的进展、图像通信和传输的广泛应用等,数字图像处理技术取得广泛的开拓性的发展,进入成熟应用阶段。21世纪,随着人工智能技术的发展,数字图像处理正全面改变人们的生活方式。
当前,数字图像处理的应用已包含了航天航空、生物医学工程、通信、工业、军事、公安、教育、文化、艺术等各个领域。比如在航天航空中的遥感细分方向,数字图像处理在农林资源调查、农作物长势监测、自然灾害监测预报、地势地貌测绘、地质构造解译、环境污染检测等多领域应用。在医学影像方向,数字图像处理在X线成像、CT扫描、核磁共振、B超、内镜、手术机器人等仪器中广泛应用。在影视领域,数字图像处理在拍摄系统、成像系统、动作捕捉系统、视频剪辑、二维跟踪、三维跟踪、绿幕抠像等视频和特效领域获得核心应用。
1.3图像数字化的概念
将模拟图像转换为数字图像的过程称为图像数字化。模拟图像本身是连续的数据,计算机中可以计算的数据尤其是保存的方式,必须存在一个计量单位。将原本连续的数据以……
主编推荐
"近年来,有关人工智能的应用与实践越来越多,电影领域包括了图形渲染技术、图像处理技术、云计算技术和视觉设计艺术,随着相关技术的发展,其视觉表现和效果将不断完善和进步。而随着人工智能技术的推广和普及,在电影制作领域获得了越来越多的应用。 现阶段,数字图像处理与人工智能在电影制作中的相关成体系的技术资料并不多。本书作为学习参考用书,其面向对象为具备一定编程能力的数字媒体技术专业本科生、研究生或正在学习影视技术基础的专业人员。 本书是“数字媒体艺术与技术系列丛书”中的一个分册,语言通俗、案例丰富,在内容的编排上,分为数字图像处理概论、人工智能在电影制作中的应用两大模块。书中结合了具体案例,从基础的数字图像处理知识讲起,解释每个步骤的原理和过程,使数字图像处理与人工智能技术在电影中的应用方案能为读者迅速的理解和掌握。"
精彩内容
本书以数字图像处理为基础,结合人工智能在电影特效制作中的应用进行编写,全书内容分为数字图像处理概论、人工智能在电影特效制作中的应用两大模块共12章。
书中所有拍摄素材均为编著团队实地拍摄或代码运行所得,其中图像基础部分是数字图像处理课程的核心内容,包含丰富的教学案例,是重要的学习资料。
媒体评论
上大老师教你掌握影视特效技术近年来,有关人工智能的应用与实践越来越多,电影特效领域包括了图形渲染技术、图像处理技术、云计算技术和视觉设计艺术,随着相关技术的发展,其视觉表现和效果将不断完善和进步。而随着人工智能技术的推广和普及,在电影特效制作领域获得了越来越多的应用。
现阶段,数字图像处理与人工智能在电影特效制作中的相关成体系的技术资料并不多。本书作为学习参考用书,其面向对象为具备一定编程能力的数字媒体技术专业本科生、研究生或正在学习影视特效技术基础的专业人员。
本书是“数字媒体艺术与技术系列丛书”中的一个分册,语言通俗、案例丰富,在内容的编排上,分为数字图像处理概论、人工智能在电影特效制作中的应用两大模块。书中结合了具体案例,从基础的数字图像处理知识讲起,解释每个步骤的原理和过程,使数字图像处理与人工智能技术在电影特效中的应用方案能为读者迅速的理解和掌握。
以下为对购买帮助不大的评价