得鹿梦鱼 得鹿梦鱼

图像的数学变换

图像数学变换的特点在于其有精确的数学背景,是许多图像处理技术的基础。在这些变换中,一种是在空间域(简称“空域”)进行的,通过对输入图像进行加工而得到输出图像;另一种数学变换则是将原先定义在图像空间的图像以某种形式转换到另外一些空间,并利用输入图像在这些空间的特有性质有效、快速地对图像进行处理和分析。最典型的变换是傅里叶变换,它把空域中的图像信号看作二维时间序列,将其变换到频率域(简称“频域”)来分析图像的频谱特性。除了傅里叶变换外,常用的非空域变换还有小波变换、离散余弦变换、PCA变换等。无论是在空域中的数学变换还是在频域等非空域中的数学变换,它们在图像分析、滤波、增强、压缩等处理中都有着非常典型而重要的应用

几何变换

几何变换可以改变图像中物体之间的空间关系。这种变换可以看成是图像内的各物体在图像内移动的过程。例如,物体的转动、扭曲、倾斜、拉伸等都是几何变换的结果

gx,y=fx,y=fa[a,y,bx,y]gx,y=fx',y' = fa[a,y, bx,y]

fx,yfx,y表示输入图像,gx,ygx,y表示输出图像,而函数a,b唯一的描述了空间变换

空间变换

简单变换

平移

[ax,ybx,y1]=[100010001][xy1]\begin{bmatrix}ax,y \\bx,y \\1\end {bmatrix}\text{=}\begin {bmatrix}1 & 0 & 0 \\0 & 1 & 0 \\0 & 0 & 1\end {bmatrix}\begin {bmatrix}x \\y \\1\end {bmatrix}

缩放

[ax,ybx,y1]=[c000d0001][xy1]\begin{bmatrix}ax,y \\bx,y \\1\end{bmatrix}\text{=}\begin{bmatrix}c & 0 & 0 \\0 & d & 0 \\0 & 0 & 1\end{bmatrix}\begin{bmatrix}x \\y \\1\end{bmatrix}

旋转

[ax,ybx,y1]=[cosθsinθ0sinθcosθ0001][xy1]\begin{bmatrix}ax,y \\bx,y \\1\end{bmatrix}\text{=}\begin{bmatrix}cos \theta & -sin \theta & 0 \\sin \theta & -cos \theta & 0 \\0 & 0 & 1\end{bmatrix}\begin{bmatrix}x \\y \\1\end{bmatrix}

灰度级插值

输出像素通常被映射到输入图像中的非整数位置,即位于4个输入像素之间。因此,为了决定与该位置相对应的灰度值,必须进行插值运算

  • 最近邻插值:即选择离它所映射到的位置最近的输入像素的灰度值作为插值结果

fx=fxk=12xk1+xkx12xk+xk+1fx=fx_k=\frac{1}{2}x_{k-1}+x_k \leq x \leq \frac{1}{2}x_k+x_{k+1}

  • 双线性插值:对最近邻插值的一种改进,即用线性内插方法

fx,y=ax+by+cxy+dfx,y = ax + by + cxy + d

  • 三次立方插值

该方法利用三次多项式Sx来逼近理论上的最佳插值函数sinxx\frac{\sin x}{x}

Sx={12x2+x30x148x+5x2x31x20x2Sx=\begin{cases}1 - 2x^2 + x^3 \quad 0 \leq x < 1 \\4 - 8x + 5x^2 - x^3 \quad \quad 1 \leq x < 2\\0 \quad x \geq 2\end{cases}

离散傅里叶变换

一维傅里叶变换

Fu=fftej2πutdtFu=f^{\infty}_{-\infty}fte^{-j2 \pi ut} dt

反变换为

ft=fFuejπutduft=f^{\infty}_{-\infty}Fue^{j\pi ut} du

这里的函数ftft必须是满足只有有限个间断点、有限个极值和绝对可积的条件,并且在FuFu也应是可积的,ftft一般是实函数,FuFu是复函数,有实部和虚部构成
Fu=Ru+jIu=FuejΦuFu=Ru + jIu= Fue^{j \Phi u}
Fu=R2u+I2u,Φu=arctanIuRuFu= \sqrt{R^2u + I^2u }, \Phi u = \arctan \frac{Iu}{Ru}

FuFu称为频谱,Φu\Phi u称为相位角。

对于连续函数ftft等间隔采样就得到一个离散序列,假设共采样N次,则这个离散序列可以表示为{f0,f1,,fN1}\{f0, f1, \cdots, fN-1\},若令xx为离散实变量,uu为离散频率变量,则一维离散傅里叶百变换定义为
Fu=1Nx=0N1fxej2πux/N,u=0,1,,N1Fu = \frac{1}{N}\sum^{N-1}_{x=0}fxe^{-j2\pi ux/N}, u=0,1, \cdots , N-1

其反变换为
fx=x=0N1Fuej2πux/N,,x=0,1,,N1fx = \sum^{N-1}_{x=0}Fue^{j2\pi ux/N}, , x=0,1, \cdots , N-1

二维傅里叶变换

假设以矩形网格采样得到的是图形用fx,yfx,y表示,则fx,yfx,y的二维离散傅里叶变换表示为
Fu,v=1MNx=0M1y=0N1fx,yej2πuxM+vyNFu,v = \frac{1}{MN}\sum^{M-1}_{x=0}\sum^{N-1}_{y=0}fx,ye^{-j2\pi \frac{ux}{M} + \frac{vy}{N}}
其反函数为
fx,y=x=0M1y=0N1Fu,ve2πuxM+vyNfx,y = \sum^{M-1}_{x=0}\sum^{N-1}_{y=0}Fu,ve^{2\pi \frac{ux}{M} + \frac{vy}{N}}

基本性质

离散傅里叶变换建立了函数在空域与频域之间的转换关系,把空域难以显示的特征在频率域中十分清楚地显示出来。

可分离性:一个二维离散傅里叶变换可以先后两次运用一维傅里叶变换实现,即先沿fx,yfx,y的列方向求一维离散傅里叶变换得到Fx,vFx,v,再对Fx,vFx,v沿行方向求一维离散傅里叶变换得到Fu,vFu,v
平移性: ,将fx,yfx,y乘以一个指数项,相当于把其二维离散傅里叶变换Fu,v的频域中心移动到新的位置。周期性:傅里叶变换和反变换均以N为周期共轭对称性:如果Fu,v的频域中心移动到新的位置。**周期性**:傅里叶变换和反变换均以N为周期**共轭对称性**: 如果fx,y$是实函数,则它的傅里叶变换具有共轭对称性
旋转不变性:
分配性:傅里叶变换的分配性表明傅里叶变换对于加法可以分配
频谱衰减特性: 变换的幅度谱会随着频率的增加而出现快速的衰减特性

离散余弦变换

傅里叶变换的一个最大问题是:它的参数都是复数,在数据的描述上相当于实数的两倍,不易计算。因此希望有一种具有相同功能但数据量又不大的变换。在这个思想的指导下,产生了离散余弦变换DCT

函数fnfn)的一维离散余弦变换及反变换分别为
Cu=aux=0N1fncos2x+1uπ2NCu = au\sum^{N-1}_{x=0}fn \cos \frac{2x+1u\pi}{2N}

fn=x=0N1auCucos2x+1uπ2Nfn = \sum^{N-1}_{x=0}auCu \cos \frac{2x+1u\pi}{2N}

au={1/Nu=02/Nu0au=\begin{cases}\sqrt{1/N} \quad u = 0 \\\sqrt{2/N} \quad u \neq 0\end{cases}

函数fnfn)的二维离散余弦变换及反变换分别为

Cu,v=auavx=0M1y=0N1fx,ycos[2x+1uπ2M]cos[2y+1vπ2N]Cu,v = auav\sum^{M-1}_{x=0}\sum^{N-1}_{y=0}fx,y\cos [\frac{2x+1u\pi}{2M}]\cos [\frac{2y+1v\pi}{2N}]

fx,y=auavx=0M1y=0N1Cu,vcos[2x+1uπ2M]cos[2y+1vπ2N]fx,y= auav\sum^{M-1}_{x=0}\sum^{N-1}_{y=0}Cu,v\cos [\frac{2x+1u\pi}{2M}]\cos [\frac{2y+1v\pi}{2N}]

小波变换

线性系统理论中的傅里叶变换是以在两个方向上都无限伸展的正弦波曲线作为正交基函数的。
是有限宽度的波并被称为小波wavelet。基于它们的变换被称为小波变换。

连续小波变换

所有小波基函数都是通过对一个称为小波基的单个原型函数Ψt的伸缩和平移产生的,基本小波是一个具有特殊性质的实值函数,它是振荡衰减的

二进小波变换

通过对基本小波Ψt的二进伸缩(以2的因子伸缩)和二进位移(每次移动k2j\frac{k}{2^j},这是二进尺度因子和小波宽度的整数倍),就形成了二进小波。

主成分分析变换PCA

它是一种统计学方法,在信号处理、模式识别、数字图像处理等领域已经得到了广泛应用。主成分分析方法的基本思想是提取出空间原始数据中的主要特征(主元),减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分信息,从而解决数据空间维数过高的瓶颈问题。

PCA是模式识别判别分析中最常用的一种线性映射方法。该方法根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大的方向(即方差最大的方向)作为判别矢量来实现数据的特征提取与数据压缩。从概率统计观点可知,一个随机变量的方差越大,该随机变量所包含的信息就越多。所谓主成分,就是原始数据的m个变量经线性组合(或映射)后得到的变量,该变化使得其变换后的变量方差为最大(第一主成分)的部分。各个主成分之间是相互线性无关(正交)的,在第一主成分之后,各主成分按方差大小的顺序排列(对应特征值按大小顺序排列)。

原理

xx表示m维随机向量,假设xx的均值为0,即xˉ=0\bar x = 0,
ww表示m维单位向量,xx在其上的投影,这个投影被定义为向量xwx和w的内积y=k=0nwkxk=wTxy = \sum^n_{k=0}w_kx_k = w^Tx满足约束条件w=wTw1/2=1w = w^Tw^{1/2}=1
主成分分析的目的就是寻找一个权值向量ww,使得表达式y2ˉ\bar {y^2}的值最大化
y2ˉ=wTx2=wTCxw\bar {y^2} = w^Tx^2 = w^TC_xw

Cxwj=λjwjC_xw_j = \lambda_jw_j