1二、解:(采用图像vision1.bmp)本题是探讨对比度增强问题,对比度小的图像很难辨别。对vision1.bmp图像通过直方图观察发现其灰度值范围在0~150之间,且多数象素点的灰度在0~50之间,对比度显然很较差。常用的对比度增强方法有图像均衡和灰度拉伸。(一)图像均衡(1)原理、方法利用统计的方法,通过点运算使输入图像转换为每一灰度级上都有相同的象素点数的输出图像(即输出图像的直方图是平的)。这样就增加了象素灰度值的动态范围。首先定义图像的概率密度函数(PDF,归一化到单位面积的直方图):)(1)(0xHAxp其中H(x)为图像直方图,A0为图像的面积转换前图像的概率密度函数为)(rPr,转换后图像的概率密度函数为)(sPs,转换函数为)(rfs。由概率论知识,可以得到:dsdrrPsPrs)()(如果想使转换后图像的灰度均匀分布,即图像的概率密度函数为1(直方图为平的),则必须要求:drdsrPr)(,要由原象素点的灰度值rs值转换为均衡化后的灰度,只需对该等式两边对r积分,得到:rrrduuHAduuPrfs000)(1)()(对于没有归一化的情况,只要乘以最大灰度值maxD(灰度图为255)即可。灰度均衡的转换公式为rduuHADrfs00max)()(对于数字图像(离散),转换公式为:aDiabHiADDfD00max)(式中Hi为第I级灰度的象素个数。为变换后的灰度值为象素点的原灰度值,baDD。(2)结果及分析经过均衡化后,图像的对比度明显增强,(图2.1和图2.3比较),基本可以辨别图像中的物体和人的特征。原图象的直方图灰度集中在0~150之间,均衡化后直方图较为平坦,且灰度分布范围扩展到0~255之间,反应在图像上就是图像有较大的反差,显然对比度增强。直方图均衡化的优点是能自动地增强整个图像的对比度,但它的具体增强效果不易控制,不能只针对某个灰度区间进行有意识的灰度变换。因此对于我们所要求的细节,该变换不一定能提高它的可看性。2图2.1原图象图2.2原图象的灰度直方图图2.3均衡化后的图像图2.4均衡图像的灰度直方图(二)灰度拉伸(1)机理及方法一般来说正确地使用直方图规定化的函数有可能获得比直方图均衡化更好的效果,而且也可以有意识地对某个灰度区间进行灰度拉伸。通过这种灰度拉伸来改变图像对比度的方法大致有两种:①线性灰度拉伸对于原图象的某个灰度区间ba,的灰度值Z按照下式变换函数变换llkZaZabZZZ)('式中,斜率为常数k=abZZlk(式2.1)显然灰度范围由ba,变换到klZZ,,从而改变图像的对比度②非线性灰度拉伸一般在傅立叶功率谱中,与直流成分相比,其它的频率成分的值即使乘以10的几次方也是小的,为此先取输入图像灰度值的对数,变换函数为llkZaZabZZZ)log(logloglog'式中斜率为常数k=abZZlkloglog(式2.2)此外,也可以规定)('ZfZ,f为其它的非线性函数,如二次函数、三角函数等。(2)针对vision1.bmp的拉伸由式2.1、式2.2(注:式2.2中自变量为logZ,应变量为Z’)可以看出3ⅰ、若斜率k1,则变换后灰度值将变大,即产生“伸”的结果,可以由图2.5得到验证,图2.5(0,0)至(27,66)区间,与图2.2(灰度值为0的象素点较多,占5.79%)相比,延伸后大部分象素点较多的灰度平移到灰度值为70的附近,灰度值为70的象素点数目占了7.60%。从对比度效果看,灰度值在区间0~27的象素点将变亮。参看图2.5的变换结果图,与原图(图2.1)比较,地板和沙发底座附近(灰度在0~27之间)的对比度明显增强,而墙壁的亮的部分(灰度值大于27),基本没有产生对比度变化。图2.5变换函数(延伸)横坐标——原灰度纵坐标——变换后的灰度图2.6变换函数(收缩)横坐标——原灰度纵坐标——变换后的灰度ⅱ、若斜率k1,则变换后灰度值将变小,即产生“缩”的结果,可以由图2.6得到验证,图2.6(0,0)至(41,4)区间,与图2.2(灰度值为0的象素点较多,占5.79%)相比,收缩后大部分象素点较多的灰度平移到灰度值为0的附近,灰度值为0的象素点数目骤增到24.37%。从对比度效果看,灰度值在区间0~41的象素点将变亮。参看图2.6的变换结果图,与原图(图2.1)比较,地板和沙发底座附近(灰度在0~41之间)几乎无法分辩,对比度减弱,而墙壁的亮的部分(灰度值大于41),基本没有产生对比度变化。ⅲ、若斜率k=1,则变换后不会改变该区间的灰度值,如上面分析中灰度在72~255区间的象素点的灰度不会改变。综上分析,直方图“伸”将使图像对比度增强,“缩”将使图像对比度减弱。(3)较佳的灰度拉伸由于vision1.bmp整幅图像明显偏暗,图像的灰度集中在较暗的区域,为此根据前面分析,采用灰度“延伸”的方法来提高图像的对比度。从原图象的直方图看出,灰度值在0~150的象素点数目占绝大多数,而占比例最大的是灰度为0附近的象素点。所以可用“延伸”在0附近的象素点灰度(使k1)可以增强图像的对比度。根据以上分析的拉伸机理,以下拉伸的效果比均衡效果好。(可以对比图2.3与图2.7的窗帘,沙发,窗口旁的桌子及桌上的东西)4图2.7较佳的灰度拉伸三、解:(采用图像vision2.bmp)(一)频谱分析的原理、依据2-D图像的傅立叶变换及反变换如下:101010101......2,1,0,]/)(2exp[),(1),(1......2,1,0,]/)(2exp[),(1),(NvNuNyNxNyxNvyuxjvuFNyxfNvuNvyuxjyxfNvuF,,可以证明傅立叶变换具有周期性,即F(u,v)=F(u+N,v)=F(u,v+N)=F(u+N,v+N),其严格的数学计算结果如图3.1(取频谱的幅度):图3.1傅立叶变换的周期性示意图图中红线为u,蓝线为v,交点为原点,共四个象限,从数学计算上讲,u、v可以为正负,且在一个周期(图3.1中粉红色的虚线矩形,记该矩形为第一个周期)内,u、v的值越大则频率就越高。在实际应用中,我们一般取u、v为正即取第一象限的频谱,如图3.2所示,对其进行平移得到图3.3的频谱图。5原图象图3.2图3.3图3.3可是认为是图3.1的第一个周期平移的结果(实际上图3.1可以看成是第一个周期沿u轴和v轴的正负方向平移的结果)。由图3.1可知在第一个周期内,离原点越近(u、v值越小),频率越低,离原点越远(要在一个周期内)(u、v值越大)则频率越高;由于用亮度信息表示频谱幅度,从图3.1可以看出低频成分的幅度较大(能量较大),能量集中在低频部分,高频部分能量很少;3.3也是同样的结果。所以可以以平移后的频谱(图3.3)的中心为圆心,以一定的半径画圆来规定频谱的低频、中频、高频部分。图中绿色圆(半径为R1)内部为频谱的低频成分,绿色圆与红色圆之间为中频成分,红色圆(半径为R2)之外为高频成分。这就是对图像频域进行高、中、低频分析的原理和依据。在频域上,我们可以用一个转移函数H(u,v)与频谱F(u,v)相乘,消除某部分的频谱分量,以达到滤波的目的。F‘(u,v)=F(u,v)H(u,v)H(u,v)频谱的幅度vu一个2-D理想低通滤波器的转移函数满足下列条件:H(u,v)=00),(,0),(,1DvuDDvuD如如上式中D0是一个非负整数。D(u,v)是从点(u,v)到频率平面原点的距离,D(u,v)=2/122)(vu,D0实际上是半径R。将半径为R的圆外的频谱分量去除,再利用剩下的频谱分量F‘(u,v)进行反变换即得到低通图。同理一个2-D理想高通滤波器的转移函数满足下列条件:H(u,v)=00),(,1),(,0DvuDDvuD如如一个2-D理想中频部分滤波器的转移函数满足下列条件:6H(u,v)=其他如:),(,0),(,121vuDDvuDD(二)通过调整半径R1和R2,滤除某种频率成分后得到的图像比较如下由于频谱图与原图象大小一样,R1,R2最大取值为22128128=181【原图象大小为(256×256)】⑴R1=2,R2=180图3.4低通图图3.5中通图图3.6高通图由上面图可以看出,半径R2=180之外,高频分量几乎没有(参考图3.3),所以其反变换的结果幅度(亮度,即灰度值)几乎为0(图3.6)在半径R1=2之内,从图3.3看出,频谱分量很集中,且幅度很大,所以其反变换的结果虽然不能反应原始图像的信息,但是幅度(亮度)较大(图3.4)在半径2R180之间,频谱分量也是较集中,所以其反变换的结果可以反应原始图像的一些基本信息(图像的某些轮廓)⑵R1=10,R2=150图3.7低通图图3.8中通图图3.9高通图由上面图可以看出,半径R2=150之外,已有一些高频分量(参考图3.3),根据傅立叶变换能量守恒定律,其反变换的结果应该也有一定的能量(与信号幅度的平方成正比)(亮度表示幅度),图3.9中的有亮度的点(由频谱的高频部分反变换得到)与原图象的桌角,人的两只脚,头顶围巾等部分对应,而这些部分是图像中变化最为剧烈的部分,因此我们可以认为图像中剧烈变化的部分为频谱的高频成分作贡献。这验证了图像的细节部分对应频谱高频成分的说法。在半径R1=10之内,从图3.3看出,频谱分量与前面R1=2时相比,显然能量增加,所以其反变换的结果应该具有更多的能量,能反应原始图像更多的信息,如图3.7,人的两只脚和桌子初具雏形。从图3.7中可以看出对频谱低频部分贡献最大的是桌面和门口的地板部分(该部分亮度较大),这说明图像中平滑的部分对应频谱的低频成分。⑶R1=20,R2=1007图3.10低通图图3.11中通图图3.12高通图⑷R1=10,R2=80图3.13低通图图3.14中通图图3.15高通图高频选择的依据:比较图3.6、图3.9、图3.12、图3.15发现,在R2小于100之后,高通图基本没有发生较大的变化,原因是这时已经包含了绝大部分的高频分量,且已经包含了一部分的中频和低频,所以高频被中频、低频分量“淹没”了,看不出高频成分,所以认为高频频谱,R2应大于100。按此方法分析,本人选择R2=135,作为高频的频谱分割阈值。中频选择的依据:在R2=135确定后,调整R1的位置,类似于图3.5、图3.8、图3.11、图3.14中通图,取①R1=40,R2=135②R1=30,R2=135③R1=20,R2=135④R1=10,R2=135,在R2再减小则中通图出现较大的轮廓信息,且低通变化不是很大,认为中频分量(包含有较多的低频分量)反变换后低频信号的幅度把中频“淹没”了,所以可以选择R1=10左右。低频选择的依据:根据上面分析R1取10。R1=10,R2=135时的结果图如下:低通图中通图高通图(三)分析结果的讨论由于以上只是作定量的分析,R1和R2的划分依据没有严格的界限,可视具体情况而定。8四、解:(采用图像vision3.bmp)(一)、八连通定义如下图,象素点S1,S2,S3,S4和R1,R2,R3,R4为象素点P的邻域,当S1,S2,S3,S4和R1,R2,R3,R4中的象素点的灰度值(二值图像)与P象素点的灰度值相同或相近时,我们就定义该点与P是连通的。S1R1S2R2PR3S3R4S4对于二值化后的图像,假设目标为黑色(灰度值0),背景为白色(灰度值255),P为目标点,若S1,S2,S3,S4和R1,R2,R3,R4中,有点的灰度值为0,则该点与P是连通的。(二)、八连通的算法:我们把各个团点(即连通块)用不同的“颜色”标志(实际上用一个数值k,例如:第一个团点用1标志,第二个团点用2标志……,第300个团点用300标志,依此类推,不同的标志值区分不同的团点)。通用的八连通算法是:如果某个象素点属于某个团点(假设该团点的“颜色”为k),