第1页(共12页)数字图像处理:部分课后习题参考答案第一章1.连续图像中,图像为一个二维平面,(x,y)图像中的任意一点,f(x,y)为图像于(x,y)于处的值。连续图像中,(x,y)的取值是连续的,f(x,y)也是连续的数字图像中,图像为一个由有限行有限列组成的二维平面,(i,j)为平面中的任意一点,g(i,j)则为图像在(i,j)处的灰度值,数字图像中,(i,j)的取值是不连续的,只能取整数,对应第i行j列,g(i,j)也是不连续的,表示图像i行j列处图像灰度值。联系:数字图像g(i,j)是对连续图像f(x,y)经过采样和量化这两个步骤得到的。其中g(i,j)=f(x,y)|x=i,y=j2.图像工程的内容可分为图像处理、图像分析和图像理解三个层次,这三个层次既有联系又有区别,如下图所示。图像处理的重点是图像之间进行的变换。尽管人们常用图像处理泛指各种图像技术,但比较狭义的图像处理主要是对图像进行各种加工,以改善图像的视觉效果并为自动识别奠定基础,或对图像进行压缩编码以减少所需存储空间图像分析主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过程。这里的数据可以是目标特征的测量结果,或是基于测量的符号表示,它们描述了目标的特点和性质。图像理解的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。如果说图像分析主要以观察者为中心来研究客观世界,那么图像理解在一定程度上是以客观世界为中心,借助知识、经验等来把握整个客观世界(包括没有直接观察到的事物)的。联系:图像处理、图像分析和图像理解处在三个抽象程度和数据量各有特点的不同层次上。图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。图像分析则进入了中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的非图形式的描述。图像理解主要是高层操作,基本上是对从描述抽象出来的符号进行运算,其处理过程和方法与人类的思维推理有许多类似之处。第二章:1.参见第一章:第1题4.jpg(jpeg)JPEG:联合摄影专家组JPEG图片以24位颜色存储单个光栅图像。JPEG是与平台无关的格式,支持最高级别的压缩,不过,这种压缩是有损耗的。渐近式JPEG文件支持交错。可以提高或降低JPEG文件压缩的级别。但是,文件大小是以图像质量为代价的。压缩比率可以高达100:1。(JPEG格式可在10:1到20:1的比率下轻松地压缩文件,而图片质量不会下降。)JPEG压缩可以很好地处理写实摄影作品。但是,对于颜色较少、对比级别强烈、实心边框或纯色区域大的较简单的作品,JPEG压缩无法提供理想的结果。有时,压缩比率会低到5:1,严重损失了图片完整性。这一损失产生的原因是,JPEG压缩方案可以很好地压缩类似的色调,但是JPEG压缩第2页(共12页)方案不能很好地处理亮度的强烈差异或处理纯色区域。优点:摄影作品或写实作品支持高级压缩,利用可变的压缩比可以控制文件大小。支持交错(对于渐近式JPEG文件)。JPEG广泛支持Internet标准。缺点:有损耗压缩会使原始图片数据质量下降。当您编辑和重新保存JPEG文件时,JPEG会混合原始图片数据的质量下降。这种下降是累积性的。不适用于所含颜色很少、具有大块颜色相近的区域或亮度差异十分明显的较简单的图片。是最常见的格式之一。BMP:Windows位图Windows位图可以用任何颜色深度(从黑白到24位颜色)存储单个光栅图像。Windows位图文件格式与其他MicrosoftWindows程序兼容。它不支持文件压缩,也不适用于Web页。从总体上看,Windows位图文件格式的缺点超过了它的优点。为了保证照片图像的质量,请使用PNG文件、JPEG文件或TIFF文件。BMP文件适用于Windows中的墙纸。优点:BMP支持1位到24位颜色深度。BMP格式与现有Windows程序(尤其是较旧的程序)广泛兼容。缺点:BMP不支持压缩,这会造成文件非常大,BMP文件不受Web浏览器支持。GIF:图形交换格式;GIF图片以8位颜色或256色存储单个光栅图像数据或多个光栅图像数据。GIF图片支持透明度、压缩、交错和多图像图片(动画GIF)。PGIF透明度不是alpha通道透明度,不能支持半透明效果。GIF压缩是LZW压缩,压缩比大概为3:1。GIF文件规范的GIF89a版本中支持动画GIF。优点:GIF广泛支持Internet标准。支持无损耗压缩和透明度。动画GIF很流行,易于使用许多GIF动画程序创建。很多QQ表情都是GIF的~缺点:GIF只支持256色调色板,因此,详细的图片和写实摄影图像会丢失颜色信息第四章1.如下表:pr(rk)、pz(zl)分别表示原直方图与规定直方图一、对原直方图进行均衡化处理,得到映射关系rk→sk(第四列)二、对规定直方图进行均衡化处理,得到映射关系zl→vl(第五列):rkpr(rk)pz(zl)sk=T(rk)vk=G(zl)rk=zl规定化后的直方图r00.1400.141/70r0=z30r10.2200.363/70r1=z40r20.2600.624/70r2=z50r30.170.190.796/70.19r3=z60.14r40.090.250.886/70.44r4=z60.22r50.060.210.947/70.65r5=z70.26r60.040.240.987/70.89r6=z70.26r70.020.111.007/71r7=z70.12三、对于每个sk,迭代计算出满足下式的最小vl,得到映射关系sk→vl,再由rk→sk得到rk→vl,最后由zl→vl的逆变换vl→zl求出rk→zl的变换:0)()(00kiirljjzklrpzpsv第3页(共12页)对k=0,l=3时,v3-s0=0.19-0.14=0,开始满足上式,于是有r0=z3对k=1,l=3时,v4-s1=0.44-0.36=0,开始满足上式,于是有r1=z4对k=2,l=3时,v5-s2=0.65-0.62=0,开始满足上式,于是有r2=z5对k=3,l=3时,v6-s3=0.89-0.79=0,开始满足上式,于是有r3=z6对k=4,l=3时,v6-s4=0.89-0.88=0,开始满足上式,于是有r4=z6对k=5,l=3时,v7-s5=1.00-0.94=0,开始满足上式,于是有r5=z7对k=6,l=3时,v7-s6=1.00-0.98=0,开始满足上式,于是有r6=z7对k=6,l=3时,v7-s7=1.00-1.00=0,开始满足上式,于是有r7=z7直方图规定化结果如最后一列所示,规定化后的直方图与规定直方图基本一致。2.rknkpr(rk)sk=T(rk)rk=skps(sk)r05600.140.141/70=10r19200.220.363/71=30.140.143r210460.260.624/72=40.286r37050.170.796/73=60.220.429r43560.090.886/74=60.260.571r52670.070.947/70.714r61700.040.997/75,6,7-70.260.857r7720.021.007/70.133.原图3*3领域平均法1111111111112255233325858302333255433359875932333325546331598860633452558333260628234678234678第4页(共12页)原图3*3中值滤波111111111111225523332233333325543333333333325546334446334525583345782346782346784.2*m+15.均值滤波:把每个像素都用周围的8个像素来做均值操作。可以平滑图像,速度快,算法简单。但是无法去掉噪声,这能微弱的减弱它。中值滤波:常用的非线性滤波方法,也是图像处理技术中最常用的预处理技术。它在平滑脉冲噪声方面非常有效,同时它可以保护图像尖锐的边缘。8.为什么一般情况下对离散图象的直方图均衡化并不能产生完全平坦的直方图?由于离散图象的直方图也是离散的,其灰度的累积分布函数是一个不减的阶梯函数。如果映射后的图象仍能取到所有256级灰度,那一定是原图象没有任何改变,这种情况只可能发生在原图象的直方图已经是一条水平线的情况下。一般情况下映射后所得到的图象只能取到少于256级灰度,这样在变换后的直方图中会有某些灰度级空缺,当然这些空缺应该均匀分布在0到255之间。于是问题就变成了将原有的256个值,即各灰度的概率,按顺序分成n(n256)份,每份的概率总和应该相等。显然这个问题是不一定有解的,因此我们只能找到一个近似解。其结果就是最后得到一幅有空缺且不太平坦的直方图9.不会发生变化,因为再次均衡化,所用的变换函数是首次均衡化后得到的增强图像的累积直方图,不会改变其结果。10.相同点:都能减弱或消除傅立叶空间的某些分量,而不影响或较少影响其他分量,从而达到了增强某些频率分量的效果。不同点:平滑滤波器减弱或消除了傅立叶空间的高频分量,所以达到了增强低频分量,平滑图像中细节的效果。锐化滤波器减弱或消除了傅立叶空间的低频分量,所以达到了增强高频分量,锐化图像中细节的效果。:两者效果相反,互为补充,从原始图像中减去平滑滤波器的结果得到锐化滤波器的效果,而从原始图像中减去锐化滤波器的结果则可得到平滑滤波器的结果。第五章:P1051.0001-210000100-200100010-201001000-20001水平模板垂直模板+45-45第5页(共12页)2.如下图,假设有四种角点:00000000000011111100001111110000111111000011111100001111110000111111000000000000-1-10-1300000-1-103-1000000-130-1-1000003-10-1-1检测左上角检测右上角检测左下角检测左上角5.参见教材P83第六章P1412.一般地,按比例将原图像放大k倍时,如果按照最近邻域法则需要将一个像素值添在新图像的k×k的子块,如果放大倍数太大,按照这种方法处理会出现马赛克效应。为了提高几何变换后的图像质量,常采用线性插值法。该方法的原理是,当求出的分数地址与像素点不一致时,求出周围四个像素点的距离比,根据该比率,由四个邻域的像素灰度值进行线性插值4.图像旋转之后,会出现许多的空洞点。对这些空洞点必须进行填充处理,否则画面效果不好。一般也称这种操作为插值处理。最简单的方法是行插值方法或列插值方法:列插值算法如下:①找出当前列的最小和最大的非白点的坐标,记作(k1,j)、(k2,j)。②在(k1,k2)范围内进行插值,插值的方法是:空点的像素值等于上一点的像素值。③同样的操作重复到所有列。经如上的插值处理之后,图像效果就变得自然了5.变换矩阵:T=0.70700.70700-0.70700.70700001.0000第6页(共12页)本题图像共有16个像素,变换前的3×16矩阵如下:P0=123412341234123411112222333344441111111111111111变换后的3×16矩阵:P=T*P012342344344544560-1-1-210-1-1110-121101111111111111111第7页(共12页)变换结果如下图所示X坐标Y坐标012340123456-2574,-2-1602,-1583,-159,574,-1585,-10591,0593,0604,0566,01591,1602,1583,1574,1612,