《数字图像处理》习题参考答案第1章概述1.1连续图像和数字图像如何相互转换?答:数字图像将图像看成是许多大小相同、形状一致的像素组成。这样,数字图像可以用二维矩阵表示。将自然界的图像通过光学系统成像并由电子器件或系统转化为模拟图像(连续图像)信号,再由模拟/数字转化器(ADC)得到原始的数字图像信号。图像的数字化包括离散和量化两个主要步骤。在空间将连续坐标过程称为离散化,而进一步将图像的幅度值(可能是灰度或色彩)整数化的过程称为量化。1.2采用数字图像处理有何优点?答:数字图像处理与光学等模拟方式相比具有以下鲜明的特点:1.具有数字信号处理技术共有的特点。(1)处理精度高。(2)重现性能好。(3)灵活性高。2.数字图像处理后的图像是供人观察和评价的,也可能作为机器视觉的预处理结果。3.数字图像处理技术适用面宽。4.数字图像处理技术综合性强。1.3数字图像处理主要包括哪些研究内容?答:图像处理的任务是将客观世界的景象进行获取并转化为数字图像、进行增强、变换、编码、恢复、重建、编码和压缩、分割等处理,它将一幅图像转化为另一幅具有新的意义的图像。1.4讨论数字图像处理系统的组成。列举你熟悉的图像处理系统并分析它们的组成和功能。答:如图1.8,数字图像处理系统是应用计算机或专用数字设备对图像信息进行处理的信息系统。图像处理系统包括图像处理硬件和图像处理软件。图像处理硬件主要由图像输入设备、图像运算处理设备(微计算机)、图像存储器、图像输出设备等组成。软件系统包括操作系统、控制软件及应用软件等。图1.8数字图像处理系统结构图11.5常见的数字图像处理开发工具有哪些?各有什么特点?答.目前图像处理系统开发的主流工具为VisualC++(面向对象可视化集成工具)和MATLAB的图像处理工具箱(ImageProcessingToolbox)。两种开发工具各有所长且有相互间的软件接口。Microsoft公司的VC++是一种具有高度综合性能的面向对象可视化集成工具,用它开发出来的Win32程序有着运行速度快、可移植能力强等优点。VC++所提供的Microsoft基础类库MFC对大部分与用户设计有关的Win32应用程序接口API进行了封装,提高了代码的可重用性,大大缩短了应用程序开发周期,降低了开发成本。由于图像格式多且复杂,为了减轻程序员将主要精力放在特定问题的图像处理算法上,VC++6.0提供的动态链接库ImageLoad.dll支持BMP、JPG、TIF等常用6种格式的读写功能。MATLAB的图像处理工具箱MATLAB是由MathWorks公司推出的用于数值计算的有力工具,是一种第四代计算机语言,它具有相当强大的矩阵运算和操作功能,力求使人们摆脱繁杂的程序代码。MATLAB图像处理工具箱提供了丰富的图像处理函数,灵活运用这些函数可以完成大部分图像处理工作,从而大大节省编写低层算法代码的时间,避免程序设计中的重复劳动。MATLAB图像处理工具箱涵盖了在工程实践中经常遇到的图像处理手段和算法,如图形句柄、图像的表示、图像变换、二维滤波器、图像增强、四叉树分解域边缘检测、二值图像处理、小波分析、分形几何、图形用户界面等。但是,MATLAB也存在不足之处限制了其在图像处理软件中实际应用。首先,强大的功能只能在安装有MATLAB系统的机器上使用图像处理工具箱中的函数或自编的m文件来实现。其次,MATLAB使用行解释方式执行代码,执行速度很慢。第三,MATLAB擅长矩阵运算,但对于循环处理和图形界面的处理不及C++等语言。为此,通应用程序接口API和编译器与其他高级语言(如C、C++、Java等)混合编程将会发挥各种程序设计语言之长协同完成图像处理任务。API支持MATLAB与外部数据与程序的交互。编译器产生独立于MATLAB环境的程序,从而使其他语言的应用程序使用MATLAB。1.6常见的数字图像应用软件有哪些?各有什么特点?答:图像应用软件是可直接供用户使用的商品化软件。用户从使用功能出发,只要了解软件的操作方法就可以完成图像处理的任务。对大部分用户来说,商品化的图像应用软件无需用户进行编程,操作方便,功能齐全,已经能满足一般需求,因而得到广泛应用。常用图像处理应用软件有以下几种:1.PHOTOSHOP:当今世界上一流的图像设计与制作工具,其优越性能令其产品望尘莫及。PHOTOSHOP已成为出版界中图像处理的专业标准。高版本的PHOTOSHOP支持多达20多种图像格式和TWAIN接口,接受一般扫描仪、数码相机等图像输入设备采集的图像。PHOTOSHOP支持多图层的工作方式,只是PHOTOSHOP的最大特色。使用图层功能可以很方便地编辑和修改图像,使平面设计充满创意。利用PHOTOSHOP还可以方便地对图像进行各种平面处理、绘制简单的几何图形、对文字进行艺术加工、进行图像格式和颜色模式的转换、改变图像的尺寸和分辨率、制作网页图像等。2.CorelDRAW:一种基于矢量绘图、功能强大的图形图像制作与设计软件。位图式图像是由象素组成的,与其相对,矢量式图像以几何、色彩参数描述图像,其内容以线条和色块为主。可见,采用不同的技术手段可以满足用户的设计要求。位图式图像善于表现连续、丰富色调的自然景物,数据量较大;而矢量式图像强于表现线条、色块的图案,数据量较小。合理的利用两种不同类型的图像表现方式,往往会收到意想不到的艺术效果。CorelDraw是2第3章图像变换3.1二维傅里叶变换的分离性有什么实际意义?解:该性质表明,一个二维傅里叶变换可由连续两次一维傅里叶变换来实现。实现的方法如下图所示:3.2图像处理中正交变换的目的是什么?图像变换主要用于那些方面?解:正交变换可以使得图像能量主要集中分布在低频率成分上,边缘和线信息反映在高频率成分上。因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像编码压缩和形状分析等方面。3.3在MATLAB环境中,实现一幅图像的傅里叶变换。解:MATLAB程序如下:A=imread('rice.tif');imshow(A);A2=fft2(A);A2=fftshift(A2);figure,imshow(log(abs(A2)+1),[010]);3.4利用MATLAB对一幅512×512的图像进行DCT变换,并保留256×256个DCT变换系数进行重构图像,比较重建图像与原始图像的差异。解:MATLAB程序如下:RGB=imread('pout512.bmp');I=rgb2gray(RGB);J=dct2(I);J(1:512,256:512)=0;J(256:512,1:256)=0;K=idct2(J);imshow(I),figure,imshow(K,[0255])3.5离散的沃尔什变换与哈达玛变换之间有那些异同?解:哈达玛(Hadamard)变换和沃尔什(Walsh)变换的变换核都是由1,-1组成的正交方阵。它们不同的地方在于变换矩阵的行列排列次序不同。哈达玛变换每行的列率排列是没有规则的,沃尔什变换的列率是由小到大。43.6求N=4对应的沃尔什变换核矩阵。⎡1111⎤⎢⎥解:H=⎢11−1−1⎥⎢1−1−11⎥⎣1−11−1⎦⎡1⎢解:⎢1⎢⎣1图a01⎤⎥11⎥01⎥⎦k01234567rk01727374757671nk560920104670535626717072k01234567rk01727374757671nk560920104670535626717072pr(rk)0.140.220.260.170.090.070.040.02′Sk0.140.360.620.790.880.950.991″Sk1737476767111Sk173747671nsk56092010461061509pr(sk)0.140.220.260.260.13解:直方图均衡中:s=T(r)r=∫0pr(r)drkWk=T(Skkn)=∑sii=0n=∑nii=0n⎥⎡1H==1⎢18⎢⎢⎣111⎤01⎥,高通算子取3×3矩阵,即:11⎥⎦表a⎢⎥⎡−1H=⎢−1⎢⎣−1−1−1⎤8−1⎥−1−1⎥⎦11345221/826/835/85222/825/832/85329/827/825/8245411113452-136552215053-13-4-12454115.3数据没有冗余度能否压缩?为什么?答:图像数据量大,同时冗余数据也是客观存在的。一般图像中存在着以下数据冗余因素:(1)编码冗余;(2)像素间的相关性形成的冗余;(3)视觉特性和显示设备引起的冗余。理论上,数据没有冗余度是不压缩的,否则无法解码出原始数据。但在大部分应用场合下采用有损压缩,数据没有冗余度也可以进行压缩。5.4如何衡量图像编码压缩方法的性能?答:一般地,图像压缩应能做到压缩比大、算法简单、易于用硬件和软件实现、压缩和解压缩实时性好、解压缩恢复的图像失真小等。但这些指标对同一压缩方法很难统一,在实际系统中往往需要抓住主要矛盾,全面权衡。常用的图像压缩技术指标有:(1)图像熵与平均码长;(2)图像冗余度与编码效率;(3)压缩比;(4)客观评价SNR;(5)主观评价。图像的主客观两种评价之间存在着密切的联系。但一般来说,客观评价高的主观评价也高,因此在图像编码的质量评价时,首先作客观评价,以主观评价为参考。5.5一图像大小为640×480,256色。用软件工具SEA(version1.3)将其分别转成24位色BMP,24位色JPEG,GIF(只能转成256色)压缩格式,24位色TIFF压缩格式,24位色TGA压缩格式,得到的文件大小分别为:921,654字节;17,707字节;177,152字节;923,044字节;768,136字节。分别计算每种压缩图像的压缩比。解:不计算较小的文件头和彩色查找表(LTU)的数据量,原始图像的数据量为:640×480×1byte=307,200byte。经转换后各种格式的压缩比如下:24位色BMP格式:307,200/921,654=0.333(增加了冗余度)24位色JPEG格式:307,200/17,707=17.35GIF压缩格式:307,200/177,152=1.7324位色TIFF压缩格式:307,200/923,044=0.333(增加了冗余度)24位色TGA压缩格式:307,200/768,136=0.400(增加了冗余度)5.6大部分视频压缩方法是有损压缩还是无损压缩?为什么?答:视频比静态图像数据量更大,同时可压缩的冗余信息更多。大部分视频压缩方法是以人眼感觉无明显失真为依据的,因此采用有损压缩。事实上,视频可以看成是一幅幅不同但相关的静态图像的时间序列。因此,静态图像的压缩技术和标准可以直接应用于视频的单帧图像。另外,利用视频帧间信息的冗余可以大大提高视频的压缩比。5.7若图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相等,能够说明上述两种情况下像素相关吗?为什么?答:不能。像素的空间相关性和时间相关性是以空间和时间的相邻性为基础的。因此,图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相等带有偶然性,不能说明两像素相关。5.8根据JPEG算法说明JPEG图像显示时会出现马赛克现象的原因。答:由于JPEG算法将整幅图像分成若干个8×8的子块,解码也是以子块为单位的,所以块间的解码误差可能反映为方块效应,在视觉上会出现马赛克现象。105.9讨论混合编码的优点。答:混合编码一般指将预测编码与变换编码相结合进行编码的方法。预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,可以发挥两种编码方法的优点,取得更好的效果。5.10有了离散傅里叶及其快速算法FFT,为什么还要提出离散余弦算法DCT及其快速算法?为什么许多视频国际标准将DCT作为帧内编码的基本压缩算法?答:在所有的变换编码方案中,离散K-