数字图像处理DigitalImageProcessing合肥工业大学理学院信息与计算科学系二零零九年内容提要八周教学内容依次如下:第1、2章绪论、图象处理的基本概念。第3、4章空域和频域变换第5、8章图象增强和图象复原。第6章图象编码第7、9章图象分割和形态学。第10章其他第1章绪论1.1从图象到图像工程–图象和数字图象–图象技术和图象工程–相关学科和领域1.2图象处理和分析–图象处理和分析系统–图象采集、显示、存储、通讯、处理和分析模块图象处理图象分析图象理解抽象程度数据量图象基础1.1.1图象和数字图象•什么是图象?图象(image)是泛指照片、动画等等形成视觉景象的事物。图象与计算机图形学中的图形的区别是:计算机图形学是从建立数学模型到生成图形,而图象通常是指从外界产生的图形。客观世界是三维空间,但一般图象是二维的。二维图象在反映三维世界的过程中必然丢失了部分信息。即使是记录下来的信息也可能有失真,甚至于难以识别物体。因此,需要从图象中恢复和重建信息,分析和提取图象的数学模型,以至于形成人们对于图象记录下的事物有正确和深刻的认识。这个过程就成为图象处理过程。1.1从图象到图像工程•为什么需要数字图象(digitalimage)?普通图象包含的信息量巨大,需要使用计算机对图象进行处理。因此,需要把普通图象转变成计算机能处理的数字图象。现在的数码相机可以直接地把视觉图象变成数字图象。数字图象类似于光栅图形,由有限行和有限列组成。每个基本单元叫做一个象素(pixel)。三维图象的象素又叫做体素(voxel)。通常的二维数字图像是一个矩型,可以用一个二维数组I(x,y)来表示,其中x,y是二维空间中的某坐标系的坐标,I(x,y)表示图像在该点处的灰度值等性质。彩色可以是红绿蓝三个单色的一定灰度值的合成。一般来说,这些坐标和灰度值是实数,不仅依赖于坐标系的选取,而且依赖于灰度值的度量单位。但是,数字计算机只可能表示有限字长的有限个数字。所以必须把灰度值离散化。简单地说,数字图象等同于一个整数值的有限矩阵。数字图像是数字图像处理和分析的对象。左边的图象是图象处理技术中常用来检验计算机算法的实际效果的标准图象。这幅图象的名称是lenna。它是由一组数字组成的。原图象的宽和高都是256个象素,每象素有八位。它在BMP格式下有约66K字节的大小。•数字图象处理的简史数字图象的产生远在计算机出现之前。最早有电报传输的数字图象。六、七十年代,随着计算机硬件的发展和快速傅立叶变换算法的发现使得用计算机能够处理图象。八十年代开始处理三维图象,九十年代以来,随着计算机性能的大幅提高和广泛使用,图象处理技术已经涉及社会的各个角落。图象逐渐在传播媒体中占据了主导地位,产生的许多的新行业新商机。未来图象处理的发展是不可限量的。数字图象处理属于计算机科学,但是它的90%依赖于数学。从这个特点来看,对于本专业的学生来说,数字图象处理技术是一个十分理想的发展方向。1.1.2图象技术和图象工程•哪些属于图象技术?图象技术是与图象有关部门的技术的总称。它是一类综合技术工程。它包括图象的采集、获取、编码、存储和传输、图象的生成、显示和输出、图象的变换、增强、恢复和重建、图象的分割、目标的检测、表达和描述、特征的提取、图象的分类、识别、图象模型的建立和匹配、图象和场景的理解。狭义的数字图象处理是指图象的增强、恢复和重建,操作的对象是图象的象素,输出的是图象。•什么是图像工程?(广义的数字图像处理)它是由图像处理、图像分析和图像理解三个系统所组成。图像处理包括图像采集和从图像到图像的变换,以改善主观的视觉效果和为图像分析和图像理解作初步的处理。图像分析是从图像中取出感兴趣的数据,以描述图像中目标的特点。图像理解是在图像分析的基础上研究各目标的性质和相互关系,以得出图像内容的理解和对原场景的解释。图像处理、图像分析和图像理解是处在从低到高的三个不同的抽象程度上的过程。本课程着重于图像处理和分析系统。图像处理图像理解图像分析抽象程度数据量图像数据符号1.1.3相关学科和领域•图象工程是一门系统地研究各种图象理论、技术和应用的交叉学科。从它的研究方法看,它与数学、物理学、生物学、心理学、电子学、计算机科学可以互相借鉴,从它的研究范围看,它与模式识别、计算机视觉、计算机图形学等学科交叉。1.2图象处理和分析1.2.1图象处理和分析系统图像处理和分析系统包括如下模块:图像采集模块、图像显示模块、图像存储模块、图像通讯模块和图像处理和分析模块。1.2.2模块•图象采集模块CCD•图象显示模块CRT,LCD•图象存储模块内存、帧缓存、硬盘•图象通讯模块LAN、WAN•图象处理和分析模块图象文件的数据结构一个完整的图象处理程序的基本功能有:打开图象文件、显示图象、对图象文件进行指定的处理、存储图象文件。由于图象文件比较大,通常需要在储存前进行压缩。所以打开和存储图象文件涉及到文件的格式。•图象文件的格式图像文件指包含图像数据的文件。文件内除图像数据本身以外,一般还有图像的描述信息,以便图像的读取和显示。表示图像常用矢量形式或光栅形式。矢量形式中图像用一系列线段或线段的组合体来表示,线段的灰度可以不同,组合体的各部分可用不同的灰度来填充。矢量形式文件中有一系列的命令和数据,执行的结果是画出图像来。图像数据文件主要是用光栅形式,即图像是一些图像点的集合,比较适合变化复杂的图像。它的主要缺点是缺少对象和像素点之间的联系,且在伸缩图像的过程中图像会改变。例如,常见的图象文件类型有bmp,jpg等等。图象处理的程序必须考虑图象文件的格式,否则无法正确地打开和保存图象文件。pgm格式美国的许多大学用pgm格式,避免使用压缩文件格式,对初学者来说是很方便的。下面是一幅该格式的图象。这是一幅pgm格式的彩色照片这是pgm格式彩色照片16进位制部分代码。原代码是不分行的字符串。这里写成分行的形式(注意:LF=换行;SP=空格;#=注解行):0x500x350x0A表示P5(LF);0x230x200x200x49…0x0A表示#(SP)(SP)I…(LF);0x360x340x300x200x340x380x300x0A表示640(SP)480(LF);0x320x350x350x0A表示255(LF)0x270x27…表示23,23,…(像素灰度值)……………………………………………………………………这幅图象文件的解码:P5#ImportedfromSUNimage:LEGGO_HOUSE_1.0.intensity6404802550x270x270x270x270x270x270x270x270x270x270x270x270x270x260x270x270x270x280x270x270x270x270x270x270x270x270x270x270x270x270x270x270x270x270x270x260x270x260x270x280x270x270x260x270x270x270x280x270x270x270x270x270x270x280x280x270x280x290x280x270x280x280x280x270x270x270x270x270x270x270x280x270x280x280x280x280x280x280x280x280x280x290x290x290x280x280x280x28………………………………………………………………...pgm格式的数字图像文件是美国计算机科学专业图像处理教学和研究的常用格式,虽然文件体积比较大,但是像素直接与数字相联系,易于检查和修改。它由两部分组成:1、第一部分是文件头,它由若干行组成:•第一行说明文件的类型,例如,P2(表示黑白图像)或P5(表示彩色图像);•接着是以#开头的注解行,在软件打开图像时不执行注解行,可以没有注解行,或有多个以#开头的注解行;•注解行后的第一行指定数字图像的大小,例如,640480(宽640个像素,高480个像素,中间有一个空格);•接下来的一行指定图像的灰度等级,例如,255。各行的结尾没有标点符号。2、第二部分是不再分段的位图列阵,例如,在256灰度的场合,P2类型是一个像素一个字节(8位),P5类型是一个像素三个字节(R、G、B各8位)。bmp(Bitmap)格式•BMP(Bitmap-File)图形文件是Windows采用的图形文件格式,在Windows环境下运行的所有图象处理软件都支持BMP图象文件格式。Windows系统内部各图像绘制操作都是以BMP为基础的。•Windows3.0以前的BMP图文件格式与显示设备有关,因此把这种BMP图象文件格式称为设备相关位图DDB(device-dependentbitmap)文件格式。•Windows3.0以后的BMP图象文件与显示设备无关,因此把这种BMP图象文件格式称为设备无关位图DIB(device-independentbitmap)格式(注:Windows3.0以后,在系统中仍然存在DDB位图,象BitBlt()这种函数就是基于DDB位图的。bmp(Bitmap)格式bmp格式又称位图文件。由三部分组成:位图文件头、位图信息和位图列阵。位图文件头有54个字节长,它给出文件的类型、大小和位图的起始位置等。位图信息给出图像的长、宽和每个像素的位数(1,4,8,24)、压缩方法、目标设备的水平和垂直分辨率。位图列阵给出原始像素的值。另外,有一些常用的压缩文件格式,如:GIF(8位)、TIFF、JPEG等等。下面是一个Matlab程序%打开蝴蝶图象,进行Fourier变换h=imread('butterfly.jpg');%openanimagefigure;imshow(h);%因为图像的格式uint8不能做加减法,%所以需要把格式uint8变成格式doubleh=double(h);[m,n,p]=size(h);hf=fftshift(fft2(h));%2DFourier变换,得到2D复数值图像hfa=log(abs(hf));%模的图像,用log来调整灰度的对比度%求出模的灰度最大值,从而把其灰度的值域变为[0,255]m=max(max(max(hfa)));hfa=hfa*255/m;figure;imshow(uint8(hfa));Imwrite(uint8(hfa),’butterfly_fft.jpg’,’jpg’);补充:图象和视觉基础2.1概论和综述2.2人眼与亮度视觉2.3颜色视觉2.4光度学和成象模型2.5成象变换2.6采样和量化2.7象素间联系2.8算术和逻辑运算2.9坐标变换第2章图象和视觉基础2.1概论和综述该基础包括视觉基础、成像基础和图像基础三部分:•视觉基础(人眼与亮度视觉,颜色视觉)•成像基础(模型、几何和采样量化)•图像基础(像素间联系、图像运算和图像坐标变换)注意:视觉:指光对感官的刺激和视觉系统的感觉。视知觉:指如何通过视觉形成关于外部世界的表象。2.2人眼与亮度视觉2.2.1人眼成象人的眼球是一个复杂的视觉器官。眼球的前部有晶状体,相当于照相机的镜头。眼球内侧的后部有视网膜。视网膜表面分布着两种感光细胞:锥细胞和柱细胞。眼内有六、七百万的锥细胞,它们对明亮的光和颜色很敏感。人眼借助于锥细胞来区分细节,因为每个锥细胞都连到神经末梢。锥细胞的视觉称为适亮视觉。眼内有75万到150万柱细胞。它们分布面大,且几个柱细胞连到一个神经末稍。分辨率低,主要提供整体视觉印象。虽然它们对颜色不敏感,但是对弱光较敏感。柱细胞的视觉称为适暗视觉。视网膜的中心是中央凹,面积约1.51.5mm2,锥细胞的密度达到150000个/mm2,是眼内最敏感的区域。人眼的构造人眼成像锥细胞和柱细胞的密度和分布2.2.2亮度适应和区分•主观亮度和主观适应性由于数字图象以客观亮度显示图象,人眼以主观亮度感受取得视觉,所以人眼的亮度适应性影响了图象处理的结果。人眼的视觉系统能适应的光的亮度等级从可以看见的昏暗到眩