第8章彩色图像处理及MATLAB实现8.1概述彩色对我们并不陌生,比如说日常生活中通过摄影相机用彩色胶卷所拍的照片。它是指用各种观测系统,以不同形式和手段,观测客观世界而获得的,可以直接和间接作用于人眼,进而产生视觉的实体。小到分子内部结构图片,大至宇宙星体照片,人类通过视觉识别文字、图片和周围环境,人的视觉系统就是一个观测系统,通过它得到的图像就是客观景物在人的心目中形成的影像。我们生活在一个信息时代,科学研究和统计表明,人类感知的外界信息,80%以上是通过视觉得到的,也就是从图像中获得。生活在色彩斑斓的世界中,人的视觉系统产生的图像多为彩色图像。对人类而言,对彩色图像信息的感知,具有至关重要的意义。彩色图像信息可以从科学和艺术两方面来理解。本章仅从科学角度讨论彩色图像信息处理,当然通过科学手段对彩色图像进行处理自然也可能使彩色图像更具有艺术效果。对彩色图像的科学处理,称为图像技术,也称为图像工程。内容非常丰富,根据抽象程度和研究方法等的不同可分为三个层次:彩色图像处理、彩色图像分析和彩色图像理解。彩色图像处理着重强调在图像之间进行的变换,彩色图像分析则主要是对彩色图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。彩色图像理解的重点是在彩色图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得到图像内容含义的理解,以及对原来客观场景的解释,从而指导和规划行为,彩色图像处理的最终研究目标为:通过二维彩色图像认识三维环境的信息。随着信号处理及计算机技术和彩色图像处理技术的发展,人们试图用摄像机获取环境彩色图像并转换成数字信号,用计算机实现人类对视觉信息处理的全过程,进而形成了一门新学科—计算机视觉,从而大大推动人工智能系统的发展,彩色图像处理技术是开发智能机器人的关键突破口,当前彩色图像技术已涉及人类生活和社会发展的各个方面,展望未来,彩色图像处理技术将能得到进一步发展和应用,从而改变人们的生活方式以及社会结构。本章第二节讨论人类彩色视觉系统有关知识,第三节讨论彩色图像处理,第四节讨论彩色图像分析。由于篇幅的关系,有关彩色图像理解的内容请参考有关计算机视觉的论著。8.2彩色视觉与彩色图像彩色图像处理的许多目标是帮助人更好地观察和理解图像中的信息,处理方案的选择和设计与信源和信宿的特征密切相关。所谓信源就是处理前或者处理后的图像,而信宿就是处理前后信息的接收者——人的视觉系统。因此了解图像特点和人的视觉系统对彩色的感知规律是十分必要的,本节将介绍有关这方面的内容,即色度学的知识。8.2.1彩色视觉人的视觉的产生是一个复杂的过程,除了光源对眼睛的刺激,还需要人脑对刺激的解释。即人的视觉系统是由眼球、神经系统及大脑的视觉中枢构成,人眼的形状为一球形,其平均直径约20毫米,这球形之外壳有三层薄膜,最外层是角膜和巩膜,最里层的膜是视网膜,它布满在整个后部的内壁上。视网膜可看做是大脑分化出来的一部分,其构造比其他感觉器官都要复杂,具有高度的信息处理机能。眼睛中的光感受器主要是视觉细胞,视网膜上存在不同的光感受器,即锥状细胞与杆状细胞。杆状细胞对彩色不敏感,锥状细胞具有辨别光波波长的能力,因此对彩色十分敏感,锥状细胞又分为对不同光谱(红、绿、蓝)敏感的三种细胞,对外膝体与大脑视觉皮层的分析表明,它们都有专门的区域从事彩色信息的处理与识别,这就是人类视觉系统的彩色信息通道。周围环境中的物体,在可见光的照射下,通过眼球的聚焦作用,在人眼的视网膜上形成彩色图像,通过人类视觉信息系统彩色信息通道各个环节的处理,使人获得彩色图像信息的感知觉。对彩色图像信息的感知觉就是人类的彩色视觉,彩色视觉是一种明视觉,常用亮度、色调和饱和度三个基本特性量来描述,称为彩色三要素。亮度是指彩色光所引起的人眼对明暗程度的感觉,亮度和照射光的强度有关。色调是指光的颜色,例如,红、橙、黄、绿……等都表示光的不同色调,改变色光的光谱成分,就会引起色调的变化。色饱和度是指色的颜色的深浅程度。如深红、淡红等等。色调和饱和度又合称为色度,它既表示色光颜色类别,又能表示颜色的深浅程度。8.2.2三色成像原理人眼视网膜中存在着对不同光谱(红、绿、蓝)敏感的三种锥状细胞,由这三种锥状细胞,人类产生自然界所有彩色的感知觉。科学实验与分析表明,自然界里常见的各种色光都可以由红、绿、蓝三种色光,按不同比例相配而成,同样,绝大多数色光也可以分解成红、绿、蓝三种色光。这便是色度学中的最基本原理—三基色原理。三基色的选择并不是惟一的,也可以选其他三种颇色为三基色。但是三种基色必须是相互独立的,即任何一种颜色都不能由其他两种颜色合成。由于人眼对红(R)、绿(G)、蓝(B)三种色光最为敏感,因此由这三种颜色所得的彩色范围最广,所以一般都选择这三种颜色作为基色。由三基色混配各种颜色的方法通常有两种,这就是相加混色和相减混色。由红、绿、蓝三基色进行相加混色的情况如下:红色+绿色=黄色红色+蓝色=紫色绿色+蓝色二青色红色+绿色+蓝色=白色称青色、紫色和黄色分别是红、绿、蓝三色的补色。由于人眼对于相同强度单色光的主观感觉不同,所以相同亮度的三基色混色时,如果把混色后所得的光亮度定为100%,那么,人的主观感觉是,绿光仅次于白光,是三基色中最亮的,红光次之,亮度约占绿光的一半,蓝光最弱,亮度约占红光的1/3。于是当白光的亮度用Y来表示时,它和红、绿、蓝三色光的关系便可用如下方程加以描述:Y=0.299R+0.587G+0.114B(8.2.1)这就是相加混色常用的量度公式。此式是根据NTSC(美国国家电视制式委员会)电视制式推得的,当采用PAL(相位逐行交变)电视制式时,公式形式为:Y=0.222R+0.707G+0.071B(8.2.2)两方程之所以不同,是因为所选取的显像三基色不同,三基色及其补色的亮度比例如图8.1所示。图8.1相加混色之三基色及补色亮度比例相减混色是利用颜料、染料等的吸色性质实现的。例如青布之所以呈现青颜色,是因为它用青色染料染过,而青色染料能吸收红色(青色的补色),在白光照射下,经吸收红色而反射青色,同样黄色颜料因有吸收蓝色的能力,所以在白光照射下,它是反射蓝色的补色——黄色。如果把青、黄两种颜料混合,那么在白光照射下,由于混合颜料吸收了红、蓝两色而反射绿色,所以混合颜料呈现绿颜色。由上例子可知,相减混合色是以吸收三基色的比例不同而配成不同的颜色的。由于红、绿、蓝三基色的补色分别是青色、紫色和黄色,所以,用吸收三基色的不同比例配色,也就是用青色、紫色和黄色颜料的不同比例配色,因此,也称青、紫色和黄色为颜色料三基色。在颜色料三基色混色情况下,可用如下公式描述:(青色+黄色)颜料=白色-红色-蓝色=绿色(青色+紫色)颜料=白色-红色-绿色=蓝色(黄色+紫色)颜料=白色-蓝色-绿色=红色(青色+黄色+紫色)颜料=白色-红色-绿色-蓝色=黑色可见,由颜料三基色相加,由于混合颜料吸收白色,而呈现黑色。本章彩色图像处理中,都是采用相加混色法。所以,今后我们所讨论的三基色,都是指红、绿、蓝三色。国际照明委员会(CIE)选择红色(波长λ=700.00nm),绿色(波长λ=546.1nm),蓝色(波长λ=435.8nm)三种单色光作为表色系统的三基色。这就是CIE的R、G、B颜色表示系统。由三基色原理可知,任何颜色都可由三基色混配而得到,为了简单又方便地描绘出各种彩色与三基色的关系,采用彩色三角形与色度图的表示方法。1931年CIE制定了1个色度图(如图8.2所示),用组成某种颜色的三原色的比例来规定这种颜色。图中横轴代表红色色系数,纵轴代表绿色色系数,蓝色系可由z=1-(x+y)求得。图中各点给出光谱中各颜色的色度坐标,蓝紫色在图的左下部。绿色在图的左上部,红色在图的右下部,连接400nm和700nm的直线的光谱上所没有的由紫到红的系列。通过对该图的观察分析可知:1)在色度图中每点都对应一种可见颜色,或说任何可见颜色都在色度图中占据确定的位置,即在(0,0),(0,1),(1,0)为顶点的三角形内。而色度图外的点对应不可见的颜色。2)在色度图中边界上的点代表纯颜色,移向中心表示混合的白光增加而纯度减少。到中心点C处各种光谱能量相等而显示为白色,此处纯度为零。某种颜色的纯度一般称为该颜色的饱和度。3)在色度图中连接任意2端点的直线上的各点表示将这2端所代表的颜色相加可组成的一种颜色。根据这个方法,如果要确定由3个给定颜色所组合成的颜色范围,只需将这3种颜色对应的3个点连成三角形,见图8.2。在该三角形中的任意颜色都可由这3色组成,而在该三角形外的颜色则不能由这3色组成。由于给定3个固定颜色而得到的三角形并不能包含色度图中所有的颜色,所以只用(单波长)3基色并不能组合得到所有颜色。图8.2色度图示意下面是一个色度图中一些点的3特征量值示例。图8.2中心的C点对应白色,由3原色各1/3组合产生。图8.2中P点的色度坐标为x=0.48,y=0.40。由C通过P画1条直线至边界上的Q点(约590nm),P点颜色的主波长即为590nm,此处光谱的颜色即Q点的色调(橙色)。图8.2中P点位于从C到纯橙色点的66%的地方,所以它的色纯度(饱和度)是66%。8.2.3彩色图像格式通过前面有关彩色视觉和三基色原理的介绍,了解到引起人类彩色视知觉的彩色图像有多种表示方法。下面介绍彩色图像的表示模式:1)RGB模式RGB是色光的彩色模式。R代表红色,G代表绿色,B代表蓝色,三种色彩叠加形成了其他的色彩。因为三种颜色都有256个亮度水平级,所以三种色彩叠加就能形成1670万种颜色了,也就是“真彩色”,通过它们足以再现绚丽的世界。在RGB模式中,由红、绿、蓝相叠加可以形成其他颜色,因此该模式也叫加色模式(CMYK是一种减色模式)。所有的显示器、投影设备以及电视等许多设备都是依赖于这种加色模式实现的。就编辑图像而言,RGB色彩模式也是最佳的色彩模式,因为它可提供全屏幕的24bit的色彩范围,即“真彩色”显示。但是,如果将RGB模式用于打印就不是最佳的了,因为RGB模式所提供的有些色彩已经超出了打印色彩范围之外,因此在打印一幅真彩的图像时,就必然会损失一部分亮度,并且比较鲜明的色彩肯定会失真的。这主要是因为打印所用的是CMYK模式,而CMYK模式所定义的色彩要比RGB模式定义的色彩少得多,因此打印时,系统将自动进行RGB模式与CMYK模式的转换,这样就难以避免损失一部分颜色,出现打印后的失真现象。2)CMYK模式CMYK是相减混色,主要用在印刷业,以打印在纸张上的油墨的光线吸引特性为基础,理论上,纯青色(C)、品红(M)和黄(Y)色素能够合成吸收所有颜色并产生黑色。实际上,由于油墨杂质的影响,只能产生一种土灰色,必须以黑色(K)油墨混合才能产生真正的黑色,因此,CMYK称为四色印刷,当所有四种分量值都是0%时,就会产生纯白色,其他颜色由相应百分比的CMYK值相减混色而得。CMYK模式是最佳的打印模式,RGB模式尽管色彩多,但不能完全打印出来。3)Lab模式Lab模式既不依赖于光线,又不依赖于颜料。它是CIE组织确定的一个理论上包括了人眼可见的所有色彩的色彩模式。Lab模式弥补了RGB与CMYK两种彩色模式的不足。Lab模式由三个通道组成,但不是R,G,B通道。它的一个通道是照度,即L。另外两个是色彩通道,用a和b来表示。a通道包括的颜色是从深绿(低亮度值)到灰(中亮度值),再到亮彩红色(高亮度值);b通道则是从紫蓝色(低亮度值)到灰(中灰度值),再到焦黄色(高亮度值)。因此,这种彩色混合后将产生明亮的色彩。在表达色彩范围上,处于第一位的是Lab模式,第二位的是RGB模式,第三位的是CMYK模式。Lab模式所定义的色彩最多,且与光线及设备无关,并且处理速度与RGB模式同样快,且比CMYK模式快数倍。因此,可以大胆地在图像编辑中使用Lab模式,而且,Lab模式保证在转换成CMYK模式时色彩没有丢失或被替代。因此,最佳避免色彩损失的方法是:应用Lab模式编辑图像,再转换成CMYK