第五章数字图像基础概述:•图像数据压缩有两个基本依据:一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;利用的压缩技术是无损压缩技术,另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的。利用有损压缩技术。•实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。5.1视角系统对颜色的感知•颜色是视觉系统对可见光的感知结果。•可见光是波长在380nm~780nm之间的电磁波•研究表明,人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑。视觉系统对颜色的感知特性•眼睛本质上是一个照相机人的视网膜(humanretina)通过神经元来感知外部世界的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏感的杆状体(rod)。•红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同人们可以使用数字图像处理技术来降低数据率而不使人感到图像质量明显下降。视觉系统对颜色和亮度的响应特性产生波长不同的光所需三基色•自然界中的任何一种颜色都可以由R,G,B这3种颜色值之和来确定•图中的纵坐标表示标称单位光强度,横坐标表示波长,负值表示某些波长(即颜色)不能精确地通过相加混色得到。使用等量的三基色可匹配等能量的白光。5.2彩色图象的颜色模式•一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型;•一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型。相加颜色模式•显示彩色图像用RGB相加混色模型•颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)相加颜色模式•当三基色等量相加时,得到白色;等量的红绿相加而蓝为0值时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。图象的相加色•一幅彩色图像可以看成由许多的点组成的•每个像素都有一个值,称为像素值,它表示特定颜色的强度。•一个像素值往往用R,G,B三个分量表示颜色相加列表RGB颜色000黑001蓝010绿011青100红101品红110黄111白标准的电视图形阵列适配卡的16色代码RGBHSL颜色000016000黑(Black)10012816024060蓝(Blue)2012808024060绿(Green)3012812812024060青(Cyan)412800024060红(Red)5128012820024060品红(Magenta)612812804024060褐色(Darkyellow)71921921921600180白(Lightgray)81281281281600120深灰(DarkGray)标准的电视图形阵列适配卡的16色900255160240120淡蓝(Lightblue)100255080240120淡绿(Lightgreen)110255255120240120淡青(Lightcyan)12255000240120淡红(LightRed)132550255200240120淡品红(LightMagenta)14255255040240120黄(yellow)152552552551600240高亮白(Brightwhite)注意:色调-饱和度-亮度(hue-saturation-lightness,HSL)颜色模型CMY相减混色模型•用彩色墨水或颜料进行混合,这样得到的颜色称为相减色。•任何一种颜色都可以用三种基本颜料按一定比例混合得到。•这三种颜色是青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型。•减少了为视觉系统识别颜色所需要的反射光CMY相减色•在相减混色中,当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。相减色列表青色品红黄色相减色000白001黄010品红011红100青101绿110蓝111黑相减色与相加色之间关系相加混色相减混色生成的颜色RGBCMY000111黑001110蓝010101绿011100青100011红101010品红110001黄111000白RGB与CMYK间关系彩色空间的线性变换标准•为使用人的视角特性以降低数据量,通常把RGB空间表示的彩色图像变换到其他彩色空间。•目前采用的彩色空间变换有三种:YIQ,YUV和YCrCb。每一种彩色空间都产生一种亮度分量信号和两种色度分量信号,而每一种变换使用的参数都是为了适应某种类型的显示设备。•YIQ适用于NTSC彩色电视制式,YUV适用于PAL和SECAM彩色电视制式,而YCrCb适用于计算机用的显示器。YUV与YIQ•YIQ模型,其中的Y表示亮度,I、Q是两个彩色分量。•YUV模型,Y表示亮度,UV用来表示色差,U、V是构成彩色的两个分量;YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。可用于对单色图分别进行编码。•YUV表示法的另一个优点是可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YUV利于数据压缩,依据是?YUV与RGB彩色空间变换–Y=0.299R+0.587G+0.114B–U=-0.147R-0.289G+0.436B–V=0.615R-0.515G-0.100BYIQ与RGB彩色空间变换–Y=0.299R+0.587G+0.114B–I=0.596R-0.275G-0.321B–Q=0.212R-0.523G+0.311BYCrCb与RGB彩色空间变换–Y=0.299R+0.578G+0.114B–Cr=(0.500R-0.4187G-0.0813B)+128–Cb=(-0.1687R-0.3313G+0.500B)+1285.4图象的三个属性•图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等。•显示分辨率是指显示屏上能够显示出的像素数目•图像分辨率是指组成一幅图像的像素密度的度量方法。•图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为640×480,那末一幅320×240的图像只占显示屏的1/4;像素深度•像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16777216种颜色中的一种。•在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加1位或几位作为属性(Attribute)位。例如,RGB5∶5∶5表示一个像素时,用2个字节共16位表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而图像深度为15位。真彩色、伪彩色与直接色•真彩色(truecolor)–真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。•伪彩色–伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(colorlook-uptable,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。•直接色–每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。真彩色和伪彩色图像之间的差别5.5图象种类•矢量图和位图–计算机包含两种类型的图形格式:矢量图(VectorBasedImage)和位图(BitMappedImage)。–矢量图(图形):主要用于工程图、白描图、图例、卡通漫画和三维建模等。由图形应用程序创建,在数学上定义为一系列由线连接的点,其内部表示为单个的线条、文字、圆、矩形、多边形等图形元素。每个图元称为对象,可以用一个代数式来表达,并且是一个独立的实体,具有颜色、形状、大小和屏幕位置等属性。–通过软件,矢量图很容易转化为位图,而位图转化为矢量图则需要复杂而庞大的数据处理。2.位图(图像):•是直接量化的原始图像信号形式,图像的最小单位是像点,用于表现自然影像。像素点由若干个二进制位进行描述,二进制位代表像素点颜色的数量,二进制位与图像之间存在严格的“位映射”关系,具有位映射关系的图叫作“位图”。•位图与矢量图的不同点:–1)位图的容量一般较大,与图的尺寸和颜色有关;矢量图一般较小,与图的复杂程度有关。–2)位图的文件内容是点阵数据;矢量图的文件内容是图形指令。–3)位图的显示速度与图的容量有关;矢量图的显示速度与图的复杂程度有关。–4)从应用特点看,位图适于“获取”和“复制”,表现力丰富,但编辑较复杂;矢量图易于编辑,适于“绘制”和“创建”,但表现力受限。彩色图像●RGB——红、绿、蓝RGBRGBR数组—8bit表示(256阶梯)G数组—8bit表示(256阶梯)B数组—8bit表示(256阶梯)最大表示:28×28×28=224=16777216(16.7M)教学进程CMYK彩色图像●●CMYK青、品红、黄、黑CKMYC数组—8bit表示(256阶梯)M数组—8bit表示(256阶梯)Y数组—8bit表示(256阶梯)K数组—8bit表示(256阶梯)最大表示:28×28×28×28=232=4294967296(4294M)CMYK教学进程灰度图象•灰度图象是按照灰度的等级数目进行划分进行•如果灰度等级用8位表示,则灰度等级就是256级•如果灰度等级用1位表示,则称为单色图象单色图像●单色图像——色族单一的图像,但并非只有一种颜色的图像单色图像“二值”图像只有黑、白两色简单形式复杂形式“灰度”图像具有256级灰度●单色图像用途:简单形式——文本显示、木刻、版画效果的图像复杂形式——书籍用图片、报纸用图片●单色图像格式:TGA、JPG、TIF、PCX等教学进程JPEG压缩算法•由ISO和IEC两个组织联合组成的一个专家组,负责制定静态的数字图象数据压缩编码标准•可用于静态图象,也可以用于动态图象•基本压缩算法:–离散余弦变换:25:1没有区别–预测技术为基础的无损压缩算法–JPEG2000压缩算法:小波变换●压缩比——10:1~100:1(一般压缩比≯40:1)●压缩原理——采用无失真预测编码、有失真DCT编码等混合编码方式●无失真预测编码——线性预测编码,压缩比2:1●有失真DCT编码——[1]离散余弦变换压缩编码,压缩比40:1[2]霍夫曼编码(增强型编码)[3]自适应算术编码(增强型编码)●特点[1]压缩比可调[2]对CPU的响应速度要求不高[3]压缩算法复杂(可同时使用四种压缩编码方式)JPEG图像压缩算法JPEG图像压缩算法JPEG是有损压缩算法JPEG核心是“离散余弦变换(DiscreteCosineTransform,DCT)”JPEG压缩算法的基本步骤为:1、离散余弦变换DCTTransformation2、系数量子化CoefficientQuantization3、Huffman无损压缩LosslessCompression静态图象压缩原理图JPEG压缩的主要计算步骤•正向离散余弦变换(FDCT)。•量化(quantization)。•Z字形编码(zigzagscan)