第二章-数字图像表示及其处理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

图像处理与模式识别ImageProcessingandPatternRecognition版权所有:钱瑛OutlineofLecture2•人眼视觉特性•色度学与彩色模型•图像的数字化•数字图像的基本类型•图像的文件格式•图像的输入•图像的存储与输出人眼视觉特性人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围。最外层是坚硬的蛋白质膜,其中,位于前方的大约1/6部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。其余5/6为白色不透明组织,称为巩膜,作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来调节,以控制进入眼睛内部的光通量大小,其作用和照相机中的光圈一样。最内一层为视网膜,它的表面分布有大量光敏细胞。除了三层薄膜,在瞳孔后面还有一个扁球形的透明水晶体。水晶体的作用如同可变焦距的一个透镜,它的曲率可以由睫状肌的收缩进行调节,从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。用眼睛看建筑物侧面的图解,C点是晶状体的光心视觉低级感知层次视觉系统从外界获取图象,就是在眼睛视网膜上获得周围世界的光学成象,然后由视觉接收器(杆状细胞和锥状细胞在视网膜上作为视觉接收器),将光图象信息转化为视网膜的神经活动电信息,最后通过视神经纤维,把这些图象信息传送入大脑,由大脑获得图象感知。100m15m2.55mm17mm中心凹(成像区)x/17=15/100x=2.55mm视网膜上有杆状细胞和锥状细胞两类视觉接收器:杆状细胞(Rods):细长而薄,数量上约7500万~1亿5000万,它们提供暗视,即在较低数量级亮度时的视觉响应,其光灵敏度高。锥状细胞(Cons):结构上短而粗,数量少,约600万~700万,光灵敏度较低,它们提供昼视,其响应光亮度范围比杆状细胞要高5~6个数量级。在中间亮度范围是两种视觉细胞同时起作用。锥状细胞集中分布在视网膜中心小凹里。•人类视觉系统在对物体的识别上有特殊强大的功能;但在对灰度、距离和面积的绝对估计上却有某些欠缺;•以传感器单元的数目比较:视网膜包含接近1亿3000万至1亿5000万个光接收器,这远远大于一般数字成像系统CCD片上的传感器单元数;•和它每次执行运算的数目比较:和计算机的时钟频率相比,神经处理单元的开关时间将比之大约慢104倍;•总体而言,人类的视觉系统还是比计算机视觉系统要强大得多。它能实时分析复杂的景物以使我们能即时的反应。假设一个平面如磨砂玻璃一样散光,被1个强度为I且可以变化的光源从背后照亮,1个照度增量为△I,像短促闪光一样加在均匀照明的平面上,可使人感到平面中间像1个圆形亮点,如图所示如果△I不够亮,实验者没有感知上的变化,当△I逐步增强,感知上发生变化。如果50%的机会感知亮度变化,则量△I50/I为韦伯率,小的韦伯率表示可区分强度的小变化,有较好的亮度区分能力;大的韦伯率表示只有大的强度变化才能区分,有较差的亮度区分能力•亮度适应性人眼视觉系统对亮度的响应具有对数性质,是单调的非线性系统。实验证明,这一非线性接近1/3的幂指数函数。人眼通过这一对数性质,达到宽达108的视觉亮度范围。但在固定背景光的条件下,适应范围并不宽,约几十个灰度级。眼睛对光强的响应是非线性的。一块光强为I+∆I的小块被背景强度I所包围,则可觉察的差值∆I是I的函数,即对视觉敏感的是对比度,而不是亮度值本身。韦伯定理:如果一个物体的亮度与其周围背景I有刚刚可觉察得到的差别,则它们的比值是I的函数。其在一定的亮度范围内,近似不变,为常数值0.02,这称为韦伯比。即:∆I/I=0.02(常数)视觉范围是指人眼所能感觉到的亮度范围。这一范围非常宽,大约从百分之几cd/m2到几百万cd/m2。事实上,在人眼适应了某一平均的亮度环境之后,它能感受的亮度范围要小得多。即使是客观上相同的亮度,当平均亮度不同时,主观感觉的亮度也不相同。603602(分)Ld人眼分辨率)(Ld3438分即马赫带效应人眼对于图像上不同空间频率的成分具有不同的灵敏度。视觉系统对空间高频和空间低频的敏感性较差,而对空间中频则有较高的敏感性,因而在亮度突变处产生亮度过冲现象,这种过冲对人眼所见的景物有增强其轮廓的作用。每个条带内部的亮度是常数,但仍然有强烈的边缘效应色度学与彩色模型•光波:光是一种按波长辐射的电磁波。–光的物理性质:波长(光速,频率)和幅度–下页图:可见光谱•颜色–视觉系统对可见光的感知•视网膜上锥状光敏细胞:光强与颜色。•视网膜上杆状光敏细胞:光强。–颜色度量:色调、亮度、饱和度•色调——波长•亮度——幅度•饱和度——色光的纯度500600紫400700750紫蓝蓝蓝绿绿绿黄黄橙橙红红350可见光0.005nm5nm350nm750nm0.4mmγ射线χ射线紫外线红外线无线电波0.01nm10km电磁波波长范围很大,使人产生视觉,感到明亮和颜色的电磁波叫可见光。可视光区的波长在400nm~700nm,当光谱采样限制到三个人类视觉系统敏感的红、绿、蓝光波段时,对这三个光谱带的光能量进行采样,就可以得到一幅彩色图像。•色调Hue:人眼感觉到物体反射或发射光波的波长。色调就是颜色的分类。如–七色:红、橙、黄、绿、青、蓝、紫–在色谱中,色调连续变化。•饱和度Saturation:指颜色的纯正程度。–与亮度有关:某一色调参入白光,色调不变但饱和度降低–与参入其它颜色的光有关:饱和度与色调都会改变。•亮度Intensity:人眼感受到的颜色的光的强度–同一种色块,在不同强度的白光照射下,反射的光波波长一样(色调相同),但人眼感觉到的颜色不同。–某一颜色的光,量度很弱,趋于黑色,反之,趋于白色。彩色的表示彩色的表示是基于TomasYoung提出的三基色原理:•“任何彩色可以用合适的三种基本色混合而再生”。•生理学已证明,视网膜中有三种视锥体,具有不同的吸收光谱,SR(λ),SG(λ),SB(λ)其中:λMIN≤λ≤λMAX、λMIN≈400nm、λmax≈780nm•吸收光谱响应的峰值分别在光谱的红、绿、兰区域。而且,吸收曲线有相当多的部分是相互重叠的。这是三基色原理的生理基础。人眼中红绿蓝锥状体的波长吸收函数国际照度委员会(CIE)在1931年规定3种基本色的波长为:R:700nm,G:546.1nm,B:435.8nm三基色相加混色:红、绿、兰三基色(RGB)三基色相减混色:黄、青、品红(CMY)设组成某种颜色C所需的三个刺激量分别用R、G、B表示每种刺激量的比例系数为r、g、b,有1bgrBGRBbBGRGgBGRRrgGbBrGC有:1931年CIE根据此原则制定了一个色度图:舌型图•每一点对应一种颜色•边界点代表纯颜色•任意两点连线表示线上的颜色可由两点颜色混合形成•任意三点形成的三角形内的颜色可由三点颜色混合形成•R、G、B各用一个字节可表示:28x28x28=1677万色–RGB全为1为白色–RGB全为0为黑色–RGB数值相等为灰色–RGB哪个数值大就偏向哪种颜色RGB彩色模型也称为彩色空间或彩色系统,是描述色彩的一种方法。目前表达颜色的彩色模型有许多种,它们是根据不同的应用目的而提出的。在数字图像处理中,实际上最常用的彩色模型是RGB(红、绿、蓝)模型,HSI(色调、饱和度、亮度)模型。前者主要用于彩色显示器和彩色视频摄像机;后者则更符合人类描述和解释颜色的方式。彩色模型在RGB模型中,每种颜色出现在红、绿、蓝的原色光谱分量中,这个模型基于笛卡尔坐标系统。图中R、G、B位于3个角上;青、深红和黄位于另外三个角上,黑色在原点处,白色位于RGB彩色模型离原点最远的角上。在该模型中,灰度等级沿着主对角线从原点的黑色到点(1,1,1)的白色分布。黄(1,1,0)黑(0,0,0)绿(0,1,0)青(0,1,1)蓝(0,0,1)品红(1,0,1)白(1,1,1)红(1,0,0)彩色模型HSI(Hue,Saturation,Intensity)颜色空间–HSI能减少彩色图像处理的复杂性。–合乎人对彩色的认识:色彩:色调、饱和度亮度:非彩色属性,对应黑白图像的灰度。HIS彩色模型——双三棱锥模型形(74年)这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。I:双三棱锥中心线;表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其颜色是什么。H:表示色度,由角度表示。反映了该颜色最接近什么样的光谱波长。0o为红色,120o为绿色,240o为蓝色。0o到240o覆盖了700nm~435.8nm的可见光谱颜色,240o到360o是400nm~435.8nm的可见光谱颜色。S:饱和度,饱和度参数是沿双棱锥中心线垂直方向到彩色点的长度。在双棱锥的外表面是纯的或称饱和的颜色,其饱和度值为1。在中心是中性(灰色)影调,即饱和度为0。HIS彩色模型彩色模型之间的转换RGB到HSI的彩色变换:)(31BGRI)],,[min()(31BGRBGRS]360,180[HH360H,BG],180,0[H,BG)]BG)(BR()GR[(2/)]BR()GR[(arccosH2/12使时时HSI到RGB的转换:由HIS到RGB的转化公式有些不同,它取决于要转换的点落在原始色所分割的哪个扇区。色度学与彩色模型RGB模型HIS模型图像的数字化一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即:I=(x,y,z,λ,t)。当一幅图像为平面单色静止图像时,空间坐标变量z,波长λ和时间变量t可以从函数中去除,一幅图像可以用二维函数f(x,y)来表示:f(x,y)=i(x,y)r(x,y)这里0i(x,y)0r(x,y)1反射分量限制在0和1之间。i(x,y)的性质取决于照射源,而r(x,y)取决于成像物体的特性。数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个步骤:扫描、采样和量化。采样采样(Sampling):对图像空间坐标的离散化,它决定了图像的空间分辨率。用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个亮度取平均值,作为该小方格中点的值;或者把方格的交叉点处模拟图像的亮度值作为该方格交叉点上的值。采样行采样列像素行间隔采样间隔图像的采样分辨率分辨率是指映射到图像平面上的单个像素的景物元素的尺寸。单位:像素/英寸,像素/厘米(如:扫描仪的指标300dpi)或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。单位:像素*像素(如:数码相机指标30万像素(640*480))常用的几种分辨率•屏幕分辨率(screenresolution)也称光栅分辨率,CRT在水平和垂直方向上能显示的最大光点数。•显示分辨率(displayresolution)计算机显示控制器所能提供的显示模式。•图象分辨率(imageresolution)每英寸图象含有多少个象素点。图象尺寸大小、图象分辨率、图象文件大小分辨率(续)•位分辨率(bitsresolution)也称位深,用来衡量每个象素存储的信息位数。如2位、8位、24位。•输出分辨率(outputresolution)打印机等输出设备每英寸所产生的点数(dpi)。以多大的采样间隔进行采用为好?取样与量化•点阵采样的数学描述ij)yjy,xix()y,x(SjIIP)yjy,xix()y,x(f)y,x(S)y,x(f)y,x(fj)yjy,xix()yj,xi(f取样与量化•点阵采样的的耐奎斯特准则

1 / 73
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功