数字图像处理第1章绪论提要1.1人眼的视觉1.2图像数字化1.3数字图像表达1.4数字图像质量34导论什么是数字图像处理?数字图像处理(DigitalImageProcessing)是一个迅速发展的专业领域。它的主要目的是将图像信号转换成数字信号并利用计算机对其进行处理和加工,以便提取图像中的信息。5这是什么图像?6什么是图像?图像?卡斯尔曼:一幅图像就是指某些事物的表示,并包含关于目标的描述性信息。你会如何定义?众所周知的事情正因为众所周知而不为人所知7什么是图像?图像的类型图像以各种不同的形式出现:数学上连续的、离散的是一种二维函数f(x,y),其中x,y是空间(平面)坐标,幅度f称为亮度或灰度物理上:某种物质或能量的分布可见的、不可见的8什么是数字图像处理处理连续的、离散的数字图像一个2D数字化采样值的方形阵列,只有数字图像才能用计算机处理以相等间隔采样的方形格栅模式(光栅以等幅度间隔量化9为什么要数字图像处理?应用需求图像是人们获取和交换信息的主要来源,因此数字图像处理的应用领域必然涉及人类生活和工作的方方面面。技术进步计算机:不断增长的性能和不断降低的价格图像数字化与显示设备的不断出现–数字相机,扫描仪,视频捕获设备,…–CRT,LCD,打印机,…10为什么要数字图像处理?具有的独特优势图像数字化,以便于图像的传输、打印和存储图像的增强和复原,改善图像质量图像的分割和描述,获得图像的信息大量图像的高速处理三维及更高维图像数据的测量和显示(如遥感图像和各种内脏器官及血管形状的测量与显示)2020/5/12为什么要数字图像处理•历史–the1950s:NASA,IC–the1960s:大型主机,CCD相机–the1970s:CT(ComputerizedTomography),LSI–the1980s:PC,VLSI,计算机视觉(ComputerVision)–the1990s:一系列图像压缩国际标准1112应用举例医学和生物学成像:CT,B超,磁共振…工业:机器视觉,自动控制,…空间:航空,导航,遥感(森林,环境,资源),…监控:视频监控,牌照识别,人脸识别,…军事:侦察,导航,声纳成像,…艺术……2020/5/12成像的能量源电磁能量谱:Gamma-射线,X-射线,紫外,可见光,红外,微波,无线电波;CT,MRI,EIT,PET声波与超声波:B超,声纳电子:电子显微镜计算机图形学1314Gamma射线成像•PET(positronemissiontomography):正电子射线层析术•Cygnus:天鹅座15X射线成像•Aorticangiogram:大动脉血管造影•Anatomical:解剖的,解剖学的1516显微成像•Taxol红豆杉醇•cholesterol胆固醇•Nickeloxide镍氧化物•organicsuperconducting有机超导17多频谱成像18光学成像•Intraocularimplant:眼内植入19光学成像20红外成像21磁共振成像,MRI22超声波成像•Thyroid:甲状腺,甲状软骨23计算机图形学•Fractal:分维24图像处理系统的基本步骤2020/5/12一个典型的通用图像处理系统–输入Input–存储Storage–处理器Processor–输出Output25广义图像非光学图像高维图像(包括多频谱图像)非标准采样的图像非标准量化的图像图像处理与图像分析图像处理是指为了能更好地观察图像或其他目的而产生一个修改了的图像图像分析把图像转换成某种非图像的形式,诸如目标的数量、类型、尺寸等计算机图形学:关于用计算机产生图像的学科计算机视觉:对景物进行解释2020/5/12某些相关术语2627如何学习?阅读教科书参考文献讨论课堂、小组实验C,C++,Java自己动手!参考书GonzalezRCandWoodsRE.DigitalImageProcessing,2ed.北京,电子工业出版社.2002K.R.Castleman,DigitalImageProcessing,清华大学出版社何东健,《数字图像处理》,西安电子科技大学陈桂明,张明照,戚红雨编.应用MATLAB语言处理数字信号与数字图像.北京,科学出版社.200028第2章数字图像处理基础2020/5/122.1人眼的视觉为什么要讨论人类视觉系统(HumanVisionSystem,HVS)?图像的信息来源于观察。数字图像处理的目的在于提供与观察者的视觉能力相匹配的图像输出,以便于观察者理解和解释图像的内容,提取图像信息。人们从外界所获取的信息中有80%是通过视觉获得的。通过HVS,人们能感知外界物体的大小、形状、颜色、明暗、动静和远近等。数字图像处理是从模拟人类的视觉开始的。尽管数字图像处理系统已可以完成相当多的工作,但其性能比起HVS来说还差得很远。理解人类视觉特性,有助于开发模拟人眼视觉过程的模型,并对图像处理系统的设计具有重要的指导作用。302020/5/12视觉生理和视觉心理通过人眼所形成的图像包括物理范畴的像和心理范畴的像:即来自外界物体的光线,通过人眼的折光系统在视网膜上所形成的物象,它与外界物体通过照相机中的透镜组在底片上成像并无原则上的区别;而来自视网膜的神经信息,则通过人脑的神经信息处理在视觉中枢内形成主观意识上的映像。以下分别从视觉生理和心理两个方面来讨论人眼的视觉特性。312020/5/12人眼视觉系统(视觉生理)左图是人的右眼水平切面结构图。眼内与产生视觉直接有关的结构是眼睛的折光系统和感光系统。折光系统由角膜、房水、晶状体和玻璃体组成。视网膜含有对光刺激高度敏感的视杆细胞和视锥细胞,能将外界光刺激所包含的视觉信息转变成电信号,并在视网膜内进行编码、加工,再由视神经传向视觉中枢作进一步分析,最后形成视觉。322020/5/12亮度与颜色视觉视杆细胞(RodCell)在光线较暗时活动,有较高的光敏度,但不能作精细的空间分辨,且不参与色觉。在较明亮的环境中以视锥细胞(ConeCell)为主,它能提供色觉以及精细视觉。(亮视觉和暗视觉)颜色视觉是指对不同颜色的识别,即不同波长的光线作用于视网膜后在人脑引起不同的主观映像。正常视网膜可分辨波长380-760nm之间的上百种不同的颜色,每种颜色都与一定波长的光线相对应。视网膜中并不存在上百种对不同波长起反应的视锥细胞。早在19世纪初期,Young和Helmholtz就提出了三原色理论。该理论认为在视网膜上分布着三种不同的视锥细胞,分别含有对红、绿、蓝三种光敏感的视色素。当某一波长的光线作用于视网膜时,可以一定的比例使三种视锥细胞分别产生不同程度的兴奋,这样的信息传至中枢,就产生某一种颜色的感受。332020/5/12亮度与颜色视觉近年来,通过实验确定,在视网膜中存在三种基本类型的视锥细胞。这些视锥细胞具有不同的吸收特征,该特征是波长的函数,在光谱的红、绿和蓝区域具有峰值吸收。存在三种视锥细胞,这为彩色视觉的三原色理论提供了生理机能的基础。当光刺激激活一个视杆细胞或视锥细胞,就发生一个感光换能反应,产生一个神经脉冲。神经脉冲通过视觉系统传播的方式至今还不是十分清楚。知道的是视神经束包含800000量级的神经纤维。三种锥状细胞的相对视敏函数曲线相对视敏函数曲线342020/5/12视觉心理视觉心理是指外界视觉刺激带来的感觉、知觉、认知等人内心的各种情感形式。外界的各种事情经由视觉系统接受后,其反应在很多情形下与外界的物理特性不一定相同。对于图像、风景的主观视觉反应,由于经过高层次复杂反应的合成,因而变得非常复杂。以下介绍几种效应或效果。35主观亮度2020/5/12Scotopic:暗视的,rods视杆细胞;Photopic:明视觉的,cones视锥细胞36亮度辨别力2020/5/12韦伯比(Webratio)ΔB/B:大约为2%,但在暗和亮的区域该值升高。调节ΔB的大小,使B+ΔB刚好能被察觉与B有所不同372020/5/12马赫效应在亮度突变处,视觉的主观感受出现虚幻的亮或暗的条纹。因Mach效应而对人眼所见景物有增强其轮廓的作用。382020/5/1239DigitalImageProcessingChapter2:DigitalImageDisplayandVisualPerception记录神经纤维接受器A信号.单独照射A引起较大的响应.对B附近的3个接受器加照射引起A上的响应减少.增加对B的照射进一步降低A的响应.因此对邻近接受器的照射抑制了接受器A的光刺激.这种抑制称为侧抑制,因为是越过视网膜,以侧抑制的神经丛结构由侧面传送的.40侧抑制与侧激励2020/5/12侧抑制与侧激励412020/5/12临界闪烁融合频率CFF(CriticalFlickerFusionFrequency)•对于闪烁的光源,当闪烁频率增大到某一数值的时候,就能感觉到它是连续光源,这种现象叫闪烁融合,这时的频率叫闪烁融合频率(简称闪频值)。•由于帧率大于CFF,运动图像看起来就是连续的讨论:•TV(PAL,NTSC),HDTV、电影等的帧率?人眼视觉暂留效应(0.05-0.2秒)422020/5/12同心圆错觉432020/5/12Jastrow错觉442020/5/12Muler-Lyer错觉452020/5/12462020/5/12对比效应,一方使另一方向自己相反性质或程度方向变化的效果。诱导效应,有多个对象时,一方对另一方、量多者对量少者(或者相反)施加影响而产生的知觉。在图像显示中如何利用?也可以考虑作为补充或强调等特殊手段来使用。472020/5/12同时对比相同亮度的目标物(方块)放在不同亮度的背景上,给人眼的亮度感觉是不同的。这种效应是由背景的不同引起的。在照明光源中的应用?白平衡?482020/5/12同时对比色度同时对比效应49视觉暂留现象1.注视右图中心红点15秒-30秒钟!(不要看整个图片,而是只看那中间的红点)2.然后朝自己身边的墙壁看(白色的墙或白色的背景)3.看的同时快速眨几下眼睛,看看您能看到什么?2020/5/1250视觉暂留现象2020/5/1251颜色恒常性在视觉心理学上是指人眼普通存在的一种知觉常性,即不因外界环境变换而保存对客观色彩知觉不变的一种心理倾向。从计算机视觉的角度来说就是消除光照的影响,得到场景的本质色彩。2020/5/1252颜色恒常性2020/5/12532020/5/12HVS模型wH1(w)wH2(w)wH3(w)线性系统1(,)xyHww单调非线性系统线性系统2(,)xyHww线性系统3()tHw波长相关接收器神经信号波长敏感接收器的输出馈入到一种代表人眼光学部分的低通线性系统H1,后面跟随着一个表示视杆或视锥细胞的非线性强度响应的一个单调非线性系统,接着横向抑制过程通过一个具有带通响应的线性系统H2来描述,而人眼神经暂存响应限制引起的延迟和滞后则由一个线性时间传递函数H3来模型化。541.2图像获取根据成像原理和方法的不同,可分成数字图像(例如数码照片、CT图像)和模拟图像(例如TV图像和X光片);本节主要讨论模拟图像输入到计算机中的图像获取技术。图像获取装置按其有无机械扫描、有无透镜和滤色镜等光学系统、摄像器件种类等要素进行组合,有多种方式。常用的图像获取方式有利用扫描仪和利用摄像机的两种。2020/5/12扫描仪扫描仪就是能够把照片、图画以及写在纸上的原稿等二维图像分解成一维像素串,并将像素的光信号转换为电信号的装置。每个像素由光信号变换为电信号的过程称为光电变换。传真机和电子式复印机的输入,与图形扫描仪同样,都利用扫描和光电变换。扫描在历史上有过各种各样的方法,大体上可分为机械式和电子式两类。机械式的一个实用化例子是下图所示的平台扫描方式和圆筒扫描方式。2020/5/12相机相机是目前应用领域和应用范围最广的图像获取手段。相机的主要成像器件有CCD和CMOS两种图像传感器。基本成像过程都包括光电转换、电荷收集、信号转换与输出等步骤。现在的