1第一章光、影像、浮水印和抽樣原理21.2光與顏色1.3人眼與照像機的關係1.4彩色模式的轉換-RGB、YIQ、HSV和YUV1.5隱像術與浮水印1.6人臉的定位應用1.7影像抽樣原理1.9作業1.5.1影像的位元平面剖析1.5.2基本原理1.6.1形態學1.6.2離散餘弦轉換1.7.1傅利葉轉換1.7.2避免混疊效應1.1前言3光(Light)是一種粒子,也是一種波。人的眼睛只能看到可見光的部份,卻不能看見頻率(Frequency)低於可見光的紅外線和微波,也無法看見頻率高於可見光的紫外線和加瑪射線。在影像處理中,像素的亮度(Brightness)和頻率的關係,如圖1.2.1所示。低頻率的紅光和高頻率的紫光的亮度都不如比較中間頻率的黃綠光來的強。紅黃綠紫亮度頻率可見光1.2光與顏色圖1.2.1亮度與頻率的關係41.3人眼與照像機的關係除了利用掃描器(Scanner)外,影像處理前的輸入影像有很大的比例是由照像機(Camera)拍攝而得。瞳孔的功能很像照像機的光圈,是用來調節進入人眼內部的光通量,光通量一般以流明(Luminance)為單位。視網膜睫狀肌水晶體視神經束瞳孔眼角膜虹膜圖1.3.1人眼示意圖5圖1.3.2透鏡成像原理圖1.3.2為透鏡成像的中央投影(CentralProjection)示意圖。圖中的f代表鏡頭的焦距;f1代表物距,f2而代表像距。f、f1和f2會滿足下列式子21111fffQ1:令f1=3cm和f2=6cm,求算f。ANS:根據式(1.3.1),我們得到所以f=2cm。EOA2161311f(1.3.1)61.4彩色模式的轉換在影像的彩色模式中,比較常見的有下列幾種:(1)RGB,(2)YIQ,(3)HSV,(4)YUV。RGBYIQBGRQIY311.0528.0212.0321.0275.0596.0114.0587.0299.0(1.4.1)Q1:給一像素,其(R,G,B)為(100,50,30),試求其對應的灰階值。ANS:由式(1.4.1)可得故得灰階值63。EOA6330114.050587.0100299.0Y7Q2:給一2×2RGB影像請將I由RGB彩色影像轉換成YIQ影像,這裡(10,20,40)代表R=10,G=20和B=40。ANS:利用式子(1.4.1)可得經過四捨五入後,所得到的YIQ影像為EOA)120,250,50()200,150,100()20,30,40()40,20,10(I)84,77,175()4,46,141()1,9,32()4,12,19(YIQI8圖1.4.1彩色Lena影像圖1.4.2轉換的高灰階Lena影像給一彩色Lena影像,如圖1.4.1所示,利用式(1.4.1)中Y與RGB的關係,我們可得到圖1.4.2所示的高灰階影像。9RGBHSV255),,(),,(),,(),,(Bif360Bif5.0cos11211BGRMaxVBGRMaxBGRMinBGRMaxSGHHGHHBGBRGRBRGRH(1.4.2)在HSV系統中,H=0時代表紅色,H=120時代表綠色,H=240時代表藍色。當的S=0時,表示影像為灰階式的影像。當H=0且S=1時,影像為紅色。當V=0時,表示黑色。反之,當V=1時,表示白色的亮光。10HSV系統可以圖1.4.3表示其座標系統。HSV彩色系統有時也稱作HSB彩色系統,這裡的B代表Brightness。HSV有時更被稱作HIS,這裡的I代表Intensity,其實就是灰階值。圖1.4.3HSV彩色系統11)33sin()33cos(VUQ)33cos()33sin(VUIYUVYIQ在JPEG系統中,我們第一步輸入RGB彩色影像。第二步將RGB彩色轉換成YCbCr彩色系統。詳細的Cb和Cr可由下式獲得5.02/5.02/YRCYBCrb(1.4.3)的代表“BlueMinus‘BlackandWhite’”;代表“RedMinus‘BlackandWhite’”。rbCYCbCrC121.5隱像術與浮水印1.5.1影像的位元平面剖析將RGB分解成R平面、G平面和B平面(a)R平面(b)G平面(a)B平面圖1.5.1.1彩色Lena影像的三張分解圖13(a)第一張位元平面(b)第二張位元平面(c)第三張位元平面(d)第四張位元平面(e)第五張位元平面(f)第六張位元平面(g)第七張位元平面(h)第八張位元平面將高灰階Lena影像中的灰階像素分解成八個位元平面圖1.5.1.2高灰階Lena影像的八張分解平面14圖1.5.1.3圖1.5.1.2(e)~(h)的合成影像我們把圖1.6(e)~(h)疊在一起可得到圖1.5.1.3。圖1.5.1.3中的Lena和圖1.4.2中的Lena在肉眼上幾乎分辨不出什麼差異。15Q1:給一如下的44子影像,子影像的每一個像素之灰階值佔用八個位元,請算出第三張位元平面。876532313029101112130123ANS:我們首先將上面的子影像轉換成00001000000001110000011000000101001000000001111100011110000111010000101000001011000011000000110100000000000000010000001000000011將右邊第三位元全部收集起來,我們得到如下的第三位元平面:0111011100110000EOA16Q2:前述的隱像術之優缺點為何?ANS:滿足上圖的函數也叫單程函數(OneWayFunction)。利用位元平面來植入影像的最大缺點為:一旦經過壓縮後,所植入的影像很容易受到破壞,解壓後所取出的影像常常已遭到很嚴重的破損。EOA171.5.2基本原理給二張影像A和B,所謂的隱像術就是把A影像隱藏在B影像並且讓人無法察覺B影像中藏了A影像。101022210)),(),('(1255log10NxNyyxByxBNMSEMSEPSNR而所謂的浮水印,可把A看成標誌(Logo),通常這個標誌可想成一種版權。隱像術PSNR令B'為將A隱藏在B後的結果。PSNR(PeakSignal-to-NoiseRatio)很常被用來評估B'和B的相似性,PSNR的定義如下浮水印18一種SVD結合VQ的隱像術方法已知有一的灰階影像A,假設A的秩(Rank)為r,則A的SVD可表示為tVUANNV和U為正交矩陣(OrthogonalMatrix)且,其中滿足和。這裏等於,為矩陣AtA的第i個特徵值(Eigenvalue)。),...,,(21ndiagn...,210...21r0...21nrriσii19Q1:如何知道?0λiANS:利用22XXXXXAXAXAXAXAXtttttEOA20Q2:如何知道A可進行SVD分解?也就是,如何得到ttttVUVVUUVUA11121121000)(ANS:(1.5.2.1)212222A8888AAt例如,令,則。的特徵值(Eigenvalues)為和。將特徵值開根號,A的奇異值為和。特徵值為16的特徵向量為而特徵值為0的特徵向量為,利用這二個特徵向量可建構出AAt161024102tV1,11tV1,12111121),(21VVVUAVjjjuAV利用可得所以21212121222241111AVul22又由,可得。利用可找出UAVttVUA0jtuAtu21,212tu1,0,03和來。所以A的SVD可表示為我們可利用前人提出的結合SVD及VQ之方法,在壓縮效果和失真之間得到一個較好的平衡。21212121000421212121tVUA23圖1.5.2.1(a)為待植入的F16影像,圖1.5.2.1(b)為將F16植入圖1.4.2後的結果。F16經隱像後,效果的確蠻好的,畢竟在圖1.5.2.1(b)中,用肉眼實在看不出F16隱藏其中。(a)待植入的F16(b)將F16植入圖1.4.2後的結果圖1.5.2.1隱像後的效果24Q3:一般而言,怎樣分辨浮水印和資料隱藏?ANS:用浮水印所加入的影像,主要是想確定誰是影像的真正所有者;而資料隱藏只是想透過隱像術的技巧將資料隱藏起來。EOA251.6人臉的定位應用圖1.6.1.1輸入的影像圖1.6.1.2皮膚色所在封閉(Closing)算子開放(Opening)算子1.6.1型態學26bABABADBb),(123451234511BAxy123451234511xy123451234511xy圖1.6.1.3集合A和B圖1.6.1.4D(A,B)圖1.6.1.5E(A,B)令A為待處理的區塊集而B為結構化元素集(StructuringElements):擴張(Dilation)和侵蝕(Erosion)擴張運算侵蝕運算bABABAEBb)(),(Θ27Q1:今將圖1.11的區塊集改成下圖所示的區塊:ANS:根據前面D(A,B)和E(A,B)的定義,我們有試求D(A,B)和E(A,B)。BAD,BAE,EOA28XY1234567891012345678910Q1.1:給以下三區塊集,如下圖所示,延用圖1.6.1.3的結構化元素集B,請分別算出此三區塊集經開放算子及封閉算子運算後的結果,並加以說明。29X1234567891012345678910YANS:開放算子先進行擴張運算再進行侵蝕運算,經由擴張運算可以得到下圖的結果。再將擴張運算所得區塊集進行侵蝕運算,最後可得下圖的結果。XY1234567891012345678910封閉算子先進行侵蝕運算再進行擴張運算,經由侵蝕運算可以得到下圖再將侵蝕運算所得區塊集進行擴張運算,最後可得下圖的結果。XY1234567891012345678910此即為封閉算子運算後的結果。EOA30Q2:如何利用擴張運算子D和侵蝕運算子E以求得影像中輪廓的外圍?ANS:令I代表原影像,而B代表結構化元素集。D(I,B)將影像的輪廓擴張;E(I,B)可將影像的輪廓侵蝕及縮減。因此D(I,B)-E(I,B)可得到影像中物體的輪廓外圍,這裏的‘-’代表兩影像相減。下面的圖為測輪廓的示意圖:介於D(I,B)和E(I,B)之間的環形區域可視為物體I的輪廓。EOA31Q4:如何利用色調範圍來過濾皮膚色?ANS:首先利用人工點選的方式,將所有訓練影像中的皮膚色予以框出來,然後將色調抽取出來,並且將統計出來的平均值和標準差用於濾波器的設計,下面為其示意圖:32令f(x,y)為框框內位於(x,y)的灰階值減去128,則DCT的計算公式如下NjyNixyxfjCiCNjiDNxNy2)12(cos2)12(cos),()()(21),(1010otherwiseiic,10,2/1)(otherwisejjc,10,2/1)(f(x,y)也可透過IDCT(inverseDCT)得到,公式如下透過式子(1.4)求得f(x,y)後再加上128即可得到位於影像中(x,y)位置的原始灰階值。NjyNixjiDjCiCNyxfNiNj2)12(cos2)12(