ComputerEngineeringandApplications计算机工程与应用2011,47(10)1前言随着计算机视觉和图形图像技术的快速发展,复杂的计算机生成算法已经能够模拟真实感非常强的自然场景模型,例如波浪、山峦、天空、植被等。计算机所生成图像在视觉上与真实的自然图像肉眼几乎难以区分。图1是两幅非常逼真的计算机生成图像[1],几乎可以以假乱真。在多媒体取证和图像安全领域,高度逼真的计算机生成图像已经成为一种潜在的数字图像伪造方式,如何有效区分和鉴别真实的自然图像和具有真实感的计算机生成图像,已经成为数字图像取证中的重要问题之一。一般来讲,真实自然图像指通过图像采集设备如数码相机等,直接获取的真实对象和场景的数字图像,计算机生成图像指通过计算机软硬件系统利用算法模型生成的虚拟对象和场景的合成图像。自然图像与合成图像的采集和生成过程截然不同,这必然会引起二类图像某些特征的差异。复杂的计算机图形生成算法只是基于真实场景的建模和仿真,这种仿真引起的偏差会使具有真实感的计算机虚拟图像和真实自然图像之间具有一定统计特征差异。通过选择合基于谱相关性的数字图像真伪鉴别康晓兵1,2,魏生民2KANGXiaobing1,2,WEIShengmin21.西安理工大学印刷包装工程学院信息科学系,西安7100482.西北工业大学现代设计与集成制造技术教育部重点实验室,西安7100721.DepartmentofInformationScience,FacultyofPrintingandPackagingEngineering,Xi’anUniversityofTechnology,Xi’an710048,China2.KeyLabofContemporaryDesignandIntegratedManufacturingTechnology,MOE,NorthwesternPolytechnicalUniversity,Xi’an710072,ChinaKANGXiaobing,WEIShengmin.Spectralcorrelationbasedimageauthenticationmethodfordigitalimageforensics.ComputerEngineeringandApplications,2011,47(10):8-12.Abstract:Howtodiscriminatebetweenphotorealisticcomputergeneratedimagesandrealphotographicimagescapturedwithadigitalcamerahasbecomeanimportantcomponentofdigitalimageforensics.Tosolvethisproblem,thispaperpres-entsanovelimageauthenticationapproachusingspectralcorrelationbetweencolorplanesinanimageforforensicanalysis.Insingle-CCDimagingsystems,onlyonecolorcomponentperpixeliscaptured,themissingtwocolorvaluesatthepixelareinterpolatedbyCFA(ColorFilterArray).DemosaickedimagesbyCFAinterpolationexhibithigherspectralcorrelationbetweendifferentcolorplanes.Inthesuggestedmethod,statisticalspectralcorrelationsbetweencolorcomponentsareexploitedusingdiscretewavelettransformandnormalizedcrosscorrelationtoverifyphotographicimages.ExperimentalresultstestedonthedefactostandardColumbiadatasetdemonstratethatthesefeaturesareeffectualincapturingthedifferencesbetweentwokindsofimagesandtheproposedmethodachievespromisingaccuracyinpassiveimageauthentication.Keywords:digitalimageforensics;spectralcorrelation;passiveimageauthentication;waveletdecomposition摘要:如何区分逼真的计算机生成图像和真实的自然图像,是数字图像取证领域的一个重要研究方向。提出了一种基于谱间相关性的图像真伪鉴别算法。在单CCD数码成像过程中,每个像素只采集单一颜色值,缺失的颜色值通过颜色滤波阵列插值获得,而基于颜色滤波阵列插值的去马赛克方法会引起彩色图像三个颜色分量之间较高的谱间相关性。算法利用小波变换和标准互相关系数提取颜色组件谱间相关性,作为区分和识别特征。通过在标准图像库上的实验测试,表明所提取特征有效捕获了二类图像的差别,并具有较高的检测率。关键词:数字图像取证;谱间相关性;被动式图像鉴别;小波分解DOI:10.3778/j.issn.1002-8331.2011.10.003文章编号:1002-8331(2011)10-0008-05文献标识码:A中图分类号:TP391.41基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.50875215)。作者简介:康晓兵(1970—),男,博士生,讲师,研究领域为多媒体安全,图像处理及模式识别;魏生民(1948—),男,博士,教授,博导。E-mail:kangxb@xaut.edu.cn收稿日期:2011-01-20;修回日期:2011-03-08图1逼真的计算机生成图像82011,47(10)适的能够捕获统计差异的图像特征,就能够检测和识别计算机生成图像,进而可以鉴定图像的原始性和真实性,解决数字图像的取证问题。主动式数字水印技术是图像真伪鉴别的首选方法[2],但大多数数字图像并未预先嵌入水印信号,利用水印技术鉴别图像真伪有其局限性,需要采用被动盲鉴别方法[3]。在数字图像被动盲取证中,图像真伪鉴别问题主要采用基于图像特征的模式识别与分类方法,其中,特征的选择和提取是关键。在现有方法中,Lyn和Frid[4]在小波域中进行图像真伪鉴别,利用子带系数的统计量和带间预测错误作为识别特征,共提取216个特征值,检测率达到66.8%。同样,Wang和Moulin[5]也采用基于小波的统计模型来提取图像特征,其中提取了144个特征值,而且检测率更高。Dehnie等[6]利用图像传感器模式噪音的统计特性来识别计算机生成图像,检测率可以达到75%。Ng[7-8]等通过几何方法建立纹理模型来挖掘二类图像在形成过程中的自然差异,包括对象模型、光线模型及获取设备等三方面,提取了192个特征值,检测率达到83.5%。Dirik等[9]扩展了方法[6],提取了颜色滤镜阵列的插值痕迹和色差等作为特征,检测率接近90%。Chen等[10]在HSV颜色空间计算小波域中典型函数矩作为分类特征。Sutthiwan等[11]则利用图像YCbCr颜色空间中一维和二维特性函数的统计矩来提取分类特征。Li等[12]利用图像二阶差分统计量来鉴别自然图像和计算机图形,检测率为90.2%。Chen等[13]利用遗传算法在小波域统计矩基础上提取优化特征来识别计算机图形,平均检测率为82.3%。图像的形成过程一般会对图像的固有特性产生重要影响。去马赛克方法是自然数码成像过程中一种典型的图像重建和处理方法。去马赛克方法[14]会引起彩色自然图像3个颜色分量之间较高的谱间相关性。本文结合图像不同形成过程引起的图像特征差异,利用多尺度小波分析和标准互相关系数等工具,提出了一种基于谱间相关性的数字图像真伪鉴别算法。2图像形成过程差异2.1数码成像过程近年来数字成像技术有了较大的发展,数码相机等成像设备的应用已经非常广泛。在彩色RGB图像采集过程中,考虑到低成本和小尺寸的要求,大多数消费级数码相机均采用单传感器CCD或CMOS,即在每个像素点上只采集单一值,其他缺失像素颜色值要通过基于颜色滤波阵列(CFA)的去马赛克(Demosaicing)方法[14],在空间和谱间的邻域上进行采样和插值估计获得。一般单CCD数码相机采集图像的过程如图2所示。在去马赛克方法中,最常用的是BayerCFA采样模式,如图3所示。其中,R、G、B三分量采用交替采样模式,并且G通道采样数是R和B通道的2倍,这种模式符合人们视觉系统在不同谱波长上的空间敏感度。基于CFA插值的去马赛克方法主要任务是RGB三颜色图像的重建。去马赛克插值方法较多,早期主要采用单个颜色通道内的邻域进行插值,例如最近邻、双线性、双立方、卷积等插值方法,这些方法都是利用图像的空间平滑性,它们的缺点是会产生边缘效应、伪彩色及拉链效应等;另一类去马赛克算法采用全通道邻域插值,即在估计任何一个颜色分量的缺失样本值时,都会涉及到3个颜色分量的邻域采样值,这类方法是目前研究的热点。因此,通过去马赛克方法重建的自然数码彩色图像,其R、G、B三颜色通道之间具有较强的谱间相关性,尤其在高频信息部分。2.2图像形成过程差异计算机生成图像主要依靠较复杂的场景模型和光线传输模拟来产生,其中的场景一般由光源和具有一定材质特性的几何对象组成。真实感计算机图像作为几何实物的逼真呈现,其合成过程包括两个重要部分:(1)场景建模,包括光照模型、对象反射模型、对象几何模型等;(2)场景呈现,逼真的场景建模和准确的光照传输模拟是真实感计算机图形生成的关键[16]。通过分析数码图像和计算机图形两类图像的形成过程,不难发现其中的区别:计算机图形生成过程中采取了对实际场景的近似模拟和部分简化操作等,例如场景建模、全局光照建模、颜色独立性设定、纹理合成等;而数码成像过程是一个相对复杂的图像函数的形成过程,一方面,图像函数的值依赖于场景中物体表面的材料和反射特性,另一方面,相机的传感器特性、镜头的光学特性、光源的光度特性及采集过程中的各种处理方法等都直接影响所得到的图像函数。自然图像采集过程中一些特殊处理方法,例如CFA插值和白平衡处理等,这些过程都会在图像中留下特有的痕迹或特性。本文利用数码成像过程CFA插值等方法引起的图像较高的谱间相关性特征,来区分和识别自然数码图像和计算机生成图像。2.3谱间相关性在自然彩色图像中,由于获取过程CFA插值引起的像素颜色分量之间的相关性包括两类:空间相关性(或称灰度相关性)和谱间相关性(或称颜色相关性)[15]。空间相关性指在单颜色灰度平面内邻域像素之间存在的相关性,谱间相关性指彩色图像在一定邻域像素内3个颜色分量之间具有的相关性。这二类相关性与图像采集过程中的去马赛克算法有直接关系。现实世界中对象表面的反射比特性也会间接引起自然图像3个颜色分量之间的依赖关系,而在计算机图像的生成过程通常为了计算的有效性而简化和消除了这种依赖关系[16]。例如采取颜色独立设定等机制,使得其谱间相关性和空间相关性要弱很多,而面向单颜色平面插值的空间相关性在几何缩放、重采样等图像处理过程中会引起变化。因此,本文利用彩色图像信号在一定空间邻域内展现出的谱间相关性特征进行二类图像的分类和识别。在谱间相关性特征提取中,一方面,由于RGB颜色空间中三颜色分量的统计相关性更强;另一方面,小波多尺度分解有助于图像信号的不同尺度和不同频谱真实三维场景自然数码图像JPEG压缩镜头滤光器单CCD传感器基于CFA去马赛克白平衡和伽马校正