基于Benford定律的音频重量化检测方法摘要本文给出一种利用Benford定律对音频信号重量化进行检测的方法,该方法统计WAV格式音频信号各帧DCT系数首位数字的概率分布,并将其与Benford定律对比。对于未经重量化的音频信号,二者具有理想的拟合度,而被重量化的音频信号则不具有这一特点。由这一原理可实现音频信号重量化的检测。实验结果表明,利用Benford定律可以有效地检测出对音频信号的重量化,对于持续一定时间长度的局部重量化,也可以定位出篡改位置。关键词:Benford定律:DCT系数:重量化:篡改检测1.引言随着数字音频技术的迅速发展,数字音频的应用范围越来越广泛。与模拟音频相比,数字音频具有诸多优点:易于存储,存储介质易于保存,容易编辑,方便复制,易于传输传播,成本低,抗干扰能力强等。这些优点使得数字音频拥有广阔的应用前景,但功能强大的音频编辑软件的出现,使得音频的安全性遭受了巨大的挑战。例如,CoolEditPro作为音频编辑软件中的佼佼者,可以对音频文件进行透彻解析,并可以容易地对波形文件进行操作,比如插入音轨、删除、修改以及增加音效。这些强大的功能给人们的生活带来了诸多便利和乐趣,但同时也使得音频的篡改变得异常容易,并且极其隐蔽不易察觉。而当音频应用于·些如法庭举证、部门机密文件、历史文献备份等特殊场景时,其真实性就显得格外重要。例如当数字音频材料在法庭中作为电子证据出现时,作为一个重要的司法应用,一定要确保数字声像材料的真实性。自二十世纪九十年代以来,数字音频篡改鉴定技术开始兴起并得到了迅速发展,各种优秀的鉴定方法脱颖而出:Farid于1999年提出了应用双谱分析检测音频信号篡改的算法;Grigoras提出利用ENF(ElectricNetworkFrequency)信息检测音频篡改的方法;姚秋明等人提出了基于期望最大化算法的音频重采样篡改的检测方法;Ding等人提出以子带频谱平滑方法检测音频信号是否被插值或拼接篡改;邵松年等人提出利用数字录音设备的本底噪声特性,来检测音频信号中有无被篡改入其他录音设备录制的音频的方法;Yang等人提出基于MP3格式音频帧位移的篡改检测方法。近几年来,作为篡改检测的一种方法,Benford定律开始应用于图像篡改检测领域。Jolion提出图像梯度幅度值符合Benford定律;Acebo等证实自然图像的光强度在特定条件下符合Benford定割。Gonzales等在模对数域构建了广义Benford定律。Fu等表明图像块DCT系数的首位符合Benford定律,并以此检测图像的重压缩。本文将Benford定律引入音频篡改检测领域,给出了一种利用Benford定律对音频信号重量化进行检测的方法。2.Benford定律Benford定律由物理学家FrankBenford在1938年提出。该定律表明,对于大量真实的数据,第一位有效数字(FSD,firstsignificantdigit)为d的概率符合公式(1):f(d)=log(1+1/d),d=1,2,···9(1)即1在首位出现概率约为30.1%,2为17.6%,3为12.5%,依次递减,9的出现概率约为4.6%。作为该定律的主要奠基人,FrankBenford对人口出生率、死亡率、物理和化学常数、素数数字等各种现象进行统计分析后发现,由度量单位制获得的数据都符合这一定律。而人为伪造的数据和计算机随机产生的数据,则不符合这一定律。因此,该定律广泛应用于审计领域,用于检测舞弊现象。1996年美国学者Hill从理论上对Benford定律做出了恰当的解释,并进行了严谨的数学证明。3.基于Benford定律的音频信号重量化检测方法现阶段常见的音频格式有CD、WAV、MP3、WMA等等。其中WAV音频来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样,使得到一系列离散的采样点,以不同的量化位数将其转换成二进制数,然后存入磁盘,就产生了WAV文件。该格式记录声音的波形,只要采样率高、采样字节长、机器速度快,该格式的声音文件便能够和原声基本一致。由于WAV格式应用比较广泛,因此本文主要研究WAV音频的篡改检测。如果要将一小段量化位数为16比特(或32比特)的音频插入到量化位数为8比特的音频中,以达到伪造语境、篡改原始语义的目的,必定会出现降低量化位数的操作,即存在WAV格式的重量化。对于三种不同量化位数的真实音频及两种重量化音频,分别进行如下操作:(1)设音频信号长度为厶以帧长L,进行分帧Lf,得到帧数为|L/L=|Ff;(2)对每帧音频信号进行DCT变换,得到DCT系数Cf={ckj|k=0,1,2...,Lf-1},j=1,2,...f;(3)统计各帧DCT系数Cj首位的概率Pij,i=1,2,...9,j=1,2,...F;(4)取所有帧的平均值,将统计平均值与Benford定律对比,二者拟合度以X2度量,定义如式(2)所示。(2)其中,是实际首位概率,Pi是Ben_ford定律预测的概率,Pi的计算方法如式(3)所示:(3)原始音频与重量化音频DCT系数首位概率分布对比如图l所示。其中,图l(a)示出了16比特量化位数的原始音频信号的DCT系数首位概率分布情况,图1(b)示出了重量化(16比特转为8比特)音频信号的DCT系数首位概率分布情况。这里取帧长度Lf=500点。(a)原始音频(b)重量化音频图1原始音频与重量化音频DCT系数首位分布概率由图1(a)和图1(b)可以看出,未经过重量化的音频信号首位概率分布与Benford定律具有较好的拟合度,而经过重量化的音频信号的首位概率分布与Benford曲线有略有分歧,这一现象为重量化检测提供了判断依据。因此可以通过拟合度X2与门限值thr比较进行篡改检测。为了进一步实现局部重量化的检测及定位,将待检测音频以重叠率80%进行分段,对每段音频按上述步骤检测,计算拟合度X2(i),并定义MARK(i)(4)MARK(i)=l表示第i段为重量化语音,MARK(i)=0表示第i段为真实语音。4.结论本文提出了一种基于Benford定律检测音频信号重量化的方法,该方法将Benford定律引入音频篡改检测领域。具有运算量少,简单实用等优点。但由于Ben_ford定律揭示大量数据的统计特性,因此当重量化持续时间较短时,对统计概率的影响非常微弱以至于无法检测。因此只有重量化持续足够时间时,该方法才能有效地检测出音频信号的重量化并定位重量化位置。如何对持续时间较短的重量化进行检测是下一步研究的重点。参考文献:[1]高阳·数字音频材料的真实性检测[D],上海交通大学工学硕士学位论文,2009[2]FaridH.Detectingdigitalforgeriesusingbispectralanalysis[J].1999.[3]GrigorasC.Digitalaudiorecordinganalysis:theelectricnetworkfrequencycriterion[J].InternationalJournalofSpeechLanguageandtheLaw,2005,12(1):63-76.[4]姚秋明,柴佩琪,等.基于期望最大化算法的音频取证中的篡改检测[J].计算机应用,2006,26(11):2598-2601.[5]QiD,WangX,Xi-jianP.Audiointerpolationandstitchingdetectionbasedonband-partitioningspectralsmoothness[C]//InformationEngineering,2009.ICIE'09.WASEInternationalConferenceon.IEEE,2009,1:189-192.[6]邵松年,黄征,等.数字音频与录制设备的相关性研究[J].计算机工程,2009,35(19):224-250.[7]YangR,QuZ,HuangJ.Detectingdigitalaudioforgeriesbycheckingframeoffsets[C]//Proceedingsofthe10thACMworkshoponMultimediaandsecurity.ACM,2008:21-26.[8]柳永娟,马晓红.2010通信理论与信号处理学术年会论文集[C].北京:电子工业出版社,2010.525-530.[9]路允祥.音频信息篡改检测算法的研究[D].大连:大理理工大学,2011.