第6章音频数字水印技术第6章音频数字水印技术6.1概述6.2人类听觉特性6.3时域音频水印算法6.4变换域音频水印算法6.5其他类型的水印算法6.6音频水印的评估标准和攻击6.7小结第6章音频数字水印技术6.1概述6.1.1音频信号的数字化音频信号的数字化是指对模拟的声音信号进行A/D转换,使其转化为数字信号。这个过程有两个重要的参数:量化精度和瞬态采样频率。第6章音频数字水印技术对高质量音频的量化方式最流行的格式是16bit线性量化,如Windows可视音频格式(WAV)和音频交换文件格式(AIFF)。另一种较低质量音频的量化方式一般采用8bitμ律量化。这些量化方法会使信号产生一些畸变,在8bitμ律量化中显得更为明显。第6章音频数字水印技术6.1.2音频信号传送环境在实践中,含有水印的音频信号从编码到解码之间有多种可能的传播途径。这里,我们仅考虑最普通的四种情形。第一种情形是声音文件从一个机器拷贝到另一个机器,其中没有任何形式的改变。第二种情形是信号仍然保持数字的形式,但采样率发生变化。第6章音频数字水印技术第三种情形是信号被转换为模拟形式,通过模拟线路进行传播,在终端被重新采样。第6章音频数字水印技术6.1.3对音频数字水印的要求要想成功地在数字音频媒体中隐藏水印,必须注意以下几方面的要求。1.对数据变换处理操作的稳健性要求水印本身应能经受得住各种有意无意的攻击。典型的攻击有添加噪声、数据压缩、滤波、重采样、A/D-D/A转换、统计攻击等。第6章音频数字水印技术2.听觉相似性数字水印是在音频载体对象中嵌入一定数量的掩蔽信息,为使得第三方不易察觉这种嵌入信息,需谨慎选择嵌入方法,使嵌入信息前后不产生听觉可感知的变化。3.是否需要原始数据进行信息提取根据数据嵌入和提取方案的不同设计,有些方案可以不需要借助于原始数据进行信息提取,这一性能将影响方案的用途和性能。第6章音频数字水印技术4.数据提取误码率数据提取误码率也是音频水印方案中的一个重要技术指标,因为一方面存在来自物理空间的干扰,另一方面信道中传输的信号会发生衰减和畸变,再加上人为的数据变换和攻击,都会使数据提取的误码率增加。5.嵌入数据量指标根据用途的不同,在有些应用场合中必须保证一定的嵌入数据量,如利用音频载体进行隐蔽通信。第6章音频数字水印技术6.1.4数字音频水印系统的典型应用随着音频素材在互联网上的指数级增加,数字音频水印技术有着广泛的应用前景:(1)为了便于对音频素材进行查找和检索,可以用水印技术实现元数据(描述数据的数据)的传输,就是用兼容的隐藏的带内方式传送描述性信息。第6章音频数字水印技术(2)在广播领域中,可以用水印技术执行自动的任务,比如广播节目类型的标识、广告效果的统计分析、广播覆盖范围的分析研究等。其优点是不依赖于特定的频段。(3)用水印技术实现知识产权的保护,包括所有权的证明、访问控制、追踪非法拷贝等。这也是水印技术最初的出发点。第6章音频数字水印技术6.2人类听觉特性频域掩蔽算法的具体实现步骤如下:(1)计算频谱。对每16ms的信号s(n),其采样点数N=512,用Hamming窗h(n)进行加窗处理)]2cos(1[238)(Nnnh(6-1)第6章音频数字水印技术s(n)的功率谱由下式得到210)]2exp()()(1lg[10)(NnNnkjnhnsNkS(6-2)第6章音频数字水印技术(2)确定纯音和噪音成分。这样做是因为纯音和噪音的掩蔽模型不同。如果某个频谱成分的局部极大值(S(k)>S(k+1)且S(k)≥S(k-1)),满足下式:S(k)-S(k+j)≥7dBj∈{-2,+2},if2<k<63j∈{-3,-2,+2,+3},if63≤k<127(6-3)j∈{-6,-5,…,-2,+2,…,+5,+6},if127≤k≤250则该成分是纯音。]101010lg[10)(10)1(10)(10)1(kSkSkStmkS(6-4)第6章音频数字水印技术(3)去除被掩蔽成分,分为以下两步:①根据如图6-1所示的绝对听阈曲线,把在绝对听阈以下的纯音和噪音成分去除。②对相互间隔小于0.5Bark的多个纯音成分只保留其中有最大值的那一个。第6章音频数字水印技术图6-1绝对听阈曲线图3040506070809010000.050.10.150.20.250.30.35JPEG压缩品质比特误码率空域小波域第6章音频数字水印技术(4)计算局部掩蔽阈值与整体掩蔽阈值。对原始的N/2(即256)个频域采样点(用k代表),只有其中的一部分采样点(用i代表)被用来计算整体掩蔽阈值。层Ⅰ和层Ⅱ所用到的采样点不同。层Ⅰ:频带被划分为30个子带,最低频6个子带中所有采样点都用到,接下来的6个子带的采样点每2个用到1个,余下的18个子带的采样点每4个用到1个。第6章音频数字水印技术层Ⅱ:频带被划分为30个子带,最低频3个子带的所有采样点都用到,接下来的3个子带的采样点每2个用到1个,接下来的6个子带的采样点每4个用到1个,余下的18个子带的采样点每8个用到1个。共用到采样点132个。第6章音频数字水印技术(5)掩蔽是可以叠加的,因而在z(i)处具有的总掩蔽阈值LTg(i)为z(i)处的安静时阈值LTq(i)和所有临mjizjzLTmjizjzLTiLTgnmlmqiLT110/))(),((110/))(),((0/)(101010lg10)((6-8)第6章音频数字水印技术6.3时域音频水印算法6.3.1最不重要位方法最不重要位方法是一种最简单的水印嵌入方法。任何形式的水印都可以转换成一串二进制码流,而音频文件的每一个采样数据也是用二进制数来表示。这样,可以将每一个采样值的最不重要位(多数情况下为最低位)用代表水印的二进制位替换,以达到在音频信号中嵌入水印的目的。第6章音频数字水印技术6.3.2基于回声的水印算法利用回声嵌入水印的算法是一种经典的音频水印算法。它利用了人类听觉系统的另一特性:音频信号在时域的向后屏蔽作用,即弱信号在强信号消失之后变得无法听见。弱信号可以在强信号消失之后50~200ms的作用而不被人耳察觉。第6章音频数字水印技术设音频序列S={s(n),0≤n<N},按下式即可得到含有回声的音频序列Y:y(n)=s(n),0≤n<ms(n)+λs(n-m),m≤n<N(6-9)第6章音频数字水印技术图6-2回声编码水印嵌入流程图原始音频数据音频数据段分段回声混入含水印音频数据衰减延时水印比特段组合第6章音频数字水印技术在实际的应用中,为了提高水印嵌入的效率,Gruhl采取的方法如下:(1)假设要嵌入的水印比特为“1011001”,先将整个音频信号分成如图6-3所示的7段。(2)分别使用式(6-9),得到延时分别为m0和m1的两个含有回声的信号,如图6-4所示。(3)构造“1”混合信号和“0”混合信号,如图6-5所示。第6章音频数字水印技术图6-3将原始信号分为小段以嵌入数据1a0b1c1d0e0f1g第6章音频数字水印技术图6-4产生“1”和“0”回声信号(用虚线表示)10ab11cd0e0f1g1011001m1m0第6章音频数字水印技术图6-5构造混合信号a1b0c1d1e0f0g10101“1”混合信号“0”混合信号第6章音频数字水印技术(4)将延时为m0的信号和“0”混合信号相乘,延时为m1的信号和“1”混合信号相乘,最后将两个信号相加得到含水印信号。第6章音频数字水印技术图6-6回声编码水印提取流程图含水印音频数据段DFT复对数IDFT平方复倒谱的自相关)(ˆ)(ˆ10mymy和比较水印比特第6章音频数字水印技术回声水印的嵌入过程也可以看作音频信号和一个回声内核进行卷积,回声内核如图6-7所示。图中m是回声延时,λ是回声的衰减系数。第6章音频数字水印技术图6-7回声内核m1第6章音频数字水印技术6.3.3其他的时域水印方法虽然最不重要位方法有一些局限性,但由于时域水印算法运算速度快,因此除了对回声算法进行研究外,一些学者对时域的其他算法进行了深入研究,提出了一些新的算法。第6章音频数字水印技术Kim等认为将水印信号嵌入时域中每一个样点会使人耳产生感知,他们每间隔一定的距离(3~5个样点),通过修改样点的幅度值而嵌入水印。在水印检测时不需要原始音频信号,而是根据嵌入水印的样点附近的样点值估计该点的原始值,进而获得嵌入的水印。第6章音频数字水印技术Lie等提出的方法与Kim的方法类似,不同处是将每个比特的水印信号嵌入到一段音频信号中。具体算法如下所述。水印嵌入算法:将音频信号f(x)分段,每段长度为L。将任意相连的三段分别记为sec_1、sec_2和sec_3。每段的能量定义为:132312211)()()(LxLxxLxLxxLxxxiiiiiixfExfExfE(6-10)第6章音频数字水印技术其中xi表示sec_1的起始样点。将三段的能量按从大到小进行排列,重新表示为Emax、Emid和Emin。计算它们的能量差:A=Emax-EmidB=Emid-Emin(6-11)第6章音频数字水印技术(1)当水印比特为1时,如果A-B=Emax-2Emid+Emin≥(Emax+2Emid+Emin)·d,则不对信号修改;否则增加Emax或减小Emid,直至A-B≥(Emax+2Emid+Emin)·d。(2)当水印比特为0时,如果B-A=2Emid-Emin-Emax≥(Emax+2Emid+Emin)·d,则不对信号修改;否则增加Emid或减小Emin,直至B-A≥(Emax+2Emid+Emin)·d。第6章音频数字水印技术图6-8使用三个相邻的样点段以嵌入水印示意图幅度f(t)LLLE1Sec_1E2Sec_2E3Sec_3t第6章音频数字水印技术图6-9段边界处的渐变加权曲线加权系数w1.0Lt(a)w为大于1的情形加权系数w1.0Lt(b)w为小于1的情形第6章音频数字水印技术6.4变换域音频水印算法6.4.1相位水印算法相位水印算法利用人耳听觉系统对绝对相位不敏感以及对相对相位敏感的特性,使用代表水印数据的参考相位替换原始音频段的绝对相位,并对其他的音频段进行调整,以保持各段之间的相对相位不变。相位编码的具体步骤如下:第6章音频数字水印技术(1)设原始音频序列为S={s(i),0≤i<L}(6-13)将S分割成N个等长的小段sn={sn(i),0≤n<N,0≤i<K}(6-14)其中K=L/N。第6章音频数字水印技术(2)对第n段sn(i)进行K点的离散傅里叶变换(DFT)。生成相位矩阵φn(ωk)和幅度矩阵An(ωk)(0≤k<K)。(3)计算并存储相邻段对应频点的相位差Δφn+1(ωk)=φn+1(ωk)-φn(ωk)(6-15)其中0≤n≤N-1,0≤k<K。第6章音频数字水印技术(4)设水印序列W={wk,0≤k<K),wk∈{0,1}。用下式定义wk所代表的相位值22)(0kifwk=1ifwk=0(6-16)第6章音频数字水印技术(5)对0<n<N,利用相位差重新产生相位矩阵:))()()(())()()(())()()((1211101kNkNkNknknknkkk(6-17)第6章音频数字水印技术(6)利用修改的相位矩阵φ′n(ωk)和原始幅度矩阵An(ωk)(其中0≤n<N,0≤k<K)进行IDFT,生成含水印的音频信号。第6章音频数字水印技术水印解码时,首先要获得含水印音频信号的同步信息,信号段的长度、DFT变换点数都应该为解码方所了解。具体说来,解码过程分以下三步:(1)在已知发送方信号段长度的情况下,将接收到的音频信号分段。(2)提取出第一段,对它做DFT,计算相位值。(3)根据相应的阈值,对相位值进行检测,得到0或1值,构成水印序列