数字水印技术的发展与应用1数字水印技术的发展与应用上海大学计算机应用技术蔡闻怡指导教师:丁友东1.引言信息媒体的数字化为信息的存取提供了极大的便利性,同时也显著提高了信息表达的效率和准确性。特别是随着计算机网络通讯技术的发展,数据的交换和传输变成了一个相对简单的过程,人们借助于计算机、数字扫描仪、打印机等电子设备可以方便、迅速地将数字信息传输到所期望的地方。随之而来的副作用是这些数字形式的数据文件或作品使有恶意的个人和团体有可能在没有得到作品所有者的许可下拷贝和传播有版权的内容,例如,现代盗版者仅需轻点几下鼠标就可以获得与原版一样的复制品,并以此获取暴利;而一些具有特殊意义的信息,如涉及司法诉讼、政府机要等信息,则会遭到恶意攻击和篡改伪造等等。这一系列数字化技术本身的可复制和广泛传播的特性所带来的负面效应,已成为信息产业健康持续发展的一大障碍,目前,数字媒体的信息安全、知识产权保护和认证问题变得日益突出,且已成为数字世界中一个非常重要和紧迫的议题。密码技术是信息安全技术领域的主要传统技术之一,它是基于香农信息论及密码学理论的技术,现有的数字内容的保护多采用加密的方法来完成,即首先将多媒体数据文件加密成密文后发布,使得其在传递过程中出现的非法攻击者无法从密文获取机要信息,从而达到版权保护和信息安全的目的。但这并不能完全解决问题:一方面加密后的文件因其不可理解性而妨碍多媒体信息的传播;另一方面多媒体信息经过加密后容易引起攻击者的好奇和注意,并有被破解的可能性,而且当信息被接收并进行解密后,所有加密的文档就与普通文档一样,将不再受到保护,无法幸免于盗版。换言之,密码学只能保护传输中的内容,而内容一旦解密就不再有保护作用了。因此,迫切需要一种替代技术或是对密码学进行补充的技术,它应该甚至在内容被解密后也能够继续保护内容。这样,人们提出了新兴的信息隐藏的概念——数字水印(digitalwatermarking)。数字水印技术是目前信息安全技术领域的一个新方向,是一种可以在开放网络环境下保护版权和认证来源及完整性的新型技术,创作者的创作信息和个人标志通过数字水印系统以人所不可感知的水印形式嵌入在多媒体中,人们无法从表面上感知水印,只有专用的检测器或计算机软件才可以检测出隐藏的数字水印。在多媒体中加入数字水印可以确立版权所有者、认证多媒体来源的真实性、识别购买者、提供关于数字内容的其它附加信息、确认所有权认证和跟踪侵权行为。它在篡改鉴定、数据的分级访问、数据跟踪和检测、商业和视频广播、Internet数字媒体的服务付费、电子商务认证鉴定等方面具有十分广阔的应用前景。自1993年以来,该技术已经引起工业界的浓厚兴趣,并日益成为国际上非常活跃的研究领域。最初提出数字水印的目的是为了保护版权,然而随着数字水印技术的发展,人们发现了更多更广的应用,有许多是当初人们所没有预料到的。下面列出了七种已提出的或实际的水印应用:广播监控、所有者鉴别、所有权验证、操作跟踪、内容认证、拷贝控制和设备控制。(1)广播监控:通过识别嵌入到作品中的水印来鉴别作品是何时何地被广播的。(2)所有者鉴别:嵌入代表作品版权所有者身份的水印。(3)所有权验证:在发生所有权纠纷时,用水印来提供证据。(4)操作跟踪:用水印来鉴别合法获得内容但非法重新发送内容的人。数字水印技术的发展与应用2(5)内容认证:将签名信息嵌入到内容中以待日后检查内容是否被篡改。(6)拷贝控制:使用水印来告知录制设备不能录制什么内容。(7)设备控制:使用水印来制造设备,比如Digimarc公司的MediaBridge系统。数字水印技术还处于发展之中,上述七个方面也不可能包含其所有可能的应用领域,但可以看出数字水印技术未来的应用市场将会更加广阔,毕竟,它还是个方兴未艾的领域。2.数字水印的基本理论2.1定义和基本特点所谓数字水印是向多媒体数据(如图像、声音、视频信号等)中添加某些数字信息以达到文件真伪鉴别、版权保护等功能,嵌入的水印信息隐藏于宿主文件中,不影响原始文件的可观性和完整性。数字水印过程就是向被保护的数字对象(如静止图像、视频、音频等)嵌入某些能证明版权归属或跟踪侵权行为的信息,可以是作者的序列号、公司标志、有意义的文本等等。与水印相近或关系密切的概念有很多,从目前出现的文献中看,已经有诸如信息隐藏、信息伪装、数字水印和数字指纹等概念。不同的应用对数字水印的要求不尽相同,一般认为数字水印应具有如下特点:·可证明性:水印应能为受到版权保护的信息产品的归属提供完全可靠的证据。水印算法能够将所有者的有关信息(如注册的用户号码、产品标志或有意义的文字等)嵌入到被保护的对象中,并在需要的时候将这些信息提取出来。水印可以用来判别对象是否受到保护,并能够监视被保护数据的传播、真伪鉴别以及非法拷贝控制等。这实际上也是发展水印技术的基本动力。·不可感知性:不可感知性是指视觉或听觉上的不可感知性,即指因嵌入水印导致载体数据的变换对于观察者的视觉或听觉系统来讲应该是不可察觉的,最理想的情况是水印与原始载体在视觉上是一模一样的,这是绝大多数水印算法所应达到的要求。·鲁棒性:鲁棒性是指水印应该能够承受大量的物理和几何失真,包括有意的(如恶意攻击)或无意的(如图像压缩、滤波、打印、扫描与复印、噪声污染、尺寸变换等等)。显然在经过这些操作后,鲁棒性的水印算法应仍能从水印载体中提取出嵌入的水印或证明水印的存在。一个鲁棒的水印应做到若攻击者试图删除水印将会导致水印载体的彻底破坏。由于水印特性的要求对应用的依赖型很强,恰当的评价准则和具体的应用有关。许多文献中讨论的数字水印可能不具备上述特点,或者只具备部分上述特点,这里我们讨论更广泛意义上的水印。2.2数字水印的分类随着数字水印技术的发展,水印算法的分类方法繁多:·按水印的特性,可分为鲁棒水印和脆弱水印。鲁棒水印主要用于在数字作品中标识著作权信息,如作者、作品序号等,它要求嵌入的水印能够经受各种常用的编辑处理;脆弱数字水印主要用于完整性保护,与鲁棒水印的要求相反,脆弱水印必须对信号的改动很敏感,人们根据脆弱水印的状态就可以判断数据是否被篡改过。·按水印所附载的媒体,可分为图像水印、音频水印、视频水印、文本水印以及用于三数字水印技术的发展与应用3维网格模型的网格水印等。随着数字技术的发展,会有更多种类的数字媒体出现,同时也会产生相应的水印技术。·按水印的检测过程,可分为明文水印和盲水印。明文水印在检测过程中需要原始数据,而盲水印的检测只需要密钥,不需要原始数据。一般来说,明文水印的鲁棒性比较强,但其应用受到存储成本的限制。目前学术界研究的数字水印大多数是盲水印。·按水印的内容,可分为有意义水印和无意义水印。有意义水印是指水印本身也是某个数字图像(如商标图像)或数字音频片段的编码;无意义水印则只对应于一个序列号。有意义水印的优势在于,如果由于受到攻击或其他原因致使解码后的水印破损,人们仍然可以通过视觉观察确认是否有水印。但对于无意义水印来说,如果解码后的水印序列有若干码元错误,则只能通过统计决策来确定信号中是否含有水印。·按水印的用途,可分为票据防伪水印、版权保护水印、篡改提示水印和隐蔽标识水印。票据防伪水印是一类比较特殊的水印,主要用于打印票据和电子票据的防伪。一般来说,伪币的制造者不可能对票据图像进行过多的修改,所以,诸如尺度变换等信号编辑操作是不用考虑的。但另一方面,人们必须考虑票据破损、图案模糊等情形,而且考虑到快速检测的要求,用于票据防伪的数字水印算法不能太复杂。版权标识水印是目前研究最多的一类数字水印。数字作品既是商品又是知识作品,这种双重性决定了版权标识水印主要强调隐蔽性和鲁棒性,而对数据量的要求相对较小。篡改提示水印是一种脆弱水印,其目的是标识宿主信号的完整性和真实性。隐蔽标识水印的目的是将保密数据的重要标注隐藏起来,限制非法用户对保密数据的使用。·按数字水印的隐藏位置,可分为时(空)域数字水印、频域数字水印、时/频域数字水印和时间/尺度域数字水印。时(空)域数字水印是直接在信号空间上叠加水印信息,而频域数字水印、时/频域数字水印和时间/尺度域数字水印则分别是在DCT变换域、时/频变换域和小波变换域上隐藏水印。2.3基本理论框架一个数字水印方案一般包括三个基本方面:水印的生成、水印的嵌入和水印的提取或检测。数字水印技术实际上是通过对水印载体媒质的分析、嵌入信息的预处理、信息嵌入点的选择、嵌入方式的设计、嵌入调制的控制等几个相关技术环节进行合理优化,寻求满足不可感知性、安全可靠性、稳健性等诸条件约束下的准最优化设计问题。而作为水印信息的重要组成部分——密钥,则是每个设计方案的一个重要特色所在。往往可以在信息预处理、嵌入点的选择和调制控制等不同环节入手完成密钥的嵌入。数字水印一般过程基本框架示意图如图1和图2所示。图1水印嵌入的一般过程基本框架图1展示了水印的嵌入过程。该系统的输入是水印信息W、原始载体数据I和一个可水印生成算法(G)水印信息(W)原始载体数据(I)水印嵌入算法(E)加入水印后的数据(WI)私钥/公钥(K)数字水印技术的发展与应用4选的私钥/公钥K。其中水印信息可以是任何形式的数据,如随机序列或伪随机序列;字符或栅格;二值图像、灰度图像或彩色图像;3D图像等等。水印生成算法G应保证水印的唯一性、有效性、不可逆性等属性。水印信息W可由伪随机数发生器生成,另外基于混沌的水印生成方法也具有很好的保密特性。密钥K可用来加强安全性,以避免未授权的恢复和修复水印。所有的实用系统必须使用一个密钥,有的甚至使用几个密钥的组合。水印的嵌入算法很多,从总的来看可以分为空间域算法和变换域算法。具体算法将在后面详细介绍。由图1可以定义水印嵌入过程的通用公式:),,(KWIEIW(1)其中WI表示嵌入水印后的数据(即水印载体数据),I表示原始载体数据,W表示水印集合,K表示密钥集合。这里密钥K是可选项,一般用于水印信号的再生。图2水印检测的一般过程基本框架图2是水印的检测过程。由图2可以定义水印检测过程的通用公式为①有原始载体数据I时:),,(ˆKIIDWW(2)②有原始水印W时:),,(KWIDWW(3)③没有原始信息时:),(KIDWW(4)其中,W表示估计水印,D为水印检测算法,WI表示在传输过程中受到攻击后的水印载体数据。检测水印的手段可以分为两种:一是在有原始信息的情况下,可以做嵌入信号的提取或相关性验证;二是在没有原始信息情况下,必须对嵌入信息做全搜索或分布假设检验等。2.4数字水印嵌入算法数字水印技术的学科特点在于它横跨图像处理、多媒体技术、模式识别、密码学、数字通信等多学科领域,以这些领域的算法、思想和概念为基础。一个数字水印方案一般总是综合利用这些领域的最新进展,各学科的学者们也提出了不尽相同的算法。针对静态图象压缩标准JPEG[1],在离散余弦变换基础上植入数字水印的研究成为热点;针对目前流行的视频压缩标准MPEG[2]、H.263,Dittmann等[3]提出了两种适用于空域和频域的算法;1995年,Cox等[4]在传统通信系统的基础上,提出了扩频水印的概念。这种方法较好地利用了人类视觉系统的特性,水印信息经过一定的调制过程隐藏于数字图象感知比较重要的频谱部分,从而可以抵抗有损压缩和其它数字图象处理操作;Xia等[5]、Zeng[6,7]等做了基于离散小波变换的数字水印技术研究;Zhu等[8]在DWT技术上,从编码角度做了一些研究;Pitas等[9]在统数字水印(W)/原始数据(I)待检测数据(WI)水印检测算法(D)估计水印(W)/相似度检测(Sim)私钥/公钥(K)数字水印技术的发展与应用5计学和混沌的基础上,提出了一种新颖的算法;Wolfgang等[10]、schyndel等[11]在其定义的m-序列基础上,提出了可以有效抵抗线性和非线性滤波以及JPEG有损压缩的数字水印植入算法;Qu等[12]以图形着色问题为基础,提出了两种有趣的数字水印技术;Kankanhalli等[13]研究了基于图象内容的数字水印技术,这与