APP下载

基于DCT和神经网络的视频版权保护算法

2012-02-19张玉杰张媛媛

陕西科技大学学报 2012年1期
关键词:数字水印编码神经网络

张玉杰, 张媛媛

(陕西科技大学电气与信息工程学院, 陕西 西安 710021)

0 引 言

数字水印技术是利用数字作品中普遍存在的冗余数据与随机性,将数字、序列号、文字、图像标志等版权信息嵌入到数字作品本身之中,从而起到版权保护、秘密通信、数据文件的真伪鉴别和产品标识等作用.数字水印最初研究的重点是图像水印,已经取得了不少的研究成果,而且推出了一些实用的产品,而基于视频产品的水印研究则相对较少.随着多媒体技术的发展,视频产品越来越多,因此亟需解决视频产品的版权保护问题.在多媒体视频中嵌入数字水印作为一种版权保护方法,已成为多媒体安全领域的一个热点,也是信息隐藏技术研究领域的重要分支.为了节约数据存储和便于传输,视频的主要存储模式是压缩格式的,因此视频水印在很大程度上是与压缩编码标准紧密联系在一起的.当今视频压缩的国际标准包括MPEG系列、ITU-T的H.261和H.263等,都采用混合编码,MPEG系列标准是运用十分广泛的压缩编码标准,MPEG-4是其重要的组成部分[1].

本文对目前各种针对视频的版权保护技术进行了研究和分析,给出了一种基于神经网络和DCT的视频水印算法,能有效解决视频版权保护问题.此算法将水印嵌入到压缩编码后的视频I帧的DCT变换后的DCT系数中,神经网络用于水印的检测过程,较好地改善了水印算法的鲁棒性.

1 视频水印

视频序列可以被看作是由一系列连续的静止图像组成的时间序列,所以视频水印算法的研究在盲检测性、鲁棒性、不可见性等方面均可以借鉴已有的图像水印算法.而对于静止图像来说,图像水印容量有限,因此多数研究者利用HVS系统,以保证嵌入水印在可视范围内不影响图像质量.视频序列就不同,它存在静态分量的重复性及时间上的冗余性.在视频压缩编码中,都是通过运动估计与补偿、前后帧图像的运动参数及残差图像等来描述,因此视频数据压缩比大大提高,这样视频在传输存储过程中均以压缩的模式实现.

1.1 视频水印的特点

尽管视频与图像的水印算法有着多方面的承接性,但在研究视频水印时,更多需要考虑其区别于图像水印的特点[2]:

(1)视频水印系统中含有有损压缩编解码的过程.鉴于视频数据量的巨大,在传输存储中必须进行压缩编解码,因此水印必须具有一定的抵抗攻击的能力.

(2)视频水印的容量比图像水印更大.更大的可用载体容量为设计更具鲁棒性的水印方案提供了诸多的选择.

(3)视频水印的实时性要求.对于不同的应用我们有不同的实时性的要求,例如电视广播或者视频点播中应用数字水印实时性较高,称作强实时的;相反一些摄像录像过程中嵌入或提取水印,对实时性的要求就不高,称为弱实时的;而在需要存储的某些视频作品中,无论嵌入还是提取都对实时性没有要求.

(4)视频压缩编码的国际标准也影响水印算法设计的灵活性,因此在视频水印算法研究中需要与具体的应用系统相结合,根据不同要求来设计水印方案.

1.2 视频水印的分类

(1)前置视频水印技术. 前置视频水印技术是将水印直接嵌入在原始未压缩视频数据中.此类嵌入方法多采用已有的静止图像水印技术,其中水印嵌入过程可分为两类:其一是直接在视频帧图像的空间域嵌入水印;另一种是将空间域图像帧作某种变换,包括图像帧自身时-频域的变换和前后帧某种特征的提取,将水印嵌入.

前置水印需要经历视频的压缩编解码过程,肯定导致部分水印信息的丢失,影响水印提取检测,因此设计算法时应着重考虑其抗压缩编码的鲁棒性问题.

(2)内置视频水印技术. 内置视频水印技术是将水印嵌入算法与视频编码系统相结合,并内嵌于视频压缩编码器之中,利用视频编码过程中产生的信息来调制水印嵌入.内置视频水印技术是针对特定的视频编码系统来设计的,可以更好地控制水印的调制.该类视频水印算法设计受压缩编解码系统算法复杂度的影响,因此水印算法需要使用与系统算法相同的技术.例如在MPEG编码标准中,由于是以DCT变换为核心的,因此无法使用小波变换等技术.内置视频水印的优势在于水印嵌入算法与视频压缩编码算法相关联,这样在嵌入时可以利用编码过程中的信息特征来调制水印嵌入.另外,视频编码过程中会产生多种编码特征的数据信息也可以用来作为嵌入点.因此,内置视频水印中水印嵌入点的多样性也是一大优势.现有的算法中,一般嵌入点位置选择有下面几种:原数据、DCT变换系数、量化后变换系数、运动分量和VLC数据码流.本文提出的水印方案就是基于此类嵌入技术的.

(3)后置视频水印技术. 后置视频水印技术是将水印信息嵌入到压缩编码之后的数据中的方案,这种技术基于重要的应用背景,首先是视频作品的版权保护,它可以不需要完全视频解码再编码来完成水印的视频嵌入,从而保护视频作品.相应的算法设计必须考虑编码后码流格式和传播环境的约束,还要考虑到可能对解码系统造成的影响,因此此方案对压缩编码系统的依赖性更大,在实现上有着不小的难度.

1.3 视频水印常见的嵌入方案

目前数字水印的嵌入方案主要有以下3种:

嵌入方案一:是将水印信息直接嵌入到原始视频数据中,形成含水印的原始视频信息,然后进行MPEG视频编码.虽然这种方案可以充分利用各种静止图像数字水印技术和策略,同时该方案不会影响标准MPEG编解码器的使用,但水印信息的引入通常会导致整体码流信息的增加,而经过MPEG编解码处理以及水印信息的再编码后可能会造成部分水印信息的丢失,从而为水印的提取和检测带来诸多不利因素.但是这种嵌入方案的最大优点是计算复杂度低、易于实现.

嵌入方案二:水印嵌入在编码阶段的离散余弦变换的直流系数(DC)中(量化后、预测前),此类方案的优点是水印仅嵌入在DCT系数中,不会增加视频流的数据比特率;易设计出抗多种攻击的水印;可通过自适应机制依据人类视觉特性进行调制,在保持较好的主观视觉质量的同时保持较强的抗攻击能力.缺点是对于已压缩的视频有一个部分解码、嵌入、再编码的过程.

嵌入方案三:水印直接嵌入在MPEG-4压缩比特流中,此类方案的优点是不需完全解码和再编码的过程,对整体视频信号的影响较小;缺点是视频系统对视频压缩码率的约束将限制水印的嵌入量,同时水印的嵌入可能造成对视频解码系统中运动补偿环路的不良影响,而且该算法设计具有一定的复杂度.

综合以上方案,依据嵌入方案二,作者提出了用确定的神经网络来实现水印的盲提取,达到视频版权保护的目的.

图1 径向亟数基网络的结构示意图

2 RBF神经网络

径向基函数(RBF)网络是以函数逼近理论为基础而构造的一类前向网络,该网络的学习等价于在多维空间中寻找训练数据的最佳拟合平面.径向基函数网络是一种局部逼近网络,即对于输入空间的某一个局部区域只存在少数的神经元用于决定网络的输出.BP神经网络是典型的全局逼近网络,对每一个输入/输出数据对网络的参数都要调整.而径向基函数网络规模远远大于BP网络,但是学习速度快,并且网络的函数逼近能力、模式识别和分类能力都优于后者,一个典型的径向基函数网络包括两层,即隐层和输出层,如图1所示为一径向基函数网络的结构图.

3 视频水印的嵌入算法

3.1 水印信息的选择

在数字水印系统设计中, 首先要决定在被保护的数字产品中嵌入什么样的数字信息以此作为水印信息.目前, 主要采用的水印信息有两种: 一是不带任何实际意义的随机序列, 无法说明提取出来的水印具体是什么; 二是带有实际意义的数字信号, 如版权ID 号、数字图像等等.以随机序列作为水印信息的水印方案非常多, 其目的是为了增强嵌入水印后的图像对于合谋攻击的抵抗能力.但在某些实际应用中, 需要进行有意义的信息的嵌入,而版权ID 码的抗干扰能力非常有限, 为此应该充分考虑利用人类视觉有限分辨率的特点, 以二值图像作为水印信息是目前采取的较好的选择.

3.2 水印信息的加密

随着信息安全与保密倍受重视, 图像加密技术得到了快速发展, 数字图像置乱技术由此诞生.该技术可看作是由经典密码学中的单表系统扩展而来, 早期用于对模拟图像的位置空间进行置换.针对数字图像, 置乱过程可以在数字图像的空间域甚至频率域上进行.简单地说, 数字图像置乱是对数字图像的一种加密算法, 其算法设计者可以对算法的选择、参数的选择以及使用随机数的技术进行自由控制, 目的是使非法攻击者无法对图像的内容进行破译.经过置乱变换之后的图像已经面目全非, 在不知道所使用的置乱变换情况下, 想要恢复出原始图像是极其困难的.

目前, 数字图像的置乱技术主要有: Arnold 变换、Hilbert 曲线、Conway 游戏、Tang 锄算法、幻方、IFS 模型等.通常,可以通过利用置乱技术, 以给定的密钥来确定水印嵌入的位置, 再嵌入水印;或者直接利用置乱技术进行图像加密.

在数字水印算法中使用置乱技术, 需要考虑两方面: ( 1) 计算量尽可能的小; ( 2) 置乱度尽可能的大.Arno1d 算法实现起来容易, 其置乱次数能够为隐藏系统提供密钥( key) , 增强了系统的安全性和保密性, 同时该算法实现的置乱解决了随机置乱的不可恢复性, 因此本文采用Arnold 变换进行二值水印图像的处理.

Arnold 变换俗称猫脸变换, 是Arnold 在遍历理论研究中提出的一种变换方法.该变换设有单位正方形上的点(x,y) , 对点(x′,y′)的变换为:

(1)

此变换称为二维Arnold 变换, 也简称Arnold 变换.在数字图像上对Arnold 变换进行应用, 可以通过改变像素坐标从而改变图像像素点的布局.实际上, Arnold 变换可看作是一种点的位置移动变换, 并且这种变换是一一对应的.如果把数字图像用一个矩阵表示, 则经过Arnold 变换后的图像会变得面目全非, 但如果继续对其进行Arnold 变换, 那么一定会出现与原图一致的图像, 即Arnold 变换是具有周期性的变换.

3.3 水印嵌入方案设计

本水印嵌入方案是基于帧的编码方案, 使用一个二值序列S,由P和Q两部分组成:S=P+Q,P是一个长度为K的固定模式序列,Q是图片版权拥有者期望嵌入的长度为L的加密后的水印信息,模式序列P用于训练神经网络.将水印信息嵌入到标准的矩形帧( I 帧) 的DCT 变换后的DCT 系数中.

为保证数据内容得到较好的保护, 向视频中嵌入水印的周期应尽可能的小, 但过小的水印嵌入周期会导致视频图像的视觉效果大幅度降低.所以, 通常情况两次水印嵌入的间隔时间最长不得超过1 s.MPEG 4 视频编码标准中, 视频可看作是由一个或多个画面组( GOP) 序列构成, 画面组的长度没有严格限制, 但要求至少有一个I帧图像.一般地, 每个画面组由12 帧图像构成,包括1个I帧、3个P帧、8个B 帧, 排列顺序为IBBPBBPBBPBB.本水印嵌入算法方案仅在I帧中进行水印信息的嵌入, 并保证每个画面组有一张水印图像嵌入, 即每隔12 帧图像进行一次水印嵌入操作.

该算法中,采用附加进水印信息的模板去训练神经网络,通过机器学习的方法得到模板特征数据与嵌入了水印数字视频数据的关系(权值),从而利用此值和神经网络输出嵌入到数字视频中的未知的水印信息.

4 水印的检测方案设计

本文利用神经网络来提取水印,不需要使用宿主图像,实现了水印的盲提取.水印的提取过程是水印嵌入的逆过程.

水印提取算法的描述如下:

(1)对含水印视频进行解码,提取I帧中的DC系数( 量化后预测前).

(2)提取水印位置嵌入点的像素值和模式序列.根据RBF神经网络的模型和参数得到含水印图像的网络输出值ti,比较水印嵌入点的像素值xi与网络输出值ti之间的大小,如果xi>ti,则水印值为1,否则为0.依次排列为一个序列.

(3)对恢复所得的序列做逆“之”字排序,得到置乱的水印图像.

(4)利用密钥key 对置乱的水印图像做Arnold 逆变换,变换所得的图像即为水印图像.

5 仿真实验结果

在MATLAB环境下进行水印嵌入、提取以及鲁棒性测试实验,水印图像为256×256的带有“陕西科大”字样的二值图像,宿主视频为中央电视台的一段新闻视频节目,这段视频播放速度是每秒30帧,主要内容是新闻主持人在室内播音的视频流.

图2和图3中给出了Arnold变换的实例,从左到右依次为原始水印、迭代30次的水印以及迭代192次的水印.

图2 迭代30次的水印图 图3 迭代192次的水印图

图4 原始视频 图5 嵌入水印视频

图6 提取的水印

神经网络选用RBF神经网络,隐含层神经元采用tansig传递函数,输出层采用logsig传递函数,神经网络的训练目标误差为0.000 1.原始视频、嵌入水印的视频和提出的水印图像如图4、图5和图6所示.

6 结束语

本文提出的对视频版权保护的方案能有效地将水印嵌入到视频流中, 抵御目前常见的多种攻击.本文详细给出了一种基于DCT 系数、Arnold 变换和神经网络技术的视频水印算法, 该算法比其他方法对视频版权的保护效果更好,可以有效增强视频流的鲁棒性以及抵抗多种攻击.神经网络的引入,解决了传统方法所不能解决的问题,促进了数字水印技术的进一步发展.

参考文献

[1] 马 洁,李建福.基于混沌映射的视频数字水印算法[J].计算机科学,2010,37(9):287-290.

[2] 叶 青,黄晓放.视频数字水印技术在版权保护中的研究与应用[D]. 武汉:武汉理工大学硕士学论文,2008.

[3] 张德丰.Matlab小波分析与工程应用[M].北京:国防工业出版社,2008:65-78,115-130.

[4] 陈 军,张 伟,杨华千,等. 一种基于小波变换和神经网络的数字水印算法[J].计算机科学,2011,38(6):142-144.

[5] 唐松生,董 颖.基于DWT的视频数字水印算法[J].信息技术,2008,(4):116-117.

[6] 项巧莲.基于JPEG图像格式的数字版权信息隐藏方法研究[J].武汉科技学院学报,2008,21(1):47-49.

[7] 尹忠海,周翔翔. 基于变换域数字指纹/水印的叛逆者追踪[J].网络安全技术与应用,2008,(3):59-62.

猜你喜欢

数字水印编码神经网络
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
基于网屏编码的数字水印技术
神经网络抑制无线通信干扰探究
Genome and healthcare
基于FPGA的数字水印提取系统设计研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于数字水印的人脸与声纹融合识别算法