APP下载

一种自适应复倒谱音频水印算法

2010-01-10黄雄华蒋伟贞

关键词:鲁棒性比特音频

黄雄华,蒋伟贞

(1.桂林电子科技大学教学实践部,广西桂林 541004;2.暨南大学信息科学技术学院,广东广州 510084)

0 引 言

计算机技术和通信技术的发展使得数字作品能被方便的复制、篡改和传输,数字水印技术作为一种新的保护版权、鉴定作品完整性的有效手段,受到人们的广泛的关注和研究[1].同时,在需要重播的应用中,数字水印技术是替代密码学的潜在解决方法之一[2,3].

复倒谱分析是语音信号处理中的一种强有力的分析手段.倒谱分析是同态系统的理论基础,其在语音识别、地震检测、声纳分析等方面有广泛的应用.已有学者在倒谱域中研究倒音频水印并取得了一些成果,如文献[4,5]提出的倒谱域统计均值修改算法,文献[6]提出的倒谱域BCH纠错码的鲁棒音频水印算法,以及文献[7,8]提出的根据人类听觉感知特性和心理声学模型定性控制水印嵌入的倒谱域音频水印算法.这些算法的一个共同问题在于缺乏定量的自适应机制,因为水印的嵌入强度等参数需要反复实验来获得,且难以得到最合适的值.基于此,本文提出一种根据SNR来自适应确定水印嵌入强度的音频水印算法,该算法可根据听觉要求的SNR自适应确定最大嵌入强度,且水印具有较好的鲁棒性.

1 离散傅立叶变换及其性质

离散傅立叶变换(DFT)是倒谱分析的核心,本文的自适应算法应用其相关性质.

音频信号的傅立叶变换及其逆变换可表示为,

并且有下述性质:

(5)式中,I表示单位阵.

其中,~a 表示a的共轭.i×ji×j

2 音频信号的复倒谱变换过程

音频信号的复倒谱变换过程如图1所示.

图1 复倒谱变换的过程

图1中,x→={xi|0≤i<N},表示输入的音频信号,X→={Xi|0≤i<N},表示经DFT变换后的信号,lnX→={lnXi|0≤i≤N-1},表示取对数后的信号,C→={Ci|0≤i≤N-1},表示倒谱系数.复倒谱域的变换是可逆变换,其逆变换过程如图2所示.

图2 复倒谱的逆变换过程

3 自适应复倒谱统计均值修改算法

3.1 复倒谱统计均值修改算法原理

复倒谱统计均值修改(CCSMM)算法[1,3,5]的基本原理为:首先,将音频数据分帧,对每帧求复倒谱系数;其次,计算每帧的倒谱系数的均值,并将每个倒谱系数减去均值;最后,根据水印比特“1”或“0”,调整统计均值分别为M1或M2,并作逆变换.水印的提取以(M1+M2)/2为门限,倒谱系数均值大于门限提取“1”,否则提取“0”.

显然,上述算法中M1和M2的确定选择需要反复实验以满足水印的鲁棒性和透明性的要求,最佳取值通常难以获得,M1和M2的取值与音频信号有关.基于此,本文通过SNR来确定M1和M2的值,提出了一种自适应复倒谱统计均值(ACCSMM)音频水印算法.

3.2 ACCSMM算法相关原理

3.2.1 倒谱域与时域的对应变化关系.

以下沿用前述的符号及其意义,并在相应的符号上加“′”号表示倒谱域变化后对应的值(即添加水印后的相应值).若倒谱域每个系数变化量为Δ,倒谱系数可表示为,

那么,倒谱系数经过DFT变换后的表达式为,

其中,T表示转置(以下同).由式(3)、(4),式(8)可简化为,

式(9)经过指数化过程,可表示为,

式(11)经过 IDFT变换后,可表示为,

3.2.2 音频质量评价准则.

目前,音频水印对嵌入了水印的音频失真评价标准借鉴了信号处理的方法,即通过峰值信噪比PSNR(Peak Signal to Noise Ratio)和信噪比SNR来衡量嵌入水印后音频信号的听觉失真度.

设 x→是含有 N个样点的原始数字音频信号, x→={xi|0≤i<N},xi是幅值序列.x→′是嵌入水印后的数字音频信号,x→′={x′i|0≤i<N},x′是幅值序列.音频信号,x→′的SNR定义为:

由式(10)、(12),式(13)可表示为,

其中,Ci是xi的函数.式(13)表明,对确定的帧长N,由初始信号和要求的音频失真度量SNR可以自适应地确定倒谱变化量.

4 水印的嵌入算法

根据上述的原理,我们采用视觉可见的二值图像作为水印,二值图像表示为:P={P|pm×n,0≤m<M,0≤n<N},pm×n表示图像像素,M,N分别为图像的宽和高;音频表示为,X={X|xi,0≤i≤L},xi表示音频幅度,L是音频长度.算法的具体步骤如下:

首先,将图像水印经过降维处理,

其次,从音频起始处开始做分帧处理,每帧长度l=?L/M·N」,?·」表示取整.

然后,对每帧按下述方法嵌入一比特的水印.记,x(j,k),1≤k≤l,1≤j≤M×N,表示第j帧的第 k个数据,并对所有的帧求复倒谱变换,

就研究区域而言,以视域分析为评价标准,制定合理的建筑高度,重组广场空间序列,通过对其景观视点与视线的控制,建立良好的视觉廊道体系.图8是教堂广场空间现有视觉廊道的示意图,在实际改造中,可打开作为实际入口空间的肥城支路与中山路交汇处空间,使其落于可见度的核心区域,而实际出口区域(曲阜路东段与浙江路交汇口)应适当缩小占地面积,对人流形成明确指引路线,在整体设计上完善原有视觉廊道体系,形成以天主教堂为统领,各区域层次分明、功能明确的视觉廊道体系.或者直接打开空间,使整个区域形成连贯开放的视觉廊道体系,整体空间以天主教堂为重心,各区域相互呼应,提高整体空间品质及空间使用效率.

>0,设定添加水印后的统计均值门限为“0”,统计均值大于“0”提取比特“1”,统计均值小于“0”提取比特“0”,可以实现水印的盲检测.同时,为使水印鲁棒性较好,δ(j)可选取,

最后,将嵌入水印后的倒谱系数做逆倒谱变换,从而得到含水印的音频.

5 水印的提取

根据前面的分析,我们可以实现水印的盲提取:首先,将带水印的音频分帧,帧长与嵌入水印时相同;其次,对每帧作倒谱变换,计算其统计均值,并与与门限“0”比较,如果大于“0”,提取比特“1”;否则,提取比特“0”;最后,将水印比特按序排列并升维还原图像水印.

6 实验结果

在实验中,我们选用了图3所示的64×64的二值水印图像,并截取了名为flybird.wav的音频左声道前50 s的音频数据作为载体音频,采样频率为44.1 KHz,16比特量化.预设含水印各帧局部信噪比为60 dB,在未受攻击的情况下,提取的水印如图4所示.比较图3、4可见两者几乎无视觉上的差异.

图3 原始水印图像

图4 未受攻击提取的水印

为了测试算法的鲁棒性,本文对水印音频进行了多种攻击模拟:包括MP3压缩,压缩率为128 kbps;高斯白噪声,方差为0.01;低通滤波,截止频率为6 KHz;重采样,采样频率为11 025 Hz.攻击后提取的水印如图5所示.

图5 攻击模式测试

表1 不同攻击模式下水印的归一化相关值表比较

式中,P,Ps分别表示原始水印图像和提取的水印图像;p(m,n),ps(m,n)分别表示其像素(m,n)值.

实验结果表明,本文提出的水印算法在较高的SNR条件下仍具有较好的鲁棒性.

7 结 论

本文利用复倒谱域系数的统计均值趋于零的特性,以“0”为水印提取门限,实现了水印的盲提取.同时,为了提高水印的鲁棒性,在嵌入水印过程中应用了音频信号失真评价准则——信噪比来控制水印的不可听性.在信噪比确定的情况下,按式(14)计算取得最大水印嵌入强度,相应的也就取得了最大水印鲁棒性,实验的结果也表明了水印在不可听的情况下的鲁棒性.

[1]Cox IJ,Miler ML.The First50Years of Electronic Watermarking[J].Applied Signal Process,2002,56(2):225-230.

[2]Arnold M.Audio Watermarking:Features,Applications,and Algorithms[C]//IEEE Multimedia and Expo.NewY ork:IEEE Press,2000:1013-1016.

[3]Swanson M D,Zhu B,Tewfik A H.Robust Audio Watermarking Using Perceptual Masking[J].Signal Process,1998,66(3):337 -355.

[4]Xin L,Heather Y H.Transparent and Robust Audio Data Hiding in Cepstrum Domain[C]//Proceedings of IEEE International Conference on Multimedia and Expro.New Y ork:IEEE Press, 2000:397-400.

[5]K wang L S,Sung H Y.Digital Audio Watermark-ing in the Cepstrum Domain[J].IEEE Trans On Consumer Electronics,2000, 46(3):744-750.

[6]Liu S C,Lin S F.BCH Code-Based Robust Audio Watermarking in the Cepstrum Domain[J].Journal of Information Science and Engineering,2006,22(1):535-543.

[7]G opalan K.Audio Stegnography by Cepstrum Modification[C]// Conference on Acoustice,Speech and Signal Processing.Philadelphia:IEEE Press,2005:481-484.

[8]年桂君,王树勋,唐笑年.倒谱域自适应音频水印算法[J].吉林大学学报,2008,26(1):55-61.

猜你喜欢

鲁棒性比特音频
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
基于确定性指标的弦支结构鲁棒性评价
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
比特币还能投资吗
比特币分裂
音频分析仪中低失真音频信号的发生方法
比特币一年涨135%重回5530元
基于非支配解集的多模式装备项目群调度鲁棒性优化
非接触移动供电系统不同补偿拓扑下的鲁棒性分析