APP下载

基于PN序列和完全互补码的鲁棒音频水印算法

2019-11-20陈亮李德

关键词:鲁棒性音频剪切

陈亮, 李德

( 延边大学 工学院, 吉林 延吉 133002 )

0 引言

随着计算机网络技术的蓬勃发展,数字音频作品的存储、复制和传播变得越来越容易,而随之而来的版权纠纷问题时有发生[1].近年来,一些学者利用数字音频水印技术对数字产品的版权问题进行了研究,并取得了较好的研究成果.例如:高雪丽等[2]利用奇异值分解技术提出了一种轮廓波变换的水印算法,该算法在抵抗高斯噪声、裁剪攻击和压缩攻击方面具有很强的鲁棒性,但当压缩比逐渐提高后,鲁棒性会逐渐降低.杨振仁等[3]利用图像归一化技术提出了一种采用Arnold和扩频技术将音频进行离散余弦变换(discrete cosine transform,DCT)的水印算法,该算法对仿射变换、高斯噪声等攻击具有很好的鲁棒性,但在抵抗剪切攻击方面相对较弱.Hu等[4]在变换域的基础上应用量化索引调制技术,并根据人耳的听觉掩蔽效应提出了一种DCT水印算法,该算法对高斯噪声和滤波攻击具有较好的鲁棒性,但对幅值修改、剪减等几何攻击的鲁棒性较差.Bhat等[5]通过对音频信号块进行奇异值分解,提出了一种离散小波变换(discrete wavelet transformation,DWT)算法,该算法在水印检测方面的误检率和漏检率较低.Lei等[6]提出了一种基于音频向量关系的算法,经计算机模拟验证表明该算法对水印有良好的鲁棒性,但对音频的随机剪切等几何攻击的鲁棒性较差.Fallahpour等[7]提出了一种基于奇异值分解(singular value decomposition,SVD)的DCT域水印算法,该算法在水印的鲁棒性和可嵌容量方面较为平衡,但因缺乏同步机制容易造成误检测.Kumsawat等[8]提出了一种遗传算法(genetic algorithm,GA),该算法在理论上可以平衡水印的不可感知性和鲁棒性,但实验结果显示鲁棒性并未有明显提升.基于上述研究,本文针对数字音频作品的版权保护,将回声隐藏技术和扩频技术相结合,提出一种对多种攻击透明性好、鲁棒性强的音频水印算法.

1 相关技术介绍

1.1 PN序列回声隐藏

最长线性反馈移位寄存器序列是回声隐藏技术中最为常见的伪随机序列(M序列),其通常由反馈移位寄存器生成.由于M序列和随机噪声的特性都具有随机特性和周期性,因此M序列又被称为伪噪声序列(PN序列)[7].在信息隐藏过程中,首先需对音频信号进行分割,并将回声引入每个音频段的前后核,然后通过计算音频信号中每个音频段的短时能量值,以此自适应地调整前后回声核的衰减系数an.自适应调整规则如下:

(1)

1.2 完全互补码

由以上描述可将互相关函数表示为Rc1c2(τ), 且当c1=c2时Rc1c2(τ)为自相关函数.由此可知,可将完全互补码定义为一组M序列的自动互补码,由其构成的矩阵为:

(2)

其中M和N分别表示完全互补码构造矩阵的行数和列数,C表示一段完全互补序列.公式(2)中每行构成一组完整的完全互补序列,即每行在行内形成自相关,每两行序列码之间形成互相关.

2 音频水印算法的设计

2.1 音频水印的嵌入算法

本文算法的音频水印嵌入流程如图1所示,构造步骤见步骤1—步骤3.

图1 音频水印信息的嵌入流程

步骤2 载体信息处理.本文在载体信息处理中使用的PN序列为10阶的M序列.通过计算水印序列w(n)和PN序列c(n)即可生成扩频信号s(n),s(n)的计算公式为s(n)=w(n)⊕c(n).由于PN序列具有伪随机特性,因此扩频信号s(n)的频谱宽度远大于原始水印的频谱宽度.设水印信息d(n)的比特率为Kbps,如果扩频序列每个码片的传送时间为Tc, 则扩频信号的带宽Wss=1/Tc.在载体信息处理阶段,基带信号也需要处理,其处理过程为:首先对二进制数字基带信号进行差分编码,将绝对码表示的二进制信息转换成相对码表示的二进制信息,然后进行绝对相位调制.

步骤3 水印信息的嵌入.水印隐藏信息的整个嵌入过程具体如下:

1)使用矩形窗口均匀分割音频信号时,窗口长度以T为单位,即每个窗长包含N(N=T×fs,fs为音频信号的采样频率)个采样点数,且将音频信号分为M个音频段(不足一个时长T的部分不计).

3)对前后向回声核进行改造得到新的回声内核,改造公式为:kn=δ(n)+(-1)p+1(αδ(n-d)+αδ(n+d)), 0<α<1.将d0和d1定义为延时, 然后按照公式(3)完成水印嵌入.

(3)

5) 将所有音频段按照它们被分段的顺序重新组合成完整的音频信号.

图2 音频水印信息提取流程图

2.2 音频水印的提取算法

音频水印的提取过程与水印的嵌入流程相反.图2为水印信息的提取流程图,具体提取步骤如下:

步骤1 采用窗函数设计带通滤波器(FIR滤波器).过滤器的顺序是127, 函数选择汉明窗.本段带通滤波器的主要参数为:中心频率为4 900 Hz, 起始频率为3 400 Hz, 截止频率为6 400 Hz, 滤波器带宽为3 000 Hz(大于发送端带通信号的带宽).

步骤2 对上一步得到的基带信号进行去噪,提取水印序列.

步骤3 将步骤2中得到的相关值与阈值进行比较,得到水印序列.

步骤4 在时域内提取水印信息.在嵌入隐藏信息的过程中,由于水印信息隐藏的音频信号具有与PN序列相同的分布特征,且回声核衰减系数的符号由PN序列控制,因此本文使用PN序列对每个音频段执行自相关检测.

3 实验结果与分析

3.1 实验环境

实验采用3种波形音频信号(分别标记为1(轻音乐)、2(钢琴乐)和3(摇滚乐)),每种波形音频信号时长为3 min.音频采样频率为44.1 kHz, 量化精度为16位.使用12个长度的随机二进制序列作为水印序列,水印强度系数α为动态嵌入强度.

3.2 透明性验证

音频信噪比(SNR)是评价噪声信号在原始音频信号中嵌入强度的一种有效方法.通常,信噪比越大,人耳感知噪声的能力越困难,即表明水印信息的隐藏效果越好,水印信息的透明性越高.图3为原始音频和含水印信息音频图.由图3可以看出,二者之间虽然存在差异,但并不明显,这表明本文水印算法具有较高的透明性.

表1为不同嵌入强度的信噪比.由表1可以看出,本文算法的信噪比SNR随着嵌入强度的增大而逐渐减小,由此可知人耳对音频载体嵌入噪声的感知随嵌入强度的增大逐渐减小,这表明本文算法得到的音频水印具有较好的不可感知性,音频效果良好.

图3 原始音频图和含水印音频图

嵌入强度SNR/dB0.00151.490.00346.650.00541.980.00737.460.00933.970.01032.120.02025.01

3.3 鲁棒性验证

为了测试本文算法的鲁棒性,对音频载体分别进行滤波、剪切、噪声、重采样和MP3压缩攻击实验,具体的实验结果如下.

1)滤波攻击.采用截止频率为1 kHz的巴特沃斯低通滤波器对音频信号进行滤波.滤波阶数分别为1、2和4时,(滤波攻击的结果(相似度(NC)与比特出错概率(BEP))如表2—表4所示.由表2—表4可以看出,本文算法能够有效地抵抗低通滤波攻击,说明本文算法对低通滤波攻击具有很强的鲁棒性.

表2 滤波攻击轻音乐(1号)的结果

表3 滤波攻击钢琴乐(2号)的结果

表4 滤波攻击摇滚乐(3号)的结果

2)剪切攻击.用回声隐藏信息剪切30、60 s和90 s的音频信号,实验结果如表5—表7所示.由表5—表7可以看出,音频经过3个时长的剪切攻击后,仍能提取出较为准确的水印信息,这说明本文算法对剪切攻击具有较强的鲁棒性.

表5 剪切攻击轻音乐(1号)的结果

表6 剪切攻击钢琴乐(2号)的结果

表7 剪切攻击摇滚乐(3号)的结果

3)噪声攻击.在音频信号中引入100、300 dB和900 dB的白噪声,实验结果如表8—表10所示.由表8—表10可以看出,本文算法能够有效地抵抗噪声攻击,说明本文算法对噪声攻击具有很强的鲁棒性.

表8 噪声攻击轻音乐(1号)的结果

表9 噪声攻击钢琴乐(2号)的结果

4)重采样攻击.对音频信号分别进行22.05、16 kHz和11.025 kHz的采样攻击,结果如表11—表13所示.由表11—表13可以看出,本文算法能够有效地抵抗重采样攻击,说明本文算法对重采样攻击具有很强的鲁棒性.

表11 重采样攻击轻音乐(1号)的结果

表12 重采样攻击钢琴乐(2号)的结果

表13 重采样攻击摇滚乐(3号)的结果

5)MP3压缩攻击.对音频信号进行压缩编码(压缩比为12.5∶1),解码后提取隐藏信息,结果如表14所示.由表14可以看出,本文算法可较好地抵抗MP3压缩攻击,说明本文算法对MP3压缩攻击也具有较好的鲁棒性.

表14 MP3压缩3种类型音乐的结果

3.4 算法性能比较

为验证本文算法在抵抗攻击方面的性能,将本文算法分别与文献[9](语音内容认证算法)、文献[10](线性预测倒谱滤波算法)和文献[11](基于音频特征的鲁棒水印算法)的算法进行对比,检测结果如表15所示.从表15可以看出:本文算法在抵抗高斯噪声、滤波、重采样攻击时其性能均优于文献[9-11]的算法;在抵抗剪切和MP3压缩攻击时,其性能均优于文献[9]和文献[11]的算法,但略低于文献[10]的算法.综合来看,本文算法不仅明显优于文献[9]和文献[11]的算法,而且略优于文献[10]的算法.

表15 不同算法的性能

4 结论

研究表明,本文提出的基于PN序列和完全互补码的数字音频水印算法对水印信息的检测率超过98%,对高斯噪声、滤波和重采样等攻击的水印信息检测率超过90%,且在抵抗高斯噪声、滤波、重采样、剪切和MP3压缩攻击时其性能均优于文献[9]和文献[11]的算法,在抵抗高斯噪、滤波、重采样攻击时,其性能优于文献[10]的算法,说明本文算法的鲁棒性较强,具有很好的应用价值.本文算法在抵抗剪切和MP3压缩攻击时的效果略低于文献[10]的算法,因此在今后的研究中,我们将探讨利用QR分解和小波变换的方法来进一步提高本文算法对抗剪切攻击和MP3压缩攻击的鲁棒性.

猜你喜欢

鲁棒性音频剪切
武汉轨道交通重点车站识别及网络鲁棒性研究
东天山中段晚古生代剪切带叠加特征及构造控矿作用
TC4钛合金扩散焊接头剪切疲劳性能研究
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
基于确定性指标的弦支结构鲁棒性评价
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
音频分析仪中低失真音频信号的发生方法
混凝土短梁斜向开裂后的有效剪切刚度与变形
非接触移动供电系统不同补偿拓扑下的鲁棒性分析