基于LWT-DCT-QR混合域的音频信号水印算法
2017-04-25虞文进徐培富王文娟叶志晖
虞文进, 徐培富, 王文娟, 叶志晖
(浙江中烟工业有限责任公司, 浙江 宁波 315000)
基于LWT-DCT-QR混合域的音频信号水印算法
虞文进, 徐培富, 王文娟, 叶志晖
(浙江中烟工业有限责任公司, 浙江 宁波 315000)
为提高音频水印的鲁棒性,设计了一种基于LWT-DCT-QR混合域的水印嵌入方法,充分发挥提升小波变换运算速度快、离散余弦变换抗干扰能力强以及QR分解数值稳定性好的特点,并通过Logistic混沌序列进行加密,从而实现水印图像的嵌入与提取。通过噪声、采样、滤波、剪切、压缩等攻击对水印的安全性、不可感知性以及鲁棒性进行了仿真与测试,并利用水印信号的相关系数(NC)和信噪比(SNR)进行分析评定。测试结果表明,所提出的水印算法具有较强的抗攻击能力,与相关文献相比具有一定的优越性。
音频水印; 提升小波变换; 离散余弦变换; QR分解
0 引 言
根据嵌入过程中对音频信号处理方式不同,水印算法主要分为时(空)域法和变换域法两种。时域法不经过任何变换,直接把水印嵌入到音频信号上,该方法简单易实现,但水印比较脆弱,容易受到攻击,鲁棒性差[1];变换域法在信号处理过程中加入了域的变换,从而增加了水印的抗攻击能力,如离散傅里叶变换、离散余弦变换等[2-3]。为了进一步发挥各算法的优势,目前学者们都在不断致力于混合域水印算法的研究。如文献[4]中提出一种基于小波包和心理声学模型的数字音频水印算法,利用心理声学模型自适应控制嵌入水印时引起的听觉偏差,提高了水印的不可感知性。文献[5]中利用小波变换多分辨率分析与奇异值分解鲁棒性强的特点,提出一种基于DWT-SVD的音频零水印算法。文献[6]中提出一种基于小波变换与离散余弦变换的水印嵌入方法,提出可利用小波变换模拟临界频带的划分方法,在特定的频带上进行水印的嵌入。
不可感知性和鲁棒性是衡量水印算法是否有效的重要指标[6],但两者却存在着一定的矛盾,提高鲁棒性常常会影响音频水印的不可感知性。同时在水印嵌入过程中,往往会使原始音频信号发生改变,使得数字水印所具有的鲁棒性受到破坏。基于此,本研究提出一种基于LWT-DCT-QR的多混合域音频水印算法,从而实现水印信号的嵌入与提取,并通过鲁棒性测试检验该算法的不可感知能力及抗攻击能力。
1 相关理论分析
1.1 QR分解
QR分解是一种线性代数工具。任意一个矩阵A∈Rm×n(m≥n)都可以用一个对角大于0的上三角矩阵和一个正交矩阵来表示,且分解唯一,即[7]:
(1)
正交矩阵是性态最好的矩阵,所以QR分解具有分解速度快,数值稳定性好的特点。
1.2 提升小波变换
小波变换是通过对基底的伸缩和平移来构造小波基函数,具有多分辨率分析的特点,但由于计算过程复杂使其应用受到一定的限制。因此出现了提升小波变换算法(LWT),该方法不依赖于傅里叶变换,先是对现有的小波滤波器进行分解,然后分步实现小波变换,从而大大提高了计算效率。
LWT包括分解(Split)、预测(Predict)和更新(Update)3个过程[8],如图1所示。
图1 提升小波分解过程
分解就是将原始信号分解为包括偶数序列even1和奇数序列odd1的两组互不相交的子集的过程,可表示为
(2)
预测是利用一组序列来预测另一组序列的过程。设预测值为P(even1),则与实际值之间的差值为
(3)
式中:P为预测算子;d1反映了预测值与实际值的相似程度,即差值越小,相似度越高,与原始信号的高频部分相对应。
为使分解后得到的子集与原始信号的某一标量特性保持一致,利用预测的差值去更新原始的偶数序列,更新过程为
(4)
式中:U为更新算子;s1为原始信号的低频部分。
原始信号在经过一次提升小波分解后,得到低频分量s1和高频分量d1,忽略高频分量,对低频分量再进行一次提升小波分解,又得到低频分量s2和高频分量d2,如此反复就可以对信号不断进行分解。通过改变分解流程中的数据流方向及符号可实现提升小波的逆变换,此过程称为提升小波的重构,包括更新、预测、合并过程。
1.3 离散余弦变换
离散余弦变换(DCT)避免了傅里叶变换中的复数运算,是基于实数的正交变换,具有运算速度快、能量集中、抗干扰能力强等特点。处理数字图像通常采用二维DCT,假设数字图像S(u,v)是一个N×N矩阵,则二维DCT变换公式为[9]
(5)
其离散反余弦变换(IDCT)的表达式为
(6)
2 基于LWT-DCT-QR的混合域音频信号水印算法
2.1 二值水印图像的混沌加密
对水印图像加密处理是保证水印安全性的有效手段,Logistic混沌序列具有较好的互相关性和自相关性,其定义为[10-11]
(7)
式中:xk∈[-1,1],λ∈(0,2.5),取λ=2,初始值x0=0.25,迭代后得到Logistic混沌序列S。取二值图像作为原始水印,大小为m×n,表示为
(8)
对二值图像进行降维处理,得到一维的序列
(9)
采用Logistic混沌序列对二值图像进行加密,由此得到加密后的水印图像为
(10)
2.2 水印的嵌入过程
(1) 将原始音频信号分段,每段的长度为1 024个样点。
(2) 利用Haar小波基对分段后的音频进行4级提升小波分解,得到不同分辨率级下小波提升分量,其中A4代表音频信号的低频分量,D1~D4分别代表音频信号的高频分量。
(3) 将A4进行DCT变换,然后取出前1/4低频分量转化为10×10的二维矩阵。
(4) 对得到的矩阵进行QR变换,得到一个上三角矩阵R,对矩阵R的第一个值R(1,1)进行水印嵌入,得到矩阵R′。
(5) 对嵌入水印后的矩阵进行QR逆变换,然后转换为一维矩阵,替换DCT变换后得到的1/4低频系数,再进行一维IDCT变换,得到含水印的矩阵S。
马博士表示,未来3年,他们将分离、保藏5000-10000株乳酸菌和双歧杆菌,建立世界上最大的母乳源乳酸菌与双歧杆菌资源库,并对中国人群微生物生物多样性进行系统研究。
(6) 将矩阵S替换LWT变换得到的低频分量A4,进行LWT逆变换,得到嵌入水印后的音频分段。
(7) 重复(2)~(6)步骤,待所有分段都嵌入水印后,就完成了整个音频水印的嵌入。图2所示为水印嵌入流程。
图2 水印嵌入流程
2.3 水印的提取过程
水印提取过程就是水印嵌入的逆过程,其步骤如下:
(1) 将嵌入水印的音频信号分段,每段的长度为1 024个样点
(3) 对低频分量进行DCT变换,然后取出1/4低频分量转化为10×10的二维矩阵。
(4) 对得到的矩阵进行QR变换,得到一个10×10的上三角矩阵S。
(5) 取出上三角矩阵的S(1,1)和S(2,2),如果S(1,1)/(S(2,2)·Δ)的值接近偶数,则水印信息为0;如果该值接近奇数,则水印信息为1。Δ为嵌入强度,这里取Δ=0.5。
(6) 重复(2)~(5)步骤,直到每个分段都完成水印提取,最后可得到水印图像。图3所示为水印提取流程。
图3 水印提取流程
3 仿真与测试
3.1 不可感知性分析
为测试嵌入水印对音频信号的影响,选用采样频率为44.1 kHz,单声道、16 bit,音频格式为WAV的原始音频文件进行Matlab软件听觉感知仿真,水印信号为16×16的二值图像,嵌入过程采用Logistic混沌序列进行加密,仿真结果如图4所示。
(a) 水印嵌入前音频波形
(b) 水印嵌入后音频波形
(c) 水印嵌入前后波形差
由仿真结果可知,在水印嵌入前后,音频信号的波形没有发生明显变化,经听觉测试感知不到水印的存
在。为避免因主观因素的影响,计算嵌入水印前后音频信号的信噪比SNR,求得SNR的值为46.94 dB,人在听觉上无法感觉到它的存在,这表明本文提出的水印算法具有较好的不可感知性。
3.2 保密性测试
为测试Logistic混沌序列水印加密的有效性,对其进行保密性测试,分别采用正确密钥和错误密钥提取水印图像,并与原始水印图像进行对比,测试结果如图5所示。
(a)原始水印(b)正确密钥提取水印(c)错误密钥提取水印
图5 保密性测试
结果表明,使用正确密钥提取的水印图像非常清晰,与原始水印图像相比基本没有发生变化,而使用错误密钥提取得到的水印图像非常模糊,无法分辨出水印图像的具体内容。由此可见,采用Logistic混沌序列对原始音频信号进行置乱加密具有较好的安全性,保密性高。
3.3 鲁棒性测试
为检验本文所提算法对常规攻击操作的鲁棒性,对嵌入水印的音频信号进行噪声、重采样、滤波等7个操作攻击,分别采用相关系数NC和信噪比SNR作为评价指标对其进行判定,相关系数公式为[12-13]
(11)
把水印看作噪声信号,加到原始音频信号中,这样
就可以采取计算信噪比SNR的方法来衡量水印对原始音频信号的影响,其表达式为:
(12)
式中:y(i)为原始音频;y′(i)为嵌入水印后的音频;N为音频长度;i为采样点数。
分别采用流行音乐和古典音乐作为测试文件,则嵌入水印的音频在各种攻击操作下的信噪比和相关系数如表1所示。
表1 各种攻击操作下水印的信噪比和相关系数
经过攻击操作后,对嵌入的水印图像进行提取,提取结果如图6、7所示。
(a) 白噪声
(b) 下采样
(c) 压缩
(d) 剪切
(e) 低通滤波
(f) 重量化
(g) 去噪
(a) 白噪声
(b) 下采样
(c) 压缩
(d) 剪切
(e) 低通滤波
(f) 重量化
(g) 去噪
提取结果表明,嵌入水印的音频在受到各种攻击操作后,所提取出来的水印图像都比较清晰,很容易分辨出来。由此可见,采用本文所提出的水印嵌入算法得到的音频信号基本不受各攻击操作的影响,具有较强的鲁棒性。
为了进一步验证LWT-DCT-QR混合算法的有效性,采用本算法与文献[14-15]所用算法进行音频水印鲁棒性测试,选取相同的音频信号作为原始音频文件,并采用相同格式的图像作为水印。分别选取各嵌入算法的相关系数进行列表对比,结果如表2所示。
表2 鲁棒性测试对比结果
对比结果表明,与文献[14-15]所用水印算法相比,LWT-DCT-QR混合水印算法相关系数大大提高,能更有效抵御各种攻击操作,鲁棒性强,优越性明显。
4 结 语
为提高音频水印的抗攻击能力,提出一种基于LWT-DCT-QR的混合域音频水印算法,利用提升小波运算速度快、DCT抗干扰能力强以及QR分解数值稳定性好的特点实现水印信号的嵌入与提取。为验证所嵌入水印的不可感知性,采用Matlab软件进行仿真,并以信噪比SNR和相关系数NC作为衡量指标进行鲁棒性对比测试。仿真及测试结果表明,利用LWT-DCT-QR水印嵌入算法得到的音频信号在进行噪声、重采样、滤波、压缩等攻击操作下,可保持较好的鲁棒
性和不可感知性,嵌入过程不改变原始水印信息,避免其受到损坏,有效保护音频版权不受侵害。
[1] 李 慧. 基于变换域的数字音频零水印算法研究[D].南昌:江西理工大学,2012.
[2] 杨 榆,雷 敏,钮心忻,等. DWT-DCT-QR结合的音频盲水印算法[J]. 重庆大学学报,2012,35(8): 62-66.
[3] Moattar M H, Homayounpour M M. Text-independent speaker verification using variation Gaussian mixture model[J]. ETRI Journal, 2011, 33(6):914-923.
[4] 孙 锐,蒋建国,杨兴明. 基于小波包和心理声学模型的音频水印算法[J]. 系统仿真学报,2007,19(10): 2248-2255.
[5] 蔡咏梅,郭文强. 基于DWT-SVD的音频零水印算法[J]. 计算机工程与设计,2014,35(1): 42-46.
[6] 董 斌. 基于变换域的音频水印研究及实现[D].长春:吉林大学,2011.
[7] 马晓红,赵琳琳. 基于QR分解和提升小波变换的鲁棒音频水印方法[J]. 大连理工大学学报,2010,50(2): 278-282.
[8] 陈新龙,李晓艳,胡国庆,等.基于提升小波与DCT的自适应音频水印算法[J].计算机应用.2011,31(2): 521-524.
[9] 彭 维,高 健,孙瑞鹏,等.基于DCT系数比较的音频水印算法[J]. 计算机应用与软件,2014,31(11): 158-160.
[10] 刘素楠,方志宏,李淑芝. 采用混沌加密和重复码的复倒谱音频水印算法[J].计算机工程与应用,2010, 46(4):79-82.
[11] 马 婷,陈农田. 基于Logistic混沌加密的NSCT-DWT-SVD彩色水印算法[J]. 现代电子技术,2016, 39(10):37-41.
[12] Weychan R, Marciniak T. Analysis of differences between MFCC after multiple GSM transcending[J]. Przeglad Elektrotechniczny Selected Full Texts, 2012, 88(6): 24-29.
[13] 许文丽,王命宇,马 君. 数字水印技术及应用[M]. 北京:电子工业出版社, 2013.
[14] 于晓敏,于晓坤,耿 蕊.声基于离散小波变换的盲水印研究与仿真[J].计算机仿真,2011,28(8): 287-290.
[15] 刘 娇, 费耀平, 李 敏. 基于量化的倒谱变换数字音频水印算法[J].计算机工程与应用,2007, 43(33): 84-88.
Audio Signal Watermarking Algorithm Based on LWT-DCT-QR Hybrid Domain
YUWenjin,XUPeifu,WANGWenjuan,YEZhihui
(China Tobacco Zhejiang Industrial CO., LTD., Ningbo 315000, Zhejiang, China)
In order to improve the robustness of audio watermarking, a watermark embedding method is presented based on the LWT-DCT-QR mixed domain. It integrates the advantages that the lifting wavelet transform speed is fast, discrete cosine anti transform holds interference ability and QR decomposition has good numerical stability, and achieves image watermarking embedding and extraction. Through attacks tests of noising, sampling, filtering, cropping, compression, the security of watermark, perception, and robustness are guaranteed. Correlation coefficients of watermark signal (NC) and signal to noise ratio (SNR) are computed to complete the analysis and evaluation. The results show that the proposed watermarking algorithm has strong anti attack ability, and has certain advantages compared with the related literature.
audio watermarking; lifting wavelet transform; discrete cosine transform; QR decomposition
2016-06-27
虞文进(1964-),男,浙江金华人,硕士,高级工程师,研究方向:信息技术管理。
Tel.:13615886952;E-mail:yuwenjin.1964@163.com
TN 915.08
A
1006-7167(2017)03-0026-05