APP下载

语音信号的混沌遮掩及其正定盲提取算法

2016-11-24王尔馥郑远硕陈新武刘晓珍

通信学报 2016年8期
关键词:时频信噪比语音

王尔馥,郑远硕,陈新武,刘晓珍

(黑龙江大学电子工程学院,黑龙江 哈尔滨 150080)

语音信号的混沌遮掩及其正定盲提取算法

王尔馥,郑远硕,陈新武,刘晓珍

(黑龙江大学电子工程学院,黑龙江 哈尔滨 150080)

利用小波变换提取语音信号的能量聚集带,将其隐藏在混沌载体信号中进行传输,设计一种盲提取算法实现不同混沌动力学系统下语音信号的有效提取。以3种不同维数的混沌动力学系统为背景,仿真实验定性和定量地分析了所提出算法的性能,验证了噪声环境下算法的可靠性,证明盲提取算法可作为对混沌保密通信系统保密性验证的有效方法。

小波变换;语音信号;FastICA算法;混沌系统

1 引言

语音是人类最常用、最便捷的交流方式,语音信号的分离与提取已成为学者们研究的热点问题,以此为背景出现了盲信号处理这一学科分支。然而,随着信息交换方式的日益更新,信息安全问题成为摆在学者面前一个亟待解决的研究课题。对语音信号采用有效的载体进行遮掩传输,在接收端对期望信号进行盲提取,可以解决语音信息传输中被截获、侦听所导致的信息泄露问题,保障信息传输的安全,相应的盲提取算法更可以作为验证混沌信号保密通信系统传输能力的一种手段。

混沌是非线性科学中发展活跃、应用前景广阔的一个领域。自19世纪70年代以来,混沌信号处理在理论上取得了很大进展[1,2],在工程领域中也得到了一定应用[3],特别是用于保密通信传输,可达到对传输信号加密和遮掩的效果。

国内外有很多学者对盲分离算法进行了研究,如海洋杂波背景下小目标信号的提取、利用经验模态分解及小波变换实现混沌背景下的谐波信号盲分离[4,5]。Vincent[6]采用ICA技术根据音频配乐分离出不同的乐器以实现对音乐录音的交互式修改。国内在该领域也取得了一定的成绩,成谢锋等[7]提出对混沌信号作经验模态分解(EMD),从而实现混沌信号的提取。孟宗等[8]利用小波半软阈值对故障信号进行消噪处理,并采用JADE算法对信号进行盲源分离。林秋华等[9]利用欠定盲分离问题的难解性,提出一种通过构造欠定加密混合矩阵的方法对语音信号进行加密,在提高安全性的同时保持了优良的音频质量。但在上述研究中,没有运用非平稳信号处理手段挖掘混沌信号和语音信号各自的时频能量聚集特性,更没有考虑对语音信号进行混沌遮掩及保密传输。

本文首先基于时频分析理论,利用复 Morlet小波对语音信号和混沌系统进行分析,挖掘语音信号和混沌信号的时频能量聚集特性;然后,利用混沌信号的高能量和宽频谱特性,将语音信号隐藏在混沌系统的相应维度信号中,实现语音信号的混沌遮掩和保密传输;最后,借助盲源分离中的相关算法,对混合语音信号进行提取,验证混沌遮掩保密传输的安全性。

2 语音信号与混沌载体的时频分析

为了降低环境噪声的干扰,选择元音因素的语音库来保证算法的有效性及可对比性。本文选取国际标准语音库——TIMIT语音库中的SA1和SA2语音作为待传输信号,图1和图2分别为语音SA1和SA2的波形。

语音信号的幅值和频率比较低,为了实现语音信号的保密传输,需要选择合适的混沌信号作为载体对其进行遮掩。从信号能量角度,只要语音信号的能量聚集带能够基本被混沌信号掩盖,其传输的保密性就可以保证。由于语音信号属于非平稳信号,傅里叶变换在此具有局限性,因此选择时频分析对语音信号进行处理,本文采用复Morlet小波对其进行分析。语音信号的采样频率取为 fs=8000Hz。

这2路语音信号的频率分布范围比较广,但集中在频率500~600 Hz的信号幅值相对较高,称之为能量聚集带。

本文分别选取典型的二维Henon混沌系统、三维Chen混沌系统和四维Qi超混沌系统作为载体,从有效性及普适性这2方面对其进行分析。3种混沌系统的动力学方程如式(1)~式(3)所示[10]。

其中,a,b为系统参数,当参数值取 a=1.4,b=0.3且初值 x0=y0=0.4时,Henon系统处于混沌状态。

图1 语音SA1的波形

图2 语音SA2的波形

Chen混沌系统在实际安全通信中的应用广泛,它是三维自治系统,其动力学方程式为[11]

其中,a,b,c为系统的参数,当参数值取为a=35,b=3,c=28时,Chen系统处于混沌状态。

Qi系统是一个四维的超混沌系统,其动力学行为比一般的混沌系统更加复杂,其动力学方程式为[12]

与维数较低的系统不同,非线性项存在于每个表达式中,其作为系统输出参数,用来控制输出。其中,为系统的状态变量;a,b,c,d,r为可以控制混沌系统状态的参数。当初值时,Qi超混沌系统有2个正的李雅普诺夫指数,系统处于超混沌状态。3种混沌的时域波形如图3~图5所示。

图3 Henon混沌系统时域波形

图4 Chen混沌系统时域波形

图5 Qi混沌系统时域波形

Henon混沌系统的能量强度分布相对均匀,在0~4 000 Hz频率范围内能量强度主要集中在0.8 J左右;而三维 Chen混沌系统的能量强度主要集中在100~300 Hz,在这个频率范围内能量最高可达到60 J,主要集中在200 Hz左右,而在300~4 000 Hz频率范围内能量分布都比较均匀,能量强度主要集中在 6 J左右;Qi超混沌系统的能量聚集带主要分布在0~200 Hz,其中,能量最高可达到23 J,不过只有小部分主要集中在50 Hz左右,其余部分的能量大概在10 J左右,而在200~4 000 Hz能量聚集带内能量分布比较均匀,这一特点和 Chen混沌系统相类似,能量强度大概在3 J左右。

3 混沌遮掩语音传输系统的模型建立

3.1 模型建立

本文考虑在信道加噪的正定系统下对隐藏在混沌信号中的语音信号进行盲提取,系统的数学模型可以抽象,如图6所示。

不考虑传输延时,并假设收发天线数目相等,得到瞬时混合模型下的正定盲源提取模型为

其中,P为置换矩阵,Λ为对角矩阵,盲源分离允许存在排列顺序和信号幅度的不确定性。

3.2 仿真流程及算法评价

图6 系统数学模型

根据小波变换得到的语音和混沌信号的时频特性,结合系统的数学模型,设计得到本文的仿真流程,如图7所示。首先利用小波变换分别分析语音信号和混沌信号的时频分布特性,以此来验证语音信号的成功遮掩;继而将2种信号混合进入信道,在信道中加入加性高斯白噪声;最后接收端利用FastICA算法对混合信号进行盲分离,通过对比分析混合分离前后的语音信号的波形图和相似系数矩阵。当由相似系数构成的相似系数矩阵的每一列有一个元素大于 0.9,其他元素均接近 0时,说明实现了混沌背景下含噪语音信号的盲分离;反之则无法实现混沌背景下含噪语音信号的盲分离。

图7 算法流程

接收端采用盲源分离理论中经典的FastICA算法,其分离矩阵及归一化的分离矩阵表达式为

其中,g为系统全局矩阵,E为数学期望,数学期望必须用它们的统计值来代替。本文采用相关系数来评价算法的提取性能,设Sj与y'i分别表示源信号和分离信号,相关系数的表达式为

当2个信号完全相关时,ξij=1;当2个信号完全独立时,ξij=0。ξij越接近1表明源信号和分离信号之间的相似程度越高,即该算法的分离误差越小,分离性能越好。

4 仿真实验及性能分析

为了验证算法的有效性,本文考虑2路语音信号和1路混沌信号混合分离的情况,语音库中所选取的2路语音信号的说话者均为女性,其音色和音调极为相似,一定程度上增大了算法的提取难度。需要重点指出的是,本文模型里的噪声为加性高斯白噪声,而实质上模型里所用到的载体——混沌信号有类噪声的性质,其能量巨大,但由于混沌系统的能量无法计算,因此下文中所提及的参数信噪比(SNR)仅涵盖了加性高斯白噪声,并没有考虑混沌信号的能量。即如果考虑混沌系统的能量,实际的SNR将远远低于仿真中所用的参数值。

设N=3,假设SNR=30 dB,随机产生一个行满秩(rank(A)=N)的信道混合矩阵,即

由于语音信号是一维信号,而3种混沌信号分别为二维、三维和四维信号,因此统一选取这 3种混沌信号中的第1路信号与其他2路语音信号进行混合。下面分别以二维 Henon混沌系统、三维Chen混沌系统和四维超混沌Qi系统为例进行详细的分析。

4.1 Henon混沌系统

仿真 1为了进一步验证语音信号是否被成功隐藏在混沌信号中,以Henon混沌系统为背景,利用小波变换分析混合信号的时频特性。设采样频率fs=8 000 Hz 。由第2节可知,语音信号频率分布比较广,但其能量、幅值级别都比较低,而Henon混沌系统的频率在0~4 000 Hz范围内能量强度主要集中在0.8 J左右,高于语音信号的能量强度,完全可以把语音信号遮掩起来,同时通过分析混合信号的时频特性,混合信号的时频特性中无法分辨语音信号的时频分布特性,即实现了语音信号的成功隐藏。

仿真2接收端采用FastICA算法对混合信号进行盲提取。设采样频率 fs=8 000 Hz ,由Henon混沌系统产生数据点数45 001,截取语音信号的点数为10 000~55 000,图8和图9分别为提取的2路语音信号SA1、SA2的波形。由于信道中加性高斯白噪声的影响,与原信号的波形图对比会产生毛刺现象,但是提取前后的信号具有整体上的一致性,同时可以得到在SNR=30 dB时的相似系数矩阵为

在矩阵C中,第1、第2、第3列分别表示语音SA1、SA2和混沌信号;观察矩阵C可以看出,第1列最大值为0.924 2,第2列为0.917 8,第3列最接近于1为0.998 2,其余的数均接近0,从而在Henon混沌背景下验证了该算法的提取性能。

图8 Henon背景下提取SA1语音信号

图9 Henon背景下提取SA2语音信号

为了验证噪声环境下的可靠性,本文在不同信噪比条件下分别对3种信号的相似系数进行了仿真实验,图10为不同信噪比下3种信号相似系数的曲线。

图10 不同信噪比下3种信号的相似系数分析

从图 10可以看出随着信噪比不断增大,相似系数呈现出增长的趋势。然后利用 MATLAB中的wavwrite函数把语音信号另存为音频文件,由于受到加性高斯白噪声的影响,在播放的过程中虽然有杂音,但可以清楚地还原源语音信号的信息内容。为了证明噪声环境下算法的可靠性,需要对不同信噪比下算法的性能进行分析。表1为在不同信噪比下的相似系数,可以看出2路语音信号都得到了较好的分离,说明了该算法可以在高斯白噪声的影响下成功地把隐藏在混沌信号中的语音信号分离出来,从而验证了噪声环境下算法的可靠性,为信息的保密隐藏及安全传输开辟了一条新的途径。

表1 Henon混沌背景下信噪比为29~35 dB时3种信号相似系数

4.2 Chen混沌系统

由第2节的分析可知,Chen混沌系统的能量强度明显比Henon混沌系统高很多,因此对于能量较高的语音信号,Chen混沌系统也可以对其起到较好的遮掩效果。重复4.1节中的仿真1和仿真2步骤,得到Chen混沌背景下的仿真结果,如图11和图12所示。然后在不同信噪比条件下分别对3种信号的相似系数进行了仿真实验,图13为不同信噪比下3种信号相似系数的曲线,表2为在不同信噪比下3种信号的相似系数,验证在 Chen混沌背景下含噪语音信号的成功遮掩和有效分离。

图11 Chen背景下提取SA1语音信号

图12 Chen背景下提取SA2语音信号

图13 不同信噪比下3种信号的相似系数分析

表2 Chen混沌背景下信噪比为29~35 dB时3种信号相似系数

4.3 Qi超混沌系统

由第 2节中对混沌系统能量聚集带的分析可知,虽然Qi超混沌系统的能量强度没有Chen混沌系统的高,Qi超混沌系统的能量聚集带主要分布在0~200 Hz,而语音信号的幅值和频率较低,因此,Qi超混沌系统可以实现对语音信号的完全隐藏。并且与Henon混沌系统和Chen混沌系统相比,Qi超混沌系统具有2个正的指数。该系统与以往系统的最大不同之处在于它的每个方程均含有非线性项,系统的动态行为更难以预测,更加难以破译,在保密通信方面比一般的混沌系统具有更高的使用价值,受到科研工作者的普遍关注。同样重复4.1节中的仿真1和仿真2步骤,得到Qi超混沌背景下的仿真结果,如图14和图15所示。在不同信噪比条件下分别对 3种信号的相似系数进行了仿真实验,图16为不同信噪比下3种信号相似系数的曲线,表3为在不同信噪比下3种信号的相似系数,验证算法的通用性。结合图11、图14、表2、表3,可以看出当信噪比大于或等于30 dB时,提取出的信号与原信号的相似度均在0.9以上,信号的时域波形与原信号极为相似,表明提取算法的性能较好。综上,该算法实现了在不同的混沌背景下语音信号的盲分离,从而验证了算法的有效性。

根据文献[13]中算法复杂度的相关知识,通过对算法进行分析,可以计算得到其时间复杂度为仿真实验得到了在不同混沌背景下算法运行的总时间,由于混沌系统复杂度的影响,因此在不同混沌背景下算法的运行时间是有差别的,如表4所示。

图14 Qi背景下提取SA1语音信号

图15 Qi背景下提取SA2语音信号

图16 不同信噪比下3种信号的相似系数分析

表3 Qi混沌背景下信噪比为29~35 dB时3种信号相似系数

表4 3种混沌系统时间复杂度分析

5 结束语

混沌保密传输广泛应用于各种信息安全通信领域中,语音信号的混沌遮掩传输是一个至关重要的问题。本文采用小波变换对语音信号和混沌信号的时频特性进行分析,从而实现可靠的隐蔽传输。为验证混沌保密传输的有效性,采用FastICA算法实现了含噪信道情况下正定系统混沌能量聚集带内语音信号的盲提取,下一步有望实现欠定系统混沌能量聚集带内语音信号的盲提取,为语音保密通信提供有效分离方法。

[1]陈铁明,葛亮. 面向无线传感器网络的混沌加密与消息鉴别算法[J].通信学报,2013,05:113-120.CHEN T M,GE L. Chaos-based encryption and message authentication algorithm for wireless sensor networks[J]. Journal on Communications,2013,05: 113-120.

[2]王尔馥,王冬青,丁群. 混沌保密通信系统中谐波信号提取的时—频域联合新方法[J]. 通信学报,2011,12:60-64.WANG E F,WANG D Q,DING Q. New time-frequency method of harmonic signal extraction in chaotic secure communication system [J].Journal on Communications,2011,12:60-64.

[3]贾红艳,陶倩,陈增强,等. 分数阶Chen系统的分析、同步及其保密通信实现[J]. 天津科技大学学报,2015,30(6): 66-71.JIA H Y,TAO Q,CHEN Z Q,et al . The analysis,synchronization and secure communication of fractional order Chen systems[J]. Journal of Tianjin University of Science amp; Technology,2015,30(6): 66-71.

[4]HAYKIN S,LI X B. Detection of signals in chaos[J]. Proceedings of the IEEE,1995,83(1): 95-122.

[5]ARAKI S,SAWADA H,MUKAI R. Underdetermined blind sparse source separation for arbitrarily arranged multiple sensors[J]. Signal Process,2007,87: 1833-1847.

[6]VINCENT E. Musical source separation using time-frequency source priors[J]. IEEE Transactions on Speech and Audio Processing,2005: 1-8.

[7]成谢锋,徐亮,严仍义. 混沌混合信号欠定盲分离方法的研究[J].南京邮电大学学报,2011,30(1): 29-34.CHEN X F,XU L,YAN R Y. The research of underdetermined blind source separation methods of Chaos of mixed signal[J]. Journal of Nanjing University of Posts and Telecommunications,2011,30(1): 29-34.

[8]孟宗,马钊,刘东,等. 基于小波半软阈值消噪的盲源分离方法[J].中国机械工程,2016,27(3): 45-50.MENG Z,MA Z,LIU D,et al. Semi-soft threshold de-noising based on wavelet method for blind source separation[J]. Chinese Journal of Mechanical Engineering,2016,27(3): 45-50.

[9]LIN Q H,YIN F L,MEI T M,et al. A blind source separation based method speech encryption[J]. IEEE Transaction on Circutis and Systems I: Fundanmental Theory and Applications,2006,53(6):1320-1328.

[10]贺锋涛,张敏,白可,等. 基于激光散斑和 Henon映射的图像加密方法[J]. 红外与激光工程,2016,04: 275-279.HE F T,ZHANG M,BAI K,et al. Image encryption method based on laser speckle and Henon mapping[J]. Infrared and Laser Engineering,2016,04:275-279.

[11]CHEN G R,UETA T. Yet another chaotic attractor[J]. International Journal of Bifurcation amp; Chaos,1999,9(7): 1465-1466.

[12]QI G Y,DU S Z,CHEN G R,et al. On a four-dimensional chaotic system[J]. Chaos,Solitons amp; Fractals,2005,23(5): 1671-1682.

[13]严蔚敏,吴伟民. 数据结构(C语言版)[M]. 北京:清华大学出版社,2011.YAN W M,WU W M. Data structure(C language version)[M]. Beijing:Tsinghua University Press,2011.

Chaotic hiding and its positive definite blind extraction algorithm of speech signal

WANG Er-fu,ZHENG Yuan-shuo,CHEN Xin-wu,LIU Xiao-zhen

(Electronic Engineering College,Heilongjiang University,Harbin 150080,China)

The wavelet transform was used to extract energy accumulation zone of speech signal hidden in the chaotic carrier signal for transmission,and a blind extraction algorithm was designed to achieve speech signal extraction under different chaotic dynamical systems. Using three different dimensions of the chaotic dynamic system as the background,simulation experiment analysed the performance of the proposed algorithm in aqualitative and quantitative ways,and verified the algorithm’s reliability under the noise environment that prove the blind extraction algorithm can be used as an effective method of security verification of chaotic secure communication system.

wavelet transform,speech signal,FastICA algorithm,chaotic system

s:The National Natural Science Foundation of China (No.61571181),Postdoctoral Research Foundation of Heilongjiang Province (No.LBH-Q14136)

TN910

A

2016-05-13;

2016-06-20

王尔馥,efwang_612@163.com

国家自然科学基金资助项目(No.61571181);博士后研究人员落户黑龙江科研启动基金资助项目(No.LBH-Q14136)

10.11959/j.issn.1000-436x.2016171

王尔馥(1980-),女,黑龙江哈尔滨人,博士,黑龙江大学副教授、硕士生导师,主要研究方向为盲信号分离及盲均衡。

郑远硕(1994-),女,海南乐东人,黑龙江大学硕士生,主要研究方向为通信信号盲提取及数字化技术。

陈新武(1992-),男,福建仙游人,黑龙江大学硕士生,主要研究方向为盲均衡及其硬件实现。

刘晓珍(1990-),女,山西吕梁人,黑龙江大学硕士生,主要研究方向为谐波信号的盲源分离。

猜你喜欢

时频信噪比语音
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于深度学习的无人机数据链信噪比估计算法
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
基于稀疏时频分解的空中目标微动特征分析
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
不同信噪比下的被动相控阵雷达比幅测角方法研究
基于时频分析的逆合成孔径雷达成像技术