APP下载

端到端语音加密通信的同步信号设计*

2016-04-06陈瑶瑶郝建华张子博装备学院研究生管理大队北京101416

电讯技术 2016年2期

陈瑶瑶,郝建华,张子博(装备学院研究生管理大队,北京101416)



端到端语音加密通信的同步信号设计*

陈瑶瑶**,郝建华,张子博
(装备学院研究生管理大队,北京101416)

**通信作者:yachtchan@163. com Corresponding author:yachtchan@163. com

摘 要:在语音加密通信过程中,接收方需要通过信号同步来实现精确的解密并恢复出语音信号,而现有方法精确度低且运算量大。为了解决端到端语音加密、解密过程中的同步问题,设计了一种新的基于线性调频信号的同步信号结构。该同步信号是基于带宽经过筛选的线性调频信号产生,避免了因为添加同步信号而使带宽扩展的问题。同步信号结构由两种不同长度的线性调频信号组合而成,不同的组合形式又会产生不同的同步效果。这种结构设计大大提高了同步的精确度和减少了同步运算量。理论和实验证明:该方法可以实现对接收信号帧起始位置进行精确地定位;不会展宽和影响语音信号的频谱;可以透过语音编解码器传输;具有一定的抗噪声性能;运算量比原始结构的同步信号大大减少。

关键词:保密通信;语音加解密;同步信号结构;端到端;线性调频信号

1 引 言

当前,窃听事件频频发生,通信安全面临巨大挑战。移动运营商针对通信安全问题采取了一些改良措施,但是无法从根本上弥补安全漏洞[1]。为此,越来越多的企业将注意力放在实现端到端通信加密的技术上,国外已经有不少相关手机产品问世。端到端加密通信使语音历经模-数-模的转化过程,进入手机的语音是已经加密过的,加密过程与手机及其通信网络无关。即使语音在通信传输过程中被截获,也需要正确的密钥解密才能获取原始语音信息。

语音信号在传输和处理过程中是以帧为单位进行的[2]。端到端语音加密通信主要面临加密和同步两个技术问题。对于同步问题的解决国内外研究相对较少,这是一种模拟域的同步问题。文献[3]提出了一种基于双音多频(Dual Tone Multi-Frequency,DTMF)的密钥同步方法,利用两种不同频率的正弦信号来表示数字信号,可适用于这种模-数-模的加密体制。尽管这种方法可以满足初始的同步,但是,一旦持续地使用这种方法来稳定同步系统,信道利用率将大大降低,而且仅仅依靠单频正弦信号的相关性实现同步,精确度难以保证。文献[4]也给出了类似的同步方法,但是该方法需要多次使用离散傅里叶变换,计算量较大,不满足实用要求。除此之外,还有一些数字信号同步的方法[5],但是并不适用于这种模-数-模的通信方式。本文以新唐NCU120芯片为核心,搭建语音加解密的测试平台,对构造的同步信号进行调试。

2 端到端语音加密的概况

2. 1 端到端语音通信系统

端到端加密是指语音在进入手机终端之前,经过一个加密装置被加密;接收到的语音在通过手机终端后,经过一个解密装置被解密,中间通信过程语音完全以密话的形式在传输,保证了语音的安全性。过程如图1所示。

图1 端到端加、解密过程Fig. 1 End-to-end encryption and decryption process

然而,进出手机终端的加密语音是模拟信号,由于手机内部声码器对于输入信号有特殊的要求,没有语音规律特性的信号将难以被正确编码传输。所以,端到端的语音加解密需要解决加密算法和收发双方同步的问题。这里选择NUC120芯片、NAU8822芯片和FM1188芯片等,构建端到端语音加密硬件测试平台,并利用KeilμVision 4进行程序调试,如图2所示。

图2 硬件平台系统框图Fig. 2 System block diagram for hardware platform

2. 2 语音加密过程

加密后的语音信号在移动终端中要经过特殊的压缩编码,一旦信号不具备语音信号的特征形式,则无法透过声码器,接收端同样就难以正确恢复出语音[6]。所以,加密后的信号必须满足类语音的特性,不能变成杂乱的噪声化信号。一般解决方案有类语音的调制[7]、置乱算法[8]、波形映射[9]等,这里选择基于快速傅里叶变换(Fast Fourier Transform, FFT)的频域置乱方法作为端到端语音的加密算法。将时域信号变换到频域,对其频域系数进行特定的置乱操作。

设so[n]是一帧长度的时域语音信号采样序列,对其作傅里叶变换得到频谱So[k]:

将so[n]的频谱So[k]进行频域置乱得到St[k],即

式中:P是N×N阶的置乱矩阵。置乱后的语音信号st[n]可由St[k]做傅里叶逆变换得到:

实现加密、解密过程的关键在于置乱矩阵P和同步信号的设计。

2. 3 语音同步过程

通信的双方既是发送方,也是接收方。收发双方必须要建立标识位,确定完整一帧语音信号的起始位置,保证取得的一帧语音和另外一帧语音无交叠,才能正确恢复出原始语音。在收发两端都需要添加同步模块用于同步的产生和检测。其中,同步检测过程包括初始同步和保持同步两部分,一旦检测到初始同步后,系统会进入同步保持状态。这时只对同步进行一定的修正,不会影响系统的稳定运行。

3 新型结构同步信号设计

3. 1 同步方式选择

同步问题涉及模拟通信系统和数字通信系统。在数字通信系统中,同步方法有载波同步、码元同步、群同步和网同步等[10]。群同步的思想比较符合端到端的同步需求,接收端利用群同步信号划分接收语音帧信号。这要求同步信号自相关特性曲线具有尖锐的单峰,以便容易从接收帧语音中识别出来。为了长时间的保持系统同步,需要周期性地插入同步帧。

3. 2 同步信号性能要求

结合实际语音在通信系统中的传输特点和硬件设备的参数要求,对于同步信号的设计有六点要求。

(1)识别度高。由于数据是未经编码的模拟信号,所以要产生比较明显的相关峰,需要特殊设计。

(2)可透过声码器。同步信号要满足声码器编解码要求,否则透不过声码器进行传输,接收端无法进行同步。

(3)带宽合适。在通信系统中,传输语音信号的标准话路频带宽度一般被限制在300~3 400 Hz 内,同步信号也要满足这个要求,否则数据可能被滤限丢失。

(4)精确度。接收端接收到的信号中,可能只包含有同步帧的部分数据,在一定的参数要求下,这种残缺的同步信息也应被检测到。

(5)同步算法运算量。由于硬件设备的参数限制,同步算法不能过度复杂,导致数据处理出现错乱和延时。

(6)一定的抗噪声性能。同步信号应可以在一定的噪声干扰条件下仍被检测到,具有合适的抗噪性能。

以上几点要求在设计同步帧的过程中必须考虑。为此,笔者在经过大量研究探讨后,设计了一种满足要求的同步信号形式。

3. 3 新同步信号设计过程

语音是时变和非平稳的,但在一段时间内(10~30 ms)人的声带及声道形状相对稳定[11]。利用这一特性,选取32 ms作为语音处理的帧单元,A/ D和D/ A芯片采用8 000 Hz、16位采样,也即每一帧256采样点。为了有效处理采样的数据,提供4帧长度的缓冲池,对数据进行储存缓冲。一同步帧信号长度同样选取256采样点。

3. 3. 1 同步信号的选择

语音的有效信息一般是在300~3 400 Hz范围内,语音的传输过程中会有相应的带通滤波器进行滤波。文献[3]选用多个单频的正弦信号作为同步信号,精确度不高,信息传输效率低,接收端难以对正弦信号进行精确地同步。由于线性调频信号有很好的自相关峰值尖锐特性,线性调频带宽越宽,其自相关峰值越高。这里选择300~3 400 Hz频率范围内的线性调频信号作为同步信号。

图3中,同是256点信号,线性调频信号的这种相关特性可以满足精确同步的要求。正弦信号可以通过检测过零率来实现同步的效果,但其很容易受到干扰,影响同步效果。而通过不断地进行频率检测识别单频正弦波的方法,运算量太大,不适用本系统。

图3 两种同步信号的比较Fig. 3 Comparison between two synchronous signals

3. 3. 2 同步帧结构设计

发送方每隔一定长度语音帧添加一个同步帧头,供接收端同步检测。然而,接收方往往不会恰巧检测到一个完整的同步帧,同步信号可能会只留下一部分供检测,情况如图4所示。

图4 同步帧在不同位置Fig. 4 Get synchronous frame in different locations

图4中,4个大方框代表4帧缓冲池,阴影部分是数据帧,透明部分是同步帧。假设同步检测仅在第一缓冲池内进行,数据是以帧为单位右进左出。图4(a)同步帧恰好完全在缓冲池内,可以精确地被检测到;图4(b)同步信号仅留下尾部的一些,无法被检测;图4(c)同步信号仅露出了一些,同样无法被检测到。后两种情况只要同步帧不完整,就无法检测同步,之后的数据也就无法确定起始位置。

为此,同步帧头尾均设计了相同的32点短同步信号,只要头尾留出32点的同步信息,就可以被检测出来。为了确定检测到的短同步是头是尾,中间添加两个96点相同大小的长同步信号。长和短同步信号均是线性调频信号,可以被准确检测出来。帧结构如图5所示。

图5 同步帧结构图Fig. 5 Structure diagram of synchronous frame

这里的32点和96点是在满足本文硬件设备精确度要求的前提下选择的,对于不同的精确度和运行环境要求可以按照此结构调整实际点数。而且,这种结构设计可以解决上述遇到的两种问题。

4 同步信号仿真结果

根据设计的同步帧结构要求,以8 kHz为采样频率,32 ms为一帧长度,分别产生32点线性调频信号和96点线性调频信号,两种线性调频信号频率范围均在300~3 400 Hz内,并按结构形成一帧同步信号,数据由MATLAB生成后导入Keil μVision 4进行调试。同步信号构成如图6所示。

图6 同步帧波形图Fig. 6 Waveform of synchronous frame

该同步信号具有独特的自相关特性,当本地利用32点短同步与之进行相关时,将产生两个尖峰,分别代表着头和尾两个短同步的位置;当本地利用96点短同步与之进行相关时,同样将产生两个尖峰,这是用来确定同步帧的头和尾。

为了使同步信号在传输过程中不被滤波器滤除数据,设计的各个线性调频信号的带宽均满足300~3 400 Hz的要求,语谱图显示了其时频分布情况,如图7所示。

图7 同步信号语谱图Fig. 7 Spectrogram of synchronous signal

在实测过程中,当同步帧被完整接收时,本地32点短同步信号与之相关,将产生两个峰值,这时可以精确判断同步帧起始位置;当接收端仅接收到部分同步信号时,本地32点短同步信号与之相关,将产生一个峰值,此时,需要利用本地96点长同步信号与之相关。当紧接着的数据与之相关没有产生峰值时,则判定此短同步信号是同步帧的尾部,从而判断同步帧和数据的起始位置。图8是同步检测结果。

图8 同步检测Fig. 8 Synchronous detection

从图8中可以看到,无论是长同步信号还是短同步信号,和语音均不产生相关峰值,这也保证了同步的准确性。添加同步帧信号前后时频语谱图比较如图9所示。由图9可知,添加同步信号并没有引起频谱的扩展,同步数据可以满足滤波器的通带要求。

图9 语谱图比较Fig. 9 Comparison of spectrogram

5 评 价

5. 1 运算量对比

同步检测是通过长、短同步相结合的方式进行检测的。这种结构可以保证检测过程只需在一帧缓冲内进行,同样可以准确检测到同步信号。对于4帧长度缓冲池,使用单类型的同步信号与采用新结构的同步信号,两种情况中的乘法次数比较结果如表1,可以看到新结构的同步信号在计算量上减少了88%。

表1 乘法运算次数对比Tab. 1 Comparison of the number of multiplications

5. 2 抗噪声性能比较

同步信号是由两种线性调频信号组成的,具有一定的抗噪声性能。一般音频电话线路信噪比大于30 dB,否则话音质量很差。文献[12]给出了在不同信噪比下全频段白噪声对语音清晰度的影响。对于信噪比R、语言清晰度C,有以下对应关系(这里以男生语音为例):

C=-0. 000 5 R2+0. 033 5 R+0. 560 3。(4)

分别将由正弦信号和线性调频信号组成的同步信号在不同信噪比条件下进行同步检测,检测结果如图10所示。

图10 同步检测概率Fig. 10 Probability of synchronous detection

图10中的检测概率是两种信号在不同信噪比条件下,对实际检测到的同步帧位置与理论值进行比较统计出来的结果。由图可见,在0 dB左右,语音的清晰度达到50%以上,正弦信号在此信噪比下只能达到50%左右的正确检测概率,而新结构的同步信号可以达到近100%的正确率。在正常通话过程中,这种同步检测的可靠性是相当高的。

5. 3 对频谱带宽的影响

一般语音信号信息包含在300~3 400 Hz带宽内,传输过程中将会有相应通带宽度的滤波器进行滤波。同步信号在设计时考虑到这一点,对线性调频的起止频率和带宽进行了特殊考虑,满足宽带要求。在实验板上进行实测时,可以完整地通过Codec芯片中的滤波器。测试结果如图11所示。

图11 同步信号实测图Fig. 11 The measured synchronous signal

6 结束语

本文针对端到端语音的传输特性,设计了一种新的可用于端到端模拟信号同步的同步信号结构形式。该结构将长同步和短同步结合在一起,共同作为判定同步位置的条件,大大减少传统方法的乘法运算量,提高了同步信号的正确检测概率和精确度。该结构设计方法和思想可以灵活应用于其他各类同步信号的设计中去,同时能根据不同的参数要求和运行环境进行调整。理论分析和仿真结果表明:该同步信号不仅满足了同步所需的精确度要求,而且具有一定的抗噪性能,添加在语音信号中,并没有引起频谱的展宽。本文设计解决了端到端语音传输的关键问题,并在通信实践中取得了良好的同步效果。

参考文献:

[1] TOORANI M,BEHESHTI A. Solutions to the GSM security weaknesses[C] / / Proceedings of the Second International Conference on Next Generation Mobile Applications,Services and Technologies(NGMAST'08). Cardiff, Wales,UK:IEEE,2008:576-581.

[2] 胡航.现代语音信号处理[M].北京:电子工业出版社,2014.

HU Hang. Modern speech signal processing[M]. Beijing: Publishing House of Electronics Industry, 2014. (in Chinese)

[3] 滕广超,郎建军,杜奇才,等.一种语音加密器中密钥同步方案的设计与实现[J].微处理机,2014(6):30-32,37.

TENG Guangchao,LANG Jianjun,DU Qicai,et al. Design and implementation ofthe key synchronization scheme in speech scrambler[J]. Microprocessor,2014(6):30-32, 37. (in Chinese)

[4] 刘广建,张义军.一种实现语音信号同步的方法[J].现代电子技术,2007(3):49-50,53.

LIU Guangjian, ZHANG Yijun. One method to achieve synchronization of speech signal[J]. Modern Electronic Technology,2007(3):49-50,53. (in Chinese)

[5] YAAKOB W F H. Synchronization system for crypto initialization over GSM voice channel[C] / / Proceedings of the 9th WSEAS International Conference on Signal, Speech and Image Processing. Wisconsin: IEEE,2009: 241-244.

[6] 陈立全,胡爱群,徐青,等.一种抗RPE-LTP声码器压缩的端到端数据传输方法[J].中国工程科学,2007,9 (12):81-55.

CHEN Liquan,HU Aiqun,XU Qing,et al. An end-to-end data transmission method of anti-RPE-LTP vocoder compressed[J]. China Engineering Science,2007,9(12):81 -55. (in Chinese)

[7] 铁启龙.基于正交频分复用的GSM加密语音通信[J].信息通信,2014(3):193-194. TIE Qilong. GSM voice encryption communication based on orthogonal frequency division multiplexing[J]. Information and Communication, 2014 ( 3 ): 193 - 194. (in Chinese)

[8] ALWAHBANI S M H,BASHIER E B M. Speech scrambling based on chaotic maps and one time pad[C]/ / Proceedings of 2003 International Conference on Computing, Electrical and Electronics Engineering. Khartoum,Sudan:IEEE,2013: 128-133.

[9] LADUE C K,SAPOZHNYKOV V V,FIENBERG K S. A data modem for GSM voice channel[J]. IEEE Transactions on Vehicular Technology,2008,57(4):2205-2218.

[10] 樊昌信,曹丽娜.通信原理[M].北京:国防工业出版社,2009.

FAN Changxin,CAO Lina. Communication theory[M]. Beijing:National Defense Industry Press,2009. (in Chinese)

[11] 李晔,崔慧娟,唐昆,等.数字语音编码技术[M].北京:电子工业出版社,2013.

LI Ye,CUI Huijuan,TANG Kun,et al. Digital speech coding technologies[M]. Beijing:Publishing House of Electronics Industry,2013. (in Chinese)

[12] 刘辉,章斯宇,孟子厚.低SNR下汉语单音节清晰度测量与可懂度估计[J].电声技术,2010(1):60-62,66.

LIU Hui,ZHANG Siyu,MENG Zihou. Test on mandarin monosyllable clarity and speech intelligibility estimation with low SNR [ J]. Electroacoustic Technology, 2010 (1):60-62,66. (in Chinese)

陈瑶瑶(1992—),男,安徽宿州人,2013年于南京理工大学获工学学士学位,现为硕士研究生,主要研究方向为信息与通信工程;

CHEN Yaoyao was born in Suzhou,Anhui Province,in 1992. He received the B. S. degree from Nanjing University of Science and Technology in 2013. He is now a graduate student. His research concerns information and communication engineering.

Email:yachtchan@163. com

郝建华(1973—),男,陕西延安人,副教授,主要研究方向为信息与通信工程;

HAO Jianhua was born in Yan' an, Shaanxi Province, in 1973. He is now an associate professor. His research concerns information and communication engineering.

张子博(1988—),男,河北邢台人,硕士研究生,主要研究方向为信息与通信工程。

ZHANG Zibo was born in Xingtai,Hebei Province,in 1988. He is now a graduate student. His research concerns information and communication engineering.

Design of Synchronous Signal for End-to-End Speech Encryption Communication

CHEN Yaoyao,HAO Jianhua,ZHANG Zibo
(Department of Graduate Management,The Academy of Equipment,Beijing 101416,China)

Abstract:In the process of the encrypted speech communication,the receiver needs to synchronize the signal to decrypt the speech precisely and restore the original speech signal. However,the existing methods have low accuracy and cost a large computation. In order to solve the synchronization problem in the process of the end-to-end speech encryption and decryption,this paper designs a new synchronous signal structure based on the linear frequency modulation(LFM) signal. The synchronous signal is the chirp signal whose bandwidth has been filtered already and this method can avoid expanding the speech bandwidth caused by adding the synchronous signal. Synchronous signal structure is composed of two different lengths LFM signal and different combinations will produce different synchronization effect. This design greatly improves the accuracy of synchronization and reduces the amount of synchronous operation. Theoretical analysis and experimental verification show that the method can accurately locate the beginning of the received signal,and the speech signal spectrum will not be broadened and affected. This synchronous signal can be transmitted through the voice codec and has anti-noise performance. Compared with the original structure of the synchronous signal, the computation cost of the scheme is greatly reduced.

Key words:secure communication;speech encryption and decryption;synchronous signal structure;end-to -end;linear frequency modulation signal

doi:10. 3969/ j. issn. 1001-893x. 2016. 02. 016引用格式:王薇,王静,陈小坡,等.基于干扰矩阵的高密WLAN场景下集中式功率控制[J].电讯技术,2016,56(2):201-207. [WANG Wei, WANG Jing,CHEN Xiaopo,et al. Centralized transmit power control based on interference matrix in high-density WLAN environment[J]. Telecommunication Engineering,2016,56(2):201-207. ]

作者简介:

中图分类号:TN918. 91

文献标志码:A

文章编号:1001-893X(2016)02-0195-06

*收稿日期:2015-05-18;修回日期:2015-08-18 Received date:2015-05-18;Revised date:2015-08-18