一种无线电话音信号时差估计方法
2015-02-17李宝林,文飞,李佳
一种无线电话音信号时差估计方法
李宝林1,**,文飞2,李佳1
(1.西华师范大学 计算机学院,四川 南充 637008;2. 空军工程大学 空管领航学院,西安 710051)
摘要:无线电话音信号的时差估计一直是个难题,其主要原因有话音信号带宽较窄且非平稳、在时域上具有非连续性及无线电信道(特别是短波信道)衰落的非一致性。针对上述特点,提出了使用短时处理技术来估计两路信号互相关谱的线性相位的无线电话音信号时差估计方案。新方案融合了话音激活检测技术和短时分段处理技术,并使用加权最小二乘相位拟合方法来求解时差。对比实验表明新方案的时差估计效果显著优于经典的广义互相关算法。
关键词:短波通信;时差估计;无线电话音信号;短时分析;话音激活检测;无源定位
1引言
时差估计是现代信号处理中信号检测和参数提取的一个重要组成部分,广泛应用于探测、通信、生物医学和地球物理等领域[1]。特别地,时差估计是辐射源跟踪和定位系统(如雷达和声纳等)中的核心部分,时差估计的精度直接决定了目标定位的精度。经历了过去几十年的广泛深入研究,时差估计技术目前已较为成熟。在众多传统的时差估计方法中,广义互相关方法[2]较为经典且应用最广泛。广义互相关方法的基本思想是:首先,将两路信号进行白化处理(预滤波);然后,把其中一路信号相对于另一路信号进行时移,并利用互相关技术比较两路信号的相似程度,相似程度最大的位移量(即两路信号互相关的峰值位置)对应时差的估计值。广义互相关方法通过对接收信号进行白化处理,使得两路信号的相关峰更加尖锐,从而达到提高时差测量分辨能力和稳定性的目的。在信号和噪声都是高斯平稳的独立过程的假设下,广义互相关算法是最优的时差估计算法,其估计方差渐进地逼近克拉美劳下限[3-4]。
无线电话音信号是无线电通信中一种常见的信号,如短波、超短波电台话音信号。无线电话音信号时差估计的主要应用场景有两个方面。一是远距离(数千到上万公里)短波通信中话音信号的广域分集接收。由于电离层的不稳定性,远距离短波通信的稳定性通常较差。为了提高此类通信的稳定性,一种可行的方案是使用多个广域分布的接收器来分集接收同一个短波信号。其中,接收器之间相距足够远(如数百到数千公里),以使得不同接收器对应的短波信道相互独立。最终,通过对多个接收器的输出进行分集合并来改善通信效果。在这个过程中,需要估计出不同接收器输出信号之间的相对时差用于信号的合并。二是无线电话音信号源的跟踪和定位,主要用于对无线电台的侦察定位,是电子对抗中电子侦察的一个重要组成部分。
在实际应用环境中,广义互相关算法估计无线电话音信号时差的效果并不理想,其主要原因是:一是话音信号带宽较窄,其能量主要集中在50 Hz~2 kHz;二是话音信号非平稳且在时域上具有非连续性;三是实际无线电(特别是短波)信道衰落的非一致性使得同一话音信号在不同接收器输出之间的相关性显著下降。针对上述特点,本文提出了一种新的无线电话音信号时差估计方案。新方案融合了话音激活检测技术和短时分段处理技术,并使用加权最小二乘相位拟合方法来求解时差:首先,针对话音信号的时域非连续性,新方案使用话音激活检测技术来提取信号中的话音片段,以减轻噪声的影响来提高时差估计的稳定性;其次,针对语音信号的非平稳性和信道的非一致性,新方案使用短时处理技术来更好地估计两路信号互相关谱的线性相位,具有很强的相位野值抑制能力;最后,基于估计得到的互相关谱线性相位,新方案使用加权最小二乘相位拟合方法来快速求解时差。文章最后给出了新方案与广义互相关方法的对比实验结果,证明了新方案的有效性。
2信号模型和广义互相关算法
这里假设没有多径和多普勒频移,且忽略信号解调过程中的频差。两个接收器接收到的基带话音信号可以表示为
x1(t)=A1(t)s(t)+n1(t),
x2(t)=A2(t)s(t-τ)+n2(t)。
(1)
式中,s(t)为基带话音信号源;τ为信号源到达两个接收器的相对时差;n1(t)和n2(t)为相互独立的零均值高斯白噪声,并且都独立于s(t);A1(t)和A2(t)是两个信道的幅度衰落函数,这里假设A1(t)和A2(t)是慢变的,即在较短的时间段内可以假设A1(t)=A1和A2(t)=A2,其中A1和A2为常数。
设xi(t)的傅里叶变换为
(2)
式中,i=1,2;k=1,2,…,K。广义互相关算法通过搜索下式的最大值来估计时差:
(3)
式中,Wi(ωk)是与信号和噪声的统计信息相关的加权函数。在实际工程应用中,信号和噪声的先验信息通常是未知的,因而通常用信号和噪声统计的估计值来代替加权函数中涉及的统计理论值。
3基于话音检测和短时分段处理的话音信号时差估计方案
基于话音检测和短时分段处理的话音信号时差估计方案融合了话音激活检测技术和短时分段处理技术,并使用加权最小二乘相位拟合方法来求解时差。本节将详细介绍新方案的实施步骤。
3.1话音激活检测预处理
话音激活检测又叫有声无声检测[5-7],主要用来检测话音信号中存在话音的部分,它在语音识别、语音编码、语音增强中都有广泛的应用。利用话音激活检测技术对语音片段进行拼接后再进行时差估计,可以减小语音非占空时的噪声影响。
假设噪声为不相关的高斯白噪声,对于每段信号有如下两个假设:
H0:语音不存在:X=N;
H1:语音存在:X=N+S。
(4)
式中,S、N和X分别是语音信号、噪声和接收信号片段的K维离散傅里叶系数向量,并且记它们的第k个元素分别为S(ωk)、N(ωk)和X(ωk)。假设语音信号与噪声都是独立的高斯过程,则在似然比的几何意义下最终的判决算法可表示为[5]
(5)
式中,η为似然比判决门限,γk=|X(ωk)|2/λN(k)为后验信噪比,λN(k)表示噪声频谱N(ωk)的方差。
上述算法利用了语音信号与噪声之间频谱分布的差异性,在高斯分布假设下通过计算式(4)中两种情况下的似然比来判决是语音还是噪声。图1显示了一段话音信号的话音激活检测输出。由于时差信息只包含在话音激活片段中,因此只使用话音激活信号片段能有效减轻噪声片段对时差估计的影响。
图1 一段语音信号的话音激活检测输出
3.2短时分段处理
由于话音信号是一种非平稳信号,因此一般不用平稳信号的处理方法来进行处理[4]。研究表明,语音的产生与肌肉运动的变化有关,而这种变化相对来说是慢变的,即可认为在一个较短的时间范围内语音的特性基本保持稳定(即此时间段内语音是相对平稳的)。基于这种思想,人们通常使用短时处理技术来处理语音信号。
在实际应用环境中,使用短时分段平均的方法还可以有效地抑制噪声野值和干扰。基于话音激活检测的输出,我们使用短时分段平均的方法来估计两通道信号之间的频域互相关谱。具体地,假设接收器i输出的数据长度为N,i=1,2,把此数据分为L段,每段长度为N/L,对L段数据分别进行傅里叶变换得到其频域数据Xi,l(ωk):
(6)
式中,l=1,,2,…,L,w(n-m)是窗函数。随后计算两通道对应段数据的互相关谱
图2是分段平均(取中值)求两路话音信号(经话音激活预处理的拼接数据)相位差值(即平均互相关谱的相位)的示意图,详细的实验设置见第4节。可以看到使用短时分段平均的方法可以有效抑制相位野值,使两通道信号的相位差趋近于线性相位。
图2 两通道信号分段平均估计的相位差值
3.3加权最小二乘相位拟合算法
利用两通道信号互相关谱的线性相位测量来估计时差是常用的简单且实用的时差估计方法[8-9]。在噪声统计独立和非散射信号源的理想情况下,利用两通道信号的线性相位差来估计时延和其他最优时延估计算法具有一样的精度。同时,在非理想的情况下,利用相位数据来估计时延具有以下的潜在优势。例如,当接收端噪声为相关或相干噪声时,通过合理选择频率点,利用相位数据的时差估计算法可以在一定程度上减少由于相关噪声引起的估计偏差。
这里假设在较短的时间段内信道衰落函数为常数,即A1(t)=A1和A2(t)=A2,由信号模型(1)知,两通道信号的互相关谱理论上可以表示为
GX1X2(ωk)=|A1|2|A2|2|S(ωk)|2ejωkτ+jc。
(7)
(8)
上式的最小二乘闭式解为
(9)
当取W=I时,I为单位矩阵,上式为标准的最小二乘估计。在实际的处理过程中,相位数据p由3.3节介绍的短时分段平均方法估计得到。与广义互相关算法相比,相位拟合算法的优势在于不需要谱峰搜索,时差估计直接由式(9)求出。
4实验结果
本节给出本文方法与广义互相关方法分别处理实验室采集信号的结果,对两种方法的时差估计效果进行了对比评估。新方案的实施步骤为:
(1)估计两通道信号的信噪比,取信噪比较大的一路信号使用话音激活检测技术进行预处理,根据话音激活检测的输出分别截取两通道信号对应的语音片段并进行拼接;
(2)基于话音激活检测输出,使3.2节中的短时分段平均方法估计两通道信号的互相关谱;
(3)根据分段平均得到的互相关谱,提取互相关谱的相位并使用加权最小二乘相位拟合算法估计时差。新方法中信号分段长度为60 ms。在互相关算法的实施中,其搜索间隔为40 ns,然后,在搜索得到的互相关峰值周围进行二阶样条插值来得到更好的分辨率。
在第一个外场实验中,使用两个相距300 m的接收机同步接收一个近场对讲机信号,对讲机信号为载波400 MHz的调幅话音信号,接收信号解调到基带后的采样率为100 kHz。两个接收机经GPS授时同步采样。对讲机距两个接收机天线的真实距离差为240 m,因此,由真实信号传输距离差引入的时差约为800 ns。
图3显示了采集的两通道信号(已对信号进行了2 kHz带外滤波)话音激活检测的输出为矩形线框部分,图4给出了本文方法的时差估计结果。可以看出,当累计话音信号长度超过0.6 s时,新方案估计的时差收敛到真实值周围±100 ns以内,并且随着累计时间的增加趋于稳定;互相关算法的时差估计结果(在互相关峰值周围二阶样条插值后)为321.78 ns。通过对比可以看出,新方法的估计误差远小于互相关算法。
图3 外场采集信号的话音激活检测输出
图4 新方法的时差估计结果(信号分段长度为60 ms)
在第二个外场实验中,除发射源由对讲机改为功率可控的数字发射机外,其他实验条件不变。在发射机三种不同发射功率下,分别对比互相关方法和新方法时差估计的精度。在每种发射功率情况下,接收信号按4 s每段分为50段,表1给出了上述两种方法50次独立实验的统计均方根误差和三种情况下两个接收机估计得到的信噪比。从表中可知,新方法的估计均方根误差明显小于经典的互相关算法。
表1 发射机三种不同发射功率下两种方法的
5结束语
无线电话音信号时差估计的难点在于话音信号带宽较窄且非平稳,同时在时域上具有非连续性,以及无线电信道(特别是短波信道)衰落的非一致性。本文提出了一种稳健的无线电话音信号时差估计方法,可用于此类信号的分集接收、跟踪和定位。新方案融合了话音激活检测技术和短时分段处理技术,并使用加权最小二乘相位拟合方法来求解时差。外场实验结果表明新方法的表现明显优于传统互相关算法。
参考文献:
[1]Carter G C. Coherence and time delay estimation[J]. Proceedings of the IEEE,1987,75(2): 236-255.
[2]Knapp C H,Carter G C. The generalized correlation method for estimation of time delay[J]. IEEE Transactions on Acoustics,Speech,Signal Processing,1976,24(4): 320-327.
[3]Ianniello J P. Time delay estimation via cross-correlation in the presence of large estimation errors[J]. IEEE Transactions on Acoustics,Speech,Signal Processing,1982,30(6): 998-1003.
[4]王巍,熊瑾煜,朱中梁.多用户环境下定位精度的克拉美罗下限与时延估计算法[J]. 电子学报,2005,33(1):131-134
WANG Wei,XIONG Jinyu,ZHU Zhongliang,Cramer-Rao Low Bound for Location and Time Delay Estimation Algorithm in Multi-User Environments [J]. Acta Electronica Sinica,2005,33(1):131-134.(in Chinese)
[5]Sohn J,Kim N S,Sung W. A statistical model-based voice activity detection[J]. IEEE Signal Processing Letters,1999,6(1): 1-3.
[6]Shina J W,Changb J,Kim N S. Voice activity detection based on statistical models and machine learning approaches[J]. Computer Speech & Language,2010,24(3): 515-530.
[7]Ghosh P K,Tsiartas A,Narayanan S. Robust Voice Activity Detection Using Long-Term Signal Variability [J]. IEEE Transactions on Audio Speech and Language Processing,2011,19(3): 600-613.
[8]Tian X,Li R,Wang W. An Efficient Time Delay Estimation Algorithm for Multipath Signal of Distance Signal in TACAN System [J]. Journal of Electronics & Information Technology,2010,32(9): 2273-2276.
[9]Wen F,Wan Q,Luo L Y. Time-difference-of-arrival estimation for noncircular signals using information theory[J]. International Journal of Electronics and Communications,2013,67(3): 242-245.
李宝林(1976—),男,安徽太湖人, 2008年于四川大学获博士学位,现为西华师范大学副教授,主要研究方向为物联网应用;
LI Baolin was born in Taihu,Anhui Province,in 1976. He received the Ph.D. degree from Sichuan University in 2013. He is now an associate professor. His research concerns application of Interent of Things.
Email:scu_lbl@sina.com
文飞(1983—),男,四川阆中人,2013年于电子科技大学获博士学位,现为空军工程大学讲师,主要研究方向为统计信号处理;
WEN Fei was born in Langzhong,Sichuan Province,in 1983. He received the Ph.D. degree from University of Electronic Science and Technology of China in 2013. He is now a lecturer. His research concerns statistical signal processing.
李佳(1982—),女,四川石棉人,讲师,主要研究领域为计算机网络。
LI Jia was born in Shimian,Sichuan Province,in 1982. She is now a lecturer.Her research concerns computer network.
引用格式:李宝林,文飞,李佳.一种无线电话音信号时差估计方法[J].电讯技术,2015,55(6):629-633.[LI Baolin,WEN Fei,LI Jia.A Time Delay Estimation Method for Radio Speech Signals[J].Telecommunication Engineering,2015,55(6):629-633.]
A Time Delay Estimation Method for Radio Speech Signals
LI Baolin1,WEN Fei2,LI Jia1
(1.College of Computer,China West Normal University,Nanchong 637008,China;
2.School of Air Traffic Control and Navigation,Air Force Engineering University,Xi′an 710051,China)
Abstract:Time delay estimation(TDE) for radio speech signals has long been a difficult problem mainly due to the following reasons. First,the bandwidth of speech signal is very narrow. Second,speech signal is non-stationary and is not continuous in time. Third,the attenuation functions of different radio channels are not concordant,especially for shortwave channels. According to above features,this paper proposes a new TDE scheme for radio speech signals. The new scheme incorporates the voice activity detection and short time analysis techniques in estimating the cross-correlation(CC)spectra,and employs a weighted least square method to solve the time delay based on the phase of the estimated CC spectra.Comparative experiments show the new scheme is superror to classical generalized cross-correlation method.
Key words:HF communication;time delay estimation;radio speech signal;short time analysis;voice activity detector;passive localization
作者简介:
中图分类号:TN912.3
文献标志码:A
文章编号:1001-893X(2015)06-0629-05
通讯作者:**sculbl@sina.com Corresponding author:sculbl@sina.com
收稿日期:*2014-12-05;修回日期:2015-04-15Received date:2014-12-05;Revised date:2015-04-15基金项目:国家自然科学基金资助项目(61401501);四川省科技支撑计划项目(2013SZ0056)Foundation Item:The National Natural Science Foundation of China(No. 61401501);The Science & Technology Pillar Program of Sichuan Province(2013SZ0056)