APP下载

基于短时傅里叶变换特征分析的语音比对

2019-09-10陈淑杰

信息技术时代·上旬刊 2019年3期
关键词:特征向量Matlab仿真

摘要:针对语音信号对比问题,提出了特征参数提取和基于余弦定理的向量相似度分析方法。将不同时刻的瞬时频率及其瞬时频率对应的幅值这两个特征参数提取放到两个向量中,利用余弦定理求出两个向量夹角的余弦值作为相似度判定依据,从而根据两个特征向量的相似度求出两个音频信号的相似性。

关键词:短时傅里叶变换;瞬时频率估计;特征向量;向量相似度;MATLAB仿真

引言

现如今,与音频信号比对相关的信号处理方法数不胜数,英语打分软件,K歌打分软件都用到了语音比对原理,本文将最大幅度、瞬时频率作为相似性原理估计的两个特征值,从而完成语音比对任务。

傅里叶变换方法作为一种全局的线性处理方法【2】,反映了信号在整段时间内的频谱信息,只适用于平稳信号的精确分析,无法满足频谱结构随时间变化的非平稳信号的分析。语音信号是典型的非平稳信号,针对语音信号的分析处理,用时频联合分析的方法可以揭示信号的时频细节,从而更准确的对其进行分析与处理。目前,时频信号的分析处理已经广泛应用于物理、天文学、化学、生物学、医学和通信等众多领域。时频分析在信号处理领域显示出的巨大潜力,吸引着越来越多的人去研究并利用它。

1 短时傅里叶变换

STFT思想是:选择一个时频局部化的窗函数,假定分析窗函数g(t)在一个短时间间隔内是平稳(伪平稳)的,移动窗函数,使f(t)g(t)在不同的有限时间宽度内是平稳信号,从而计算出各个不同时刻的功率谱。短时傅里叶变换使用一个固定的窗函数,窗函数一旦确定了以后,其形状就不再发生改变。

STFT定义是:

式中【3】, 表示时间窗函数,上标“*”表示复共轭。从式①中可看出:对于特定的时刻t,STFT是信号 与中心在 t的平滑移动窗函数 乘积的傅里叶变换。从这个意义上,STFT可以理解为信号 在分析时刻t的局部频谱。由于分析窗的作用,在分析窗以外的信号得到抑制。

2 瞬时频率估计方法

估计瞬时频率属于时变信号分析的问题,在时频结果基础上,通过比较每一局部时间段上随频率变化的幅度、能量或密度的大小,可以获得对应每一局部时间段上最大幅度、能量或密度的频率值,文中所采用的估计瞬时频率的方法就是将此局部时间内对应的最大幅度的频率作为信号瞬时频率的估计值。

3 基于特征向量的相似度估计

本文相似度估计所用方法是:构造特征向量,将求取语音信号的相似度转化成求取特征向量的相似性。

向量相似性求取原理:

上图是一个二维向量的几何表示。其中有二维向量a和b。θ就是这两个二维向量的夹角;如果夹角为0度,意味着方向相同、线段重合;如果夹角为90度,意味着形成直角,方向完全不相似;如果夹角为180度,意味着方向正好相反。因此,我们可以通过夹角的大小,来判断向量的相似程度。夹角越小,就代表越相似。

由资料【4】查阅,可得基于余弦定理的相似性估计公式为:

本实验选取两个参数作为特征参数:1.瞬时频率向量2.瞬时频率对应的幅值向量。根据以上向量相似性估计原理可设定本实验相似性判定条件:两个特征参数的cosθ都小于0.6,判定不相似。两个特征参数的cosθ都大于0.6且小于0.7,判定相似性为60%,两个特征参数的cosθ都大于0.7且小于0.8,判定相似性70%,两个特征参数的cosθ都大于0.8且小于0.9,判定相似性为80%,两个特征参数的cosθ都大于0.9且小于1,判定相似性為90%,两个特征参数的cosθ都等于1,判定相似性为100%。

由于两个语音信号一般情况下维度不同,若进行截取,则会发生频谱泄露。故在代码中利用补零方法解决了两个语音信号不同维度,无法进行处理的问题,仿真效果较好。

5 MATLAB编程思想

音频信号相似性判定:

找一对相似的语音信号,如英文单词LIVE和LOVE。分别对两个语音信号进行短时傅里叶变换(STFT),然后找出两个英文单词最大幅度时对应的瞬时频率,并将这些数据(瞬时频率及瞬时频率对应的最大幅度)分别存放到对应的数组中。将这两类数据转化为向量A和B,如:LIVE对应向量为A1、B1,LOVE对应向量为A2,B2。利用余弦定理的相似性原理,列出判定条件,即可判断LIVE和LOVE的相似性。利用此编程思想可判定两语音信号的相似性。

6 仿真验证

信号相似性对比

图一图二对比,可知两个信号不相似,但是MATLAB的出来的结论与信号时域图对比得出来的结论相同,可知本实验信号相似性判定原理与程序都是正确的。

7 结束语

利用短时傅里叶变换可进行各种时频分析。其中信号相似性判定可由多种方法求出。本实验利用基于余弦定理的特征向量相似性原理来判定两个信号的相似性,本实验程序由本作者完全自主编写而成,若经过语音包进行检测后,则具有实际工程参考价值。

本实验存在的问题是实验数据量有待增加,后续需要进行更多数据的检测。

参考文献

[1]赵立昕,蔡志坚,周正.超宽带信号的时频分析[J].高技术通讯,2006,16(2):1332135.

[2]吴军.数学之美.北京:人民邮电出版社2012,5(2):9787115282828.

作者简介:陈淑杰(1999.02-),女,河南省驻马店市人,职称:学生,单位:郑州大学信息工程学院,专业:通信工程。

猜你喜欢

特征向量Matlab仿真
高中数学特征值和特征向量解题策略
三个高阶微分方程的解法研究
微信网络的信息传播模型研究
常规PID控制和常规模糊控制的比较
氨基酸序列特征向量提取方法的探讨
感应电机低速运行时自适应状态观测器研究
基于鼠标行为的电子商务中用户异常行为检测
MATLAB仿真在《控制工程基础》教学中的应用
一种改进的峰均功率比判源方法
矩阵方法求一类数列的通项