APP下载

基于MEL频率倒谱系数技术的音控汽车天窗的研究设计*

2015-06-23赵向阳

河南工学院学报 2015年2期
关键词:控制板天窗特征参数

袁 霞,赵向阳

(河南机电高等学校汽车系,河南新乡453000)

基于MEL频率倒谱系数技术的音控汽车天窗的研究设计*

袁 霞,赵向阳

(河南机电高等学校汽车系,河南新乡453000)

基于对语音信号的研究,采用MEL频率倒谱系数对语音信号进行提取,动态规划的思想进行语音信号的匹配,以汽车天窗为控制对象,实现了系统样机的研制。测试结果表明,系统在车内噪音低于70分贝下的平均识别率高达93%。

MEL频率倒谱系数技术;语音控制;汽车天窗;单片机

0 前言

随着汽车电子技术的高速发展,人们对汽车天窗控制的方便性要求越来越高。在行车过程中,驾驶员分神对汽车天窗进行开启闭合时,将有一定的安全隐患。语音是人类最重要、最基本、最有效、最常用和最方便的通信形式。如果对汽车天窗的控制通过语音来进行,其舒适性和方便性对汽车行车安全,增加驾驶舒适和方便性具有重大意义。

在本论文中,对语音信号分析的基础上,根据系统设计的需求及要达到的目的,采用MEL倒谱系数对语音信号进行提取,动态规划的思想进行语音信号的匹配,实现了语音控制汽车天窗的设计和研究。经过在河南新马电动车厂进行测试,在车内噪音低于70分贝下的平均识别率可达93.6%。

1 语音识别系统

1.1 语音识别系统原理图

如图1所示,语音信号经过录音笔转换成电信号,电信号经过预处理,预处理就是对信号进行预加重处理、加窗处理和端点检测处理等。预处理过的语音信号经过特征提取形成特征库,对特征库进行大量训练形成语音参考模式库。对待识别语音同样经过预处理、特征参数提取之后,与语音参考模式库进行模式匹配,得出最终的识别结果。

图1 识别系统原理图

1.2 语音识别中的特征提取

语音信号进行特征参数的提取就是对语音信号进行预处理、分帧处理和端点检测后,对处理过的语音信号采用MEL倒谱系数(Mel Frequency Cepstrum Coefficient)进行特征参数的提取[1][2][3]。

音控汽车天窗的控制语音主要为“开”和“关”。以采样语音“开”为例取其特征参数。

首先,假设一帧采样语音“开”为{li}i=1,2,..N(N为帧长),对其加窗后作N点FFT为频域分量{Li}i=1,2..N,取频域分量模的平方得到离散功率谱S(n)。离散功率谱通过带通滤波器组所得m个参数Pj。

其次,用离散余弦变换将参数Pj变换到倒谱域。

其中P为MFCC参数的阶数,我们取P=12,{Dk}k=1,2…12即为所求的MFCC参数。

1.3 模式匹配

动态时间规整(Dynamic Time Warping,DTW)是将动态规划(DP,Dynamic Programming)[4][5][6]的思想用于解决语音识别中的语速多变的问题,即当未知单词的时间轴不均匀地扭曲或弯折时,使其特征与模板特征对正。待识别的语音信号与模式库的语音信号采用动态时间规整技术来进行匹配。

“开”模板的参考模式表示为{C(1),C(2)..C(m)..C(M)},m为训练语音帧的时序标号,C(m)为第m帧的语音特征矢量。

“开”测试模式表示为{S(1),S(2)..S(n)..S(M)},n为测试语音帧标号,S(n)为第n帧的特征矢量。

计算他们之间的失真D[T,R],失真越小相仿度越高。

2 音控汽车天窗的硬件设计

2.1 凌阳SPCE061A单片机的主要特点

凌阳单片机SPCE061A是台湾凌阳科技公司研制的一个16位结构的微控制器。它的内核采用u'nSPTM16位微处理芯片。它具有较强的中断处理能力、效率高的指令系统及低功耗、低电压的特点。

SPCE061A的A/D转换器有8个通道,其中有1个通道是MIC-IN输入,它专门用于对语音信号进行采样。A/D转换器对输入的音频信号进行8kHz采样。

2.2 硬件方案总体设计

本系统的硬件电路主要包括凌阳单片机SPCE061A、凌阳单片机 SPCE061A对汽车天窗驱动电机回路进行控制的控制电路和汽车天窗的控制电机。

从图2中可以看出,控制对象就是汽车天窗驱动电机,语音信号通过录音笔输入凌阳单片机SPCE061A。经过识别后,由SPCE061A发出信号给控制板,由控制板发出控制信号来控制汽车天窗的关闭。

根据对汽车天窗位置的状态分析,可以得到汽车天窗的运行状态与控制板输出的对照表。控制板的输出(IO8和IO9)与汽车天窗的运动状态对照表如表1所示。

图2 硬件方案总体设计框图

表1 控制板输出与汽车天窗状态对照表

3 实验结果和小结

本文简要介绍了语音识别中语音信号特征提取及匹配,在此基础上采用SPCE061A为语音信号处理芯片,设计了音控汽车天窗控制装置,实现了语音控制汽车天窗的动作。

设计完成的音控汽车天窗控制装置经过反复调试,能够实现语音控制,在安静环境下准确率达到93%以上。语音控制信号“开”和“关”的测试结果如表2所示。

表2 音控汽车天窗控制装置测试结果

(责任编辑 吕春红)

[1]杨行峻,迟惠生,等.语音信号数字处理[M]北京:电子工业出版社,1995.

[2]李虎生.汉语数码串语音识别及说话人自适应[D].北京:清华大学,2002.

[3]陈永彬,王仁华.语音信号处理[M].北京:中国科学技术大学出版社,1990.

[4]雷静.语音识别技术的研究及基本实现[D].武汉:武汉理工大学,2002.

[5]肖江南.汉语孤立词识别系统开发与研究[D].桂林:广西师范大学,2004.

[6]杨行峻,迟惠生,等.现代语音信号处理技术及应用[M].北京:机械工业出版社,2003.

[7]Hashemi,A.,Pisu,P.:‘Adaptive threshold-based fault detection and isolation for automative electrical systems’.Proc.Eighth orld Congress on Intelligent Control and Automation,2011,Taiwan,pp.1013—1018.

Research and Design of Voice Controlled Automobile Skylight based on the Frequency Cepstrum Coefficients Technology

YUAN Xia,et al
(Henan Mechanical and Electrical Engineering College department of automotive engineering,Xinxiang 453000,China)

This paper realized the development of the system prototype,based on the study of speech signal,the extraction of speech by Mel Frequency Cepstrum Coefficient,matching the speech signal through the idea of dynamic programming,automobile skylight as the control object.The test results showed that the average recognition rate of the system is high to 93.6%when the vehicle interior noise less than 70 decibels.

MEL frequency cepstrum coefficients technology;voice control;automobile skylight;single chip microcomputer

TP29

A

1008-2093(2015)02-0013-02

2014-10-16

袁霞(1976-),女,河南开封人,讲师,硕士,主要从事汽车电子研究。

猜你喜欢

控制板天窗特征参数
冕洞特征参数与地磁暴强度及发生时间统计
自制新款天窗固定器
基于MoldFlow的汽车天窗注射模浇注系统分析
轨道交通AFC导向标识控制板设计
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
迈腾车天窗无法关闭
一种机载SAR中心控制板的设计
DX-600发射机FCOG6100控制板的原理与应用
统计特征参数及多分类SVM的局部放电类型识别