基于单片机的室内语音识别无线求救设备

2016-09-08林发辉

中国新通信 2016年15期

林发辉

【摘要】本文对室内语音无线识别及求救设备的设计思路和主要技术进行了分析和设计。设备运行过程中，以单片机为主控芯片，主要应用语音识别和无线传输两个环节完成呼救音的识别和呼救监控的触发，能够将求救信息及时传递给救援人员，保证了家居安防和人们的生命财产安全。

【关键词】单片机语音识别无线求救室内安全

一、前言

及时报警在家居安防监控过程中非常重要。在很多场合下，遇险后报警人是无法通过正常方式报警的，例如入室抢劫时被害人会被蒙住嘴和眼睛，突发疾病的人无法清晰、大声的求救。因此，在出现突发情况时，简单的声音呼救是没有效果的，必须通过一定的识别设备，及时接收并识别轻微的、模糊的声音，这对提高家居环境的安全度具有重要的意义。在实际应用过程中，识别设备在接收到真的呼救信号后，能够触发监控探头将现场的图像记录下来，并将信息及时传递到救援机构或报警人亲属，这样就能让报警人获得便捷、快速和有效的保护。本文基于单片机构建了一套室内语音识别及无线求助系统，该系统实现了室内报警语音的识别和报警信号的传输，创新地将无线通信技术和语音识别技术结合起来。从实际情况出发，使得家居用户在紧急情况发生时不需要寻找报警和通讯设备，只需要动口就能完成求救工作。

二、系统框架分析

2.1主控芯片

本系统主要基于STM8系列的单片机对室内语音识别系统进行设计。单片机作为系统的主控芯片，对整个系统的架构设计优化、信息传输速度提升、系统开发维护都具有重要的作用。该系列的单片机包含8位框架结构，其中，CPU包含6个寄存器，这些寄存器对提高数据的访问和处理能力十分重要。另外，该系列单片机具有支持20个寻址方式和80个基本语句的指令集，并且CPU的所有寄存器都具有可寻址地址。而且，该系统的单片机保密功能良好，目前处于世界领先的地位，对保护我们的知识产权，维护项目成果在市场竞争中的正当性具有重要的意义。

2.2系统流程控制

当出现求救信号后，系统首先使用麦克风采集室内的语音信息，然后在通过无线传输模块将声音信号转化成电信号并传送给单片机，在微控制器——单片机的控制下，首先由语音识别模块对声音信号进行判断和分析，如果确认收到的信号为求救信号，则当单片机收到语音识别模块确认后，将控制通信模块将求救信息发送出去。同时，设备的液晶显示屏上会出现求救时间的发生时间，设备喇叭会发出报警声，直到使用按键输入后才能取消报警。详细的系统流程控制图如图1所示。

三、语音识别控制

本系统中的语音识别是设备的重要组成部分。使用语音识别是提高室内安防效果的重要途径。按照实际的需求，报警对象可以发出一些简单的声音入室抢劫时被害人会被蒙住嘴和眼睛，突发疾病的人无法清晰、大声的求救。这种声音模式是不引人注意的，用力幅度也是比较小的，但是其中仍然包含可用的音频数据。这种声音数据在呼救现场不会引起人们的注意，沉闷而且单调，同时，这种声音还有其他的一些特点，例如，呼救音在时域上具有非常强的稳定性。

在时域上，能够针对此类信号提取短时平均过0率和能量。而且，按照实际的需要，此类语音识别主要针对特定人语音的识别，只有设定的呼救者发出呼救并被确认以后，语音识别模块才能被触发并使整个系统开始工作。具体实现的功能需求包括：能够对呼叫的语音信号进行识别。识别技术对语音文本的内容要求不高，只要能够识别简单的音素及其组合即可。这时人们在特殊环境下必须发出的声音的。但是，只能采用特意拖长的发音时间及反复的相同的语音信号进行呼救；能够对说话的人的身份进行识别的功能，以确定特定的呼救用户；对识别的结果提供一种触发手段，例如远程报警、触发报警铃、打开视频监控等。

本装置语音识别的过程如图2所示。

语音识别最主要的部分是对特征的提取和模式的匹配。所谓特征提取，又包括语音前端处理与特征提取。前者指语音采样、分帧、A/D变换、特征提取和端点检测等。首先要识别特定人的声音，并对声音进行采样。系统语音的采样和A/D变换都是通过硬件完成的。采集的数据表明：成年人的有意识低音能够延续7.5左右，而普通的无求救意识发音不会存在如此上的时间，而且也不会保持持续的稳定的频率和振幅。除此之外，呼救音的具体长短能够根据口型、声带、肺活量和堵塞物的进行分析。例如，不同的堵塞物，或者不同的堵塞方式，都会造成差异的波形变异特征，这种数据规律是可寻的。因此，语音识别的着眼点就在于叠加多个特征量，形成多层次的识别模型。

四、数据无线传输控制

无线数据传输模块主要基于GPRS网络进行信号传输。这种传输方式成本较低，适用于短距离传输的情况，非常适合家居语音识别及求救系统的应用环境。GPRS在进行无线信息传输时，目前常用的是多媒体服务MMS，因此我们只需要将报警信息按照MSS协议进行打包，就能快速完成信息的传输过程。其中，报警信息数据包括WSP和WTP两种结构。

在本系统研发过程中，我们应用NRb24LO1无线传输模块，这个模块属于2.4G信息传输，内容集成了PCB天线，调制过程为GFSK，在国际通用频段ISM上共有125个频点，能够保证2M数据的高速传输。该模块还将高度信号处理功能集成进来，这里面主要包括自动应答和自动重发数据包等。

模块内置的点对点通信控制和CRC容错机制，能够保证数据的安全、稳定传输，另外，还包括了载波检测和传输错误计数等功能，能够进行跳频设置。模块的SPI结构能够与单片机直接相连或使用单片机进行模拟，内部的FIFO能够处理各种高、低速的接口，并选择性打开某些接收通道，因此能够适应各类型单片机的使用。

五、结论

总的来说，本设备以单片机为控制核心，并在它的基础上完成了语音识别模块和无线传输模块的设计开发，系统运行所需的成本较小，而且由于使用单片机进行集中控制，系统具有反应迅速、呼叫方便、操作便捷的特点，且可以设置呼叫不被察觉的模式，从而真正实现了安全求救的目的。另外，该设备的语音识别误报率较低，市场推广前景十分广阔。

参考文献

[1]张雄伟，陈亮，杨吉斌.现代语音处理技术及应用[M].北京：机械工业出版社，2003.

[2]陈涛.基于DSP的语音信号识别系统的研究与实现[D].成都：成都理工大学，2010.

[3]林玮，杨莉莉，徐柏龄.基于修正MFCC参数汉语耳语音的话者——识别[J].南京大学学报（自然科学版），2006，（01）：54-62.