基于单片机控制的语音采集与回放系统设计研究
2020-06-01崔浩斌
崔浩斌,刘 伟
(中船重工纵横科技有限公司,湖北宜昌443000)
1 引言
目前,基于51单片机的语音采集回放系统种类繁多,但是在语音采集及回放的效果方面有的不甚理想。为此,本系统利用AT89C51单片机[1]的精准控制,在采集通道采用射极跟随器隔离以及4阶低通滤波器滤波,保证采集语音的质量;在回放通道上,再次将存储的信号进行滤波放大和频率校正,进而保证回放语音的效果。同时,系统采用了三种编码模式,并在三种编码模式下对语音回放的效果做出对比。
2 系统硬件设计
系统主体由语音处理前向通道、A/D转换模块、单片机控制兼数据处理模块、D/A转换模块、键盘显示模块及后向处理通道组成。单片机构成系统的控制中心,控制功能选择和结果显示。通过前级放大和加法器进行2.5V抬升,将微弱的电信号的峰-峰值放大至MAX118可读取的0~5V,中间由射级跟随器进行隔离,再通过300Hz~3.4kHz的带通滤波器滤除噪声。信号通过A/D转换后进入单片机进行相应处理,然后经D/A转换成模拟信号输出,后极通过300Hz~3.4kHz的带通滤波器使之平滑,并用音频功放放大语音信号输出。
系统分为采集通道、控制单元和回放通道三个部分。采集通道通过麦克风将声音转换成电信号,经射极跟随器、两级放大器、滤波器对转换后的电信号进行隔离、放大和滤波后,再对声音信号进行A/D采样并存储到单片机的外部存储区内。回放通道通过D/A转换将存储区中的信号转换成声音,经滤波器、频率校正及放大器后通过扬声器放出。系统的控制单元主要由单片机构成,通过键盘对系统系统进行操作。系统原理框图如图1所示[2]。
图1 系统原理框图
2.1 采集通道设计
1)麦克风电路
话筒在受到声音振动后,其电阻随声音信号的变化发生大小变化。根据话筒采集语音的原理,在话筒与标准电压之间接一47kΩ的限流分压电阻。通过10μF耦合电容将话筒分得的变化电压信号传递给初级同相放大器,输出信号作为下一模块的输入信号。麦克风电路如图2所示[3]。
图2 麦克风电路
2)射极跟随器
麦克风采集的信号极为微弱,且输出阻抗不可忽略,故放大前必须进行隔离,并尽量减小信号输出阻抗。运用电压跟随器的输入阻抗很高、输出阻抗很小这个特点,这里作为多级放大器的第一级,起隔离和缓冲的作用。射极跟随器如图3所示[4]。
3)前级放大器
放大器采用多级信号放大器级连,其中AV=-RF/R1。总增益AV0=AV1×AV2=0.1~50×100,两级放大均增益可调,其中第一级放大倍数较小以保证信号不会被失真放大。放大器具体电路如图4所示。
图3 射极跟随器
图4 放大电路
4)前级滤波器
选择巴特沃斯滤波器,4阶低通滤波器级联4阶高通滤波器,具体电路如图5所示。由巴特沃思低、高通电路阶数N与增益G之间的关系可知:二级四阶时V1=1.152即Q1=0.541,V2=2.235即Q2=1.31,Q=0.541×1.31=0.70871≈0.707。
图5 巴特沃斯滤波器
2.2 控制单元设计
中央处理模块由A/D采样、D/A转换、单片机控制兼数据处理模块组成。
AD转换电路[5]使用ADC0809芯片,它将输入的连续模拟量,转换为数字量,然后再交由单片机处理和存储。采用中断的方式检测电路是否转换完成。其电路原理如图6所示。
图6 A/D转换电路
内存扩展电路[6]如图7所示,采用62256 32K来存储由AD转换而来的数字量,用74373来锁存低八位的地址。
图7 内存扩展电路
DA转换电路如图8所示,使用DAC0832芯片,将由62256存储的数据输出,转换为模拟量,经过运算放大器转换为电压量输出,这个输出量就是经过存储和处理之后的声音的音量。
图8 D/A转换电路
2.3 回放通道设计
回放通道中的放大器和滤波器与采集通道中的设计相同。其扬声器电路设计为由集成功放LM386及外接元件构成,调节10kΩ的滑阻可调节扬声器的音量。调节36kΩ的滑阻可以使电压放大倍数的调节范围在20~200范围内变化。5引脚处10Ω的电阻和0.047μF的电容串联构成矫正网络用来进行相位补偿。7引脚处的10μF的电容为旁路电容。6引脚处的0.1μF的电容去耦电容,滤掉电源的高频交流成分。扬声器电路如图9所示。
图9 扬声器电路
3 系统软件设计
系统的软件流程[7]如图10所示。
图10 系统软件流程
4 语音回放效果及分析
实验方式为在离麦克风相同距离上用相同音量播放音乐,分别换用不同的编码方式,对各编码方式最终放音效果进行记录。结果如表1所示。
表1 不同编码方式语音播放效果
依据表中数据,对各编码方式[8]分析如下:
采用PCM编码(脉冲编码调制):其原理由抽样、量化和编码三个步骤组成,具体实现是将信号通过A/D转换为线性编码,直接存入RAM,然后通过D/A转换将音频信号回放出来。该方法原理简单,易于实现,且音质效果较好,几乎不存在失真,缺点是存储器利用率低。
采用DPCM编码(差值脉冲编码调制):该方法通过对抽样信号和预测信号的差值进行编码,可以压缩数码率,提高存储空间利用率。其数学表达式为:
式中,S(n)表示当前采样值,A(n)表示增量的累加值,A(n-1)作为预测e(n)表示A(n)与A(n-1)的差分值,以四位存入RAM。
采用插值压缩算法:考虑到大多数情况下人声频率普遍在2kHz左右,可以相应降低采样频率以提高存储时间,将原来8kHz的采样率降到4kHz。为了能较好地还原原来的语音,解码时要进行插值,可以采用线性内插或抛物线拟合内插。由于是半采样,插入的虚拟值不可能完全与原始的真实值相等,所以输出的语音信号会有一定的失真。
5 结束语
实验表明,系统各模块能按预期稳定工作,是一种实用的语音采集回放系统设计。同时通过三种编码方式进行编码,以及实际运行及理论分析可知,采用PCM编码方式语音采集回放效果最好。