三峡水库变动回水区卵石输移音频信号分析系统开发
2019-08-10胡文成
胡文成
摘要:三峡变动回水区在三峡水库175m蓄水以来以消落期卵石浅滩碍航问题为主,但测量卵石输移强度难度较大。结合自主研发的水下卵石音频采集设备,基于Matlab平台,设计卵砾石音频分析计数可视化软件。该软件具有读取音频文件、提取音频文件信息、音频文件预处理、音频特征参数分析、卵石碰撞识别计数、估算卵石输移强度等功能。为解决三峡变动回水区卵石碍航问题提供一定参考。
关键词:浅滩碍航;卵石输移强度;音频分析;可视化软件
中图分类号:TP317 文献标识码:A
文章编号:1009-3044(2019)17-0249-03
开放科学(资源服务)标识码(OSID):
Abstract: Since the Three Gorges Reservoir backwater area has been 175m water storage in the Three Gorges Reservoir, the problem of obstruction of the pebble shoal is mainly due to the erosion, but it is difficult to measure the pebble transport intensity. Combined with the self-developed underwater pebble audio acquisition equipment, based on Matlab platform, design the visual analysis software for the gravel audio analysis and counting. The software has the functions of reading audio files, extracting audio file information, audio file preprocessing, audio feature parameter analysis, pebble collision recognition counting, and estimating pebble transmission intensity. To provide a reference for solving the problem of pebbles in the backwater area of the Three Gorges.
Key words: shoal obstacle navigation; pebble transport intensity; audio analysis; visualization software
1 背景
三峽水库175m蓄水以来,长江干流航道条件大幅改善。三峡变动回水区蓄水期明显改善,消落期部分河段、特殊时段由于泥沙淤积等问题,通航十分困难。新水沙条件下入库推移质大幅减少,水库淤积平衡时间延长,变动回水区将长期面临卵砾石输移碍航问题。虽然卵石淤积量不大,但对航道条件影响很大。变动回水区目前仍以消落期卵石浅滩碍航问题为主。但测量卵石输移强度比较困难,卵石运动观测技术已成为制约航道整治维护的技术瓶颈。
每年消落期,在重庆九龙坡三角碛河槽都有数天卵砾石输移发出在岸上可以清楚听见的强烈声音[1]。由于卵石输移时发出声音这一特性,经试验论证,卵石输沙率可以通过采集和分析卵石碰撞音频进行测量。田蜜[2]等结合当前追踪技术,提出了一种基于声学原理的实时定位卵石运动观测的方法。研发了一套可用于水下卵石输移声音采集设备。设备面板安装有拾音器,卵石从设备上运动碰撞面板发出声音可以被拾音器采集到。郭琦[3]等利用小波分析对水下卵石运动声音进行了研究,提出了一种根据音频信号能量特征向量对卵石运动声音进行识别的方法。薛飞龙[4]等对卵石碰撞声音的特征参数进行了分析。董梅[5]等利用Matlab软件设计了一套语音特征提取系统。
本文基于Matlab GUI编程环境,设计了一套卵石音频特征参数分析识别系统,通过分析实测的水下卵石运动音频的特征参数,统计一段时间内卵石碰撞的次数并换算成输沙率,对三峡回水变动区卵石输移强度测量提供参考。
2 卵石声音分析识别方法
将设备放置在水下,卵石经过设备时发出的声音被设备的拾音器采集到,图1为采集到的信号的时域波形图。
2.1 音频信号预处理
分帧加窗:卵石运动声音信号属于非稳态、时变的信号,而通常对于声音信号的分析方法是基于稳态信号这个前提,因此在分析之前需要对卵石运动声音进行处理,使之成为稳态信号。本文窗函数使用汉明窗[6]。
降噪:原始音频信号含有噪声,其对分析造成干扰,采用谱减法[6]进行降噪处理,以提高信号质量。对几种降噪方法进行比较,谱减法对设备采集的卵石运动声音降噪效果较好。
端点检测:在音频信号处理中检测出有效音频的端点是十分重要的。语音端点的检测是指从包含语音的一段信号中确定出语音的起始点和结束点位置,以区分有话段与无话段。本文采用基于多窗谱估计谱减法和能熵比法[6]的端点检测方法。
2.2 特征分析
经过室内水槽试验,对试验得到的音频信号进行分析处理后,提出针对水下拾音器测量方法的卵石运动声音识别技术。
(1)峰值频率在1400~4000Hz;
(2)基音频率在2000~3800Hz;
(3)能量特征向量前三阶系数总能量占比在0.8~1.0。
当一段音频信号满足上述三个条件时,可认为其为卵石运动声音,利用该方法可从长时、复杂的音频信号中快速提取卵石运动声音。
3 软件总体设计
Matlab(矩阵实验室)是由美国Mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案。Matlab GUI(图形用户界面)(GUI)的制作上做了很大的改善。允许用户使用鼠标等输入设备操纵屏幕上的图标或菜单选项,以选择命令、调用文件、启动程序或执行其他一些日常任务。MATLAB 图形用户界面主要由常用对话框、按钮、文本框、面板、表格、坐标轴、复选框、单选框等控件。
本程序基于Matlab GUI编程环境,软件主要功能为:音频文件读取及信息提取、波形图绘制、音频分帧加窗、降噪、端点检测、音频特征参数提取、卵石碰撞次数统计等功能。图2是软件设计技术路线图。图3是软件主界面。
4 功能实现
4.1 音频文件读取及信息提取
本软件支持读取Matlab audioread函数支持的所有音频文件,本文主要利用此函数打开wav格式的音频文件,并提取音频文件的信息。提取的音频文件信息包括文件路径、采样率(每秒从连续信号中提取并组成离散信号的采样个数,单位为赫兹)、采样精度(反映度量声音波形幅度的精度,单位为比特)、持续时间(单位为秒)。
4.2 图像绘制
本软件能在对音频文件进行分析后绘制相关图像,便于直观地看出分析结果。主要包括三个图像:降噪后音频波形、能熵比端点检测、卵石碰撞检测音频波形。点击“求卵石碰撞次数”按钮后,软件将对导入的音频文件进行分析,并根据分析结果绘制图像。
1)降噪后音频波形对音频文件进行分析后,绘图区将对谱减法降噪后的波形进行绘制。谱减法是利用噪声的统计平稳性以及加强性噪声与语音不相关的特点而提出的一种语音增强方法。这种方法没有使用参考噪声源,但它假设噪声是统计平稳的,即有语音期间噪声幅度谱的期望值与无语音间隙噪声的幅度谱的期望值相等。用无语音的间隙测量计算得到的噪声频谱的估计值取代有语音的期间噪声的频谱,与含噪声语音频谱相减的估计值。当上述差值得到负的幅度值时,将其置零。谱减法的优点是总体运算量较小,容易实时实现,增强效果也较好,由于拾音器录制的水下卵石运动声音噪声较平稳,运用谱减法降噪比较适宜。
2)能熵比端点检测
首先计算出每帧音频信号的改进能量和每帧语音信号的谱熵,然后计算每帧的能熵比。谱熵值类似于过零率值,在有话段内的谱熵值小于无话段的谱熵值,所以用能熵比能突出有话段与无话段的差别。当某语音帧能熵比超过阈值时即认为该帧处于有话段内,从而实现端点检测。
图6为利用能熵比进行端点检测后的端点检测图像,其中横坐标为时间(单位为秒),纵坐标为短时能熵比。每个有话段均标出起始点与结束点,有话段起始点用竖直实线表示,有话段结束点用竖直虚线表示。
3)卵石碰撞检测音频波形
对有话段音频进行特征分析,当基音频率、峰值频率、能量特征向量前三阶系数总能量占比均满足条件时即认为该有话段音频为卵石碰撞产生。
图7为卵石碰撞检测音频时域波形图,其中横坐标为时间,纵坐标为归一化幅值。其中每个被认为是卵石碰撞产生的音频片段均标出。每个卵石碰撞片段起始点用蓝色竖直实现表示,结束点用蓝色竖直虚线表示。从图7可以直观地看出每个卵石碰撞片段的在整个音频文件中的位置。
4.3 数据统计
在对音频文件进行分析并得出分析结果后,可以在数据统计区查看相关数据。
图8是本软件的数据统计区。“卵石碰撞次数”将在对音频文件进行分析后返回卵石碰撞的次数。在edit控件输入卵石碰撞片段的序号,可返回该片段的三个特征参数。例如此音频文件在分析后得出有11个卵石碰撞片段,在edit控件输入1至11并点击“导出参数”按钮,即可返回相应片段的特征参数。
得到卵石碰撞次数后,可以将其转化为单宽输沙率。将卵石概化为球体,则单个卵石的质量可以表示为其中[ρ]为天然卵石密度;[d]为卵石粒径;[m]为单个卵石的质量。计算出单个卵石的质量后,根据单宽输沙率的定义,可求得单宽输沙率:
其中[n]为卵石碰撞次数;[m]为单个卵石质量;[b]为测量设备面板宽度;[t]为持续时间。根据此公式可估算卵石输移强度。
5 结束语
本文设计了一个基于Matlab GUI编程环境的水下卵石碰撞运动音频分析系统,系统主要功能包括:
1)音频文件读取级音频文件信息提取;
2)音频预处理:分帧加窗,谱减法降噪,能熵比法端点检测;
3)音频特征分析:通过分析音频片段的特征参数(基音频率、峰值频率、能量特征向量前三阶系数总能量占比)来判断该音频片段是否为卵石碰撞产生;
4)图像绘制:可绘制降噪后时域波形图、能熵比端点检测图、卵石碰撞识别时域波形图;
5)数据统计:可统计音频文件中卵石碰撞产生的音频片段的个数,导出每个音频片段的特征参数,并可根据卵石碰撞个数计算单宽输沙率。
本软件主要针对三峡变动回水区卵石碍航问题设计,配合卵石水下录音设备,统计卵石碰撞个数,估计卵石输移强度,对解决三峡变动回水区卵石碍航问题提供一定技术支撑。
参考文献:
[1] 长江重庆航运工程勘察设计院, 重庆交通大学. 三峡工程试验性蓄水以来库区航道泥沙原型观测(2008-2013年度)总结分析[R]. 武汉: 长江航道局, 2014.
[2] 田蜜, 楊胜发, 郭琦. 基于声学原理的卵石运动实时追踪研究[J]. 泥沙研究, 2017, 42(3): 14-19.
[3] 郭琦, 高辰龙, 刘卡. 基于小波变换的水下卵石运动声音识别研究[J]. 中国水运: 航道科技, 2016(6): 24-28.
[4] 薛飞龙, 宋丹丹, 杜思材. 卵石碰撞的声学特征分析[J]. 人民长江, 2018, 49(1): 95-98, 102.
[5] 董梅, 廖云霞, 刘海山, 等. 基于Matlab的语音信号特征提取系统的设计[J]. 电脑知识与技术, 2018, 14(20): 271-274.
[6] 宋知用. MATLAB在语音信号分析与合成中的应用[M]. 北京: 北京航空航天大学出版社, 2013.
【通联编辑:谢媛媛】