智慧化调频发射台站建设中音频比对系统的设计与应用
2023-09-10李姝
李 姝
河北广播电视台 河北省 石家庄市 050031
引言
随着广播电视行业的不断发展和技术进步,智慧化调频发射台站建设已经成为调频发射系统升级的重要方向之一,智慧化调频广播发射台建设可减少调频广播发射台站运维过程中人为干预,可降低运营成本,提升调频广播发射台站运维效率,确保播出安全。其中音频比对技术应用是智慧化调频发射台站建设中的重要组成部分,结合信息技术、智能控制技术、互联网技术等,可对调频广播发射台站发射信号实时自动监测和自动分析,及时发现发射信号中的异常情况,保障发射信号的安全性。音频比对技术的应用为提升调频广播发射台自动化、智能化管理水平提供了技术保障,是推进调频广播发射台站智慧化的关键内容。
1 音频比对技术概述
音频比对技术基于计算机科学和音频信号处理技术,可对音频进行自动内容比对和匹配,从而实现对音频内容的检索、识别和分析。音频比对技术的核心是基于语音识别和语音分析的算法,通过对音频声学特征进行分析和提取,对语音进行相似度处理。音频比对技术经历了三个阶段,第一阶段音频信号是否存在,主要通过对音频信号进行采样,以及音频信号电平的阈值来完成;第二阶段主要通过比较两个音频信号电平幅度来评估信号的一致性;第三阶段音频比对技术向智能化方向发展,对不同的音频特征参数进行比较。目前音频比对技术实现方式主要分为以下三类:
(1)将音频转换为具有相同时间轴的波形,用图像比对技术计算波形的相似度。此音频比对实现方法运算量较高,信号传输过程中音频的幅度、波形易受到干扰从而导致比对效果降低。
(2)用大量的音频来训练模型,利用机器学习技术计算音频相似度。此方法需要高质量、大规模的训练数据,且模型训练时间较长,训练模型影响后续音频比对效果,另外,缺乏公开的、可信度高的广播音频数据集。
(3)提取音频特征并计算出相似度,以此来描述整体音频的相似度。音频特征参数可以很好地表征音频的特征,能够很好地区分、反映音频的性质,且稳定性较高。目前多数音频比对算法技术都使用音频的非语义特征作为比较参数,其中基于人耳听觉特性的梅尔倒谱系数MFCC 是应用较广泛的音频特征参数,目前此音频比对技术的实现方式应用最为广泛。
基于上述音频比对实现方式,对音频比对结果进行分析,对音频相似度进行判定,音频相似度判定方法主要有以下两种实现方式:
(1)计算音频间距离,音频间距离越小,音频相似度越高。
(2)计算音频相关系数,音频间相关系数越大,音频相似度越高。
2 智慧化调频发射台站建设中音频比对需求
围绕智慧化调频发射台站的建设要求,以提升调频发射台站信号质量和稳定性、提升调频发射台站运维效率、加强调频发射台站信号安全监测为目标,建立一套功能完备的音频比对系统,智慧化调频发射台站建设对音频比对系统的主要需求如下:
(1)通过自动化监测广播节目的音频特征,包括音量、音调、音质等,可以快速发现声音中存在的问题,从而提高广播节目播出质量和稳定性。
(2)对广播节目的来源和内容进行识别和比对,通过音频比对技术的应用,可以快速发现和防止广播节目被替换,保障广播节目的播出安全。
(3)对广播节目的音频质量进行实时监测和控制,通过音频比对技术的应用,可以快速发现和纠正声音中存在的噪声和失真等问题,对广播节目的音频进行干扰监测和分析,可以快速发现和解决干扰问题,保障广播节目的正常播出,提升广播节目播出效果。
(4)系统具备实时性,对广播节目进行的音频比对、统计和分析等具有实时性,可以快速发现和解决存在的问题。
(5)系统具备可扩展性,系统可以处理多路音频数据,音频比对系统与调频发射台的其他检测系统无缝集成。
3 智慧化调频发射台站建设中音频比对设计
3.1 音频比对总体结构
结合智慧化调频发射台站对音频比对功能需求,音频比对系统框架如图1 所示,主要有音频输入、实时同步模块、音频比对模块三大部分。
图1 音频比对系统框图
3.1.1 音频输入
节目源原始音频即为参考音频,通过音频采集设备在调频广播发射台站采集的节目音频或其他音频即为测试音频,参考音频、测试音频等所有音频可通过网络送入音频比对系统,音频比对系统完成测试音频与参考音频间相似度判定。
3.1.2 实时同步模块
不同的音频传输路径存在音频传输延时不一致情况,因此测试音频、参考音频输入到音频比对系统后,需要对测试音频、参考音频的延时变化进行实时测量并计算延时差,调整测试音频的延时,实现测量音频与参考音频间的实时同步调整。本音频比对系统设计同步模块的响应时间为1 秒,即1 秒内完成同步调整,调整精度为21 微秒左右(1/48kHz)。
3.1.3 音频比对模块
本模块即为音频比对算法的实现。为了提升音频比对系统的可靠性,本音频比对系统采用基于改进MFCC 余弦相似度的音频比对算法,此算法运算量相对较少,能满足对多路广播音频节目进行实时比对的要求。
3.2 音频比对输入设计
音频采集设备是音频比对输入的关键设备,具备空收信号输入和模拟/数字音频输入方式,可同时完成多路音频的远程监测和音频监听,针对调频发射台站多部发射机的应用场景,音频比对输入设计如图2 所示。
图2 音频比对输入设计
(1)对解码器输出音频进行实时监测和采集,通过网络输入音频比对系统,以此判断传输链路及解码器的音频状态和工作状态是否正常。
(2)对调频发射机的空收信号解调,解调后音频通过网络输入音频比对系统,以此判断调频发射机的工作状态是否正常。
(3)根据调频发射台站的频率情况,部署多台音频采集设备,可对所有解码器音频、调频发射机的空收信号进行信号解调,实时采集的音频通过网络输入音频比对系统。
3.3 音频比对同步设计
参考音频与测试音频的延时不同步会降低音频比对算法的性能,为保证音频比对的准确性,首先计算出测试音频和参考音频间的延时差,并进行音频实时同步调整。如图3 所示,音频比对的同步调整主要由静音段处理模块、延迟估计模块、同步成功判决模块组成。
图3 音频比对同步设计
延时同步调整通常依据参考音频与测试音频的互相关函数峰值进行调整,但如果出现静音段,将导致互相关函数计算值为零,这样参考音频与测试音频间的同步难以实现,因此在延时同步调整前,需要对音频片段进行选择,计算该音频片段的能量,通过能量值大小判断音频片段是否为静音,如果是静音,则此音频片段不参与延时估计。延迟估计模块的功能是计算测试音频片段与参考音频的互相关函数峰值,根据互相关函数峰值出现的位置完成测试音频的延迟同步调整。同步成功判决模块功能为计算同步参数,并与阀值进行比较,实时判断延迟同步调整是否有效。
3.4 音频比对算法设计
完成参考音频与测试音频的同步调整后,利用音频比对算法进行相似度计算,完成比对判决,并输出比对结果。本系统考虑音频比对算法输出结果的正确率,选择能够反映人耳听觉特性且具有一定抗噪性能的梅尔倒谱系数MFCC 特征参数、并采用余弦相似度算法如图4 所示。本系统选用的算法计算量相对低,适应多路广播音频节目进行实时音频比对的场景。实现步骤如下:
图4 音频比对算法设计
(1)对参考和测试音频数据进行预处理,并分别提取它们的梅尔倒谱系数MFCC 特征参数。
(2)将梅尔倒谱系数MFCC 特征参数完成余弦相似度计算,得到参考音频与测试音频间的相似度,相似度若大于阈值则输出比对结果为相似音频,否则为不相似音频。
3.5 音频比对算法对比
如表1 所示分别记录了不同信噪比下,使用改进前、后的余弦相似度算法时,系统的准确率、误检率、漏检率。由表中的数据可知,在无噪声情况下,使用两种算法时系统的准确率均为100%,误检率、漏检率为0。而当音频中存在噪声干扰时,使用改进后的余弦相似度算法时,系统的准确率优于99.15%,误检率均小于0.25%,漏检率小于1.85%;而使用传统余弦相似度算法时,系统的准确率优于87.71%,误检率均小于4.68%,漏检率小于5.00%。改进后的余弦相似度算法的误检率明显优于传统算法,准确率、漏检率也优于传统算法。
表1 音频比对算法比较
4 项目方案
河北广播电视台调频广播发射系统存在站点多、分布广的特点,部分为无人值守站点或无技术维护能力发射站点,存在停播、劣播、错播事故,以及发现处理不及时的问题。为提高调频广播节目的传输质量,对调频广播发射台站进行智慧化建设,利用音频比对技术、智能控制技术、物联网技术,规划建设了一套智慧远程管理平台,该平台具备多终端访问功能,可通过电脑、平板、手机等终端访问,对发射台站播出音频、调频空收信号等进行远程音频比对和监听监测,同时对发射台站设备情况、播出情况、信号质量等进行实时监测,系统配备自动报警功能,方便值守人员调度。河北广播电视台智慧远程管理平台系统结构设计如图5 所示。
图5 智慧远程管理平台系统结构设计图
调频发射台站采用监听设备完成播出音频、调频空收信号的采集与传输,采用监测设备完成设备状态、信号状态等信息的采集与传输;在监控中心部署软件,完成音频比对和监听监测、设备状态、信号质量监测。
河北广播电视台智慧远程管理平台音频比对结果如图6 所示,音频比对系统具备如下功能和特点:
图6 音频比对结果展示
(1)能够识别在无功率停播、音频空播、静音停播、内容错播或插播、声道丢失、传输延时变化、射频同频干扰、射频临频干扰、音频反相等主要安全播出事故。
(2)系统支持UDP、UDP组播、RTMP、RTP、HTTP 等多种流媒体格式,且支持MP2、MP3、AAC 等压缩格式,根据网络情况按需配置。可实现基于音频内容的实时比对,比对颗粒度为1 秒,满足在5 秒内产生报警的技术要求。
(3)支持基于音频文件的定时比对,用户可以配置实现自动化比对参数,包括时间间隔、比对时长、节目信息等参数。根据配置信息完成自动化比对,推送比对结果。
(4) 具备完善的效果展示、报警及消息推送能力,可将比对结果通过短信、微信、邮件、数据接口等多种方式推送给用户或上层系统。
(5) 提供音频实时展示(通道及电平)、延时显示、相似度柱状图、相似度历史曲线、声像图等多种显示,全面展示系统的安全播出监测情况。
(6) 具有完善的音频存储、定位功能,可以根据比对结果回溯音频节目。系统具有完善的日志记录功能,记录结果按时间、站点、异常类型等多种参数组合筛选。
结束语
音频比对技术的应用是调频发射台站智慧化建设的重要内容,提升了发射信号的准确性和稳定性,通过实时监测发射信号,能及时发现信号中的噪声和失真问题,确保发射信号的质量。其次,音频比对技术可以加强对发射信号的安全性监测。利用音频比对技术对发射信号进行实时监测和分析,及时发现异常信号,避免干扰和攻击,保障发射信号的安全性。综上所述,音频比对技术在智慧化调频发射台站建设中的应用,可以提升信号质量、安全性和智能化程度,是实现调频发射台站智慧化的重要手段。