基于贝叶斯判别的非法调频广播电台的识别*
2021-03-20林秋海
林秋海,龙 华
(昆明理工大学,云南 昆明 650100)
0 引言
非法调频广播电台即常说的“黑广播”。《刑法修正案(九)》及最高检、最高法《关于办理扰乱无线电通讯管理秩序罪的司法解释》相继出台以后,各地公安、无线电以及广电等部门通力合作,仅2020 年就取缔了2 876 起“黑广播”[1],严厉打击了违法犯罪分子的嚣张气焰。为躲避打击,违法犯罪分子转而在夜间开启非法调频广播电台或直接占用合法电台频道,增加了政府部门查处的难度。
非法调频广播最理想的判断方法是利用无线电管理部门的台站数据库,将采集到的调频广播频率与台站数据库进行逐一比对,其中未登记者即为“黑广播”。徐磊等[2]提出了利用关键词识别的判定方法,将广播语音转换为文字后再与词典进行匹配,当超过一定的概率即判断为“黑广播”。但是,此种方法需人工提前录入目前非法调频广播电台常见的不雅词汇,以作为判定词典。
近年来,机器学习和深度学习方兴未艾,在各行各业均有深入的应用。王朝卫[3]提出了基于密度聚类与SVM 的非法调频广播识别方法,采用SVM对信号特征进行分类,提高了信号识别的准确率。考虑到机器学习判断方法的多样性,笔者尝试将贝叶斯判断方法引入非法调频广播电台的识别,以分析贝叶斯判断方法在非法调频广播电台识别中的准确度和训练时间。
1 信号特征建立
信号特征的建立是机器学习的第一步。合理选择信号特征,能提高机器训练的准确率。综合过往研究,一般在选择特征上需要特征具有较好的稳定性和鲁棒性,同时尽可能包含更多的信号信息。此外,要求特征的计算量尽可能小,以方便进行提取。乔涛[4]在研究民航地空通信导航系统干扰检测技术时,提出了时频域峰态系数、近似熵、环形统计量以及高阶累积量等信号特征,对分离干扰信号具有很好的判断作用。笔者结合工作实际和相关研究,选择如下几个特征信号。
(1)连续采样电平均值X1,假设对某调频广播K进行连续采样得到N个电平值xi(i=1,2,…,N),则X1表示为:
(2)连续采样电平方差X2,可以用来表示该信号的波动幅度,具体公式为:
(3)短时平均能量X3,表示信号频谱的变化,具体公式为:
(4)偏度X4为:
式中,σ是标准差。
(5)峰度X5为:
式中,σ是标准差。
(6)零中心归一化绝对值的标准差X6为:
2 算法步骤
贝叶斯判别分析方法是根据贝叶斯准则进行判别分析的一种多元统计分析方法,具有广泛的应用[5]。笔者引入贝叶斯判别分析法,并根据6 个信号特征构建6 维矩阵。
算法具体步骤如下。
步骤1:对选择的调频广播每隔时长t后进行频谱采样,并分别分析合法调频广播和非法调频广播信号,以构建信号特征数据。播放音乐、语音时,信号特征存在一定的区别。所以,实验中需要对音乐广播和新闻广播进行区分对待。
步骤2:构建3 个总体G1、G2、G3分别代表合法音乐广播、合法语音广播以及非法调频广播,并计算总体的先验概率。
步骤3:判断3 个总体的协方差矩阵Σ1、Σ2、是否相等。
步骤4:根据贝叶斯判断准则进行待判样本归属的判断。
当Σ1、Σ2、Σ3不全相等时,有:
3 算例分析
对昆明本地调频广播频段87~108 MHz 进行扫频分析,并在后台数据库判断和人工解调听音判断后,确认88.7 MHz、89.8 MHz、91.8 MHz、93.0 MHz、95.4 MHz、97.0 MHz、99.0 MHz、100.0 MHz、100.8 MHz、101.7 MHz、102.8 MHz、105 MHz、105.8 MHz、107 MHz 为合法调频广播,98.5 MHz、103.6 MHz、104.0 MHz 为非法调频广播。结合各频率在无线电管理部门的台站信息备案和实际收听情况,此次选择89.8 MHz 中央人民广播电台《经济之声》、93 MHz 中央人民广播电台《音乐之声》以及98.5 MHz 非法调频广播作为3 个拟分析的总体G1、G2、G3,并将103.6 MHz 非法调频广播所采集到数据作为待判样本X。
本文利用德国罗德与施瓦茨公司的监测与测量接收机ESMB 设备对频谱进行采集。ESMB 在我国无线电监测领域应用广泛。近年较多厂家生产的无线电固定监测站均立足于ESMB 进行软件集成,显示了其较高的稳定性和受众度。在软件上下达监测任务,且考虑到调频广播的中频带宽一般为200~300 kHz,将采集频段设置为中频带宽左右各扩宽100~200 kHz,即每次采集时避开临频间的采集,又尽量采满600 kHz 带宽,具体见图1。设置采样步长为1 kHz,即每次频谱能采样600 个电平值。同时,设置每间隔10 s 对该频谱进行采样,共进行300 次。
对每个频段采集到的300×600 数据集进行压缩,即将采集到的600 kHz 带宽的电平值数据依次带入式(1)~式(6)以计算各调频广播频率的信号特征,得到300×6 的矩阵,具体如表2 所示。
图1 调频广播89.8 MHz 的采样图例
表1 各采样调频广播信号特征
本次实验平台基于MATLAB R2014a 进行。将表1 数据依据算法步骤1~步骤4 进行计算,并根据式(8)对待判样本X进行判断分析,结果如表2 所示。
表2 实验数据
从表2 可以看出,对待判样品300 帧的贝叶斯判断准确率达到97%,验证了贝叶斯判断在调频广播合规性上的检查具有重要的现实意义。
4 结语
通过研究可以看出,贝叶斯判别方法在非法调频广播的信号特征识别上具有积极作用。通过这种信号特征分析,对非法调频广播的识别率上达到了97%,完全满足实际工作对非法调频广播的判断意义。但是,目前只选取了频谱信号特征,存在一定的局限性。下一步考虑把“零点报时”[6]的频谱作为频谱信号特征的主要重点,减少频谱采样数量或者增加频谱信号特征的数量,以提高贝叶斯判别的准确率。