复杂噪声环境中的音乐分类和检测模型
2020-11-13孟令红
孟令红
摘要:为了提高音乐分类和检测正确率,设计了一种复杂噪声环境中的音乐分类和检测模型。首先分析当前音乐分类和检测的研究进展,指出各种音乐分类和检测模型存在的缺陷,然后采集音乐分类和检测信号,引入去噪技术对噪声进行消除处理,从信号中提取特征,最后将特征和音乐类型分别作为神经网络的输入和输出向量,通过神经网络的训练建立音乐分类和检测模型。在相同环境下,与其它音乐分类和检测模型进行了对比测试,结果表明,无噪声环境下,这个模型的音乐分类和检测精度超过95%,在复杂噪声环境下,文中模型的音乐分类和检测精度超过90%,远远超过音乐处理的实际应用控制范围,音乐分类和检测效果优于对比模型,具有一定的实际应用价值。
关键词:噪声干扰;音乐分类;检测精度;提取特征向量;神经网络;仿真测试
中图分类号:TP181
文献标志码:A
MusicClassificationandDetectionModelinComplexNoiseEnvironment
MENGLinghong
(
HebeiRadioandTelevisionStation,Shijiazhuang050031,China
)
Abstract:Inordertoimprovetheaccuracyofmusicclassificationanddetection,amusicclassificationanddetectionmodelincomplexnoiseenvironmentisdesigned.Firstly,thispaperanalyzesthecurrentresearchprogressofmusicclassificationanddetection,andpointsoutthedefectsofmusicclassificationanddetectionmodels.Thenthemodelcollectsmusicclassificationanddetectionsignals,introducesdenoisingtechnologytoeliminatethenoise,extractsfeaturesfromthesignals,andfinallytakesfeaturesandmusictypesasinputandoutputvectorsofneuralnetwork,respectively.Themodelestablishessoundthroughthetrainingofneuralnetwork.Theresultsshowthattheaccuracyoftheproposedmodelisover95%innoiselessenvironmentandover90%innoisingenvironment,whichisfarbeyondtheactualapplicationcontrolrangeofmusicprocessing,andtheeffectofmusicclassificationanddetectionisbetterthanthecomparisonmodel,andithasacertainpracticalapplicationvalue.
Keywords:noiseinterference;musicclassification;detectionaccuracy;featurevectorextraction;neuralnetwork;simulationtest
0引言
隨着人们生活水平的不断提高,人们享受生活的方式多元化,其中听音乐成为一种重要的消遣方式。但是在音乐采集过程中,由于环境中一些不利影响的干扰,使得音乐包括了一些对音质有损的信息,这些信息统称为噪声。在复杂噪声环境,有时噪声会淹没了有用的音乐信号,使得人们无法识别正确的音符,因此如何进行噪声环境中的音乐分类和检测具有十分重要的研究意义[13]。
当前复杂噪声环境中的音乐分类和检测模型主要有两大类型,一类是线性的音乐分类和检测模型,最具有代表的为k最近邻算法,其音乐分类和检测过程十分简单,使得音乐分类和检测效率相当高,但是音乐分类和检测精度比较低,使得使用范围受到了限制[45];另一类为非线性的音乐分类和检测模型,最具代表性为人工神经网络算法,如BP神经网络的音乐分类和检测模型,深度置深网络的音乐分类和检测模型等[68],它们的音乐分类和检测要优于线性的音乐分类和检测模型,但是当音乐的噪声环境比较复杂时,它们的音乐分类和检测效果急剧下降,对噪声的鲁棒性比较低,使得音乐分类和检测错误率变大,难以满足音乐分类和检测的实际应用要求[911]。
为了提高音乐分类和检测正确率,设计了一种复杂噪声环境中的音乐分类和检测模型。在相同条件,与其它音乐分类和检测模型进行了对比测试,结果表明,无论是无噪或者噪声环境下,本文模型的音乐分类和检测精度均要明显优于对比模型,对比结果有效的证明了本文音乐分类和检测模型的有效性和优越性。
1多种噪声环境下的音乐分类和检测模型
1.1音乐噪声的去除技术
当音乐含有噪声时,音乐信号变化曲线就会发生改变,设含噪
声为t(n),有用、干净的音乐信号为s(n),那么复杂噪声环境中的音乐信号如式(1)。
y(n)=s(n)-at(n)
(1)
式中,a表示噪声类型,如白噪声、高斯噪声等。
噪声t(n)通常使得音乐信号存储空间增加,变化曲线发生变异,无法正确识别音乐信号类型,因为需要消除噪声所起的负面影响,本文选择软阈值的小波变换对音乐信号噪声进行去除,设一个含有噪声的音乐信号去除前后变化曲线如图1所示。可以明显看出,无噪音乐信号和含有噪声的音乐信号变化特征差别十分明显,其中纵坐标为信号幅度,横坐标为采集时间,如图1所示。
1.2音乐分类和检测特征提取
音乐分类和检测的特征很多,由于音乐中包含信息发生变化时,其短时能量频谱就会发生相应的改变,因此短时能量频谱是一种有效的信号识别特征。本文选择短时能量频谱特征进行音乐分类和检测建模。设音乐的采样频率为fi,音乐的频谱信号方差值计算公式如式(2)。
sp=∑Ni=1(fi-i)2p(fi)∑Nn=1p(fi)
(2)
音乐短时能量频谱特征计算公式如式(3)。
ff=∑Ni=1(fi-i)2p(fi)sp3∑Nn=1p(fi)
(3)
1.3BP神经网络算法
音乐短时能量频谱特征数量为BP神经网络输入层的节点数量,音乐类型为BP神经网络的输出层的输出,隐含层映射函数为:
f:Rm→R,神经网络其输入和输出分别如式(4)、式(5)。
Sj=∑mi=1wijx(i)-θj
(4)
bj=11+exp∑mi=1wijxi-θj,j=1,2,…,p
(5)
式中,wij和θj为隐含层的节点权值和阈值。
根据同样的原理,可以得到输出层的输入和输出如式(6)、式(7)。
L=∑pj=1wjkbj-θk
(6)
xi+1=1(1+exp(∑pk=1wkjbj-θk))
(7)
式中,wkj和θk分别为输出层的节点和阈值。
1.4噪声环境中的音乐分类和检测步骤
Step1:对音乐的噪声场景进行模拟,然后从噪声场景中采集大量的音乐信号,并去除前面和最后一段音乐信号,保持音乐信号的连续性。
Step2:引入去噪技术,对音乐信号进行噪声消除处理,去除音乐信号中噪声,得到干净有用的音乐信号,有利于后续的音乐分类和检测。
Step3:从无噪的音乐信号中提取短时能量频谱特征,并采用如下方式对短时能量频谱特征进行预处理如式(8)。
ff′i=max-ffimax-min
(8)
式中,max和min分别表示短时能量频谱特征的最大和最小值。
Step4:短时能量频谱特征和音乐类型分别作为BP神经网络的输入和输出向量,通过训练确定BP神经网络的最优网络结构以及参数。
Step5:采用最优网络结构以及参数的BP神经网络建立音乐分类和检测的分类器,并对分类器的性能进行分析和测试。
综合上述可知,复杂噪声环境中的音乐分类和检测流程,如图2所示。
2音乐分类和检测模型的性能对比测试
2.1测评平臺
为了测试复杂噪声环境中的音乐分类和检测效果,在相同测试平台上,选择BP神经网络的音乐分类和检测模型,该模型没有引入去噪技术,和基于KNN的音乐分类和检测模型,该模型采用了去噪技术,但是采用KNN建立音乐分类分类器,采用复杂噪声环境中的音乐分类和检测精度和检测效率对各模型的性能进行分析,选择的测试平台设置,如表1所示。
2.2测评对象
为了使音乐分类和检测效果具有说服力,选择5种音乐,每一种音乐包括有噪和无噪数据,它们的样本数如表2所示。
2.3音乐分类和检测精度分析
采用本文模型、BP神经网络、KNN对表2中的音乐进行分类和检测,得到的实验结果如图3、图4所示。
从图3和图4的音乐分类和检测精度进行对比和分析可以发现:
(1)KNN的音乐分类和检测精度最低,无法准确描述音乐信号包含的信息,虽然引入了去噪技术,对噪声的干扰可以进行抑制,但是由于KNN只能建立音乐分类和检测的线性分类器,使得音乐分类和检测错误率比较高,实际应用价值很低。
(2)BP神经网络的音乐分类和检测精度要高于KNN的音乐分类和检测精,可以更好的描述音乐信号变化特点,这是因为BP神经网络可以建立非线性的音乐分类和检测分类器,但是由于没有引入去噪技术,无法消除噪声对音乐分类和检测的影响,使得音乐分类和检测错误率相对比较大,音乐分类和检测效果有待改善。
(3)本文模型的音乐分类和检测精度最高,可以更加全面、准确描述音乐信号包含的信息,大幅度减少了音乐分类和检测错误率,对于有噪音乐,音乐分类和检测精度超过了90%,对于无噪的音乐,音乐分类和检测精度更是达到了95%以上,完全可以满足音乐检索的实际应用要求,获得较好的音乐分类和检测结果,这主要是由于本文模型利用了去噪技术和神经网络的优点,克服了当前音乐分类和检测过程中存在的不足,对比结果体现了本文音乐分类和检测模型的优越性。
2.4音乐分类和检测效率析
对于有噪的音乐,统计3种模型的音乐分类和检测时间,如图5所示。
从图5可以看出,KNN的音乐分类和检测时间最少,速度最快,但是由于音乐分类和检测精度太低,不能满足音乐分类和检测的实际应用要求,本文模型的音乐分类和检测时间要少于BP神经网络,说明通过对噪声的消除,很好的抑制了噪声对音乐分类和检测的干扰,提高了音乐分类和检测效率。
3总结
音乐分类和检测是音乐检索的重要技术,由于噪声的干扰,当前音乐分类和检测模型无法获得理想的音乐分类和检测结果,使得音乐分类和检测错误率比较高,为了获得更优的音乐分类和检测效果,设计了一种复杂噪声环境中的音乐分类和检测模型。首先采集音乐分类和检测信号,并进行噪声消除处理,然后提取音乐分类和检测特征向量,并采用神经网络对各种类型的音乐信号变化特点进行描述,建立了音乐分类和检测模型,测试结果表明,本文模型是一种精度高、鲁棒性强的音乐分类和检测精模型,具有十分广泛的应用前景。
参考文献
[1]
杜威,林浒,孙建伟,等.一种基于分层结构的音乐自动分类方法[J].小型微型计算机系统,2018,39(5):888892.
[2]杨晓宇,黄浩,王浩华.基于改进的T型关联度在音乐分类中的应用[J].数学的实践与认识,2017,47(20):155163.
[3]颜景斌,吴石,伊戈尔·艾杜阿尔达维奇.基于单类支持向量机的音频分类[J].计算机应用,2009,29(5):14191422.
[4]倪璐.基于Android与JAVA的音乐在线分类管理与播放系统研究[J].自动化技术与应用,2020,39(2):4547.
[5]陈志高,张旭龙,肖寒,等.基于UNet和BGRURNN的实用歌声检测系统[J].微型电脑应用,2019,35(10):109112.
[6]孙慧芳,龙华,邵玉斌,等.基于过零率及频谱的语音音乐分类算法[J].云南大学学报(自然科学版),2019,41(5):925931.
[7]王洁,朱贝贝.面向中文歌词的音乐情感分类方法[J].计算机系统应用,2019,28(8):2429.
[8]符朝兴,沈威,高述勇,等.PCA改进RPROP方法的BP算法在音乐信号分类中的应用[J].测控技术,2019,38(7):8488.
[9]郑旦.基于深度置信网络的多特征融合音乐分类算法[J].电子设计工程,2020,28(4):132136.
[10]黄欢欢,卢亚玲.改进的BP算法在音乐分类中的应用研究[J].武汉轻工大学学报,2018,37(4):7075.
[11]龚安,丁明波,窦菲.基于DBN的多特征融合音乐情感分类方法[J].计算机系统应用,2017,26(9):158164.
(收稿日期:2020.03.12)