基于BP神经网络的音乐分类模型
2018-03-03刘明星
刘明星
摘 要: 针对单一特征难以建立理想音乐分类模型的不足,为了帮助用户找到自己喜欢的音乐,提出BP神经网络的音乐分类模型。首先提取音乐的多种类型特征,便于对音乐信息进行准确描述,然后将这些特征组合在一起作为音乐分类模型的输入向量,通过BP神经网络的智能学习建立音乐分类模型,最后在Matlab 2016平台下进行多个音乐分类实验。结果表明,该模型克服了单一特征提供信息简单的局限性,提高了音乐的分类正确率,而且音乐分类的实时性较好,可以用于网络上的音乐检索研究。
关键词: 情感特征; 音频特征; RBF神经网络; 音乐分类器; 音乐检索; 智能学习
中图分类号: TN711?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)05?0136?04
Abstract: Since the use of single feature is difficult to establish the satisfied music classification model, a music classification model based on BP neural network is proposed to help users to find their favorite music. The music characteristics with multiple types are extracted to describe the music information accurately. The characteristics are combined as the input vector of the music classification model, and the intelligent learning of BP neural network is adopted to establish the music classification model. The multi?music classification experiment was carried out on Matlab 2016 platform. The results show that the model can overcome the limitations of the single feature providing simple information, improve the classification accuracy of the music, has perfect real?time performance of music classification, and is used to study the music retrieval on the network.
Keywords: emotion characteristic; audio characteristic; RBF neural network; music classifier; music retrieval; intelligent learning
0 引 言
近年來,音乐处理技术得到迅速发展,出现了大量的音乐。面对大量的音乐,人们如何快速找到自己喜欢的音乐显得越来越重要[1]。音乐检索技术可以帮助用户实现该功能,而音乐分类是实现快速检索的基础,因此,建立性能优良的音乐分类模型成为当前音乐检索领域中的研究重点[2?3]。
音乐分类研究是一个复杂的系统工程,要获得理想的分类结果,涉及的因素相当多,出现了许多的音乐分类模型,所有模型都要提取音乐的特征,主要用于描述音乐的信息,以区别音乐的类型[4?5]。当前音乐特征有很多类,如音乐的能量特征、时域特征,频域特征等,它们可以描述音乐一个具体的内容,单一音乐特征提供的信息有限,不能完整描述音乐的整体内容,因此无法正确区别各种类型的音乐[6]。当前学者们经常将多种特征组合在一起实现音乐分类,由于提供了更多的信息,音乐分类结果得到了一定的改善。但是多种特征组合在一起存在两个问题:一个是特征数量太多,音乐分类时间明显延长,无法满足音乐的在线检索要求;另一个问题是多种特征可能会提供部分相同信息,使得特征之间会互相影响,特征冗余度增加,对音乐分类产生不利影响[7]。除了要提取音乐的特征之外,还有一个重要的内容就是建立音乐分类器,当前分类器的建立大多基于机器学习理论,如隐马尔可夫算法、神经网络、支持向量机等[8?10],它们均有各自的优点,如支持向量机的泛化能力优异,神经网络的学习速度快等。相对于其他算法,BP神经网络的综合性能更优,因此在音乐分类研究中得到了广泛的应用[11]。
针对音乐分类过程中的特征优化问题,提出基于BP神经网络的音乐分类模型,最后通过具体实验对音乐分类效果进行分析。
1 基于BP神经网络的音乐分类框架
基于BP神经网络的音乐分类思想为:首先提取不同类型的音乐特征,但不是将音乐多特征进行简单组合,然后采用灰色关联分析确定每一个特征的贡献率,通过贡献率体现第一个特征对音乐分类的重要程度,最后采用BP神经网络建立音乐的分类器,如图1所示。
2 音乐的多特征融合
2.1 音乐的分帧和端点检测
音乐具有非线性变化特点,是一种典型的非平稳信号,因此不能直接对音乐数据进行特征提取,而是对音乐信号进行分帧处理,然后进行音乐的端点检测,便于后续的音乐特征提取操作。
2.2 提取音乐特征
为了解决单一特征的不足,本文提取多种音乐特征,具体如下:
1) 音乐的短时能量特征。音乐与普通声音的能量区别很大,相对于普通声音,音乐的能量值相对更高,因此可以提取每一帧音乐的特征。设音乐的信号的能量为其计算公式为:endprint
式中表示窗函数。
当音乐信号帧的长度为时,的计算公式变为:
2) 音乐的时域方差特征。对于音乐的某帧可以进行如下描述:
采用小波变换进行平滑操作后,得到处理后的音乐为,具体如下:
音乐时域的均值的计算公式为:
音乐时域的方差的计算公式为:
3) 音乐的频域方差特征。采用傅里叶变换对音乐进行变换,变换后为,具体为:
并对平滑操作,得到,具体如下:
音乐频域均值的计算公式为:
音乐频域方差的计算公式为:
2.3 音乐特征的具体融合
1) 设音乐的能量、时域方差特征和频域方差特征组成的特征向量为
2) 对进行预处理,选择一组特征向量作为参考对象:与其他组特征向量组成特征向量对。
3) 根据计算特征向量组之间的偏差,并产生最大和最小差,具体计算方式为和。
4) 特征的灰度关联系数的计算公式为:
5) 特征的灰色关联度计算公式为:
式中表示权重。
采用灰色关联度得到音乐特征的贡献值,以描述特征对音乐的影响大小。
3 音乐的分类器构建
3.1 BP神经网络
BP神经网络的学习步骤具体如下:
1) 对于输入层来说,第个神经元输出和输入是相等的,因此可以有:
2) 隐含层的第个神经元输入和输出具体如下:
式中:表示输入和隐含层的神经元权值;表示隐含层的阈值;为传递函数。
3) 输出层的第个神经元输入和输出具体如下:
式中:为输出和隐含层的神经元权值;表示输出层的阈值。
3.2 BP神经网络学习过程
设样本集为,其中,表示样本的编号,期望值和网络输出值的均方误差和计算公式为:
权值应该满足的条件为:
式中:为学习次数;为学习速率。
权值应该满足的条件为:
当均方误差和的值达到实际应用的要求,那么就建立最优的BP神经网络结构。
3.3 音乐分类模型的工作步骤
音乐分类模型的工作步骤如下:
1) 收集多种类型的音乐数据,并对它们进行去噪处理。
2) 对去噪后的音乐进行分帧和端点检测,得到有用的音乐信号。
3) 提取音乐的能量、时域方差特征和频域方差特征,并将它们组合在一起,形成特征向量。
4) 采用灰色关联分析确定能量、时域方差特征和频域方差特征对音乐分类的贡献,对特征进行加权操作。
5) 将加权后的能量、时域方差特征和频域方差特征作为BP神经网络的输入,音乐类型作为BP神经网络,并进行自适应学习。
6) 根据最优BP神经网络建立音乐分类模型。
4 仿真实验
4.1 音乐数据源
为了测试BP神经网络的音乐分类模型的性能,选择多种类型的音乐作为实验对象,它们的数据分布具体如表1所示。实验平台为Matlab 2016。
4.2 确定特征的贡献率
采用灰色关联分析确定能量、时域方差特征和频域方差特征的贡献率,得到的结果如表2所示。从表2可知,贡献率最大为能量特征,说明能量特征对音乐分类结果的影响最大,频域方差特征次之,最小为时域方差特征。
4.3 结果与分析
选择单一特征作为对比模型,统计它们音乐分类的正确率,得到的结果如图2所示,从图2可知:
1) 单一特征的音乐分类正确率均低于85%,而85%是音乐实际应用的最低范围,低于85%得到的音乐分类结果不可靠,这说明单一特征能够提供的音乐信息量相对较少,无法准确反映音乐的类别。
2) 本文模型的音乐分类正确率要远远高于单一特征,而且对于每一种类型音乐,分类正确率超过了85%,达到了音乐的实际应用要求,这是因为多种特征组合在一起,可以提供更多的音乐类别信息,达到了信息互补,同时通过灰色关联分析确定每一个特征对分类结果的贡献率,获得了更优的音乐分类结果。
不同模型的音乐分类时间如图3所示。从图3可以看出,本文模型的音乐分类时间要多于单一特征,但是分类时间相当短,完全可以满足音乐分类的实时性要求,对实际应用范围没有影响。
5 结 语
为了提高音乐的分类正确率,本文提出基于特征融合的音乐分类模型,通过灰色关联分析确定不同特征对音乐分类的影响程度,并将影响程度转换为贡献率。结果表明,本文模型克服了单一特征音乐分类正确率低的缺陷,获得了理想的音乐分类结果,而且分类速度也可以满足实际应用的要求,具有较高的实际应用价值。
參考文献
[1] GEORGE Tzanetakis, PERRY Cook. Music genre classification of audio signals [J]. IEEE transactions on speech and audio processing, 2002, 10(5): 293?302.
[2] DUNKER P, BEGAU A, NOWAK S, et al. Content based mood classification for photos and music: a generic multi?modal classification framework and evaluation approach [C]// Proceeding of the 1st ACM International Conference. Vancouver: ACM, 2008: 97?104.endprint
[3] 白亮,老松杨,陈剑,等.音频自动分类中的特征分析和抽取[J].小型微型计算机系统,2005,26(11):2029?2034.
BAI Liang, LAO Songyang, CHEN Jian, et al. Feature analysis and extraction of audio automatic classification and extraction of [J]. Minicomputer system, 2005, 26(11): 2029?2034
[4] 秦丹,马光志.基于挖掘技术的音乐风格识别系统[J].计算机工程与设计,2005,26(11):3094?3096.
QIN Dan, MA Guangzhi. Computer engineering and design, the style of music recognition system based on [J]. Computer engineering and design, 2005, 26(11): 3094?3096
[5] 胡景凯,吴磊,高阳.基于学习分类器(LCS)的MP3音乐分类方法[J].重庆邮电大学学报(自然科学版),2007(4):417?421.
HU Jingkai, WU Lei, GAO Yang. MP3 music classification method based on learning classifier (LCS) [J]. Journal of Chongqing University of Posts and Telecommunications (natural science edition), 2007(4): 417?421.
[6] 张燕,唐振民,李燕萍,等.基于MFCC和 HMM的音乐分类方法研究[J].南京师范大学学报(工程技术版),2008(4):112?114.
ZHANG Yan, TANG Zhenmin, LI Yanping, et al. Research on the music classification method based on MFCC and HMM [J]. Journal of Nanjing Normal University (engineering technology edition), 2008(4): 112?114.
[7] 刘怡,蔚磊,刘子利,等.中国民歌地域风格分类中的特征选择[J].电子学报,2008,36(1):27?30.
LIU Yi, WEI Lei, LIU Zili, et al. The characteristics of the classification of regional style of Chinese folk songs [J]. Electronic journal, 2008, 36(1): 27?30.
[8] 韩浩,王寅潇,王博,等.基于概率神经网络的流行音乐分类研究[J].数字技术与应用,2013(8):64?65.
HAN Hao, WANG Yinxiao, WANG Bo, et al. Research on the classification of pop music based on probabilistic neural network [J]. Digital technology and application, 2013(8): 64?65.
[9] 王小凤,耿国华,李鹏,等.一个基于相关反馈的神经网络音乐情感分类器构建算法[J].西北大学学报(自然科学版),2012,42(1):30?35.
WANG Xiaofeng, GENG Guohua, LI Peng, et al. A relevance feedback based neural network music emotion classifier construction algorithm [J]. North University Journal (natural science edition), 2012, 42(1): 30?35.
[10] 高林杰,张明.基于熵和支持向量机的音乐分类方法[J].计算机系统应用,2014,23(5):67?83.
GAO Linjie, ZHANG Ming. Music classification method based on entropy and support vector machine [J]. Computer system application, 2014, 23(5): 67?83.
[11] 刘建辉,曾丽辉,许金凤,等.基于最小二乘支持向量机的乐器音乐分类[J].华东交通大学学报,2009,26(6):60?64.
LIU Jianhui, ZENG Lihui, XU Jinfeng, et al. Instrumental music classification based on least squares support vector machine [J]. Journal of East China Jiaotong University, 2009, 26(6): 60?64.endprint