APP下载

基于优化神经网络的音乐分类模型研究

2020-08-04黄璟

现代电子技术 2020年3期
关键词:模型构建特征提取

黄璟

摘  要: 为高效、精准地判断音乐风格归属,帮助用户快速获取偏好音乐风格,基于群智优化神经网络构建音乐风格分类模型。提取音乐样本的音质、节奏、旋律特征作为模型训练样本输入BP神经网络,通过初始化、隐含层及输出层计算、权值计算等步骤完成神经网络模型训练。采用粒子群算法确定神经网络的最优权值与阈值,粒子群算法首先编码神经网络权值与阈值,其次计算粒子适应度值,更新粒子速度和位置,符合终止条件时输出神经网络的权值与阈值优化结果,并据此构建基于群智优化神经网络的音乐风格分类模型。模型测试结果表明,所提模型在正确区分不同音乐风格的同时,展示了音质、节奏、旋律等特征。

关键词: 音乐分类; 分类模型; 特征提取; 模型训练; 最优权值确定; 模型构建

中图分类号: TN911.1?34; TP181                   文献标识码: A                    文章编号: 1004?373X(2020)03?0096?04

Research on music classification model based on optimal neural network

HUANG Jing

(Music Department, Putian University, Putian 351100, China)

Abstract: In order to efficiently and accurately judge the type of music style and help users quickly obtain their preference for music style, a music style classification model was built based on swarm intelligence optimization neural network. The acoustic quality, rhythm and melody characteristics of music samples are extracted as model training samples and input into BP neural network. The neural network model training is completed after the steps of initialization, hidden layer and output layer calculation, weight calculation and so on. The particle swarm algorithm is adopted to determine the optimal neural network weight and threshold, and then code the neural network weight and threshold, and calculate particle fitness value to update the particle velocity and position. When they conform to with the termination conditions, the optimization results of the neural network weight and threshold are output. On the basis of the results, the music style classification model based on swarm intelligence optimization neural network is constructed. The model testing results show that the model can correctly distinguish different music styles, and exhibits the characteristics of sound quality, rhythm and melody.

Keywords: music classification; classification model; feature extraction; model training; optimal weight determination; model building

0  引  言

當代互联网技术高速更新,移动终端设备使用人群规模迅速增加,流行音乐传播方式从电台和唱片形式逐渐过渡到网络电台在线收听和互联网下载等形式。相关调查显示,65%用户难以精准获取期待收听的歌曲或不明确自身音乐风格喜好。网络电台通常依照用户对音乐风格的喜好推荐歌曲,用户喜好的音乐类型可能包含多种音乐风格,导致待分类音乐规模较大,音乐分类难度大。因此,采用一种智能方法实现音乐风格分类十分重要[1]。流行音乐传统分类包括流行、乡村、爵士、摇滚、节奏布鲁斯、新世纪等六大类别,每一大类划分成不同小类,部分小类还可以进一步划分[2]。依靠人为方式划分音乐风格存在很多弊端,如分类效率低、音乐风格归属判断困难大、音乐风格类别过于粗糙或者过于精细等[3]。因此,亟待研究一种音乐风格分类模型,采用合理方法解决音乐风格分类问题。

群体智能优化算法简称群智优化算法,群智优化算法中最知名的是粒子群算法[4]。本文采用典型的BP神经网络构建音乐风格分类模型,利用粒子群算法改进BP神经网络,确定神经网络最优输入权值与阈值,避免网络随机性,解决神经网络训练时间长、陷入局部最优解的缺点,构建智能的音乐风格分类模型。

1  BP神经网络音乐风格分类模型

1.1  训练样本处理

选择流行音乐作为神经网络训练样本数据,涵盖六种音乐风格。根据音乐信号提取音乐的音质、节奏、旋律特征,音质特征体现音乐信号的纹理特性;节奏特征体现音乐信号时序性,反映音乐动态韵律信息;旋律特征体现音乐曲调轮廓,描述音乐风格基本情况。将上述特征作为神经网络训练的输入样本。

1.2  BP神经网络结构

BP神经网络是由输入层、输出层以及隐含层构成的一种多层前馈神经网络[5]。BP神经网络中各层次神经元之间全面连接,同一层次神经元彼此无连接。BP神经网络基本网络结构如图1所示。BP神经网络输入向量数量用[n]表示,输入向量用[X]表示,其中,[X=(X1,X2,…,Xn)]。BP神经网络输出向量数量用[m]表示,输出向量用[Y]表示,其中[Y=(Y1,Y2,…,Ym)]。

1.3  BP神经网络训练步骤

BP神经网络训练步骤如下:

1) 网络初始化

明确BP神经网络拓扑结构,选择[n],[d],[m]分别作为BP神经网络的输入层节点数量、隐含层节点数量、输出层节点数量,选择Sigmoid函数作为各层节点间的传递函数[6]。设[Rij]表示输入层和隐含层各神经元间彼此连接权值,[Rjk]表示隐含层和输出层各神经元间彼此连接权值。

2) 隐含层输出计算

隐含层输出计算如式(1)所示:

3) 输出层输出计算

输出层输出计算如式(2)所示:

5) 目标函数结果判断

算法终止条件为:误差函数值满足预设精度要求或学习次数超出限定值。如不满足终止条件,则继续选择样本输入和样本对应期望输出,跳转到步骤2),继续训练BP神经网络直至误差值达到标准或学习次数达到限定值[7]。

2  基于粒子群算法的神经网络优化

由于BP神经网络存在收敛时间较长、容易陷入局部最优解等缺点,导致BP神经网络音乐风格分类模型分类速率较慢,音乐风格分类结果不准确。为解决这一问题,利用收敛速度快、精度高的粒子群算法优化BP神经网络的权值与阈值,确保权值与阈值的误差最小,构建精准的神经网络音乐分类模型。

2.1  粒子群算法

粒子群优化(PSO)算法又称为鸟群觅食算法,是一种进化计算技术,起源于鸟群捕食行为研究。受鸟类集群活动规律启发,利用群体智能构建简化模型[8]。PSO是一种基于迭代的优化算法,采用迭代方式从随机解中搜寻最优解[9]。该方法的优势在于精度高、收敛速度快、容易實现,无需调整大量参数[10]。PSO搜索空间上的粒子代表优化问题的候选解,每个粒子均存在一个适应度值和一个速度,适应度值由目标函数决定,速度决定粒子移动的方向和距离,依照最优粒子所处位置和粒子自身所在位置,粒子在搜索空间智能调节速度和适应度值,直至达到最终要求[11]。

粒子速度和位置在迭代中的更新方式见式(5)、式(6):

式中:[?],[ε]分别表示惯性权重和约束因子;[c1],[c2]分别表示粒子跟踪自己的权重系数、粒子跟踪群体最优值权重系数;[γ],[ψ]表示在[0,1]范围内均匀分布的随机数;[UkiH],[Uk+iiH]表示更新前后粒子速度;[LkiH],[Lk+iiH]表示更新前后粒子位置;[PkiH],[PkgH]分别表示个体极值、全局极值。

2.2  基于PSO的BP神经网络优化

BP神经网络在实际运用过程中容易出现收敛时间较长、陷入局部最优解等情况,为弥补该缺陷,采用PSO算法优化BP神经网络权值和阈值[12],具体实现步骤如下:

步骤1:还原PSO算法种群数量、粒子位置、粒子速度取值区间、学习因子、惯性权重以及最大迭代次数等参数。

步骤2:依照输入、输出信号数量构建BP神经网络拓扑结构,初始化处理神经网络权值和阈值长度[13]。

步骤3:编码BP神经网络的权值和阈值,获取PSO算法初始种群。

步骤4:采用PSO优化BP神经网络寻优迭代,获取各组粒子的适应度值,通过适应度值明确粒子极值和粒子群极值,粒子历史最佳位置为粒子寻优迭代过程中的最佳位置[14]。

步骤5:通过式(5)、式(6)更新处理迭代粒子的速度和位置。

步骤6:判断结束条件。若适应度值符合预设精度或误差要求、适应度值达到最大迭代次数,寻优迭代停止;此时粒子所在位置为所求目标的最优解,解码最优解得到BP神经网络的最优权值和阈值[15]。若不满足结束条件,跳转到步骤4。

基于PSO优化BP神经网络流程如图2所示。

基于PSO优化后的BP神经网络权值和阈值构建BP神经网络,输入涵盖音质、节奏、旋律特征的音乐样本完成神经网络训练,构建基于PSO优化的神经网络音乐风格分类模型,即基于群智优化神经网络的音乐风格分类模型。

3  音乐分类模型验证

音乐风格分类模型训练样本包括六种音乐风格,共计300首音乐,基于该数据建立基于群智优化神经网络的音乐风格分类模型。模型训练结束后,选择60首音乐作为测试样本,展开音乐风格分类测试。

图3  最优个体适应度值趋势

从图3可以看出,粒子群算法优化后神经网络迭代48次后收敛,收敛后曲线趋于平稳;而优化前神经网络需迭代62次完成收敛,收敛之后产生短时期波动。由此可知,采用粒子群算法优化后神经网络适应度值收敛速度较快、运行稳定。

本文分类模型得到的音乐风格分类结果与实际结果对比情况如图4所示,限于篇幅仅详细列举其中12首音乐分类结果与分类特征情况,如表1所示。

图4中,本文模型大部分分类结果与实际分类结果一致,仅在摇滚音乐中错误识别一首音乐风格,由此可知,本文模型分类准确率高达98.3%,可靠性强。

音乐风格分类结果显示,本文音乐模型分类结果不仅可以展示音乐风格,还能体现音乐的音质、节奏、旋律特征,为全面了解音乐风格提供有力的参考依据。

4  结  论

传统神经网络权值和阈值随机性容易造成网络训练收敛时间长、陷于局部最优解,本文采用群智优化算法中的粒子群优化神经网络的权值与阈值,解决了传统神经网络分类模型的缺陷,由此构建基于群智优化神经网络分类模型,并将其应用于音乐风格分类。但受经验水平等因素限制,本文模型中神经网络泛化能力有待改善,今后的研究可充分结合其他高性能算法,改善神经网络的泛化能力,进一步提高模型分类性能,达到更好的音乐风格分类效果。

参考文献

[1] 胡昭华,余媛媛.深度卷积神经网络在音乐风格识别中的应用[J].小型微型计算机系统,2018,39(9):1932?1936.

[2] 郁伟生,邓伟,张瑶,等.基于时间序列的音乐流行趋势预测研究[J].计算机工程与科学,2018,40(9):1703?1709.

[3] 邵曦,姚磊.基于SVM主动学习的音乐分类[J].计算机工程与应用,2016,52(6):127?133.

[4] 陈月云,简荣灵,赵庸旭.基于快速群体智能算法的毫米波天线设计[J].电子与信息学报,2018,40(2):493?499.

[5] 张强,肖刚,蓝屹群.基于BP神经网络多类分类的湍流目标探测[J].系统工程与电子技术,2018,40(7):75?79.

[6] 田静,邢艳秋,姚松涛,等.基于元胞自动机和BP神经网络算法的Landsat?TM遥感影像森林类型分类比较[J].林业科学,2017,53(2):26?34.

[7] 曹兆伟,林宁,徐文斌,等.基于BP神经网络的东屿岛遥感影像分类[J].海洋通报,2016,35(5):587?593.

[8] 马驰,赵亮,梅雪松,等.基于粒子群算法与BP网络的机床主轴热误差建模[J].上海交通大学学报,2016,50(5):686?695.

[9] 陈啸,王红英,孔丹丹,等.基于粒子群参数优化和BP神经网络的颗粒饲料质量预测模型[J].农业工程学报,2016,32(14):306?314.

[10] 王志芳,王书涛,王贵川.粒子群优化BP神经网络在甲烷检测中的应用[J].光子学报,2019,48(4):141?148.

[11] 吴金文,王玉鹏,周海波.采用量子粒子群算法耦合差分进化算法优化BP神经网络的铣床热误差预测研究[J]. 制造技术与机床,2018(6):114?118.

[12] 游丹丹,陈福集.基于改进粒子群和BP神經网络的网络舆情预测研究[J].情报杂志,2016,35(8):156?161.

[13] 张璐,雷雪梅.基于粒子群优化BP神经网络的养肠胃菜谱判定[J].计算机科学,2016,43(z2):63?66.

[14] 刘加存,梅其祥,杨东红.基于盲动粒子群频率分解的极速学习机神经网络建模[J].信息与控制,2017,46(1):60?64.

[15] 林宇锋,邓洪敏,史兴宇.基于新的改进粒子群算法的BP神经网络在拟合非线性函数中的应用[J].计算机科学,2017,44(11A):51?54.

猜你喜欢

模型构建特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
一种基于LBP 特征提取和稀疏表示的肝病识别算法
社会资本视角下行业协会商会能力模型构建研究
虚拟现实技术在电力培训中的应用
模型构建在高中生物教学中的应用
基于云计算的大学生移动学习模型构建
高中物理解题的模型构建
基于DSP的直线特征提取算法
基于MED和循环域解调的多故障特征提取