APP下载

BP神经网络在音乐影响中的应用

2022-07-18何宇洋李媛

电子测试 2022年12期
关键词:神经元神经网络变量

何宇洋,李媛

(北京信息科技大学,北京,100192 )

0 引言

通过研究一些相关文献:于茗川分析中国流行音乐流行的因素中提出了与音乐本身相关的歌词,曲调,歌手与演唱对音乐流行的影响[1]除此之外,张莉莉则从大众文化研究视野,提出市场营销内容,包括一首音乐制作出来,从作词者,作曲者,演唱者,唱片公司等等,都会卖力宣传,引导舆论的方向来分洗音乐的流行程度[2],这些都是流行音乐影响的主要因素,然而他们只是根据大量的信息进行的定性的总结与归纳,并不能对一首音乐是否流行做一个预判,并没有一个衡量标准。田向弘,杨晓云等人还提出了现代科技对音乐的影响[3]。

他们提出的观点很好的展现了科技对音乐的影响,因此,模型的建立也是同这个角度(基于科技)更深入的探究对音乐的影响,但他们的观点美中不足的地方还是信息量大,信息数据不能量化。

综上所述,发现当前研究音乐的影响的问题:信息数据无法量化;信息量较大;量化无法预测。

(1)信息数据无法量化:音乐的形式和风格(即特征)在人类历史上一直在变化、适应和演变。由于科技的进步,近百年来的音乐有了很好的文献记载,研究和记录了音乐的特征[4],如节奏、调子、流行度等,这使得利用数学工具研究音乐成为可能。这些数据的记录便解决了此次信息量化的问题。(2)信息量大,可能会导致它们线性相关性不强。(3)量化无法预测:这俩个问题刚好满足于BP神经网络的使用条件。

BP神经网络有着良好的非线性映射能力(三层的神经网络就能够以任意精度逼近任何非线性连续函数)以及自学习和自适应能力(能够通过学习自动提取输出、输出数据间的“合理规则”,适合处理较大的数据量)并且通过这些学习建立相应的模型,对未来数据进行预测。除此之外,它的泛化能力和容错能力也高于其他的神经网络[5]。

因此,采用BP神经网络方法来研究较为复杂的音乐影响因素这是最优解,用足够的数据对其进行适当的调整和训练,通过神经网络的训练,来建立一个影响音乐流行程度的模型[6]。除此之外,BP神经网络模型的功能不仅限于预测一个特征,而且只要它还可以预测音乐风格变化的趋势[7],或任何期望的音乐特征。

1 数据预处理

1.1 源数据分析

美国研究人员调查了近百年来(1921年-2020年),音乐创作者们创造的音乐作品,收集其音乐作品的各种特征,并且给每一个音乐作品音乐的受欢迎程度。数据包含过去90年中5,854位美国音乐流行乐坛有影响力艺术家的相关信息,同时收集其音乐创作影响者和关注者,以及98,340首歌曲中的每首的创作者的名字和编号。

通过分析歌曲的特点,提炼出15个特征变化量,主要内容如表1所示。

表1 音乐的特征量

1.2 特征分析

通过对全部变量数据(共5854条)的提取每一个特征值,进行数据统计分析[8]。

每个变量的极值较小(相对于变量本身)。波动性相对其他数据较低(即方差小)。筛选出了12个变量作为流行程度的影响。主要包括:舞蹈性,能量,价态,节奏,响度,调式,技巧,不插电乐器,乐器,活力度,歌词,时长。采用神经网络能够将一些现象量化,揭示其背后的发展规律。

2 BP神经网络训练与预测

2.1 BP神经网络原理

BP网络是一种多层前馈神经网络。它的名字来自网络训练中的反向传播算法。调整网络权重的训练算法。同时,BP网络是具有三层或更多层神经元的神经网络(图1),包括输入层,中间层(隐藏层)和输出层。上层和下层完全连接,同一层中的神经元之间没有连接。输入层神经元和隐藏层神经元是网络的权重,每个神经元都有输入,并向一个或多个其他神经元产生单个输出。接收外部数据的层是输入层。产生最终结果的层是输出层。输入层和输出层之间是隐藏层。可能有一个或多个隐藏层,或者根本没有隐藏层。隐藏层或输出层中的任何神经元都会集成来自上一层中所有神经元的信息,通常会向集成信息添加阈值,然后将集成信息用作该层中神经元的输入[9]。

图1 BP神经网路基本原理

2.2 BP神经网络的设计

(1)具体步骤如下[10]:

①设定网络结构、输入层、隐藏层、输出层节点个数,以及学习率、最大学习周期等数,设定l=1。

②随机乱数生成初始权重Wji与Wkj,选定节点输出转换的激活函数。

多个值x1,x2,x3,输入相应的权重w1,w2,w3。输入值x和权重w乘以并求和,因此有一个输出y。

③随机选取一组训练样本。包括输入层向量Xk,输出层向量dk。

④计算隐藏层每个节点的输出值Zj,以及输出层每个节点的输出值yk。

⑤计算误差值Error。

⑥计算输出层的差距量,隐藏层的差距量。

⑦误差值若超过20%则重新调整参数和比对数据。

(2)参数设定

经过多次的数据训练后,可以达到了设定的误差。训练获得的其他信息为:训练次数5000,目标误差0.0000001,最大误差0.0557501,最小误差0.0000000,最小误差学习速率0.05。训练结果显示此模型的收敛速度较快,误差较小。

(3)神经元数目的选择

为确定隐藏层神经元数目,选择计算的公式为:

其中x为输入层,z为输出层,y为隐藏层。代入数据,得y=5。

此神经网络共5层,输入层为1,有12个神经元(对应着12个变量),输出层为1,有1个神经元(对应着1个变量)。又因为此次输入层与输出层之间神经元的数目差距过大,所以选择了3个隐含层依次过度,神经元个数(以5为中点)依次选为8,6,1。

(4)函数的选择

网络训练函数为tringlm(trainlm是指L-M优化算法,其优点为速度快,精度高),网络性能函数为mse(均方误差,用于检测模型预测值与真实值的偏差)。

因为输入层变量大小的不同而无法比较和应用,所以运用激励函数(归一化)进行处理。

即将各个变量的范围控制在了(0,1)区间内。隐藏层的激活函数设置为tansig,purelin函数。

此次应用激活函数的公式为:

2.3 BP神经网络预测结果与误差分析

预测本质是用历史数据来预测未来可能发生的行为或现象。但是,模型的好坏,是在预测工作中,需要根据估计某变量未来的可能性的值,要验证预测结果的正确性,只能待其发生后再观察以验证。

但是,此次对于音乐的流行程度,选择采用数据的一部分是未参加训练的数据作为预测数据,并以其真实值作为结果来验证模型的准确。

预测数据采用中抽取100条进行模拟预测,最终结果如图所示:其中红色代表实际值,分布范围为83到100,蓝色部分代表预测值,分布范围为70到96。

从图2的重合程度来看,BP神经网络预测值与实际值基本吻合。运用方程公式(2)计算最终结果的误差。

图2 预测值和真实值的比对

在下面的图3中画出了最终结果误差的分布,误差范围在-0.2到0.15之间(通常认为(-0.2,0.2)的误差范围是良好结果的指示)

图3 误差范围

对几个波动稍大(误差稍大)的数据进行合理分析(即讨论除所给数据的变量之外的影响)如受战争,政治,经济等因素影响,某些作品受人们喜爱,而某些作品会被封杀等等。

3 结论

经验证,采用BP神经网络的方法可以有效且高效的实现对音乐特征的分析及预测。

以美国近百年(1921年-2020年)历史数据为样本建立时间序列训练样本,进行训练与预测,获得以下研究成果:(1)采用BP神经网络方法预测,预测标准误差控制较小,预测效果较好。(2)结果分析,舞蹈性对音乐的流行程度起到主要的作用。(3)结果显示,再创建音乐时,采用本模型,能够很好的预测音乐的流行程度。

猜你喜欢

神经元神经网络变量
《从光子到神经元》书评
抓住不变量解题
也谈分离变量
神经网络抑制无线通信干扰探究
跃动的神经元——波兰Brain Embassy联合办公
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
SL(3,3n)和SU(3,3n)的第一Cartan不变量
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制