基于权值合理分配的电子音乐智能分类模型
2018-07-10杜非霏
杜非霏
摘 要: 针对传统分类技术存在分类不准确、耗费时间长,难以满足人们实际生活中对音乐分类需求等问题,提出基于权值合理分配的电子音乐智能分类模型。根据音色特点、基频特点和节奏特点,对电子音乐音色和节奏特征进行提取;利用不同音色特征对权值隐写检测贡献不同,综合考虑权值合理分配并提高特征分类能力,利用多种滤波器计算音频信号过零率,并根据音色所属区域对其频率倒谱系数展开分析;随机设置权值和阈值,并确定隐含层节点数,求得权值最优解,由此构建分类模型。通过实验验证可知,该模型分类准确,且耗费时间较短。
关键词: 权值合理分配; 电子音乐; 智能分类模型; 隐写分析算法; 音色; 基频; 节奏
中图分类号: TN911?34; TP309.2 文献标识码: A 文章编号: 1004?373X(2018)13?0168?04
Abstract: The traditional classification technology has the problems of inaccurate classification effect and long time consump?tion, and is hard to meet the requirement of people′s real life for music classification. Therefore, the electronic music intelligent classification model based on weight reasonable distribution is presented. On the basis of characteristics of tone, base frequency and rhythm, the tone and rhythm characteristics of electronic music are extracted. Since the different tone characteristics have different contributions for weight steganographic detection, the weight reasonable distribution is comprehensively considered to improve the feature classification ability. A variety of filters are used to calculate the zero?crossing rate of the audio signal, and the frequency cepstrum coefficient is analyzed according to its tone area. The weights and thresholds are set randomly, and the number of hidden layer node is determined to obtain the optimal solution of weight, so as to construct the classification model. The experimental results show that the model has accurate classification result and short time consumption.
Keywords: weight reasonable distribution; electronic music; intelligent classification model; steganalysis algorithm; tone; base frequency; rhythm
0 引 言
随着电子音乐在网络中不断发展,促使广大音乐爱好者可通过网络获取喜爱的音乐,引起了音乐爱好者对电子音乐种类分类产生了极大兴趣。但是,传统分类技术存在分类不准确、耗费时间长等问题,难以满足人们实际生活中对音乐分类的需求,为此,提出基于权值合理分配电子音乐智能分类模型。
以音乐特征为载体的信息隐藏技术成为电子音乐分类领域的一个研究重点。其中,权值隐写检测技术是区分电子音乐种类的重要组成部分。智能分类从音色、节奏和基音频率三方面对音频特征进行了提取,衡量既定时间间隔音频信号所经历的过零值次数;根据人耳听觉特点,利用傅里叶变换音频特征,使用双离合变速器进行处理,提取频率倒谱系数,并从分析窗和结构窗角度提高分类速度。设计实验验证该模型构建的合理性,并由此得出结论。实验结果表明,该模型分类准确,且耗费时间较短,与传统分类方法相比效果更佳。
1 基于权值分配电子音乐分类模型的构建
1.1 基于权值分配特征提取
为了获取音频准确性与简洁性特征,需对音频进行分析,提取出有关分类的信息。电子音乐种类的特征应根据具体应用而进行特征提取,该特征具有音色、基频和节奏特点,基于该特点对电子音乐音色和节奏特征进行提取。
1.1.1 音色特征提取
针对具有相似音调和节奏的音频,需对音色特征进行区分。音色特征是一个具有短时间特点的电子音乐因素,想要准确提取音色特征,就需对信号帧数进行区分[1]。将最初获得的音频信号分成等段长度的帧,信号帧与信号帧之间具有一定的重叠性,为了促使信号更加平滑,需要對信号帧进行加窗处理。为了减轻边缘信号帧影响,选择长度为512的帧数,重叠后点数为25,进行分帧处理之后,通过傅里叶积分变化获得帧信号频谱,进而对谱特征进行提取[2]。
由于不同音色特征的电子音乐对权值隐写检测贡献不同,为了综合考虑权值是否合理分配,需提高特征分类能力,利用多种滤波器计算音频信号过零率,并根据音色所属区域对其频率倒谱系数展开分析,其次进行统计,特征提取框架如图1所示。
由图1可知,基于权值合理分配音色特征提取框架的主要内容有以下三个方面。
1) 过零率
分析过零率是衡量既定时间间隔音频信号所经历的过零值次数,忽略自然产生的噪音,对过零值进行随机选择。因此,对于静音片段,过零率需要高于所有有声片段,该区域通常被称为音频判断区域,如果有声音,说明该区域处于高声区;如果无声音,说明该区域值没有过零[3]。过零率[Z]的数学表达式为:
2) 頻率倒谱系数
频率倒谱系数受到人们对于听觉特征的启发,根据听觉特点,人耳感受到了响度与幅度的实际变化。将幅度值频谱取对数后,系数可根据频率分成若干个频带,由于获取频率向量具有高度辨识特征,且还具有复杂连带性,为了去除响度与幅度之间的连带性,需利用傅里叶变换音频特征,使用双离合变速器进行处理,整个频率倒谱系数提取过程如图2所示[4]。
由图2可知,由于频率倒谱系数第一个系数代表音频信号中的直流分量,因此,在实际应用中可去除。频率倒谱系数具有一阶和二阶差分量,存在一定的现实意义。
3) 分析窗和结构窗
在对短时音频分析过程中,信号可被分成若干个重叠部分,这些重叠分量被称为分析窗[5]。分析窗具有较小但相对稳定的频率特征,在短时间内频谱与时间规律相吻合,此时会产生一种质感,为了获得质感特征,需将若干个特征向量组成强大的结构窗,由此计算特征向量的均值与方差。采用该方式可降低计算量,提高分类速度。
1.1.2 节奏特征的提取
音乐节奏特征可直观反映出音乐信号随着时间的变化而发生改变,节奏特征有音乐节奏、节拍和拍速,通常利用直方图对节奏特征进行提取[6]。节拍直方图可由音频信号小波分解得到,并对时域信号进行高通与低通滤波处理,其计算流程如图3所示。
由图3可得到不同特征向量数值:节拍直方图相对峰值、每拍周期、峰的幅度比值、整个峰的幅度值之和。
1.2 分类模型的构建
根据上述音色与节奏特征的提取,随机设置权值和阈值,并确定隐含层的节点数,可求得最优解[7]。设隐含层节点数为[N],那么音色向量输出函数为:
基于此分析电子音乐分类效果,具体描述为:
1) 主成分分析+电子音乐分类训练情况([W1]);
2) 核主成分分析+支持向量机电子音乐分类训练情况([W2])。
对电子音乐分类平均训练时间进行设定,如图4所示。
由图4不同电子音乐分类平均训练时间不同,可获得基于权值合理分配的电子音乐智能分类模型,如图5所示。
2 实 验
为了验证基于权值合理分配电子音乐智能分类模型设计的合理性进行了如下实验。实验中共包含蓝点音乐(Blue)、古典音乐(Classical)、乡村音乐(Country)、迪斯科(Disco)、嘻哈(Hiphop)、爵士(Jazz)、金属乐(Metal)、流行音乐(Pop)、雷鬼音乐(Reggae)、摇滚(Rock)等10种音乐类型,其中每种音乐共包含100种乐曲,将此乐曲进行音乐特征提取获得音乐片段[8]。通过实验验证不同分类模型对电子智能音乐分配的影响以及权值分配与电子音乐相结合的有效性。
2.1 分类准确率实验结果与分析
将上述处理的音乐片段进行不等段截取处理,分别分为等长的2段、4段和8段,并对每一段进行标记,加以区分。将分割后的音乐片段进行提取,获得12维的频率倒谱系数(MFCC)和12维的一阶差分频率倒谱系数(MFCC)共同组成的24维特征向量[9?10]。根据音乐特性和权值分配原理,将上述等长时段分别按照2个时间段、4个时间段、8个时间段进行训练,获得智能分类模型,构建一个音乐分类系统,如图6所示。
将该系统中每类音乐词汇表大小设置为1 000,使用密度聚类算法(DBSCAN)来决定权值合理分配电子音乐智能分类模型的主题。针对每一个分类进行10次实验,在每次实验中进行随机分类,从每种乐曲中选择60%的数据作为训练集合,其余作为测试数据集合。
采用传统分类方法与本文设计的模型分类方法对10次实验平均分类正确率进行对比,结果如表1所示。
由表1可知,针对这10种音乐类型,传统分类方法最低准确率为68.39%,而本文分类方法最低准确率为82.91%。传统分类方法最高准确率为88.29%,而本文分类方法最高准确率为99.80%。由此可知,采用基于权值合理分配的电子音乐智能分类模型方法可提高分类准确率,具有精准的分类性能。
不同训练时间段对音乐的分类情况也不同,选取本文分类方法准确率最高的摇滚乐为实验对象,测试随着时间段的增加,正确分类率是否会受到影响,结果如图7所示。
由图7可知,摇滚乐在时刻为8 s时分类准确率最高,并且随着时间的增加,准确率呈下降趋势,说明该模型在分类时不是耗费时间越长准确率就越高,也不是耗费时间越短分类准确率就越低,而是每个时刻的音乐片段都会影响分类信息的提取,因此,只有在特定的时间内分类才会准确。
2.2 分类效果对比分析
为了验证本文设计模型的分类效果,选择50名音乐系学生对这10种音乐进行选择,发现喜欢流行音乐的学生人数最多,其次是摇滚与嘻哈,然后是古典音乐与爵士,喜歡蓝点音乐、乡村音乐、迪斯科、金属乐和雷鬼音乐人数较少。
将传统分类效果与本文分类效果进行对比,结果如图8所示。
由图8可知,根据调查结果采用基于权值合理分配的电子音乐智能分类模型效果较好,可合理对音乐进行智能分类。
2.3 实验结论
经过上述实验内容可知,采用基于权值合理分配的电子音乐智能分类模型需根据特定时间对音乐分类信息进行提取,才会提高分类准确率,具有精准的分类性能,并且该分类模型效果较好,可合理对音乐进行智能分类,进而证明了该方法的合理性。
3 结 语
根据音乐动态特征,对传统分类方法进行改进,提出基于权值合理分配的电子音乐智能分类模型设计,并利用权值分配隐写分析算法求取模型动态参数,进而对音乐进行建模,将获取的向量作为序列模型,并得出分类结果。通过实验验证该模型设计的合理性,并能准确对电子音乐进行分类,性能较好。
参考文献
[1] 杨宇,李紫珠,何知义,等.QGA?VPMCD智能诊断模型研究[J].振动与冲击,2015,34(13):31?35.
YANG Yu, LI Zizhu, HE Zhiyi, et al. QGA?VPMCD intelligent diagnosis model [J]. Journal of vibration and shock, 2015, 34(13): 31?35.
[2] 赵伟,周建辉.基于模糊C均值聚类算法的音乐喷泉智能识别[J].控制工程,2015,22(6):1057?1062.
ZHAO Wei, ZHOU Jianhui. Based on the fuzzy C?means clustering algorithm music fountain intelligent identification [J]. Control engineering of China, 2015, 22(6): 1057?1062.
[3] 黄步添,刘琦,何钦铭,等.基于语义嵌入模型与交易信息的智能合约自动分类系统[J].自动化学报,2017,43(9):1532?1543.
HUANG Butian, LIU Qi, HE Qinming, et al. Intelligent contract automatic classification system based on semantic embedded model and transaction information [J]. Acta automatica sinica, 2017, 43(9): 1532?1543.
[4] BESSE P C, GUILLOUET B, LOUBES J M, et al. Destination prediction by trajectory distribution based model [EB/OL]. [2017?11?14]. https://www.fondation?hadamard.fr/sites/default/files/public/bibliotheque/guillouet?pgmodays2017_partie1.pdf.
[5] 葛顺,夏学知.一种基于概率影响分析的智能决策模型[J].计算机工程,2016,42(6):213?217.
GE Shun, XIA Xuezhi. An intelligence decision model based on probabilistic influence analysis [J]. Computer engineering, 2016, 42(6): 213?217.
[6] 刘紫燕,毛攀,吴俊熊,等.基于改进智能水滴算法的多用户OFDMA系统资源分配[J].电讯技术,2017,57(2):161?166.
LIU Ziyan, MAO Pan, WU Junxiong, et al. Resource allocation with improved intelligent water drops algorithm in multi?user OFDMA system [J]. Telecommunication engineering, 2017, 57(2): 161?166.
[7] 方如举,王建平,孙伟.基于最小流量的智能配电网WSNs通信模型[J].电子测量与仪器学报,2017,31(8):1218?1226.
FANG Ruju, WANG Jianping, SUN Wei. WSNs communication model based on minimum traffic for smart distribution grid [J]. Journal of electronic measurement and instrumentation, 2017, 31(8): 1218?1226.
[8] 吴承毅.基于多维度特征权值动态更新的用户推荐模型研究[J].现代电子技术,2016,39(15):127?129.
WU Chengyi. Research on user recommendation model based on multi?dimensional feature weight dynamic update [J]. Modern electronics technique, 2016, 39(15): 127?129.
[9] 曾奕棠,张玉峰.基于云分类挖掘的物流信息智能分析方法研究[J].情报科学,2016,34(11):135?139.
ZENG Yitang, ZHANG Yufeng. Research on intelligent analysis method of logistics information based on cloud classification mining [J]. Information science, 2016, 34(11): 135?139.
[10] CAPELETTO C A, COSTA C, SAYER C, et al. Mathematical modeling of molecular weight distribution in miniemulsion polymerization with oil?soluble initiator [J]. AICHE journal, 2016, 63(6): 1?7.