基于歌词的流行音乐情感二值分类研究
2016-02-13蒋旻隽
蒋旻隽
(上海应用技术大学计算机科学与信息工程学院,上海 201418)
基于歌词的流行音乐情感二值分类研究
蒋旻隽
(上海应用技术大学计算机科学与信息工程学院,上海 201418)
着眼于音乐情感的分类,使用计算机领域文本分类的技术,利用KNN分类算法,对流行音乐中的情感进行挖掘,从而实现基于中文歌词的流行音乐情感的二值分类。主要借鉴文本处理的方法,将歌词通过分词、词频统计、权重计算等一系列的处理,变为可计算的特征向量;并且在此基础上使用KNN分类算法,对于流行音乐中的情感进行了二值分类。通过实验结果可以看出,该方法有较高的准确率。
情感分类;流行音乐;歌词文本处理;KNN算法
0 引言
音乐是人们休闲娱乐生活中必不可少的一部分,计算机与互联网的发展使我们可以通过网络方便地取得音乐资源,网络上的海量音乐信息,对媒体内容的管理和检索提出了更高的要求。通过音乐所表达的情感进行音乐检索更方便,更智能,更贴近人们的日常生活。从前的音乐检索方式大多忽略了用户对于音乐情感上的需求,更多的是通过声学、音频等专业邻域的特征检索。有关基于情感的音乐检索的研究工作较少,Feng等通过检测音乐的演奏速度和清晰度,来分析音乐中所蕴含的情感[1]。情感识别方法主要有基于知识的模型和基于数据的模型[2],使用统计分析或者机器学习的理论建立关键变量与其他可测变量的统计或者学习模型也是最常用的方法,例如基于支持向量机[3-5]的方法、高斯混合模型方法[6]。
本文的重点在于挖掘流行音乐中的情感,基于流行音乐的歌词对其进行二值分类。本文主要从音乐歌词所包含的情感分类技术出发,在现有歌词分类方法的基础上,与音乐领域的相关知识相结合,构建情感所对应的词汇表,将中文文本分类的方法应用于流行音乐的情感分类中,结合KNN分类算法,实现流行音乐的情感二值分类。
1 基于KNN算法的音乐情感分类
对于情感的分类而言,最常见也是最直接简单的情感分类方式便是好和坏,积极与消极。根据一定的调查和研究,大部分的流行音乐所带给人们直观的感觉便是表示积极情绪和表示消极情绪的音乐,所以本文将流行音乐中的情感分类两大类,体现积极情绪的一类和表现消极情感的一类。
K最近邻(KNN,k-Nearest Neighbor)分类算法是数据挖掘分类技术中最简单的方法之一。KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。
KNN算法的基本步骤为:(1)算距离:给定测试对象,计算它与训练集中的每个对象的距离;(2)找邻近:圈定距离最近的K个训练对象,作为测试对象的邻近;(3)做分类:根据这K个邻近归属的主要类别,来对测试对象分类。
2 音乐情感与特征向量
2.1 音乐情感表达
本文研究的对象是流行音乐的歌词与音乐情感的对应关系,已有的研究成果表明,汉语情感词汇主要分布在名词、动词和形容词中,本文根据查阅的相关资料,在已有的成果的基础上,构造了适用于本次实验的情感词汇与类别对应表。将感情分类积极和消极两大情感大类,而其中又各细分了6类情感小类。详见表1中的情感与形容词的对应关系。
2.2 特征向量
计算机无法直接处理文字、语言,必须通过一定的方法将文本形式的歌词转化为可以被计算机处理的形式化特征向量。利用向量空间模型,文本的数据就转换成了计算机可以处理的结构化数据,两个文档之间的相似性问题转变成了两个向量之间的相似性问题。
本文将歌词的文档以表示情感的特征词用空间向量的形式表达出来特征向量表示为D=(t1,t2,…,tn),由于我们将情感细分为12小类,因此此处n的取值为12,即每个特征向量是12维的。另外,每一维表示某一文本中出现第i个小类中的形容词的次数。例如,某首歌词中出现了3次“笑容”,1次“甜蜜”,1次“温馨”,对照表1,可以发现这几个词语都被归纳在第六个小类“快乐”这一情感中,因此对于这首歌词的特征元素t6的计数值就为6。
当得到一首歌词文本后,首先要使用特殊工具对其进行分词,将完整的词句变为一个个单词,随后通过手动操作从中选取名词、形容词等富含情感因素的词语,第三步是将这些词语和下表的情感类别词汇对比,统计任意一首歌词,对于每一个情感小类中的词语出现的次数,最终得到每首文本歌词所对应的特征向量。
表1 情感类别与词汇对应表
3 实验分析
3.1 总体设计
本方法主要有预处理和分类处理两大部分。预处理部分主要将文本型的歌词进行分词以及一系列相关的后序处理,最终得到相关的特征向量;而实际的分类处理,则是利用KNN算法,通过计算测试的未知样本与已知的训练样本之间计算欧式距离,以及排序比对等处理,以得到未知样本所在的类别。主要可以细分为以下几个步骤:
①使用ICTCLA2014对实验数据进行分词,表示出使用数据的特征词;
②进行特征项的选取,选择歌词中的带有明显情感特征的词汇,形容词、名词和动词作为特征项;
③词频统计,统计所选特征项在所需分类歌词中文档中出现的次数,将所有的歌词文本(包括训练样本以及测试样本)转换为特征向量;
④手动将各个训练样本的类别进行标注;
⑤利用KNN算法对各测试样本进行分类。
3.2 实验与结果分析
本次研究选用180首流音乐的中文歌词。在180个实验数据中,有100首歌曲是情感类别已经明确的训练样本,而另外80首未标注情感类别的歌词文本作为测试样本,主要用于对分类结果进行观察和分析验证分类方法的正确合理性。
对于使用KNN算法有两个关键点,一是特征向量之间的距离计算公式的选择,其二是关于关键参数k的取值。首先,我们选择最为常用的欧氏距离来度量两个向量之间的邻近程度,计算公式为,d=。其中d为我们所求的距离,X=(x1,x2,…,xn)以及Y=(y1,y2,…,yn)为两个特征向量,代表两个歌词文本。而对于k的选择上,经过反复实验对比k取值3的时候,分类的效果最佳。
根据前面所设计的方案,所选用的音乐歌词具有明显的情感特征,语料库主要收集近10年的流行音乐。本次实验中,测试样本为80首歌曲,表示积极和消极各40首,积极类歌曲分类正确39首,正确率97.5%,消极歌曲分类正确38首,正确率95%。可以看出,大部分情况属于分类正确,少部分的语料分类不正确。
4 结语
本文主要研究如何利用KNN算法对流行音乐的情感进行简单的二值分类。文章首先探讨了歌词与音乐情感的关联,并借鉴文本处理的方法,将纯粹文字记录的歌词通过分词、词频统计等一系列的处理,变为可计算的特征向量;并且在此基础上使用KNN分类算法,对于流行音乐中的情感进行了二值分类。通过实验结果的相关数据可以看出,该方法能够得到较高的准确率与覆盖率。
根据情感分类的方法在音乐信息检索中有着重要的作用,同时也对理论的研究和应用有着巨大的价值。还有很多知识和理论值的我们去探索去学习。虽然歌词与音乐情感有着很大的关联,但是旋律本身对于情感的体现也尤为重要,我们将在未来的研究中更着重旋律对于音乐情感的影响,并结合歌词做进一步的音乐情感分类研究。
[1]Feng Y Z,Zhuang Y T,Pan Y H.Music Information Retrieval by Detecting Mood Via Computational Media Aesthetics[C].Proceedings of the IEEE International Conference on Web Intelligence.Beijing,China,2003:235-241.
[2]童卡娜.基于音乐联觉的听觉金制度识别模型与算法研究[D].长沙:中南大学硕士学位论文,2007.
[3]Umapathy K,Krishnan S,Jimaa S.Multigroup Classification of Audio Signals Using Time-Frequency Parameters[J].IEEE Trans.on Multimedia,2005,7(2):308-315.
[4]Ogihara M.Content-Based Music Similarity Search and Emotion Detection[C].Proceedings on 2004 IEEE International Conference on Acoustics,Speech and Signal Processing,Fairmont Queen Elizabeth Hotel,Montreal,Quebec,Canada,2004:17-21.
[5]Wang M.User-Adaptive Music Emotion Recognition[C].IEEE Transactions on Audio,Speech and Language Processing,2008,16(2): 448-457.
[6]Liu D,Lu L,Zhang HJ.Automatic Mood Detection from Acoustic Music Data[C].Proceedings of the 4th International Conference on Music Information Retrieval.Baltimore,Maryland,USA:Johns Hopkins University,2003.
Research on Binary Classification of the Emotion of Pop Music on Lyric
JIANG Min-jun
(School of Computer Science and Information Engineering,Shanghai Institute of Technology,Shanghai 201418)
Focuses on how to retrieve massive musical information on internet efficiently based on the emotions of different music,by using the techniques of text processing and KNN algorithm,it is possible to discover important information from pop music.Uses text processing method for reference to transform lyrics of music into feature vectors,applies KNN algorithm to classify musical emotion into two different categories.The proposed method is proved effective and correct by the experiments.
Classification of the Emotion of Music;Pop Music;Lyric Text Processing;KNN Algorithm
上海应用技术学院引进人才基金资助项目(No.YJ2011-69)
1007-1423(2016)35-0055-04
10.3969/j.issn.1007-1423.2016.35.011
蒋旻隽(1981-),女,上海人,讲师,博士,研究方向为人工智能
2016-11-01
2016-12-01