APP下载

基于情感主题的音乐分类研究

2019-10-11张宏阮泽楠

软件导刊 2019年7期
关键词:情感分析

张宏 阮泽楠

摘 要:为确定歌词隐含的情感主题对音乐分类的作用,在传统主题模型中融入情感、语义元素,定义基于情感主题的音乐分类标准并进行音乐分类。结合文本情感词典、Word2vec词向量空间,将主题模型的基础主题进一步归类为情感主题,并通过爬取网易云音乐歌曲信息进行模型训练及测试。实验证明,该模型具有较好的分类效果,对音乐情感分类平均准确率达到80%。

关键词:音乐分类;情感分析;主题模型;Word2vec;LDA

DOI:10. 11907/rjdk. 182780 开放科学(资源服务)标识码(OSID):

中图分类号:TP301文献标识码:A 文章编号:1672-7800(2019)007-0015-04

Music Classification Research Based on Emotion Topic

ZHANG Hong, RUAN Ze-nan

(School of Economics and Management, Zhejiang Sci-tech University, Hangzhou 310018, China)

Abstract: In order to identify the role of the emotional topic implicit in the lyrics on music classification, this paper incorporates emotion and semantic elements into the traditional topic model to define music classification criteria based on emotional topic and classify music. Combining the text sentiment dictionary and the Word2vec, the basic topics in the topic model are further classified into some emotional topics, and the model is trained and tested by crawling the song information of Netease cloud music. The experiment proves that the model has a good effect, and the average accuracy rate of music emotion classification reaches 80%.

Key Words: music classification; sentiment analysis; topic model; Word2vec; LDA

基金项目:国家社会科学基金项目(15BSH107)

作者简介:张宏(1978-),女,博士,浙江理工大学经济管理学院教授、硕士生导师,研究方向为战略管理、企业社会责任、数据营销;阮泽楠(1993-),男,浙江理工大学经济管理学院硕士研究生,研究方向为文本挖掘与情感分析。

0 引言

互联网与多媒体系统中音乐数据库激增,带来了对音乐信息检索(MIR)应用的巨大需求,尤其是音乐数据库实现自动分析的需求[1]。歌名、作者、歌词、流派及用户评论等元数据通常用于分类与检索音乐作品[2-4]。传统手动分类方法是一项高度劳动密集型的工作,且时间与金钱成本较高。另一方面,由于音乐乐理中关于情绪维度及其诱发机制的研究尚存争论[5-6],导致音乐分类类型定义存在歧义。手动分类往往因实践的任意性致使分类结果受主观因素影响较大,尤其是密切相关的类型间有时存在分类重叠现象。因此,面对日益增长的大型集合时,必须借助高效的分类系统对音乐进行分类与描述[7]。

歌曲是旋律同文字的结合,其中旋律可感染情绪,语言可进行具体陈述,两者相辅相成[8]。目前在音乐分类研究中歌词等文本属性的关注度较小,且相关研究欠缺情感、语义等元素的融入。互联网音乐的兴起为大量音乐歌词文本的采集提供了便捷途径。中文音樂平台主要有QQ音乐、虾米音乐、酷狗音乐、网易云音乐等众多平台,其中网易云音乐拥有最大数量的优质用户,尤其是中高学历的用户,其用户定义的歌单情感标签相对更具有准确性。

1 音乐分类研究现状

音乐分类系统往往基于统计或机器学习等方法对音乐进行类型分类,在具有高效、准确等优点的同时,还能避免传统分类因标准不一导致的类型歧义。在音乐分类器的构建中常用基本模型主要有神经网络模型(尤其是BP神经网络)[9-11]、支持向量机(SVM)[12]、逻辑回归、随机森林模型等。高林杰和张明等[12]提出一种基于熵与支持向量机的音乐分类方法,利用滤波器组将音乐片段分解为不同通道,通过离散傅里叶变换将其转换为频谱,再使用结合信息熵的支持向量机训练、测试包含4类音乐的数据集,研究结果中最高分类精度达到80%。另外一些使用BP神经网络的学者也获得了较高的正确分类率[9-11]。

许多学者在研究中使用音乐旋律特征的音高、音长、音色、速度、力度等作为音乐本体表征,而音乐本体特征由于音乐领域认知尚存在诸多争端,因此有学者聚焦于音乐文本信息(如歌名、歌词及音乐对应的用户评论等),通过文本挖掘的方法进行音乐情感分析。An等[13]通过以文本形式的歌词作为音乐特征,用贝叶斯分类模型对音乐情绪进行分类判别,最终精确度接近68%。Dakshina[14]使用LDA主题模型对音乐歌词进行情绪主题分析,从而实现音乐分类,其分类准确率达72%。以上基于文本的音乐分类,大多根据文本信息概率分布特征进行研究,忽略了文本数据体现的情感、语义信息。

2 融合情感、语义的主题模型设计

传统主题模型LDA(Latent Dirchlet Allocation)[15]基于文档—主题—词语间的条件概率分布,挖掘文档语料的潜在主题,其结果本质是词语组合概率,而未能体现文本在情感、语义上的关联特征。通过赋予概率主题情感、语义特征,能够更准确地定义音乐作品类别,解决传统类别定义的歧义纠纷,对音乐作品进行更准确的自动分类。

2.1 情感空间主题分布

将情感元素融入概率主題,主要聚焦于各主题分布下的词组合,结合外部情感倾向词典将词组合(即主题)情感量化。一种可行的情感词典是通过种子词与搜索引擎的词共现,对大量正向(情感值>0)、负向(情感值<0)词语进行情感倾向度标记,并存储为以词—情感倾向度作为键值对的词典[16]。融入词语的情感倾向度后,原基于概率分布的各主题也对应特定的情感值,从而能在情感维度上实现情感大类区分。具体结构流程如图1所示。

图1 主题情感化结构

其中,主题词在情感词典获得情感值时所赋的权值变量被定义为主题—词分布中各词语的概率[Pij](即LDA模型定义中[P(w/t)]),则:

[iPti=Pt1+Pt2+?+Ptn=1]  (1)

其中,[t]为某一主题,[i]为主题[t]下的某个词语,[n]为语料总词数。此时,结合情感词典中词语[i]对应的情感倾向度[Vi],某个主题[t]的情感度[Vt]定义为:

[Vt=iPti×Vi]  (2)

2.2 语义空间主题分布

借助Word2vec[17]词向量,文本概率主题可在语义向量空间中表现出深层次的关系。实现主题向量化,首先通过训练成熟的Word2vec模型给出语料库所有[n]个词语的空间向量表示,其中第[i]个词[wi]被描述为:

[wi=[ai1,ai2,ai3?ain]]  (3)

则针对某一主题[t]的向量空间描述[Wt]为:

[Wt=iPti×wi]  (4)

在语义空间中,歌词中隐含的主题可被进一步归纳为语义区分度上的系列类别,图2展示了歌词概率主题在空间向量上的分布(以二维空间为例)。

图2 语义向量空间主题分布

语义空间的两个主题向量,通过计算其余弦相似度可衡量两者相似程度。余弦相似度[18](cosine,又称余弦距离)是两个空间向量之间的夹角(夹角余弦),向量夹角(夹角余弦值)越小,向量指向越接近,其负载的上层信息内容相似度越高。向量[X=(X1,X2,?,Xi)],[Y=(Y1,Y2,?,Yi)],则:

[COS(θ)=?i=1n(Xi×Yi)i=1n(Xi)2?×i=1n(Yi)2??]  (5)

由余弦距离定义的概率主题间语义相似度可依次获得各主题间相似匹配的二元组合(如图2正中间组合)、三元组合(如图2左下、右上组合)以及更高元的组合,该过程体现了传统关联规则算法(如Apriori)[19-20]的处理思想。

2.3 模型框架

模型整体流程主要分为4层,分别包括音乐歌词预处理(分词、去噪、同类词合并等)、主题概率分布、主题情感语义分配及对新音乐的分类判断。整体流程如图3所示。

图3 融合情感、语义的主题模型框架

(1)歌词预处理部分主要为后续步骤提供适当的数据格式。首先通过定向爬虫采集歌曲、歌词信息;其次对爬取的歌词文本进行分词,并去除信息量极低的无关词语;最后包装数据结构,主要为原歌曲本体信息与歌词预处理结果的映射关系。

(2)以上述获得的词语集合为语料,进行LDA 主题模型基础训练,获得音乐歌词基于文档—主题—词概率分布下的基础类别。

(3)结合情感词典,刻画基础主题的情感倾向,将基础类别进行情感大类划分;在各情感大类下,通过关联规则[20]将基础主题根据语义向量空间上的余弦距离进一步划分为不同语义群的类别。

(4)结合情感与语义的主题分类,最终给出一套严格定义的音乐分类标准。以训练完成的模型结合分类标准,对新音乐作品进行类别判断。

3 实证研究

本文使用Python编写爬虫脚本,爬取网易云音乐网站情感类别下快乐、悲伤及平静风格各2万首歌曲信息(不重复)及歌曲对应的歌词,原始储存数据分为3类,共6万行,其中歌词字段是本文研究的主要内容,最终存储的数据结构如表1实例所示。

研究使用的词向量工具是Python版本的Gensim框架实现Word2vec与LDA,其中Word2vec训练语料主要来自中文维基百科语料,语料文本大小约为1G。

通过困惑度确定LDA主题,困惑度(perplexity)[21]可度量一个概率分布或概率模型预测样本的优劣程度,低困惑度的概率分布模型或概率模型能更好地预测样本[22]。计算每个备选主题数(0~100)下的综合困惑度,主题数—困惑度分布结果如图4所示。

图4 不同主题数的困惑度分布

综合考虑困惑度与主题数目,将最优主题数确定为[k=50],从歌词中挖掘获得50个基础主题。按概率大小取每个主题前10个主题关键词。表2展示了部分主题与该主题下关键词分布。

表2 部分主题与关键词

为构建模型适用的情感词典,本文收集了知网Hownet情感词典、台湾大学NTUSD简体中文情感词典、清华大学李军中文褒贬义词典等众多情感词典并整理汇总,作为项目中词语情感值的标度(对于未收录在词典中的词语,本文作为中性词判断,情感值以0计入),情感词典最终共包含正负向情感词语共计65 900个。

通过融合情感、语义的主题模型,最终将网易云音乐获取的6万首歌曲,根据歌词的情感语义主题划分为3大类15个小类。在检验训练模型对新歌曲的分类能力时,考虑到有歌曲类别来自网易云音乐情感标签,为减少定义歧义,本文选取快乐、悲伤两类各1 000首新歌作为测试集,模型分类结果平均准确率80%,综合多次结果绘制受试者工作特征曲线(Receiver Operating Characteristic Curve,又称ROC曲线),如图5所示,曲线下面积0.8, ROC曲线表现较好。

图5 分类结果受試者曲线

4 结语

本文通过在LDA主题模型中融入情感与语义元素,构建基于情感主题的音乐分类模型,首先针对音乐歌词进行情感主题的类别判定,并用以进行音乐情感分类。将网易云音乐的大量音乐信息作为本文模型训练及测试数据,实验结果表明,融合情感语义的主题模型在音乐类别定义及音乐分类中均有较好的效果,准确率达到80%。融合情感语义的分类方法,不仅能很好地提升音乐分类的实际效率,还可为相关理论研究提供思路。此外,针对研究中情感词典构建、语义空间准确度的提升,有待后期进一步研究。

参考文献:

[1] XIONG S,WANG K,JI D,et al. A short text sentiment-topic model for product reviews[J]. Neurocomputing,2018,10: 1016.

[2] 赵伟. 基于BP神经网络的音乐情感分类及评价模型[J]. 电子设计工程,2015(8):71-74.

[3] DANAHER B,TELANG R. An empirical analysis of digital music bundling strategies[J]. SSRN Electronic Journal,2014,60(6): 1413-1433.

[4] 陈维华. 基于支持向量机(SVM)的音乐情感分类[J]. 软件工程,2016,19(12):20-23.

[5] 钟启文. 近年关于音乐心理反应的研究综述[J]. 艺海,2017,(6): 50-53.

[6] 张浩. 论情绪和情感及其在认识中的功能——主体认识结构中的非理性要素研究[J]. 广东社会科学,2006,(6): 78-84.

[7] KIM Y E, SCHMIDT E M, MIGNECO R, et al. Music emotion recognition: a state of the art review[C]. International Symposium on Computer Music Modeling and Retrieval, 2012:171-196.

[8] 蔡振家. 音乐情绪跟音乐认知的关系:美学与心理学的对话[J]. 星海音乐学院学报,2013(2): 120-127.

[9] 钟佳颖. 基于BP神经网络的音乐情感分类模型研究[J]. 数字化用户,2017,23(41):22-23.

[10] 赵伟. 基于BP神经网络的音乐情感分类及评价模型[J]. 电子设计工程,2015(8): 71-74.

[11] 刘明星. 基于BP神经网络的音乐分类模型[J]. 现代电子技术, 2018(5):136-139.

[12] 高林杰, 张明. 基于熵和支持向量机的音乐分类方法[J]. 计算机系统应用,2014,23(5):83-88.

[13] AN Y,SUN S,WANG S. Naive Bayes classifiers for music emotion classification based on lyrics[C]. IEEE/ACIS International Conference on Computer & Information Science,2017:635-638.

[14] DAKSHINA K, SRIDHAR R. LDA based emotion recognition from lyrics[C]. Proceedings of the Second International Conference on Advanced Computing, Networking and Informatics,2014:187-194.

[15] YAN X, GUO J, LAN Y, et al. A biterm topic model for short texts [C]. Proceedings of the 22nd international conference on World Wide Web, 2013: 1445-1456.

[16] 阳爱民,林江豪,周咏梅. 中文文本情感词典构建方法[J]. 计算机科学与探索,2013,7(11): 1033-1039.

[17] RONG X. Word2vec parameter learning explained[DB/OL]. https://arxiv.org/pdf//411.2738v2.pdf.

[18] 彭凯, 汪伟, 杨煜普. 基于余弦距离度量学习的伪K近邻文本分类算法[J]. 计算机工程与设计,2013,34(6): 2200-2203.

[19] INOKUCHI A,WASHIO T,MOTODA H. An Apriori-based algorithm for mining frequent substructures from graph data[C]. European Conference on Principles of Data Mining and Knowledge Discovery,2000:13-23.

[20] XU Y, LI Y, SHAW G. Reliable representations for association rules[J]. Data & Knowledge Engineering, 2011,70(6): 555-575.

[21] 何天文,王红. 基于语义语法分析的中文语句困惑度评价[J]. 计算机应用研究,2017(12): 3538-3542.

[22] 关鹏,王曰芬. 科技情报分析中LDA主题模型最优主题数确定方法研究[J]. 现代图书情报技术,2016,32(9): 42-50.

(责任编辑:江 艳)

猜你喜欢

情感分析
基于双向循环神经网络的评价对象抽取研究
在线评论情感属性的动态变化