中文音乐情感词典构建及情感分类方法研究
2014-08-05蒋盛益廖静欣
蒋盛益,阳 垚,廖静欣
1.广东外语外贸大学 信息学院,广州 510006
2.淘宝(中国)软件有限公司,杭州 310099
中文音乐情感词典构建及情感分类方法研究
蒋盛益1,阳 垚2,廖静欣1
1.广东外语外贸大学 信息学院,广州 510006
2.淘宝(中国)软件有限公司,杭州 310099
1 前言
作为2012年中国互联网网民使用率仅次于即时通信和搜索引擎的第三大应用,网络音乐的用户规模达到43 586万,与2011年同比增长率为13.0%[1],网络音乐及其应用技术已经成为互联网的一个研究热点。音乐是情感的载体,情感是音乐的本质特征和内涵,同时也是音乐最重要的语义信息。正因如此,音乐的情感分析广泛应用于音乐检索和推荐系统、不同场景的音乐配放(如动漫制作)、个人音乐欣赏(如音乐下载服务)等领域,是人机情感交互技术研究中重要的组成部分[2],受到业界学者的高度重视。
传统的音乐情感分析大都是基于音频的,且此方面的研究已有近20年的历史,然而至今难以获得准确反映情感的音频特征,情感分析未能达到满意的水平[3]。因此研究者开始向音乐情感的另一本体——歌词展开研究,基于歌词的情感分析逐渐成为热门的研究方向。歌词,本质上属于文本的范畴。因此,从歌词分析的角度来看,音乐的情感由歌词中所有词语的情感序列组合而成,最小的语义构成单位是词语,词语的情感判别是歌词情感分析的基础。构建一部合理的情感词典,实现词汇的情感分析是高效、精确的歌词情感分析的前提和基础。
借助于HowNet[4]、《同义词词林》[5]等系统,目前国内构建中文情感词典的研究工作已获得了一定的成果。Subasic和Huettner手工建立了一个基于情感类别相关的词典,词典中标明了词的强度(表达情感的力度)和向心度(与类别的相关程度)[6]。Liu等人提出了使用Open Mind Commonsense数据库为选择的语言特征赋予情感值,并将其归纳为六个基本类别(高兴、悲伤、愤怒、恐惧、厌恶和惊奇)[7]。徐琳宏等标注了近4万句,100万字的情感语料库,给出了其情感分布和情感迁移规律等统计数据[8]。佘莉等参照《同义词词林》的结构利用聚类技术进行了词汇扩展,构建了一个包含近6 000个词汇的情感词库[9]。国内情感词典构建起步较晚,目前国内仍没有一部完善的大规模的中文情感词典被广泛认可,而面向音乐情感分类的情感词典几乎处于空白状态。
通过相关学者近几年的努力,目前国内对歌词的数据挖掘也取得了一些成果。陈若涵等采用基于词汇的向量空间模型和层次分类方法研究歌词的情感[10]。郑亚斌等通过实验表明歌词语料库的分布基本符合齐夫定律,利用向量空间模型找到了比较相似的歌词集合,提出了用LRC歌词中的时间标注信息提取歌曲的重复片段、节奏划分等[11]。丁效等通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程,并用最大熵模型解决了事件元素识别问题[12]。
本文以改进后的Hevner情感环模型为情感分类基准,从歌词文本语料库方面着手,利用HowNet中语义相似度计算的思想,构建音乐领域的中文情感词典,然后在此中文情感词典的基础上,借助KNN分类算法的思想,并利用LRC歌词携带的语速信息,提出了一种基于情感向量空间模型的歌词情感分类方法。
2 基于歌词文本的音乐情感分类
本文实验的整体过程如图1所示。
图1 基于歌词文本的音乐情感分类流程
2.1 选择音乐情感模型
不同类型的音乐必定与不同的情感类别相联系,如“快乐”、“悲伤”等。本文选择歌词文本为情感分类的载体,因此,必须设置一个针对文本分析的文本关键字模型作为情感分类的依据。作为文本关键字模型的代表——Hevner情感环模型,具有非常好的研究基础。然而,Hevner并不完全适用于中文情感的分析。因此,本文所选取的情感模型是由刘涛等根据汉语文化背景对原始Hevner情感环模型进行优化的情感模型[13],如表1所列。列1为情感类别,即本文用于情感分类的标签,共8类;而列2~列7为对应每一个类别的情感词汇,即理解为如情感类别“快乐”包括了“欣喜”、“明亮”两种情感。
2.2 构建音乐情感词典
由2.1节可知,改进后的Hevner模型分为两层,本文分别将其称呼为一级情感词汇和二级情感词汇。一级情感词汇为表1中的列1,共8个词,二级情感词汇为表1所有列(二级情感词汇包含一级情感词汇),共47个词。由于以上47个词语都是经过提炼而成的情感类别标签,并不一定适用于歌词文本的分析。正因如此,利用HowNet相似度计算及歌词语料库,本文对原始的47个情感词汇进行了扩展,构造了第三级情感词汇,使其适用于歌词文本分析。实现过程如图2所示。最终,情感词典将情感词汇分为三个级别,情感词汇由词语和情感倾向权值两个特征组成,情感倾向权值为对应的第三级情感词与所属第二级情感词的相似度值。如表2所列的存储结构将情感词汇存储在txt文档中。
表1 改进后的Hevner情感模型
图2 情感词典构建流程
表2 情感词典的存储结构
图3 标准的LRC歌词文档
其中,歌词语料库采用了从搜狗音乐网站中爬取的59 403篇LRC歌词(LRC歌词格式如图3所示),经过如图2所示的歌词处理及词汇提取后得到歌词词汇语料库,用作扩展三级情感词汇的基础数据。之后利用HowNet相似度计算方法计算歌词词汇语料库中每个词语与47个二级情感词汇的相似度值,相似度值范围为[0,1],即每个词语得到一个47维的向量。设置初始相似度阈值threshold,从0.1开始,提取出向量中相似度值大于threshold的对应的词语,用作“实验用三级情感词汇”,在多个小规模样本集中进行分类实验(分类实验方法将在2.3节阐述),分析实验结果并调整threshold,每次增加0.05,至threshold为1。最后,经过以上的多次实验,可以从结果分析得到本实验中最佳的threshold为0.3。至此面向音乐领域的中文情感词典构建完成,该词典共包含情感词汇2 417个,其中8大情感类别的词汇量的分布情况如表3所列。
表3 情感词典中8大情感子类的词汇量分布情况
2.3 构建基于歌词文本的情感向量
本文采用改进后的Hevner情感环模型的8维情感类别“神圣”、“悲伤”、“向往”、“抒情”、“轻盈”、“快乐”、“热情”和“生机”以及歌词的语速信息作为音乐的情感特征向量,共9个维度。该情感特征向量表现为音乐与每类情感的语义(前8维)和节奏强度(第9维)的相似关系。
根据公式(1)计算每一篇歌词的情感特征向量:
其中,Ek表示情感特征向量中第k维的值;Wi表示一篇歌词经过分词处理后的第i个词语;BWk,j表示情感词典中第k维情感子类中的第 j个词汇;bool(Wi,BWk,j)为判断Wi与BWk,j是否同一词汇的函数,是则取值为1,否则取值为0;Qk,j表示BWk,j所对应的情感倾向权重值,即2.2节中构建的情感词典中的情感倾向权值;M表示情感词典中第k维情感子类的词汇数目;S表示该篇歌词经过分词后得到的词语总数;StartTimei表示LRC歌词文档中的第i句歌词的时间标签;WordNumi表示第i句歌词所包含的字数;N表示该篇LRC歌词文档在经过时间标签排序后的句子总数。
通过考虑情感词典的结构信息,给出了公式(1)用于计算歌词的情感特征向量。该方法不是纯粹使用模糊数学上的and,or,not将多个词连接,而是将歌词中所有属于情感词典中每个情感子类中所有三级情感词汇的权重值进行累加,除以词汇的总数得到的均值即为特征向量前8维的取值,再通过计算LRC歌词文档的语速信息值,并赋值于特征向量的第9维。这样综合考虑了歌词情感表达的语义信息和节奏强度信息,增加了隶属该情感类别的可靠性,使得利用情感向量空间模型能够取得更好的分类性能。
2.4 歌词情感分类
本文采用KNN分类算法用于歌词情感分类,每篇歌词的情感特征表示成一个9维的情感特征向量。首先对歌词的情感特征向量进行归一化处理,然后利用KNN分类的思想,对每个测试样例,计算它与所有训练样例之间的情感特征向量的欧几里德距离,以确定其最近邻列表。最后使用多数表决的方法,分别对测试样例进行单标记分类和多标记分类。单标记分类将最近邻中出现次数最多一个类别作为测试样例的类别,多标记分类将最近邻中出现次数最多的前三个类别作为测试样例的三个类别。针对不同规模的样本集进行多次实验。注意,本文进行了两次实验,在2.2节中提到需要进行多次小规模实验,目的是得到最佳的阈值threshold。而最终的歌词情感分类是在情感词典已经构建的条件下进行,即2.2节中在threshold为0.3的条件下构建的情感词典。
3 实验结果及分析
在多次不同规模的实验中,以下是实验结果最优的实验。
(1)数据集为从歌词文本语料库中抽取了情感类别鲜明的LRC歌词文档共169篇,每个情感类别约20篇。
(2)将数据集按1∶1的比例分为训练集和测试集,按照上述歌词的情感分类方法进行单标记分类和多标记分类实验。在以下实验中,当k取值为9时分类效果最佳。实验结果如表4,表5所列。
表4 歌词情感分类——单标记分类测试结果
表5 歌词情感分类——多标记分类测试结果
从测试结果中的分类效果度量值可以看出,本文提出的歌词情感单标记分类器的平均准确率为0.705,查全率为0.705,F1值为0.697;多标记分类器的平均准确率为0.817,查全率为0.825,F1值为0.812。其中多标记分类比单标记的评估参数值提高了11%左右,且抒情、快乐和热情等类别的分类效果较好,在一定程度上实现了以文字为基础的情感分类要求,进一步验证了本文中所构建的音乐领域的中文情感词典在歌词的情感分类上具有较好的性能,能够比较准确地反映音乐领域内各情感子类的情感特征。
同时亦容易发现,神圣、悲伤、轻盈等类别的歌词的情感分类效果不佳,经认真分析整个过程,认为问题在于以下方面:
(1)情感模型。本文构建情感词典所采用的情感模型是改进后的Hevner模型,是将原Hevner模型中的英文词汇翻译成中文的基础上,再针对中国民族音乐进行改进的,而本文的研究内容主要是华语流行音乐,故在歌词的用词特点方面可能存在差异。
(2)情感词典。经过查看情感词典中各类情感词的数量分布,即表3所列,发现词汇的分布出现异常,如“生机”,情感词汇为868,显然高于其他各类的情感词汇数量,直接影响了基于歌词文本的情感向量的构建结果。
(3)基于歌词文本的情感向量。构造过程中暂未考虑词频的影响。
(4)分类方法。本文采用KNN算法作为分类方法,单一的分类器对分类效果存在影响。
4 总结与展望
本文针对歌词领域,提出了一种中文音乐情感词典构建方法及情感分类方法,其中借助了情感模型、歌词语料库、HowNet相似度计算方法,初步实验取得了较好的结果,在一定程度上证明了该构建方法及分类方法的可行性与实用性。该方法可为音乐情感分析研究者提供一种思路,帮助其进行相关的情感分析工作。在以后的研究中将从以下几个方面进行改进。
(1)针对情感模型进行进一步的改进或修改,尝试使用社会标签作为情感分类类别,即普遍认可及广泛使用的一些音乐情感,而非“神圣”、“生机”等过于书面化的词语表达。
(2)针对情感词典的构建,采用人工检查方式去除情感词典中的异常词汇及无意义词汇,研究各个分类的词语特点,优化情感词典。
(3)针对基于歌词文本的情感向量的构建,尝试增加词频及实词词性的影响作用及优化整体构建方法,如针对部分区分度不高的情感词汇,可以理解为该词在多个类别所属的情感词汇中都存在,增加参数用于降低这部分词语的权重,同时提高高区分度词语的权重。
(4)针对分类方法,尝试使用除KNN算法外的其他分类算法,对比不同分类方法的效果。
(5)结合基于音频的情感分析方法,以提高情感分类的准确率。
[1]第31次中国互联网络发展状况统计报告[R].中国互联网网络信息中心,2013.
[2]蒋盛益,李霞,王连喜.音乐情感分析综述[J].计算机工程与设计,2010,31(18):4112-4115.
[3]夏云庆,杨莹,张鹏洲.基于情感向量空间模型的歌词情感分析[J].中文信息学报,2010,24(1):99-104.
[4]董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44.
[5]梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1983.
[6]Subasic P,Huettner A.Affect analysis of text using fuzzy semantic typing[J].IEEE Trans on Fuzzy Systems,2001,9(4):483-496.
[7]Liu H,Lieberman H,Selker T.A model of textual affect sensing using real-world knowledge[C]//Proc of the 11th Int Conf on Intelligent User Interface,2003:125-132.
[8]徐琳宏,林鸿飞,赵晶.情感语料库的构建和分析[J].中文信息学报,2008,22(1):116-122.
[9]佘莉,夏虎,傅彦.音乐评论的情感挖掘研究[J].计算机科学,2009,36(5):172-176.
[10]陈若涵,许肇凌,张智星,等.以音乐内容为基础的情绪分析与辨识[C]//第二届电脑音乐与音讯技术研讨会,中国,台湾,台北,2006.
[11]郑亚斌,刘知远,孙茂松.中文歌词的统计特征及其检索应用[J].中文信息学报,2007,21(5):61-67.
[12]丁效,宋凡,秦兵,等.音乐领域典型事件抽取方法研究[J].中文信息学报,2011,25(2):15-20.
[13]刘涛.音乐情感认知模型与交互技术研究[D].杭州:浙江大学计算机科学与技术学院,2006.
JIANG Shengyi1,YANG Yao2,LIAO Jingxin1
1.School of Informatics,Guangdong University of Foreign Studies,Guangzhou 510006,China
2.Taobao(China)Software Co.Ltd,Hangzhou 310099,China
Among all the applications for China Internet users,instant message has first-largest users,search engine has the second-largest users and the web music has the third-largest users.Web music and its application technology have been popular with academics.Music plays an important role as a communication media in human communication which carries abundant information of emotion.As a result,musical emotion analysis has been paid more attention.During the process of musical emotion analysis which is based on lyric texts,a reasonable musical semantic lexicon will provide a more accurate result.This paper is about how to build a Chinese musical emotional lexicon which is based on the improved model of Hevner emotional ring model and the semantic knowledge resources provided by HowNet and a text corpus of lyrics. Also it realizes a method of lyric emotional classification with the help of emotional VSM,emotional lexicon and lyrics speed.The experiments show that the Chinese emotional lexicon built here is more suitable in the area of music than the lexicon built by manual.
Chinese emotional lexicon;musical emotion analysis;Hevner emotional ring model;HowNet
作为仅次于及时通信和搜索引擎的中国互联网网民第三大应用,网络音乐及其应用技术受到业界学者的青睐。音乐作为人类最重要的交流媒介,携带着丰富的情感信息,计算机音乐情感分析更是得到人机情感交互技术领域的高度重视。在基于歌词文本的音乐情感分析过程中,一部合理的音乐领域情感词典,将提供更加细致、更加准确的分析结果。以改进后的Hevner情感环模型为基础,借助HowNet所提供的语义资源和从网络爬取的歌词文本语料库,构建了一部树形层次结构的音乐领域中文情感词典,并利用LRC歌词携带的时间标签获取歌曲的语速信息,实现了基于情感向量空间模型和情感词典的歌词情感分类。实验表明与人工构建的情感词典相比,所构建的情感词典更适用于音乐领域。
中文情感词典;音乐情感分析;Hevner情感环模型;知网
A
TP311
10.3778/j.issn.1002-8331.1305-0147
JIANG Shengyi,YANG Yao,LIAO Jingxin.Research of building Chinese musical emotional lexicon and emotional classification.Computer Engineering and Applications,2014,50(24):118-121.
国家自然科学基金(No.61070061);教育部人文社会科学青年基金项目(No.12YJCZH281);广州市越秀区科技计划项目(No.2012-TP-005)。
蒋盛益(1963—),男,博士,教授,主要研究方向:数据挖掘、自然语言处理;阳垚(1991—),女,本科,主要研究方向:数据挖掘;廖静欣(1990—),女,硕士研究生,主要研究方向:数据挖掘。E-mail:jiangshengyi@163.com
2013-05-14
2013-06-29
1002-8331(2014)24-0118-04
CNKI网络优先出版:2013-09-04,http∶//www.cnki.net/kcms/detail/11.2127.TP.20130904.1344.015.html