基于稀疏表示的语音感情计算研究
2018-12-18金升菊
金升菊
摘要:语音情感计算是人工智能领域中语音识别研究主要问题,也是社会计算中一个前沿的新兴交叉学科问题。该文主要讨论机器学习稀疏表示在语音情感计算中的应用问题。在国际公开的语音情感数据库上研究了语音情感特征提取和识别算法,同时还讨论语音情感识别技术应用问题。实验结果表明,该文建议的稀疏表示语音情感识别算法较传统的稀疏表示具有较大竞争力。
关键词:感情计算;语音;稀疏表示;范数
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)26-0171-02
1 概述
情感是否可计算属哲学终极问题,其衍生的情感能否计算?如果能,那么计算什么?如何计算?计算方法是否可行可靠?计算结果有何价值等等一系列问题[1]。虽然部分学者认为情感是人体专有的属性,但是随着人工智能的发展越來越多学者更加倾向于认同情感是可以计算的[2]。在情感计算对象、计算方法、计算方法可行性可靠性以及计算结果价值等都有着广泛的研究[3-7]。
情感计算属自然科学与人文社会融合交叉的新兴领域,融合了数学、统计学、数理逻辑、计算机科学、神经科学以及哲学、心理学、认知科学、法学、社会学等学科知识。情感计算的奠基人Minsky认为通过计算算法可以将人的生理、表情、语言、姿态以及文字表达的情感进行测量与处理。也可以理解为情感计算是研发能感知、识别和理解人的情感并再进一步根据情感做出智能、灵敏、友好反应的软件系统,让计算机拥有如同人类一样拥有观察、识别和理解情感并做出相应的决策。
目前为止,情感计算的对象可以分为人脸表情计算、人体姿态分析、语音情感和文本情感等。人脸表情计算通过对不同情感状态的人脸特征进行分析和识别,从而确定人的情感状态,语音情感计算通过提取语音情感特征相关参数从而设计出情感分类器分析语音的情感,主要应用于情感语音的合成方面[8-9]。人体姿态情感计算通常分为手势和身体姿势的情感识别,用于仿生代理或者机器人设计。基于文本分析的情感计算,又称文本情感分析(Sen?timent Analysis)是指利用自然语言处理和文本挖掘的相关技术识别出文本所带有的情感倾向的过程。虽然人工智能已经高速发展,但目前为止计算机只能识别“说了什么”, “谁说的”和“怎样说”也有着部分研究成果,至于“带着什么情绪说的”以及“话中需要表达的更深一步蕴意是什么”。研究“带着什么情绪说的”属于语音情感识别内容。
2 稀疏表示
稀疏表示是一种通过基本信号的线性组合来表达大部分或者全部的原始信号的方法。其中,这些基本信号被称作原子,是从过完备字典中选出来的;而过完备字典则是由个数超过信号维数的原子聚集而来 [10]。可见,任一信号在不同的原子组下有不同的稀疏表示。假设一个[M×N]的矩阵表示数据集[X]由[M]个数据样本构成,每个数据样本的维度是[N];表示为[X∈RM×N],其中[Xi∈RN]。在文本情感计算中,通常情况下[X]是稠密的,也即是即[Xij≠0]。 稀疏表示的基本含义是寻找一个系数矩阵[A∈RK×N]以及一个字典矩阵[B∈RM×K]使得[BA]尽量逼近[X],且[A]尽可能的稀疏,A便是X的稀疏表示。假设[RN]中存在[L]个子空间,第[j]个子空间的维度为[dj],相应的数据子空间表示为[Sj]。现假设用[Q=[q1,q2,…,qL]]表示相应的子空间集合。
3.3 语音情感计算结果
在柏林EMO-DB德语情感语音库的535个样本中,本文对7中情感状态进行综合实验,实验结果如表2所示。
在535个测试样本中,平均识别率为94.95%。
4 结束语
本文通过稀疏表示算法在国际公开语音情感数据集柏林EMO-DB德语情感语音库的535个样本进行了实验,达到了平均94.95%的情感计算结果。虽然取得一定成果但仍存在不足,例如实验数据集虽然国际公开但仍较微小,下一步将引入更大的数据集进行实验,同时在稀疏表示上进行优化以提高语音情感计算效果。
参考文献:
[1] 李佳源.情感计算的研究现状与认知困境[J].自然辩证法通讯,2012,34(2):23-28+125.
[2] 张迎辉,林学誾.情感可以计算——情感计算综述[J].计算机科学,2008(5):5-8.
[3] 赵力,黄程韦.实用语音情感识别中的若干关键技术[J].数据采集与处理,2014,29(2):157-170.
[4] 韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50.
[5] 王薇,杨丽萍,魏丽,刘艳.语音情感特征的提取与分析[J].实验室研究与探索,2013,32(7):91-94+191.
[6] 李书玲,刘蓉,张鎏钦,刘红.基于改进型SVM算法的语音情感识别[J].计算机应用,2013,33(7):1938-1941.
[7] 黄程韦,赵艳,金赟,于寅骅,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112-116.
[8] 赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432.
[9] 林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007(1):90-98.
[10] 周志华,机器学习[M],北京:清华大学出版社,2015.
[通联编辑:梁书]