音乐情感认知模型与交互技术的思考

2018-05-14李璐

北方音乐 2018年13期

关键词：交互技术

李璐

【摘要】识别音乐特征是建立情感认知模型与交互技术的基础工作，本文由此出发分析了音乐情感认知模型的特点，随后介绍了音乐情感特征识别技术，包括音乐文件格式、主旋律识别、乐段分割等方面，希望能给相关人士提供一些参考。

【关键词】音乐情感；认知模型；交互技术

【中图分类号】J605 【文献标识码】A

一、音乐情感认知模型的特点

以计算机为基础的音乐情感认知模型是通过建立模型来对音乐中的情感内涵进行自动识别，其中的基础性工作就是建立能够满足音乐情感认知需求的心理模型，例如，以维度形式为主的Thayer模型和以离散形式为主的Hevner模型。Hevner模型是将一种环形作为反应情感、情緒和象征心境的符号。在逻辑情感上，每一个环节都会和与相邻的前后环节存在一种递进关系，在理性情绪中可以自由地变化，过渡到和它相邻的前后情感中。Thayer模型则是用紧张和活力这两种维度来表示情感变化。活力维度就是从描述活力满满到疲乏的不同反应，这种维度和认知活动以及个体的生活理性具有较多的联系。

二、音乐情感特征识别技术

（一）音乐文件格式

经常使用在我们日常生活中的音乐文件格式主要有三种形式，分别是模块文件、音频文件和MIDI文件。这三种文件具有以下几种特点。音频文件主要是通过波形的采样数据将真实声音记录下来，但记录下来的真实声音具有较大的差距，因此，需要通过数字音频进行特殊的处理，在切分检测音符时通过线性预测、同态、频域、时域编码等方式来进行，如此才能将音频中音强、音长、音高等特征完整地保留下来。要想精确地提取出音乐特征是十分困难的，会使接下来的特征识别产生较多的误差积累。MIDI是一种描述语言的文件，里面存储着可供各个音轨使用的音乐播放内容和相关乐器，它的音乐播放器是用来播放并解释声音，实质上也是以音乐特征为基础的音乐格式，在其对音乐进行分析时，我们能够从文件中直接看到各种基本特征。模块文件只是一个总的称呼，随着实际编码方式的不同又可以划分为多种格式。在提取旋律时需要以编码格式为基础，根据不同格式进行科学的处理，通用性较差。

（二）主旋律识别

人们是通过识别主旋律来认知复杂音乐的，在欣赏带有伴奏并且具有较多声部的音乐时，一般情况下都能将伴奏部分和主旋律分辨出来，并且会在心中将主旋律主动记忆下来。对于计算机来说，在分析音乐时，识别主旋律的任务包括主旋律乐段识别和主旋律音轨识别两方面。识别音乐特征和乐段的前期基础工作就是通过对主旋律的音轨进行定位来抽取MIDI多音轨音乐的音轨旋律。主旋律内容就是将旋律的摘要信息提取出来，这是在探讨检索交互式音乐中能够促进用户疲乏感降低的有效措施，通过将主旋律中具有代表性的乐段抽取出来能够作为主旋律的代表，能够在最短的长度内，将音乐的特征展示出来。现代的各种音乐领域中也广泛使用了主旋律的提取技术，主要应用于以音乐特征为基础的舞美控制，和以音乐内容为基础的音乐喷泉、动漫游戏、人机交互和音乐检索中，是在工业化音乐产品中所使用的基础工作。由于MIDI文件没有制定通道和音轨的使用规则，因此，主音轨的选择是由相关创作者来自主决定的，没有可以遵循的规律。在判断主音轨时可以参考MIDI文件中的说明，有的可以找到音轨的实际分配情况，从而发现主音轨的存在。

（三）乐段分割

曲子是由数个段落组成的，乐思表现较为完整的段落就是乐段。对乐段进行准确分割是促进音乐表达和解释音乐内涵情感的前提基础，也是构建音乐情感化自动数据库的基础性工作。对乐段进行分割最简单的方法就是对小节进行固定的方法，对于西方音乐较为规则的曲式结构来说具有极高的准确率，但划分的结果就较为固定死板了，在情感表达方面也存在不足之处，还不能有效划分长音中出现跨越小节的旋律或是长音中出现起弱拍的旋律。以曲式分析理论为基础的乐段分割手段具有使用灵活的特点。曲式结构中最小的就是乐段，带有独立的语义情感，最长可以达到数十小节，最小在几小节的范围内。从曲式的相关分析理论中可以了解到，对段落进行划分的主要标志就是句读，具体的识别规则包括使用和声的不同终止式、改变音响的力度、改变音区、停留在长音上面、使用时间较长的休止符、改变速度等。

三、结语

综上所述，音乐情感的研究工作一直是音乐学的研究重点，以计算机为基础的音乐情感认知模型和交互技术依然是当今计算机音乐领域的研究重点。

参考文献

[1]柏俊杰.多模式交互音乐感知关键技术与实验研究[D].南京：东南大学，2017.

基金项目：2016年江西高校人文社会科学研究项目“计算机视角下的音乐情感识别”（项目编号：JC162006）。