论音乐信号处理对声乐演唱评价的辅助作用
2014-04-23黄阿罗
黄阿罗
摘要:本文通过对音乐信号处理的意义和音乐信号处理应用的可行性分析,提出了具体的声乐特征提取方法,阐明了声乐特征能量提取后的对比办法,用更加量化的方式观察人的发音方式,旨在将此方法具体运用在辅助声乐演唱评价上,进而帮助声乐演唱和教学活动。
关键词:音乐信号处理 声乐演唱评价 辅助作用
众所周知,在目前的声乐演唱评价体系中以主观评价为主,老师或评委的主观意见为绝对权威,声乐教学中也采用的是传统的言传身教的教学模式。但随着文化环境的多元化,音乐的风格多样化,表现形式越来越丰富,且人们的审美日趋个性化,对音乐的理解更加多面性,特别是在某些特定的场合,比如声乐考试和歌唱比赛中,常常需要对一些音乐呈现作出一定程度的客观评价和分析,即使用声音的物理指标来评判声音以弥补传统评价方式中过多主观意见带来的疏漏。作为一种特殊的语音信号,音乐信号分析能够和信号处理中的许多方法较为紧密的联系起来,从而运用到声乐评价体系中,可以对此起到必要的辅助作用。下面本文就将具体阐述音乐信号处理的意义、应用的可行性及如何将信号处理方法运用于声乐演唱的评价活动中的方法。
一、音乐信号处理的意义
音乐信号处理是在传统信号处理基础上成长起来的,在过去的二十年中,用计算机研究音乐主要是基于音乐符号的,其中具有代表性的是MIDI电子音乐。但是,随着数字音频的出现和计算机处理能力的增加,研究的重点现在逐渐转变为对音乐信号的分析处理上。在歌唱表演中,漂亮的音色是声乐表达的灵魂,如果能够研究好灵魂中的实质内容,对我们评价音质的好坏有量化性的作用。因此,从音频波形中提取出具有实际意义的信息是非常有意义的,也非常适合用信号处理的方法来加以实现。但是,当处理如语音、音乐这种特殊的音频信号的时候,理解和应用相关的性质是十分重要的。比如,研究相关问题时,我们要从听觉特性、语言特性以及音乐特性上进行更为深入的分析。在音乐信号处理上,我们要将其诸多的性质利用起来,诸如表现形式的多样性,各种声源的协调性以及一些固定的模式和旋律上所携带的信息。利用好了这些先验信息,我们就能更好的分析音乐信号。
二、音乐信号处理应用的可行性
在音乐信号处理应用中,实验性音乐一直和信号处理方法的创新性应用息息相关,并已延展到声音合成和修剪当中。文献中指出,对音乐信号分析通常是从以下几个维度分别进行的,如音高、和声、旋律、速度、节奏、韵律以及音色。其中,对音高、和声、节奏的分析已经有了较为成熟的方法。音乐信号被定义为一系列基本频率倍数的正弦波信号的叠加,每一个音符都会在一个特定的音高上给听众一个单一特别的感受,因此,音高是音乐的基本要素,根据音乐信号的特点,可以通过短时傅里叶变换获得音乐信号的时频特征,根据该特征可分析出音乐信号中音高及和声的变化特点。节奏可看作推动音乐向前的一系列稳定的信号,可以被描述为在时间上按照一定规律分布的脉冲信号,而速度则是跟这个信号相关联的。速度和节奏在理解音乐中起着重要的作用,同理,我们也可利用短时傅里叶变换后的所得到的随时间变化的频谱求取这一规律变化的脉冲信号,故我们可将前后频谱做差分运算,以而捕获音乐信号中音高频率的突变点并得到音乐信号中速度、节奏的变化特点。
以上对音乐信号的分析都有较为成熟的方法和流程,本文所要做的主要工作是分析声乐信号的泛音、音质特点,即发声音色特点中的一部分,后文统称为声乐演唱的音色特点,并将其创造性地应用到声乐训练、评价当中。音色的客观定义是能够区分两个响度和音高都相同的声音的特征,这种特征主要是由基音频率的谐波带来的。本文主要设计了一种能够量化分析发音质量好坏的方法,并且,为了能够更好的符合人的听觉响应特性,我们利用梅尔频率对谐波频率进行分析,进而更好的分析声乐音色特征的差异。
为比较不同发声间的差异,本文设计了基于梅尔频率的滤波器组,对不同频段的声乐演唱信号进行提取分析,并提出了相异声乐特征向量,由此来反应两组发音之间声乐音色特征的差异,与优秀发音之间做对比,可量化的评判发音的质量,进而应用到声乐评价及训练当中。接下来我们就具体介绍音乐信号处理在声乐评价中运用的方法。
三、声音信号的提取方法
我们在音乐信号处理运用到声乐演唱评价中采用的是声音信号特征的提取方法。如图1所示,该评价系统分为两个部分,第一部分是对一些模板音乐信号进行特征数据提取学习,作为评价时候的参考模式。例如,我们可以将国际上最优秀歌唱家不同音高的发音进行特征提取训练学习,存储到参考模式当中,作为评价过程当中的备选模式。第二部分是对需要评价的音乐信号进行特征数据提取,并在参考模式中选取音高相同的模式进行特征对比,找出音色特征中泛音、饱满度等声乐特征的差异,从而给出相应的评分。本文所采用的样本数据是从专业艺术院校声乐专业各年级各种程度的学生演唱的相同片段。与参考模式相近,即与著名歌唱家声乐音色特征相近的得分较高,反之则得分较低。
在搜集到相关数据后,我们做了一个更接近实际的应用处理流程来提取声乐演唱中的音色特征。其流程如图2所示:
下面给出该框图的简要解释。和语音信号的预处理相类似,音乐信号也要进行预加重分帧的处理。为了去除口唇辐射对发音的影响,因而首先对输入音乐信号高频分量进行预加重处理。此后需对采样所得信号进行分帧处理,需要合理选择帧长和帧步进。
在对声乐信号频谱分析当中,为了尽量改善频率泄露的情况,通常需要对分帧后的信号进加窗处理。之后为了提取音乐信号的频率特性,则对加窗后的信号做快速傅里叶变换得到音乐信号的频谱。当我们演唱一个特定音高的音符的时候,除了在基频处会产生一根谱线外,在频谱上的其他部分也会分布的复混合频谱。这些部分的谱线的能量构成了我们发音的共鸣、泛音的特征,因此,通常我们只对信号的幅度特征感兴趣,故将其取平方后得到与能量特征相关的功率谱。endprint
Stevens等人基于彼此等距的听众对音高的感性判断,提出了梅尔刻度。研究表明该刻度与人耳的听觉特性能够很好的拟合,为了更好的度量不同音色带给人的听觉效果,故本文采用梅尔刻度对不同频率进行量度。我们将人耳建模为一组滤波器组,对不同频率具有选择特性,根据梅尔刻度,我们可以设计一系列三角滤波器组模拟人对不同频率的感知情况,根据梅尔刻度,我们设计截止频率和中心频率都不相同的三角滤波器组。将不同组的梅尔滤波器对由不同数据帧求得的功率谱密度函数进行滤波处理,得到经过相应滤波器组滤波后的功率谱,对其求和后,提取不同中心梅尔刻度下音乐信号的能量,该过程即对采样音乐信号做了平均处理的作用。根据信号的特征能量与样例特征能量进行对比,可以得出不同梅尔滤波器组所提取到的样例能量差别。在声乐信号分析当中,可提取其梅尔特征能量与要达到的目标音色进行对比分析,对演唱者的音色特征进行评判。评分过程中,可根据与模式中样例特征能量的平均差别来进行评判。
通过以上分析,阐明了声乐特征能量提取后对比办法,根据上文中描述的分析过程,可有效的对比不同声乐信号的特征能量向量之间的不同,用更加量化的方式观察人的发音方式,更好地进行客观评价,并能在一定程度上纠正人发声方面的缺陷。
四、结语
使用一些较为成熟的信号分析方法,可以有效量化分析音乐信号,使得人们不光能从感性的角度感受音乐带来的美妙体验,也可从理性的角度看待支撑这些特征背后的数字信息。这样不仅能够使得人们欣赏音乐的角度多元化,也使得在音乐教学和评比当中能够有更量化的分析、评价工具,用以对不正确的发声方式进行一定的客观评价。将信号处理方法应用到音乐信号分析尤其是声乐演唱中是一个较新的研究方向,在多个学科的积极合作和努力探索下会将会慢慢形成更加成熟和运用广泛的成果。
注:
文中所涉及的实验数据结果由电子科技大学硕士生李莽提供。
基金项目:
四川省教育厅资助科研项目(项目编号13SB0035)。
参考文献:
[1]Daniel P·W·Ellis,Anssi Klapuri and Gael Richard.Signal Processing for Music Analysis[M].IEEE Journal of Selected Topics in Signal Processing,Oct.2011.
[2]C·Roads.The Computer Music Tutorial[M].Cambridge,MA: MIT Press,1996.
[3]M·S·Puckette.The Theory and Technique of Electronic Music[M].Singapore: World Scientific,2007.
[4]R·Parncutt.A perceptual model of pulse salience and metrical accent in musical rhythms[M].Music Percept,1994.
[5]R·Zhou,M·Mattavelli,and G·Zoia.Music onset detection based on resonator time frequency image[M].IEEE Trans.Audio,Speech,Lang.Process,Nov.2008.
[6]A·J·Eronen and A·P·Klapuri.Music tempo estimation with k-NN regression[M].IEEE Trans. Audio,Speech,Lang.Process,Jan.2010.
[7]M·Goto.An audio-based real-time beat tracking system for music with or without drum-sounds[M].J·New Music Res,2001.
[8]M·Alonso,G·Richard,and B. David.Accurate tempo estimation based on harmonic noise decomposition[M].EURASIP J·Adv·Signal Process,2007.
[9]A·P·Klapuri, A·J·Eronen,and J. Astola.Analysis of the meter of acoustic musical signals[M].IEEE Trans.Audio,Speech,Lang.Process.2006.
[10]J·Paulus, M·Müller,and A. Klapuri.Audio-based music structure analysis[M].in Proc. 11th Int.Conf.Music Inf.Retrieval (ISMIR),Utrecht,The Netherlands,2010.endprint