音色调节的讨论
2020-12-16徐世和吴宗汉
徐世和,吴宗汉
(1.原美特科技(苏州)有限公司,江苏 苏州 215131;2.东南大学 物理学院,江苏 南京 210096)
一些有关音色调节剂及利用涂音色调节剂而测得的二次、三次谐波失真变化的实验报告的结果,被作为改变“音色”的佐证。在电声学中,描述一个“音”的特性主要包括响度、音调和音色3 个因素。尽管还有其他影响因素,但包括这3 大因素是公认的重要因素。本文以扬声器为中心,讨论音色调节的有关问题。
1 音色和谐波失真
1.1 音色的定义
在《电声词典》中,“音色也称‘音品’。人们在主观感觉上借以区别具有同样响度和音调的两个声音的特性[1]。它是一种复杂的感觉,主要决定于声音的波形,但也同响度和音调有关。因此一个录下的声音用不同响度级重放时具有不同的音色”。这个定义表明,音色是一个主观感觉到的和物理量相关的特性。
在百度百科上,“发音体的振动是由多种泛音组成的,其中有基音和泛音,泛音不同,决定着某一个特定的音色。音色比喻为‘调色盘产生的东西’,其种类几乎无穷无尽的。能直接触动听觉感官。一般来说,人们和其他动物区分音色的能力是‘本能’,音乐的音色分为人声音色和器乐音色”。
其中,基音即基频,泛音即谐波,第一泛音就是二次谐波,第二泛音就是三次谐波……。研究音色可以发现,随着对一些信号的量化,人们对音色的研究不断深化。尤其是一些研究者对发音体(包括人声、器乐声等)中人声的研究,发现了不同歌手音色的不同和他们声音中的谐波(泛音)有着密切关系。谐波(泛音)的种类和多少决定了音色。
一方面,音色与谐波结构有关。在谐波结构中,最简单的是“纯音”。若只有“纯音”,则表示音色“清”“淡”“单薄”。谐波(泛音)越充分,声音越饱满。低频谐波(泛音)越充分,声音听起来越厚实、越有力。而高频谐波(泛音)越充分,声音听起来则穿透力越强,越来越“亮”,越来越“尖”。若是高、低频都有且合理分布,这就是比较完美的声音。在器乐中,若出现谐波频率不是基频的整数倍时,音色就会混乱。
另一方面,音色也与时间结构有关。音色与声音的建立、衰减方式、表现状态(如颤音)以及持续时间有密切关系。
音频解析过程可以通过仪器来测量,即是可以量化的,实际操作中多利用频谱仪来进行。它的解析过程:一般取连续采样点4 096 个,考虑到音频文件一般的采样率是44.1 kHz(采样率一般指采样频率,也称采样速度,是指每秒从连续信号中提取并组成离散信号的采样个数,用赫兹(Hz)来表示),所以取1/10 s 之内的数据,然后对这4 096 个点作快速傅里叶变换(Fast Fourier Transform,FFT)得到频谱图。频谱图的信息是4 096 个点,每个点对应的是该频率上的振幅,如图1 所示。
图1 是对一位歌手的实测频谱图。频谱图是某个时间点上(严格的说是在1/10 s 中的平均值)各个频率声音的分布情况。但是,频谱图只能描述某个时间点,不能表达一段时间内的情况,所以把频谱图连续画到一张图上即声谱图,如图2 所示。
图2 上方为声谱图,下方为频谱图。若把下方的频谱图逆时针方向旋转90°,使其基线和上方声谱图的黄线平行并置于相应的4:14.5 处,则更有助于理解。频谱图和声谱图是观察谐波(泛音)的最好方式,也就是对音色观察的最好方式,常用于衡量歌手音色,且对乐器声音音色的衡量也是有效的方法。从这个意义上讲,音色经过解析后可以得到一些量化的结果,即在一定程度上把主观感觉到的物理量用测量结果表现出来,尽管尚未达到完全量化的水准,但可以实现将主观感觉和实测结果相关联的目的。
管善群的《电声技术基础》1-3-1 节中,对此又作了进一步讨论,尤其是对声音信号的声色电声设备的线性与非线性要求(注:管善群的《电声技术基础》中用的是“声色”)。书中写道:“不同的人或不同的乐器在发同一高音时,人们会感到它们的‘声色’不同,这是由于它们的基频频率相同而其他频率分量的有无和大小比例不同的缘故。从时间特性的角度来看,就是它们的波形具有相同的周期,但具体形状不同的缘故,对于那些连续谱的无调声也有类似的声色问题。”[2]这里又提出,不仅谐波(泛音)的种类和多少决定了音色,而且波形的具体形状的区别对音色也有影响。
H·F·奥尔森的《声学工程》的音色一节中提出,描述音色还需要颤音、持续时间、成长和衰变等因素[3]。百度上认为,影响音色除了频谱,影响音色的因素中波形的具体形状的区别对音色也有影响。这里有一个很重要的特征参数——包络(envelope),如图3 所示。图中的红线即一段声音信号的包络,横轴为时间,纵轴为幅值,描述的是声音随时间的变化。
最常见的包络模型是ASDR,这4 个字母对应的是模型中的4 个主要参数(Attack、Decay、Sustain、Release)的首字母,如图4 所示。其中,起音(Attack)是指声音从开始发出到达到最大音量所需的时间,衰减(Decay)是指声音达到最大音量后衰减至保持音量所需的时间,保持(Sustain)是指声音衰减后保持音量的大小;释音(Release)是指保持结束后声音从保持音量降到零所需的时间。4 个参数不一样,相同的音听起来也会不一样,这就是奥尔森一书中讲的“……持续时间、成长和衰变”[3]。
以上讲述了决定音色特征的一些参数,主要包括频谱、声谱、谐波数和谐波形状(包络)等。其中,频谱和包络,一个对应频域,一个对应时域。对音色的理解和研究本质上就是寻找更多特征参数和子特征参数的过程。想要找出核心的(子)特征参数并不容易,目前人工智能也正在被用于这方面的工作。2018 年《Nature》上发表了人类对于各种音色的快速识别能力的文章,但人工智能想要达到“人的智能”还有很长的路要走。
1.2 谐波失真的定义
在《电声词典》中,“谐波失真也称谐波畸变。信号通过传输系统时产生许多新的高次谐波分量的失真形式。用这些新增加的谐波分量的有效值和输出总信号的有效值之比来描述。它可以指二次谐波失真、三次谐波失真等。如果指所有谐波失真,为了更明确应称为总谐波失真”[1]。众所周知,喇叭的失真包括非线性失真(包括谐波失真和互调失真)和瞬态失真。互调失真是两种不同频率的信号同时加到喇叭上互相调制时引起的,会造成音调上的失真。互调失真较大时,会使合唱拍手等重放音质显著变坏。瞬态失真是由于扬声器的振动系统跟不上快速变化的电信号而引起的输出波形失真,与频率响应曲线的平滑程度有关。在振动板的每个共振点(相当于频响曲线的峰谷处),这种失真更为严重。
下面着重讨论谐波失真。谐波失真的原因主要有3 个方面。第一,一般由扬声器磁场不均匀引起谐波失真。在喇叭的磁回路间隙内,不仅只有铁片厚度对应处存在环形磁场,事实上外部同样存在磁场,因此磁场存在着不均匀性,故线圈在间隙内运动会引起一定的失真。第二,由振动板系统的非线性畸变引起谐波失真,通常在低频时产生。因为低频时振幅大,弹波等容易产生非直线性畸变。第三,非基频整数倍的谐波。由于音圈纸盆锥体的非线性在中频范围内会非常明显地出现分谐波,即外加频率的1/2、1/3、…、1/n等频率分量也会产生在非线性系统内,叫做分谐波失真。分谐波会发生在声源、线路(放大器)以及扬声器等诸多方面。本文着重讨论扬声器,其他方面从略。
杨定军在《YD300—2 纸盆扬声器的分析和改进》中,较详细地测量和分析了分谐波(工程上称为半音、半双音)[4],提出“所谓半双音问题是指给扬声器输入标称功率的正弦信号时,在某些频率上人们听到了一种不谐和音,有人称之谓怪音,这种非机械碰撞所产生的不谐和音人们一般称之半双音。我们的任务是分析这种怪音的频率成分,探讨其产生机理,最后达到减小并消除的目的。实际上,这种半双音的存在还有人的听觉可感度的问题,对于一个半双音,有的人感觉敏锐,有的人就不那么敏锐,有的人认为不能忍受,有的人认为可以忍受,深入研究的结果不可避免地要牵涉到生理声学及心理声学等内容”。文中又作了实测,“以l#样品为例,由于使用积压部件半双音比较严重,经过标称功率的纯音试听,按有关技术人员的听音标准,在568 Hz、634 Hz、1 839 Hz、2 525 Hz 处有可感觉到的半双音存在。通过实验,在568 Hz 处,标称功率的信号电压(约8.9 V)的输入,扬声器所产生的声音,主要为568 Hz,我们标之为fl,同时,在50 dB的记录纸上显示出fl/2,1.5fl,2.5fl,3.5fl,4.5fl和2fl,3fl,4fl,5fl等频率成分存在”[4]。还有,“测量结果证明这种怪音中确实存在着半音及其奇次谐波的成分,当然存在着基音的倍频的成分是大家熟知的事。对照频率响应曲线,568 Hz 和634 Hz正在中频谷点处,半音的存在说明了纸盆锥体刚性的不够。实验证明1 839 Hz 和2 525 Hz 处的半音不仅与纸盆的刚性有关,而且和纸盆折环处的振动状态有关,使用分辨力较高的激光全息照相术来分析此时的振动状态是有意义的”[4]。
但在实际工程中,大振幅时一般由扬声器磁场不均匀引起的谐波失真往往是二次谐波失真。要解决它往往是从磁路设计上寻求有效方法。对于粘在纸盆錐部防尘帽下的封闭空气以及定芯支片和盆架间的封闭空气,由它们的空气弹性的非线性特点引起的往往也是二次谐波失真。要解决它往往是不让空气处于封闭状态的思路来寻求有效方法。在大振幅时,对于支撑系统的非线性产生的谐波失真往往是三次谐波失真。根据听觉心理学和实际听觉的感受可知,人耳能承受较大的二次谐波失真值,而无法忍受相同量级的三次谐波失真值。分谐波失真在中频范围内非常明显,是音圈纸盆锥体的非线性引起的。若出现谐波频率不是基频的整数倍时,音色就会混乱,因此应该注意。简言之,谐波(泛音)的种类、多少以及波形决定了音色。分谐波对音色有重要影响,而谐波失真则是信号通过传输系统时产生许多新的高次谐波分量的衡量,也是频率响应特性中的部分特性。
2 扬声器中所谓的“音色”和谐波失真
所谓“音色”是作为自身发声的发声体(人或乐器等)发出具有有别于其他发声体的有自已特性的声音,所以“音色”表征的是人或乐器等所具有的自己声学特征表现。所谓通过测量二次、三次谐波失真就能测量扬声器中的“音色”,应是值得商榷的概念。因为扬声器(包括音响系统)本身不是一个自己发声的发声体,而是一个重放系统,也就是作为一个放声系统,希望它是一个没有畸变的放声系统,应该力图使重放信号具有原信号的各种特性,即它应是一个具有高保真度的系统。它的信号随着输入的原信号而变化。它的原信号包涵哪些信号、哪些谐波,则希望重放系统能够无畸变、不失真、保持原信号特征重放出来[1]。因此,它并不像发声体有自已特性的声音,只是传输并保持外来输入原信号的特征。信号通过传输系统时,有时会产生许多新的高次谐波分量,这就是失真。讨论时会用这些新增加的谐波分量的有效值和输出总信号的有效值之比来定量描述,即谐波失真。由此可知,并没有所谓通过测量二次、三次谐波失真就能测量扬声器中的“音色”。评价它(高保真系统)的主要技术特性是频率响应、谐波失真和信噪比(或动态范围)等。下面从扬声器纸盆结构上进行相关讨论。
2.1 扬声器纸盆的杨氏模量
扬声器对纸盆的要求在王以真编著的《实用扬声器工艺手册》己经写出[5]。从该书第74 页的表格可知,若希望扬声器的灵敏度较高,则纸盆的质量要小(密度ρ要小);若希望扬声器的失真低、线性好,则纸盆的刚性要高、内阻尼要大;若希望扬声器的频带宽,则纸盆的比弹性率E/ρ要高、几何形状良好;若希望扬声器的频率响应均匀,则纸盆的几何形状要良好、内阻尼适当。
对于在振动盆上涂敷音色调节剂,这里需要先分析材料的杨氏弹性模量。现在世界上90%的锥形盆都是由植物纤维(纸质材料)材料制成的,在《扬声器纸盆复合强化及其测量讨论》一文中有详细阐述[6]。
讨论刚性,实际上就要讨论其杨氏(弹性)模量。对于杨氏模量E,有些书上清楚地把其定义为纵向的应力和相应的伸长(应变)的比,即:
在材料特性研究中,常用到μ(泊松比),表示为:
上述的讨论都是以静态情况为基础的,也就是E是静态的数值,测量方法也往往是用静态确定的。实际使用中应该考虑动态的情况,且任何一种材料都可看作由一个弹性系数E的弹性元件和一个粘性系数为η的粘性元件并联而成,其总应力σ中应包含σE、ση两部分,而总应变ε中应包含εE和εη两部分,由此可求得理论上的E值。这在许多动态法测量中常常应用。
简言之,可以认为:
式中,E*为动态弹性模量,E'为静态弹性模量,E''为由于损耗而存在的模量值(粘滞项)。设损耗角为θ,则有:
需要说明的是,对一些弹性材料也会存在应变与应力相位不同而出现滞后现象,有的还会出现滞后的回线。这种现象的出现与损耗有关,但产生相位差的原因不完全是损耗。因此,损耗角的表示应为更好,以有别于应变与应力的滞后现象造成的相位现象。涂敷音色调节剂后,纸盆材料就成了具有音色调节剂和纸盆纸质基材的复合材料。从该复合材料的杨氏弹性模量开始进行分析,E*(动态弹性模量)、E'(静态弹性模量)和E''(由于损耗而存在模量值也就是阻尼项)都会发生变化,使得振动特性和谐振特性都有相应的变化,解释了涂敷音色调节剂后出现的变化[6]。此外,《扬声器纸盆复合强化及其测量讨论》一文还讨论了在纸浆中掺入其他成分材料后形成的复合材料的相关特性,特别是其杨氏模量的计算和测量的问题,对深入讨论纸盆涂敷后的情况具有参考意义。
下面对涂敷音色调节剂从材料的粘弹特性上进行分析。纸盆(尤其是涂敷了胶质材料的纸盆)、橡胶和其他不少工程材料一样,既具有弹性性质又具有黏性性质。这种兼具弹性性质和黏性性质的材料称为黏弹性体。在外力作用下,黏弹性体产生弹性变形,且变形随时间而变化,因此用弹性力学方法研究黏弹性体不能反映实际情况。黏弹性理论与弹性力学的主要区别在于应力-应变关系不同,因此粘弹性体的应力-应变关系是黏弹性理论的主要研究内容。黏弹性体具有的主要特征与频率(与温度)有关。频率高(或温度低)到一定的程度时,它呈玻璃态,失去阻尼性质;低频(或高温)时,它呈橡胶态,阻尼很小;只有在中频(中等温度)时,阻尼最大,弹性取中等值。在这里讨论纸盆时暂不考虑温度的因素。
3.3 声重放系统所谓“音色”的评价问题
扬声器(声重放系统)所谓“音色”的定义,应该是扬声器(声重放系统)把输入的原信号无畸变、不失真、保持原信号特征地重放出来,具有高保真特性,并表征出原信号中各发声体所具有的自己声学特征表现的衡量。管善群在《电声技术基础》的1-3-1 节中作了进一步讨论,“如果要保持声音信号原有的特殊的声色,电声设备除了应有前述的足够宽的频带要求以便不丢失声音信号频谱成份以外,还应尽量不改变信号频谱中各分量之间强弱相对关系,同时,电声设备也不应制造出多余的频率分量来。可以看到,这两项要求也就是专业中对电声设备的线性与非线性畸变的要求”[2]。其实,这是对包括扬声器在内的电声设备(声重放系统)把输入的原信号无畸变、不失真、保持原信号特征地重放出来的要求。本文着重讨论的则是包括扬声器在内的电声设备(声重放系统)。所谓“音色”则应是某个自发声单元(或多个自发声单元)发出声音后经扬声器(声重放系统)重放时其“音色”的变化。一种方式是采用主观听觉感受,考察其在高、中、低频段的“音色”对主观感受的差异、变化。
采用音频解析的方法,即可以通过仪器测量,也就是可以量化的,实际操作中利用频谱仪进行。先直接测量某个自发声单元(或多个自发声单元)发出声音的频谱、声谱等谱图,然后经扬声器(声重放系统)重放,再测量某个自发声单元(或多个自发声单元)发出声音的频谱、声谱等谱图进行比较、对比分析。应注意,对多个自发声单元采用的对比分析也不例外。
采用音色调节剂,同样应该先直接测量某个自发声单元(或多个自发声单元)发出声音的频谱、声谱等谱图,然后采用音色调节剂处理,再通过经扬声器(声重放系统)重放,测量某个自发声单元(或多个自发声单元)发出声音的频谱、声谱等谱图进行比较、对比分析。
王以真《实用扬声器工艺手册》中提出“若要扬声器低失真、线性好,则纸盆应是高刚性、高内阻尼、轴对称……”等[5],但采用音色调节剂处理未见其质量分布上的对称性的影响的评价和讨论。采用音色调节剂的处理中,在涂的方式上应有多种方式。例如:“涂布”一般应是全面地将胶(音色调节剂)和纸盆胶溶于一起;“涂敷”则应理解为将胶(音色调节剂)根据需要“涂敷”“堆”于纸盆的某些位置上,会有随机性、不均匀性而影响轴对称性。还有一种叫“涂覆”,是在某一面上单面覆(复)盖。这样“涂”的做法不同,效果也就不同。作为所谓的“音色调节剂”处理,也未见其有无实验或实践的数据提供作说明或佐证。此外,从胶的特性上还存在不少影响因素,例如有人通过改变布边涂布胶,解决布边密度高、内阻小的缺点。但是,若没有讨论布边用胶和改善扬声器性能的对应关系,只讲用新胶的布边如何好,没有对比、分析和量化关系,且未说明以前布边用的胶的种类、现在用的胶的种类、对扬声器的影响原因以及提出改善的原因,导致难以对其进行评价。
4 结语
所谓“音色”是作为自身发声的发声体(人或乐器等)发出具有有别于其他发声体的有自已特性的声音,所以表征的是人或乐器等所具有的自己声学特征表现。
扬声器(包括音响系统)本身不是一个自己发声的发声体,而是一个重放系统,即作为一个放声系统希望是一个没有畸变的放声系统,应该力图使重放信号具有原信号的各种特性,应是一个具有高保真度的系统。它的信号随着输入的原信号变化,即它的原信号包涵哪些信号、哪些谐波则希望重放系统无畸变、不失真、保持原信号特征地重放出来。扬声器(声重放系统)的“音色”应该是扬声器(声重放系统)把输入的原信号无畸变、不失真、保持原信号特征地重放出来,并可表征出原信号中各发声体具有的自己声学特征表现的衡量。
采用音色调节剂并测量二次、三次谐波能测量扬声器中的“音色”来调整扬声器的“音色”,从声学原理上值得商榷。
采用音色调节剂可作为提高高保真度、改善刚性、改善谐波失真的补充手段。为改善扬声器单元阻尼特性方面,多使用HD—306、HD—303A 胶,这在扬声器生产行业中较为普遍。需要说明的是,改善重放系统(音响系统、扬声器等)的音色需要纸盆生产公司和扬声器制造公司通力合作,需从多个方面共同努力。
本文由吴宗汉执笔。