APP下载

个性化耳廓旋转角测量与头相关传输函数定制*

2016-10-25余光正何颖洋李哲林

关键词:耳廓法兰克福声源

余光正 何颖洋 李哲林

(1.华南理工大学 物理与光电学院,广东 广州 510640; 2.华南理工大学 设计学院,广东 广州 510006)



个性化耳廓旋转角测量与头相关传输函数定制*

余光正1何颖洋1李哲林2

(1.华南理工大学 物理与光电学院,广东 广州 510640; 2.华南理工大学 设计学院,广东 广州 510006)

耳廓旋转角的测量结果与头部初始位置有关,不同的耳廓旋转角测量方法可能影响个性化头相关传输函数(HRTF)的仰角分布特性.文中分别采用面部垂直参考面和法兰克福水平参考面测量并比较了60名受试者的耳廓旋转角,发现两种方法所得均值相差5°左右.为了分析耳廓旋转角对个性化HRTF空间分布的影响,将一个左耳廓在同一个椭球上按5°间隔旋转,得到耳廓旋转角分别为16°、11°和6°的3个计算模型.然后,用快速多极边界元方法(FM-BEM)计算分析了3个耦合模型的HRTF数据.结果表明:不同耳廓旋转角条件下,HRTF的耳廓高频谷点的频率差异可以达到约1.0 kHz,某些角度的谷点幅度差异可达到约10 dB.最后,用空间坐标变换方法定制不同耳廓旋转角的个性化HRTF,结果表明,定制HRTF的耳廓谷点频率和幅度与直接通过数值计算的HRTF基本吻合,证明个性化耳廓旋转角定制方法有效.

头相关传输函数;耳廓旋转角;法兰克福面;耦合模型

自由场条件下声源到双耳的传递函数描述为头相关传输函数(HRTF),它反映了头部、耳廓和躯干等生理结构对声波散射的结果[1].HRTF的高频谱特征主要是耳廓对高频声波反射作用(空间滤波)的结果,被认为是声源仰角定位的关键因素之一.不同受试者的耳廓外形(以及相应的生理参数)存在显著差异,因而HRTF的高频谱特征是个性化的物理量.

对每一名受试者都进行计算或测量HRTF数据是一项复杂耗时且不太现实的工作[2-3],因此有研究者通过测量生理参数,对个性化HRTF的参数进行估计和定制[4].Algazi等[5]对CIPIC真人数据库中的受试者的27个生理参数进行测量,华南理工大学声学研究所对52名真人受试者的17项生理参数进行统计[6].基于生理参数,Middlebrooks[7]提出将频率标度法用于个性化HRTF的研究;Zotkin等[8-9]提出个性化HRTF的生理参数匹配法; Brown等[10]在1998年提出了基于个性化生理参数的HRTF结构模型.然而,这些方法都需要复杂繁多的个性化生理参数,在应用中不容易实现.

最近,Xie等[11]的研究采用聚类的方法对个性化HRTF进行分类.这种个性化分类定制的方法不需要考虑复杂的生理参数,在虚拟听觉重放中只选用与倾听者相匹配的个性化HRTF数据类,就能在一定程度上改善重放效果.

描述耳廓的生理尺寸参数较多[6-7],其中耳廓旋转角可能直接影响HRTF的仰角分布特性[12],其余耳廓参数主要描述耳廓自身的结构和尺寸.事实上,基于HRTF高频谱特征的聚类,主要与耳廓结构和尺寸有关,与耳廓旋转角并无直接关系(耳廓旋转角只影响HRTF数据在不同仰角方向的整体分布特性).因此,在个性化HRTF的定制中,可以进一步考虑耳廓旋转角的影响,从而发展出改善虚拟听觉重放中声源仰角定位的有效方法.

耳廓旋转角通常是相对于受试者头部的侧垂面进行定义和测量的,与受试者头部初始位置有关.但已有的关于生理参数测量的文献,包括CIPIC数据库以及华南理工大学声学研究所第一代数据库(简称SCUT数据库)[5-6],都只要求受试者测量过程中平视前方,没有明确提及受试者头部初始位置的定标方法.如果不同受试者头部初始位置存在差异,则影响个性化耳廓旋转角的测量一致性和统计意义;如果不同生理参数数据库是基于不同的头部初始位置测量的,则可能导致不同生理参数数据库的耳廓旋转角存在整体性差异.

事实上,在HRTF数据测量中,有文献提及头部初始位置的要求.例如,Riederer等[13]测量真人受试者的HRTF时,提出以垂直线辅助调整受试者的面部至垂直态;Blauert[14]则建议用人体工学的法兰克福面来确定水平面.

文中分别采用文献[13]和[14]的方案确定头部初始位置,对笔者所在课题组新扫描的60名真人受试者的耳廓旋转角进行测量和对比分析;为了分析耳廓旋转角对个性化HRTF的影响,设计了椭球形头部与个性化耳廓(相同耳廓形状,不同的耳廓旋转角)的耦合模型,对个性化HRTF数据进行了计算和分析;最后,用空间坐标变换方法,对个性化HRTF进行耳廓旋转角参数定制,并对该定制方法的有效性进行验证.

1 HRTF的坐标与定义

1.1双耳极坐标

HRTF通常在空间球坐标或双耳极坐标系统下定义[1].文中研究的是耳廓旋转角对HRTF的影响,主要分析不同仰角的HRTF变换规律,因此采用图1所示的双耳极坐标.点声源的空间位置用坐标(r,Θ,Φ)表示;其中:r表示声源距离,-90°≤Θ≤ 90°表示声源方向矢量与中垂面的夹角,0°≤Φ< 360°表示声源方向矢量在中垂面的投影与正前方的夹角.因此,(Θ,Φ)=(0°,0°) 表示正前方,Θ=90°表示正右方,Θ=0°表示中垂面,以此类推.

图1双耳极坐标示意图

Fig.1Schematic diagram of binaural polar coordinate

1.2HRTF的定义

在图1所示的双耳极坐标下,HRTF可以按照如下的表达式进行定义:

(1)

式中: f表示频率;P表示点声源在左、右耳受声点的声压;P0表示点声源在头中心的自由场辐射声压;变量A表示受试者生理参数集合,例如,将图2的耳廓旋转角定义为ψ,则有ψ∈A.

2 耳廓旋转角的测量

2.1耳廓旋转角的定义

如图2所示,耳廓旋转角是基于垂直参考线和耳长测量线定义的.耳长d定义为耳廓耳轮和耳垂之间的最长距离,耳廓旋转角ψ定义为耳长(d)的测量线和垂直辅助线的夹角.

图2耳长d和耳廓旋转角ψ的定义

Fig.2Thedefinitionsofpinnalengthdandpinnarotationangleψ

对耳廓旋转角ψ的测量,需首先确定受试者头部的初始位置状态(影响垂直参考线).如果受试者的头部初始位置不一致(例如不同受试者头部前后倾斜的角度不同),将使得耳廓旋转角的测量结果不具统计意义.

结合图1和图2可知,一旦确定了头部初始位置和三维坐标系,耳廓旋转角ψ与双耳极坐标的仰角Φ之间就存在某种对应关系,从而为后文的个性化耳廓旋转角定制提供了方便.

2.2头部位置的初始态

在人体工学中,常借助法兰克福面来确定人体头部的水平面位置[15].按定义,对于每一名受试者,取其左、右耳屏点EL和ER以及右眼眶下缘点KR,确定一个平面,并将该平面称为法兰克福面,如图3所示.在空间听觉的研究中,也有采用法兰克福面作为水平面的例子,其方法是将法兰克福面下移至经过左右耳道入口处,即可作为获取HRTF的水平面[10].对不同受试者都采用这一方法确定水平面(间接地确定了垂直线),从而得到耳廓旋转角参数,测量结果用S1表示.

图3由法兰克福面确定的头部初始位置

Fig.3The head initial position determined by Frankfurt plane

在测量HRTF的过程中,法兰克福面很难被采用.但有研究提及应该对头部初始位置保持一致,并借助于铅垂线,使受试者面部处于垂直(或直立)的状态,如图4所示.可更为直观地描述为:面部朝前,作一铅垂线与受试者前额和下巴前边缘相切,将此平面平移至经过两耳道入口处,从而确定受试者的初始位置.为了比较,在测量真人受试者的耳廓旋转角时,也采用了图4的垂直辅助直线来确定受试者头部初始位置,测量结果用S2表示.

图4由垂直面部确定的头部初始位置

Fig.4The head initial position determined by the vertical face

2.3测量结果对比分析

如图2所示,耳长d的测量线不受头部初始位置状态的影响,但其与头部垂线的夹角(即耳廓旋转角ψ)将随头部初始位置的不同而改变.因此,当采用图3和4的方法分别确定头部初始位置状态后,可使用计算机软件(如Geomagic)对耳廓旋转角进行测量.用SCUT新扫描的头部模型,测量得到的耳廓旋转角结果如表1所示.为了与以往生理参数测量结果比较,同时给出了CIPIC数据和SCUT第一代数据(简称SCUT)的耳廓旋转角测量结果.需指出的是,在文献[2]和文献[3]中,并未提及耳廓旋转角测量的参考基准及其方法,因而为比较数据带来一定困难.

表1 耳廓旋转角测量统计数据

从表1的统计结果可知,在4组耳廓旋转角数据中,CIPIC和SCUT的均值和方差明显大一些,这可能是测量耳廓旋转角时没有明确规定水平面或垂直面引起的,也可能是受试者群体差异引起的.由于之前的测量是对真人受试者进行的,且只提示受试者平视前方,没有从人体工学角度明确标定测量方法,因而实验结果也难以重复.

对比S1和S2两组数据,借助法兰克福面测得的耳廓旋转角均值比面部垂直时测得的结果小5°左右,说明法兰克福面所确定的水平面会使得受试者面部有大约5°左右的前倾;另一方面,S1和S2两组数据的方差结果相差约0.7°,说明法兰克福面与面部垂直两种方式存在一定差异,这是由测量方法的差异引起的.上述方法各有差异,相比而言,法兰克福面的定义更为规范,容易操作,因此建议作为计算HRTF和测量生理参数的坐标定标方法.

3 HRTF的计算分析

3.1计算模型

为了突出耳廓旋转角的影响,文中采用了耳廓与椭球的耦合模型[16],即采用同样的耳廓和同样的椭球,但是以不同的耳廓旋转角进行耦合.从表1统计数据可见,采用法兰克福面作为辅助面得到的耳廓旋转角基本在6°至17°之间(均值约为12.63°,均方差为5.56°).不失一般性,文中选用KEMAR人工头(配备DB60小耳廓)的扫描模型作为算例(事实上,KEMAR也是HRTF研究中最常采用的人工头模型).如图5所示,KEMAR模型的初始测量旋转角为16°,对应模型0.然后,将耳廓分两次向前旋转5°,得到的耳廓旋转角为11°和6°,分别对应模型1和模型2.上述3个耳廓旋转角基本涵盖了表1中S2数据组的耳廓旋转角分布范围.

图5基于KEMAR人工头得到的不同耳廓旋转角的HRTF计算模型

Fig.5The HRTF calculation models of various pinna rotation angles based on the KEMAR artificial head

3.2幅度谱比较

图5中3个计算模型的HRTF均用FM-BEM方法求解[17].在中垂面,声源仰角定位主要依靠耳廓反射引起的HRTF高频谱因素,且仰角分辨率在10°的量级.从HRTF数据的特性来看,靠近中垂面的HRTF高频谱特性对声源仰角的变化也最为敏感[1].因此,有必要分析耳廓旋转角对HRTF高频谱因素的影响,特别是对中垂面以及与中垂面平行的失状面上的HRTF的影响.为了分析方便,选取了图1所示的双耳极坐标.在算例中,取声源距离0.2 m,对中垂面(即Θ=0°)的HRTF进行分析.在中垂面上,给出仰角Φ=300°,0°,60°,120°,180°,240°条件下的HRTF数据,如图6所示.

图6在中垂面(Θ=0°)上不同仰角Φ下的HRTF幅度谱

Fig.6Magnitude spectrum of HRTFs at different elevationsΦin the median plane (Θ=0°)

通常认为耳廓高频谷点是单耳谱因素的重要内容之一.因此,耳廓旋转角对HRTF的高频谷点的影响不容忽视.虚拟声重放的实际应用中,可以对不同受试者的耳廓旋转角进行适当修正(定制),使其获得更好的虚拟重放效果.

3.3误差分析

为了分析耳廓旋转角对HRTF的整体影响,取声源距离为0.2 m,在Θ=20°和40°两个平面上,仰角Φ按5°等间隔,算得图5所示3个计算模型的HRTF对数幅度谱,分别记为H0、H1、H2.然后按照定义式SD1=H1-H0和SD2=H2-H0计算幅度谱的差别,分别如图7(a)和7(b)所示.

图7 不同耳廓旋转角条件下的HRTF幅度谱误差

Fig.7The magnitude difference of HRTFs under various conditions of pinna rotation angles

由图7可见,在约6 kHz以下的频段,在双耳极坐标下,不同方向的HRTF幅度谱并无明显的差异;然而在约6 kHz以上的频段,由耳廓对声波散(反)射引起峰谷谱因素,在特定的频率(或窄带范围)存在较明显的差异.具体表现在高频HRTF幅度谱的峰谷幅值的差异和峰谷出现的频率随声源方向Φ的变化,这与图6的结果是一致的.

因此,如果只关注耳廓结构尺寸引起的HRTF幅度谱峰谷变化,而不考虑耳廓旋转角对幅度谱的整体性影响,将不能完备地表达HRTF的高频幅度谱的个性化特征.

3.4耳廓旋转角的定制

图8 模型0的定制HRTF与计算HRTF之间的谱差异

Fig.8The magnitude difference of between the customized HRTFs and the calculated HRTFs of model 0

结果表明,定制HRTF与直接计算HRTF幅度谱差异与耳廓旋转角的差异大小成正比,但整体上都较小.对比图7和8,图7表明耳廓旋转角可以引起明显的HRTF幅度谱差异;而图8正好说明,这种由耳廓旋转角引起的HRTF幅度谱差异通过HRTF的空间坐标变换,可以较好地近似(定制).因此,在分析耳廓生理参数对个性化HRTF的影响时,可以将耳廓旋转角单独考虑,从而简化不同耳廓生理参数之间的相互影响,使基于耳廓生理参数的个性化HRTF定制方法得到简化.

进一步地,对图7和图8中,对定制前后的幅度谱误差进行统计分析.在特定频段,HRTF的幅度谱误差均方根的计算公式为

(6)

图9模型2相比于模型0的HRTF幅度谱均方误差

Fig.9The magnitude difference of HRTFs between the model 2 and model 0

4 结论

分别以法兰克福面和面部垂直作为参考平面,测量和统计了60名受试者扫描模型的耳廓旋转角,发现两种头部初始位置测量得到的耳廓旋转角的均值相差约5.67°,方差相差约0.7°.考虑到法兰克福面的定标较为明确,便于操作,因此建议作为优选的测量方案.然后,采用椭球头部与个性化耳廓(具有相同耳廓形状,但不同耳廓旋转角)的耦合模型,分析耳廓旋转角对个性化HRTF的影响.结果表明,不同耳廓旋转角条件下的HRTF的高频谷点频率的差异可以达到1.0 kHz的量级.这种耳廓旋转角引起的谱差异可以通过HRTF的空间坐标变换进行修正;也可以说,可以对HRTF数据进行个性化耳廓旋转角参数的定制.

[1]XIE B S.Head-related transfer function and virtual auditory display [M].New York:J Ross Publishing,2013:20-22,234-241.

[2]余光正,谢菠荪,饶丹.人工头近场头相关传输函数及其特性 [J].声学学报,2012,37(4):378-385.

YU Guang-zheng,XIE Bo-sun,RAO Dan.Near-field head-related transfer functions of artificial head and its characteristics [J].Journal of ACTA Acustica,2012,37(4):378-385.

[3]RUI Y Q,YU G Z,XIE B S,et al.Calculation of individua-lized near-field head-related transfer function database using boundary element method [C]∥The 134thAudio Engineering Society Convention.Rome:E-Library,2013:8901.

[4]MOKHTARI P,TAKEMOTO H,NISHIMURA R,et al.Frequency and amplitude estimation of the first pead of head-related transfer functions from individual pinna anthropometry [J].Journal of the Acoustical Society of America,2015,137(2):690-701.

[5]ALGAZI V R,DUDA R O,THOMPSON D M,et al.The CIPIC HRTF database [C]∥Proceedings of 2001 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics.New York:IEEE,2001:99-102.

[6]XIE B S,ZHONG X L,RAO D,et al.Head-related transfer function database and its analyses [J].Science in China Series G:Physics,Mechanics & Astronomy,2007,50(3):267-280.

[7]MIDDLEBROOKS J C.Individual differences in externa-lear transfer functions reduced by scaling in frequency [J].Journal of the Acoustical Society of America,1999,106(3):1480-1492.

[8]ZOTKIN D N,DURAISWAMI R,et al.Rendering locali-zed spatial audio in a virtual auditory space [J].IEEE Transactions on Multimedia,2004,6(4):553-564.

[9]ZOTKIN D N,HWANG J,DURAISWAMI R,et al.HRTF personalization using anthropometric measurements [C]∥Proceedings of the 2003 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics.New York:IEEE,2003:157-160.

[10]BROWN C P,DUDA R O.A structural model for binaural sound synthesis [J].IEEE Trans Speech Audio Process,1998,6(5):476-488.

[11]XIE B S,ZHANG C Y,ZHONG X L.A cluster and subjective selection-based HRTF customization scheme for improving binaural reproduction of 5.1 channel surround sound [C]∥The 134thAudio Engineering Society Convention.Rome:E-Library,2013:8879.

[12]余光正,何颖洋,张晓民,等.耳廓旋转角对头相关传输函数的影响 [J].声学技术,2014,33(12-S2):307-310.YU Guang-zheng,HE Ying-yang,ZHANG Xiao-min,et al.Effect of pinna rotation angle on the head-related transfer function [J].Technical Acoustics,2014,33(12-S2):307-310.

[13]RIEDERER K A J.Effect of head movements on mea-sured head-related transfer functions [C]∥The 18thInternational Congress on Acoustics.Kyoto:ICA,2004:795-798.

[14]BLAUERT J.Spatial hearing,revised edition:the psychophysics of human sound localization[M].Cambridge:the MIT Press,1997.

[15]LUSIMON Y,BALL R,JUSTICE L.The 3D Chinese head and face modeling [J].Computer Aided Design,2012,44(1):40-47.

[16]RUI Y Q,YU G Z,XIE B S.Approximately calculate individual near-field head-related transfer function using an ellipsoidal head and pinnae model [J].Journal of the Acoustical Society of America,2012,132(3):1997.

[17]GUMEROV N A,O’DONOVAN A E,DURAISWAMI R,et al.Computation of the head-related transfer function via the fast multipole accelerated boundary element method and its spherical harmonic representation [J].Journal of the Acoustical Society of America,2010,127(1):370-386.

Supported by the Young Scientists Fund of the National Natural Science Foundation of China (11104082)

Measurement of Individual Pinna Rotation Angle and Customization of Head-Related Transfer Functions

YUGuang-zheng1HEYing-yang1LIZhe-lin1

(1. School of Physics and Optoelectronics, South China University of Technology,Guangzhou 510640,Guangdong,China;2. School of Design,South China University of Technology,Guangzhou 510006,Guangdong,China)

The measured value of pinna rotation angle depends on subject’s original head position,and the corresponding measurement methods of pinna rotation angle may affect the distribution of individual head-related transfer functions (HRTFs) in various elevations. In this paper,both face-based vertical reference plane and Frankfurt refe-rence plane are used to measure and compare the pinna rotation angles of 60 human subjects,and a mean diffe-rence of about 5° is obtained. Then,in order to discover the effect of pinna rotation angle on the spatial distribution of individual HRTFs,the left pinna is rotated on the same ellipsoidal head model with an interval of 5°,and three calculation models respectively corresponding to the pinna rotation angles of 16°,11° and 6° are obtained. Moreover,the HRTFs of the three coupling models are calculated and analyzed by means of the fast multi-pole boundary element method (FM-BEM). The results show that the frequency discrepancy of the pinna notches at high frequencies reaches about 1.0 kHz,and that the magnitude difference even reaches about 10 dB in some directions. In addition,from the individual HRTFs customized via spatial coordinate transformation,it is found that the frequencies and magnitude of pinna notches of the customized HRTFs are similar to those of directly-calculated HRTFs,which means that the proposed individual customization method for individual pinna rotation angle is effective.

head-related transfer function; pinna rotation angle; Frankfurt plane; coupling model

1000-565X(2016)07-0135-07

2015-07-09

国家自然科学基金青年基金资助项目(11104082);广东省高等学校优秀青年教师培养项目(Yq2013016)

余光正(1978-),男,博士,副教授,主要从事空间听觉与声信号处理研究.E-mail:scgzyu@scut.edu.cn

O 422doi: 10.3969/j.issn.1000-565X.2016.00.021

猜你喜欢

耳廓法兰克福声源
虚拟声源定位的等效源近场声全息算法
法兰克福展览(上海)有限公司
搓耳
——护肾
中国力量为何成 法兰克福车展中的一丝暖意?
基于GCC-nearest时延估计的室内声源定位
2017法兰克福车展
运用内积相关性结合迭代相减识别两点声源
浅谈耳廓缺损的法医学鉴定
德国法兰克福书展
力-声互易在水下声源强度测量中的应用