整车免提通话语音品质测试方法研究综述
2020-11-27窦汝鹏
窦汝鹏, 田 喆, 赵 猛
(中汽研汽车检验中心(天津) 有限公司, 天津 300300)
随着车载系统智能化和网联化的发展进程,无线通信技术在汽车中的应用越来越多,免提通话系统逐渐成为汽车的基本配置。车辆紧急呼叫系统是驾驶员在发生交通事故时的安全保障[1],为了保障车载端与公共安全应答点 (Public Safety Answering Point,PSAP) 可以良好地沟通,充分利用社会资源,减少公民的生命财产损失,需要对车载免提通话系统的语音品质提出一定的标准要求[2]。为保证车载免提通话系统的语音品质符合标准,需要对其进行严格的检测。目前,国内对车载免提通话系统语音品质的检测方法尚未完善,导致车载免提通话系统性能参差不齐。因此,对车载免提通话系统语音品质检测方法的研究是十分必要的。
国际电信联盟 (International Telecommunication Union,ITU) 建立了有关车辆中窄带和宽带免提通信的语音品质标准ITU-T P.1100(窄带部分)[3]和ITU-T P.1110(宽带部分)[4]。该标准由大量的测试项目组成,例如响度评定值、空闲信道噪声、带外信号处理等。该标准在安静环境和现实背景噪声情况下对车载免提系统进行测试,考虑不同车速、发动机、车身情况,针对目标车辆均衡模拟车内驾驶的真实声学场景;该标准使用人工头测试系统作为“用户”来模拟使用车载免提终端。
本文基于ITU-T P.1100和ITU-T P.1110标准,对车载免提通话系统的测试系统搭建和主要测试项进行了探讨。
1 测试系统搭建
系统通过模拟驾驶员在车辆真实行进过程中的通话场景测试语音通话品质。测试系统总体如图1所示,主要分为3个部分:人工头系统、背景噪声录制及回放系统、测试控制系统。测试时需要将测试车辆停放在符合一定声学条件的场地中进行,在车内进行免提通话语音品质的测试。
1.1 人工头系统
图2所示的人工头系统通过内置的高精度人工耳、人工嘴分别模拟系统使用者的“听”、“说”功能,使用车载免提通话终端完成通话过程。图3为人工头系统在车内的放置示意图。
人工嘴应符合ITU-T P.58[5]的规定,并且人工耳和人工嘴在进行测试前应依据ITU-T P.581[6]进行校准和均衡。
在测试车辆噪声时,适当地增大仿真嘴的输出电平以模拟“伦巴效应” (Lombard effect)。“伦巴效应”是指因噪声引起的说话行为的变化。当噪声A计权声压级长时间超过50dB时,声压每增加10dB,输出电平增加3dB。用下式表示输出电平和噪声间的关系:
式中:I——因噪声引起的仿真嘴输出电平的增加;N——靠近驾驶员头部位置的长时A计权声压级。
图1 测试系统
图2 人工头系统
图3 人工头系统在车内的放置
在测试时,人工头系统应放置在驾驶员的座位上,位置应与大多数人的驾驶习惯一致;放置时要使用适当的测量方法记录人工头系统位置 (如记录人工头系统与A柱的相对位置、与B柱的相对位置、与地板的相对高度等),确保测试场景能精确复现。人工头系统放置位置的不同可能会对测试结果产生影响,建议检查一下效果最差的位置,如发送方向上信噪比(SNR) 或语音品质可能比较差的位置。
1.2 背景噪声录制及回放系统
车辆行驶过程中往往伴随着发动机噪声、风噪、胎噪、空调风扇噪声等稳态噪声,这些噪声会对车载免提通话的语音品质产生干扰。因此,在评价车载免提通话性能时,应考虑车载免提通话系统对于噪声的处理能力。不同车辆的机械结构和材料不同,车内噪声也各不相同,在进行测试前应对不同车辆的车内噪声进行单独录制,在测试中车辆处于静止状态,通过背景噪声回放系统再现车辆实际运行状态下的声场环境。
背景噪声的录制工作应在无风无雨的天气条件下,在光滑干燥的路面进行。录制过程中关闭车窗和转向灯,车内人员尽可能保持安静,清空车厢内杂物,车门及座位上不要放置其他物品,以免在录制过程中出现杂音。在靠近车载免提麦克风处放置测量传声器来录制背景噪声,也可以使用车载免提麦克风来直接录制。
噪声录制后,还应该对录制好的背景噪声进行均衡,以保证准确重现噪声文件原始的频率特性以及声压大小。
为了模拟真实的行车环境,使用4个中音扬声器和一个低音扬声器组成的扬声器组播放背景噪声。应仔细选择扬声器的安装位置以使扬声器、车载免提麦克风和人工头系统的声传递路径间的干扰最小。通常,低音扬声器安装在座位后面正中,后备厢上面;4个中音分两组安装在车厢前后,前面2个扬声器分别放在仪表面板的上部两边或驾驶员脚部,后排2个扬声器分别放置在后座靠枕与后窗玻璃之间靠近车壳的支架处。图4为扬声器的放置示意图。
图4 扬声器的放置
为使车载免提麦克风位置处的声功率谱密度和录音信号一致,应对扬声器组进行均衡和校准。比较录音信号和模拟背景噪声信号,两者的最大A计权声压级偏差应不超过±1dB,在100Hz~10kHz频率范围内的1/3倍频程功率谱密度偏差应不超过±3dB。
1.3 测试控制系统
测试控制系统负责控制整套测试系统,调用测试数据库中的语料,并对测试采集到的实验数据进行分析。
测试控制系统通过人工头系统与车载免提通话终端的声接口相连。通过蓝牙、无线综测仪和手机与车载免提通话终端的无线电接口相连,连接方式如图5所示,有3种:①车载免提终端通过蓝牙与测试系统相连;②车载免提终端通过蓝牙与手机相连,手机通过无线信号与无线综测仪相连,无线综测仪通过同轴电缆与测试系统相连;③车载免提终端通过无线信号与无线综测仪相连,无线综测仪通过同轴电缆与测试系统相连。
图5 测试系统连接方式
测试使用的系统模拟器的音频接口应经过校准。要保证系统模拟器的设置不对传输的声信号产生附加处理(如DTX断续传输),并使免提麦克风的信号能准确传输。如无特殊说明,射频电平调到最大。在GSM或者UMTS网络制式下,AMR-NB编码的传输比特率应为12.2kbit/s,AMR-WB编码的传输比特率应为12.65kbit/s。
不同编解码器、可变速率编解码器传输比特率的变化都会影响语音传输品质。为了使测试结果更加符合实际,测试时应使用真实网络信号传输的比特率。
另外,测试中会用到手机传递信号,因为一些手机不能完全关闭信号处理,所以只能选用那些不会引入额外非线性增益的手机来进行测试。
1.4 测试场地
测试应该在安静的环境下开展,除非特殊说明,车内背景噪声应符合ISO 3745标准[7]中的NC40,小于-54dBPa(A)。对于特定测试,符合NC20时,车内背景噪声应小于-74dBPa(A),符合NC30标准时,车内背景噪声应小于-64dBPa(A)。NC标准如图6所示。
图6 测试环境的NC准则
环境条件应设置如下。
1) 测试过程中不使用测试信号。
2) 在进行窄带语音编码测试时,测试自由声场的麦克风安装在车内的测试室;进行宽带语音编码测试时,测试自由声场的麦克风安装在车外的测试室。
3) 测试环境的噪音频率应在20Hz~20kHz之间,测量时间为5s (空闲信道噪声的平均时间)。
4) 使用A计权声压级检查测试环境。
5) 将测试室的噪声的倍频程设为63Hz~10kHz来检查是否符合NC标准。
2 测试项目
ITU-T P.1100和ITU-T P.1110标准的测试项目可以大致分为延时、单讲语音品质、回声和双讲特性、背景噪声传输性能4类。
2.1 延时
延时测试用来确定信号从发送到接收经过系统所需要的时间。延时分为发送方向延时和接收方向延时,两者相加称为环回延时。ITU-T P.1100和ITU-T P.1110标准仅对环回延时进行要求,不对发送方向延时和接收方向延时做单独要求:在不使用短距离无线传输技术时,人工头系统和车载终端蜂窝天线之间的环回延时应不超过170ms;使用短距离无线传输技术时,人工头系统和车载终端蓝牙天线之间的环回延时,窄带语音编码下应不超过80ms,宽带语音编码下应不超过90ms。
延时测试是所有测试的基础,其结果直接影响到其它测试。延时补偿和信号对齐,对整个测试非常重要。同时,因延时测试持续时间短,也常用来检测系统上下行信号通路是否正常。常见的延时测试结果如图7所示。
图7 延时测试结果
图7 上方的时域图显示了源信号 (Source) 和接收信号(RCV(2))在时间轴上的相对位置。下方的分析图显示了两个信号的互相关函数,即在不同时刻两个信号的相似程度,延时的结果取值以相似程度最高的那个时刻为准。
若在时域图中接收信号波形难以识别或者在分析图中没有明显的波峰,则可能代表系统的信号通路存在问题。
在通话过程中,语音传输延时的少许变化可能并不影响我们的日常交流,对于测试系统,它计算语音品质时是根据已测得的延时对比测量信号和信号源,如果系统通信的延时不稳定,那么很有可能得到较低的语音品质分数[8]。
2.2 单讲语音品质
单讲语音品质的主要测试项目如表1所示,每个测试项目又分发送方向和接收方向。
进行发送方向测试时,测试信号由测试控制系统发出,经过数模转换后传给人工头系统上的人工嘴发声;车载免提麦克风接收到声信号后,对声音进行编码;编码后的信号经过图5所示无线传输方式,传回测试控制系统;测试控制系统对接收到的信号进行分析得到测试结果。
进行接收方向测试时,测试信号由测试控制系统发出,由无线传输方式,将测试信号传递到车载终端;车载终端的扬声器发声;人工头系统上的人工耳接收声信号;声信号经过模数转换后,发送给测试控制系统;测试控制系统对接收到的信号进行分析得到测试结果。
下面对单讲语音品质的主要测试项目进行解析。
1) 响度评定值
响度评定值并不表示实际感知的响度,而是衡量系统的传输损耗。标准系统定义了一个固定的衰减数值 (25dB),以最后接收到相同响度为基础分别比较被测系统和中间参考系统所需插入衰减数值与标准系统的差异,两者之差就是响度评定值。
表1 单讲语音品质测试项目
响度评定值的测试结果为单个数值,其结果判定非常简单。根据ITU-T P.1100和ITU-T P.1110标准,发送方向响度评定值应介于9~17dB,接收方向响度评定值应介于-2~6dB。若多个音量测试结果都处于接收方向响度评定值的合理区间,则选择最接近标准规定范围中值的音量作为标称音量进行接收方向的其它测试。
2) 灵敏度频率响应
频率响应描述了系统对不同频率的输入信号的响应特性。频率响应测量分为两步,第1步是参考测量,即不考虑被测系统的影响,计算源信号的频谱并保存;第2步加入被测系统,计算源信号经过系统后得到的信号频谱,两个频谱之差即为被测系统的频响曲线。
车载终端的频响曲线需要处于ITU-T P.1100和ITU-T P.1110标准要求的容差框线内。容差框线规定了频响曲线在各个频率点所能达到的最高和最低限值。在判定时一般会先把频响曲线与容差框线进行上边界对齐或下边界对齐,再去判别是否有超出下边界或上边界的情况:若有则结果不符合要求,测试结果显示频响曲线超出边界最大的距离数值;若无则结果符合要求,测试结果显示频响曲线与边界最小的距离数值余量。
3) 空闲信道噪声
空闲信道噪声测量被测设备在安静环境下的本底噪声电平或声压值,通常测量时会先施加一个激励信号以防止设备处于静默模式。
4) 失真
失真是指在原始的测试信号之外接收到了其它信号分量,通常是由设备的非线性元件对信号处理后产生。ITU-T P.1100和ITU-T P.1110标准采用正弦波作为原信号测量谐波失真,如发送一个1kHz的正弦波后看接收信号是否在其整数倍频率上如2kHz、3kHz等出现明显波峰。
5) 带外信号处理
测试时用带内信号能量减去带外信号的能量,得到的相对能量值,即车载终端对带外信号的抑制作用。
6) 单讲语音品质评分
ITU-T P.1100和ITU-T P.1110标准采用中的单讲语音品质,是一种客观评价方法。通过测量语音信号的特征参数来评价语音的整体品质,对单讲语音品质进行打分,使客观评价结果能够准确预测出语音品质的主观评价结果,具有重复性和稳定性好、不受人为的主观影响等优点。
2.3 回声及双讲特性
远端讲话者的声音被麦克风采集并传入至通信设备,经过无线或有线传输之后达到近端的通信设备,并通过近端的扬声器播放,这个声音又会被近端的麦克风拾取至其通信设备形成声学回声,经传输又返回了远端的通信设备,并通过远端的扬声器播放出来,导致远端讲话者听到自己的回声。这种回声会使远端讲话者产生不适,因此要在通话过程中进行回声消除处理。
双讲性能是指免提终端进行双向通话的能力。双讲性能主要由两个方面决定:双讲时回声引起的损失,单、双讲时衰减范围内的电平变化。
ITU-T P.1100和ITU-T P.1110标准在回声特性方面对车载终端的耦合损耗、回声衰减与时间的关系、各频段的回声衰减、初始收敛、回声抑制性能进行了要求。在双讲特性方面ITU-T P.1100和ITU-T P.1110标准并无强制要求,而是依据衰减范围、回声分量等测试项目的测试结果对车载终端的双讲能力进行分类。但应注意,双讲能力分类等级高并不意味着该终端总体品质就更好。
回声、双讲特性会相互影响。在通话中,为了消除回声,在扬声器输出前与发送方向信号进行对比时,参考信号传输的延时减去发送方向的信号,可能会因此影响到原有的下行信号,导致双讲通话中信号衰减较大[8]。
2.4 背景噪声传递性能
ITU-T P.1100和ITU-T P.1110标准规定,在背景噪声传递性能测试前首先要进行背景噪声采集,依据表2列出的噪声场景进行背景噪声录制。
表2 噪声场景
ITU-T P.1100和ITU-T P.1110标准中包含的测试项目有呼叫建立后的背景噪声传递、有背景噪声情况下的语音品质(即3-QUEST)、远近端语言背景噪声传递品质以及“舒适噪声”的注入。每个测试项目都要依照表2列出的场景进行单独测试,合格的车载终端应该在每个噪声场景都满足要求。
1) 呼叫建立后的背景噪声传递
该项测试基于ITU-T P.1100附件B中的相对方法[B-sottek][9],分析结果的显著特征不应超过6cp/cPa。
对于窄带语音编码,发送方向的第一个传输信号峰值在300Hz~3.4kHz之间的激励不得高于15cp/cPa;对于宽带语音编码,发送方向的第一个传输信号峰值在200Hz~7kHz之间的激励不得高于15cp/cPa。
2) 3-QUEST
3-QUEST包含以下3个测试分项:①语音品质,定义为S-MOS。②背景噪声传递品质,定义为N-MOS。需要注意的是,若车载终端将噪声消除过多,可能会导致通话过程中语音信号丢失,使N-MOS降低。③整体品质,定义为G-MOS。该项为S-MOS与N-MOS的结合。
ITU-T P.1100和ITU-T P.1110标准要求如表3所示。
表3 3-QUEST要求
3) 远近端语音背景噪声传递品质
远端语音背景噪声传递品质在接收端施加信号进行测试;近端语音背景噪声传递品质在发送端施加信号进行测试。在语音信号持续时和结束后(代表远端语音模拟结束),发送方向上的信号电平变化不得超过10dB。
建立语音呼叫后,首先播放噪声信号,在发送端进行测试,得到参考曲线;再播放同样的噪声信号,同时在上行(下行) 方向插入多段语音信号,在发送端进行测试,得到测试曲线;将两条曲线叠加,在无语音信号的区间量取曲线之间的电平差,最大值即为近端(远端) 背景噪声传递品质的结果[10]。
4) “舒适噪声”的注入
ITU-T P.1100和ITU-T P.1110标准要求,对于可以插入舒适噪声的免提终端,插入的舒适噪声电平和本地(被传输的) 背景噪声电平之差应在-5~2dB (A) 之间。插入的舒适噪声和本地背景噪声频谱差异应在表4 (窄带) 和表5 (宽带) 的范围之内。
表4 舒适噪声的频域范围 (窄带)
表5 舒适噪声的频域范围 (宽带)
3 结语
ITU-T P.1100和ITU-T P.1110标准囊括了延时、单讲语音品质、回声和双讲特性以及背景噪声传递性能。各个测试项目之间相互关联,参数的调整与分析不应局限于当前参数,而需全局考虑,为保证测试的准确性,在每次参数调整后需要对整个系统重新测量。