基于卷积神经网络的汽车行人警示音评价系统设计
2024-08-15于佳王得天
摘 要:为了使电动汽车的行人警示音符合人耳主观感受及汽车品牌定位,设计了一个基于卷积神经网络的声品质评价系统,实现了对行人警示音频的客观评价。采用等级评分对设计好的音频文件进行主观评价,并获得主观评分。基于ISO 532-1:2014标准计算音频文件的响度、粗糙度、抖动度、烦扰度、尖锐度等声品质客观参数,并将其作为卷积神经网络模型的特征输入。评价模型的输出设定为豪华,舒适,科技三个指标。经过数据训练,模型可以有效输出给定指标的评价分数,并与主观评价分数吻合良好。所提出的模型可以实现端到端的声品质客观评价,评价结果能够有效反映人耳主观感受,从而为行人警示音的快速评价提供新的方法。
关键词:行人警示音 声品质评价系统 声品质参数 卷积神经网络
1 绪论
众多汽车公司都在努力实现良好的汽车声音品质,但只有少数公司进行了深入研究,开发具有良好特性的品牌声音以匹配品牌属性[1-2]。设计音频时,人耳对声音的主观评价[3-4]受到职业、年龄和性别等因素的影响,导致评分差异较大,评分不准确,评价过程也需要耗费大量的人力和时间。为了节约时间及人力成本,确保电动汽车的行人警示声[5-6]符合人耳的主观感知和汽车品牌的定位,设计了基于卷积神经网络的声品质评价系统,来实现对行人警示音的客观评价。响度、粗糙度、波动度、烦扰度、尖锐度等心理声学参数被作为特征输入到卷积神经网络模型中,模拟人们听到声音时的心理活动。声品质是参评人员对声音的一种主观感受,通过人的主观感知来评论相同的声音给人在主观感受上带来的差异性。同济大学的方源[7]等人利用阶次分析、频谱分析等技术手段分析了电动车动力总成的主要噪声源,利用声品质客观心理声学参数对动力总成的声品质特性进行了分析研究,建立了可用于描述电动汽车动力总成噪声品质客观参数和主观评价之间相关性的焦躁度评价模型。沃尔沃汽车公司David等人[8]用声学评价参量显著度(Prominece Ratio)和声噪率(Tone-to–noise Ratio)来对电动汽车和混合动力汽车车内噪声进行评价。
主观评价中,将设计好的音频给不同性别、年龄、职业的评价人员进行打分,打分的指标有豪华感,科技感,舒适感三项指标,筛选合适的样本,进行相关性分析统计出打分结果,作为音频标签。然后划分数据集,计算得出音频的心理声学参数特征矩阵,将特征矩阵输入卷积神经网络模型中,进行训练,声品质评价系统就设计完成。将音频输入评价系统,可得到评价结果输出。
卷积神经网络模型结构如图1所示,为简化后续警示音设计的过程,需建立高精度的可重复使用的客观量化模型来代替繁杂的声品质主观评价过程,从而节省大量的时间和人力物力成本,也可避免因人员环境等因素带来的误差。本文以5个表征警示音声品质心理声学特性的客观参数作为网络输入,以表征警示音声品质三项指标的作为网络输出。
2 主观评价
首先进行主观评价指标调研,选取合适的能表征音频特征,而且人耳能够分辨较明确的主观评价指标。然后,在诸多的主观评价方法之中,选择合适的主观评价方法,使得主观评价更加方便且评价结果误差小。最后,确定声品质主观评价的指标、评价方法以及评价人员,并对评价人员进行试听和培训,在完成这一系列前期准备工作之后再在特定的主观评价试验室中进行评价试验,评价后需对评价结果进行数据分析和检验,获得最终的主观评价值。
2.1 主观评价方法
声品质评价主要通过实验研究或社会调查等方式,获取人群对特定声音的主观感受数据,通常以烦恼度,响度,粗糙度等作为噪声主观反应的衡量尺度。主观评价方法是汽车声品质研究中关键的基础方法,常见的有简单排序法、数值估计法、语义细分法、成对比较法和等级评分法等,其中以等级评分法,语义细分法和成对比较法是最为常用等级评分法。本文选择豪华感,舒适感,科技感三个主观评价指标,对行人警示音作出等级的量化评价,选用等级评分法来进行主观评价。
等级评分法需要将声音的某一属性划分为若干个等级,并将不同的分值与每个等级一一对应。为了确保评价者能够给出准确的评价分值,声音样本应按顺序播放且不重复播放。这样有利于评价者根据自身主观感知程度进行评价试验。样本的声品质等级基于每个声音样本的全部评分的平均值。等级评分法易于掌握,操作简单方便,评价结果以数值形式呈现,可直接用于客观分析。国际上常用10级刻度,大量试验证明,评价者的评分绝大多数集中在5-10之间。为了提高评价结果的准确性,应追加参考样本并注明相应的参考等级。此外,在试验前,没有经验的评价者应接受相关培训,熟悉试验样本,接受听音训练,并明确等级划分,以确保评价者能够更准确地进行评价打分。
2.2 主观评价过程
为了更准确地区分各声音样本的特性,需要对声音样本进行响度均衡化处理。为了确保评价试验的准确性,在进行评价试验之前,需要对所有声音样本进行随机排序。这样可以确保评价者在不了解所有声音样本属性的情况下进行评价试验,避免评价者在评价过程中受到经验和个人喜好的影响而直接对声音样本做出判断。
主观评价试验仍然采取等级评分法。选取豪华感,舒适感,科技感三个形容词,把豪华感、舒适感和科技感度分为10个等级,其中7级为可接受,往上越来越好,而往下越来越差。评价主体按照等级对每组声音样本数据进行打分,统计出每组样本各声音属性的平均得分,如表1所示。
2.3 相关性分析
评价样本筛选:在主观评价试验过程中不可避免地存在各种干扰因素,不能保证每个数据都有效,所以必须进行数据相关性检验。选择Spearman系数作为数据检验指标。Spearman系数,又称秩相关系数,是测定变量之间线性相关程度和相关方向的代表性指标,利用两变量的秩次大小做线性相关分析,对原始变量不做要求,属于非参数统计方法,使用方法较广。语义细分法中的等级相当于变量的秩次,因此选择Spearman系数作为数据检验指标。采用SPSS软件计算30名评价者两两之间的相关系数,得到34×34的系数矩阵,如表2所示。相关系数越大,说明两者对样本的认知程度一致性越高。
3 卷积神经网络及预测结果
选取响度、粗糙度、抖动度、烦扰度、尖锐度等声品质客观参数,并将其作为卷积神经网络模型的特征输入。
3.1 卷积神经网络架构
图2为本文设计的卷积神经网络架构,模型的整个卷积神经网络由2个卷积层组成,然后是全连接层。最终通过回归/分类层输出数值预测结果。在每个卷积层之后,计算批归一化和ReLU激活。在第一个卷积层中,卷积核的数量是32个,第二个卷积层的卷积核数量是64个。其中第一个卷积层的每个卷积核的维数为1×3,用于滤波,第二个卷积层的卷积核大小为6×1,用于整合。为了增强模型的非线性和减少过拟合,本文采用了3个全连接层,中间有两个dropout层。dropout层的概率设置为0.2。特征矩阵的大小为5×2000,由响度、粗糙度、波动度、烦扰度、尖锐度五个特征构成。
3.2 预测结果
经过数据训练和学习,卷积神经网络可实现目标值的预测。对豪华感,舒适感,科技感三个指标部分音频的标签值和预测值如图3所示。
4 结论
本研究设计了一套基于卷积神经网络的声品质评价系统,旨在客观评估行人警示音频的质量。首先,通过等级评分对设计好的音频文件进行主观评价,获取主观评分数据。然后,按照标准计算音频文件的响度、粗糙度、抖动度、烦扰度、尖锐度等声品质客观参数,并将其作为卷积神经网络模型的特征输入。评价模型的输出设定为豪华、舒适、科技三个指标。通过数据训练,该模型能够有效地输出给定指标的评价分数,并且与主观评价分数具有良好的吻合度。未来的研究方向可能包括进一步优化模型,拓展评价指标范围,以及探索更加精准的客观评价方法,从而进一步提升音频质量评估的准确性和实用性。
参考文献:
[1]Mark Allman-Ward,Roger Williams,et al.Designing and delivering the right sound for quiet vehicles[C].Inter-noise 2014.
[2]S. Hatano, T. Hashimoto, Booming index as a measure for evaluating booming sensation, Proceedings of Inter-Noise 2000,7:233.
[3]Lee, Sang-Kwon.Objective evaluation of interior sound quality in passenger cars during acceleration[J].Journal of Sound and Vibration 2008,310:149-168.
[4]Vegt, Emar.Designing sound for quiet cars[M].SAE Technical Paper,2016.
[5]Gwak, Doo Young, et al. Application of subharmonics for active sound design of electric vehicles[J].The Journal of the Acoustical Society of America,2014,136:EL391-EL397.
[6]Chang,Kyoung-Jin,et al.A research on brand sound positioning and implementing with active sound design[J].INTER-NOISE and NOISE-CON Congress and Conference Proceedings[J].Institute of Noise Control Engineering,2017.
[7]方源,章桐,等.电动车动力总成振动噪声的试验研究[J].振动、测试与诊断,2015,32(2):218-224.
[8]David Lennström, Arne Nykänen. Interior sound of today's electric cars: tonal content, levels and frequency distribution[J].SAE Technical Paper,2015.