基于脑功能网络深度学习的车内噪声评价模型

2020-06-03邹丽媛宋桂秋

机械与电子 2020年5期

邹丽媛，王宏，宋桂秋

(1.东北大学机械工程与自动化学院，辽宁沈阳 110819；2.辽宁水利职业学院，辽宁沈阳 110122)

0 引言

伴随我国汽车产业发展速度的加快，人们越来越注重乘车的舒适度。NHV性能对乘车舒适度具有直接性影响，成为人们在购车过程中首要考虑的重点指标之一。

发动机器的尖锐度、周期和响度等都会在一定程度上对发动机噪声烦躁度的主观感知造成直接性影响。声品质评价方法应运而生，其评价流程概括如下：第一，进行评价小组的创立，致力于通过借助多重回归法，就所提取的噪声响度、尖锐度以及粗糙度等客观物理参数进行客观量化模型的建立，从而达到主观进行噪声评价的目的[1-4]，心理声学由此发展而来。由于高端轿车对车内声品质的高要求，心理声学的发展得到极大支持。

近年来，越来越多的国内外研究人员将脑电方法用于噪声暴露的研究，发现噪声暴露可改变中枢神经系统，且其影响程度与噪声的类型和声压级相关。一部分研究人员使用ERP时域分析方法，发现噪声环境睡眠的受试Nogo的P3成分的幅值比安静环境睡眠的受试者明显降低[5]，噪声环境下P300的成分的幅值显著提高[6]，噪声声压级升高，可导致N1成分的幅值降低、P2成分的幅值升高，额区变化最为显著[7]。一部分研究人员研究了多种噪声环境下，脑电节律特性的变化[8-11]。

相比与功率谱密度分析，ERP时域分析等方法，本文使用的基于图论的脑功能连接复杂网络可以反映出不同频段各个导联间的关系，将大脑的神经系统由基于图论的复杂功能网络体现，更能直观地反映出噪声对大脑功能连结性的影响[12-14]。与此同时，深度学习算法在图像识别和语音识别等人工智能领域广受关注。在汽车产业向智能检测与制造方向发展的当下，本文将脑电研究与深度学习相结合并引入车内噪声评价中来。

1 实验材料和实验方法

1.1 噪声采集及被试选取实验方案及设备

本文主要选取某高端品牌的轿车、某中端品牌的吉普车及某型号的城市客车三款车型，每个车型各选1台，平均车速分别控制在30 km/h，50 km/h，80 km/h和静止但不熄火共4种状态。就其车内噪声状况进行每次时长为8 min的车内噪声录制。其中噪声采集位置均设置于驾驶员座位上的人耳所在位置。而后由10名专家组成的专家组对12个车内噪声进行评分，采用10级评分(0为舒适，10为烦躁)。

另外，在实验人员选取方面，主要选取受试者22名，男女分别11名，年龄22～40岁左右。受试者均无不良身体状况或听力障碍。要求所有受试者在实验之前的48 h内不准饮酒、喝咖啡以及使用其他药物等。实验在一个灯光相对昏暗且较为安静的封闭环境内展开。各受试者均坐在舒适的靠椅上，使用双声道音箱随机播放车内噪声，同时其采集脑电信号。

1.2 实验方案及设备

实验具体流程如下，首先采集1 min的静息脑电。然后，使用相同音量随机播放每个刺激噪声音频，同时采集被试者的脑电信号，每次实验中间间隔10 min供被试者休息，并消除组间影响。实验场景如图1所示。

图1 实验示意

选用Emotiv system的便携式脑电信号采集仪Emotiv EPOC采集脑电信号，其采样频率为128 Hz，共14个电极，以10～20导联系统国际标准放置，电极位置如图2。其中参考电极位于双侧耳后乳突处。

图2 Emotiv EPOC电极位置

2 研究方法

2.1 基于同步似然的脑功能网络构建

将时间序列xk,i(k表示通道，k=1,…,M;i表示离散时间，i=1,…,N)延迟嵌入m维空间

Xk,i=(xk,i,xk,i+τ,xk,i+2τ,…,xk,i+(m-1)τ)

(1)

τ为延迟时间；m为嵌入维数。

通过以每个时间序列k与时间点i来对嵌入向量相互之间的距离加以界定，可以得出嵌入向量小于距离ε的概率为

(2)

| |表示欧几里得距离；θ为Heaviside阶梯函数，当x≤0时，θ(x) =0，当x>0时，θ(x) =1；ω1和ω2则代表2个时间窗，其中，ω1表示自相关的Theiler校正，ω2代表锐步同化测量时间分辨率的时间窗，并基本满足ω1≪2≪N的条件。

基于每个k和i，就临界距离εk,i的值加以确定，εk,i由参考概率Pref确定(Pref≪1)。

通过对每个成对的离散时间(i，j)进行确定后，当窗ω1< |j-i|<ω2时，嵌入向量Xk,i和Xk,j之间的距离要比临界距离小，其通道数

(3)

Hi,j的值在0到M之间。

对于通道k和离散时间(i,j)，定义同步似然系数Sk,i,j

(4)

|Xk，i-Xk,j|≥εk,i，Sk,i,j=0

(5)

对所有j取均值后，可以得到同步似然Sk,i为

(6)

对脑电信号分析时，Pref=0.05。可以结合数据在时间和频率方面的特性，进行最佳延迟时间与嵌入维度的选择。具体参数数值设置如下：延迟时间为7，嵌入维度为7；ω1为84；ω2为283。

2.2 基于SAE的特征提取

近年来，针对深度学习的研究深受广大学者的关注，深度学习可以学习到人工难以提取的有效特征，大大缓解机器学习模型对特征工程的依赖。特征提取过程要求对工程领域有非常深入的理解，使用特定算法提取特征。而深度学习，可以模仿人脑对特征进行逐层扫描，通过多层神经网络的特征学习，提取重构得到有意义的高阶特征。此外，脑电信号是非线性信号，其中参杂大量非稳态噪声，本文使用基于最大相关熵的鲁棒栈式稀疏自编码器RSAE[15]提取特征，结合回归分析算法构建噪声烦恼度评价模型。

将delta，alpha和beta 3个频段的脑功能网络邻接矩阵重塑为1×(30×30×3)=1×2 700的一维向量，作为RSAE的输入，经过4层自编码器提取第四层高阶特征作为回归模型的输入，输出估计烦躁度数值。

自编码器(autoencoder,AE)，即可以使用自身的高阶特征编码自己。自编码器也是一种神经网络，它的输入与输出是一致的，如图3所示。借助稀疏编码的思想，使用稀疏的高阶特征重构自己，自编码器的学习过程是无监督的。假设其输入向量为X(包含偏置bias数值)，权值矩阵为W，激活函数为f(x)，提取的特征向量为H。其自编码与解码的过程为

H=f(WX)

(7)

(8)

RSAE是多个自编码器的级联，n个AE按顺序训练。第一个AE训练完成后，将编码器的输出作为第二个AE的输入，以此类推。如图3所示，其中图3a为第一个自编码器提取得到一阶特征和为第二个自编码器提取得到二阶特征。通过预训练得到各阶特征，将其堆叠如图3b所示，此时网络与神经网络相同。

图3 SAE示意

本文使用四阶RSAE，将第四阶特征作为之后回归模型的输入。其中第一层包含2 048个元素，第二层包含1 024个元素，第三层包含512个元素，第四层包含128个元素，即最终提取128个四阶特征作为回归模型的输入。

通过反向传播机制使得目标输出与输入无限趋近。最大相关熵的损失函数J可以表示为

(9)

n为训练集样本个数;l为每个样本的长度;当J取最大值时，参数θ为最优解。

为避免网络过拟合，使用L2正则化，加入正则化后的损失函数

(10)

3 结果讨论

3.1 基于传统心理声学声音品质的车内噪声评价

利用现普遍使用的心理声学声音品质客观评价模型对采集到的车内噪声进行评价。提取包括响度、尖锐度、粗糙度和抖动强度4项声音品质特征。

图4为静止状态下3种车型车内噪声与实验环境背景音的特征响度平均值随临界频带的变化曲线，其中实线为实验室环境，虚线为高端轿车车内噪声环境，双划线为中端吉普车车内噪声环境，点实线为城市公交车。从图4可以看出，在各个bark内噪声嘈杂度越高其特征响度越大。临界频带较高时，中端吉普车与高端轿车较为相似。实验室环境只在临界频带较低时有较为明显的特征响度。