基于经验模态分解融合快速傅里叶变换的脉搏信号频域特征分析
2023-11-06唐晓静赵静
唐晓静 赵静
1 宁夏医科大学理学院 (宁夏 银川 750001)
2 宁夏大学信息工程学院 (宁夏 银川 750001)
内容提要: 糖尿病已经成为危害健康的重要因素之一。针对现有糖尿病患者无损检测中存在的不足,提出了一种基于经验模态分解融合快速傅里叶变换的脉搏特征分析算法。算法利用经验模态分解算法的自适应特点,将具有非线性非稳态特征的脉搏波信号进行经验模态分解重构,消除背景噪声对脉搏波的影响。然后,采用快速傅里叶变换对信号进行频域特征分析。实验结果表明:光学体积描记术信号的基频最大值偏移了12.5%,而且峰值也增加了63.64%;二次谐波向右偏移了26.67%,数值增加了16.28%。42名志愿者的统计分析也证实,糖尿病患者的光学体积描记术信号与健康人相比,基频的峰值会明显高于健康人群,且峰值所在频率也明显高于健康人群。因此,该算法得到的频域特征可以应用在糖尿病患者早期辅助诊断中,具有重要的应用价值。
随着我国人口老龄化,糖尿病、冠心病等心脑血管疾病已经成为危害人们健康的重要因素之一[1]。心血管疾病患病率及病死率逐年升高,严重影响了患者的日常生活,造成了较大的社会负担。医学研究表明,心血管疾病早期诊断对预防和减少疾病的发生尤为重要,但常规的心脑血管疾病早期筛查需要专业的医护人员和设备,在经济不发达地区普及和推广尚有一定困难[2]。为此,需要找到一种便捷的心血管疾病早期预测技术,实现早期诊疗,减少此类疾病对社会和家庭的影响。
光学体积描记术(Photoplethysmography,PPG)信号携带了大量反映人体生理状态的关键信息,可以直接反映人体血液循环的状态[3,4]。分析蕴含大量生理信息的脉搏信号特征参数,对于研究人体心血管疾病情况,建立起心血管疾病的预测模型具有重要的意义。在此方面,大量的国内外学者做了深入的研究,总结了脉搏信号时域和频域的提取方法。例如:Henri等[5]采集PPG信号,利用卷积神经网络提取不同睡眠阶段的差异性进行了睡眠障碍诊断分析;Li等[6]提取了5种心血管疾病的PPG信号特征,利用卷积神经网络研究了脉搏与心血管疾病的关系。然而,脉搏信号属于一维非线性非稳态复杂生理信号,采用传统的傅里叶变换或小波分析难以剔除信号的背景噪声同时提取出信号的本征特征。
综上,本文提出一种基于希尔伯特-黄变换(Hilbert-Huang Transform,HHT)的PPG特征提取算法,算法首先通过对PPG信号进行HHT,利用PPG信号的固有频率提取出PPG本征信号,消除噪声影响。然后,通过HHT得到信号的频域特性,并将该特性作为PPG信号特征进行健康人群和糖尿病患者间的差异分析,研究统计学意义,实现疾病的早期预测。
1.基于HHT的PPG信号去噪算法
PPG信号产生于心脏收缩和舒张运动形成的血液波动,这种波动在传播过程中会受人体脏器工作状态影响形成手指处微循环血管中血液流量的有规律变化。但这种血液流量的差异很难通过一般的传感器进行采集和分析,因此,PPG信号采集需要借助740nm近红外光信号穿过皮肤组织透射的光被光敏传感器接收并转换成相应的电信号后才能进行处理。
然而透射光信号在此过程中会因运动状态、背景环境等不可避免噪声的影响出现信号噪声,这种噪声很难通过曲线拟合、平滑滤波以及形态学算法滤除。为此,本文将改进的希尔伯特-黄算法应用在PPG信号消除上[7]。通过对信号进行经验模态分解(Empirical Mode Decomposition,EMD),得到信号的本征模态函数(Intrinsic Mode Function,IMF),一次性消除各种环境噪声的影响,获得能够反映血液流量本质变化的PPG分量,再研究该分类信号的特征频谱。
EMD作为非线性非稳定信号时频域分解算法,需要满足条件为整个数据的极值点和过零点个数相等或相差最多不超过一个;任意时刻极值构成包络线相对于时间轴对称。其实现步骤如表1所示。
信号的EMD可以表示为公式(1):
其中,x(t)为原始信号,rn为残差,IMF为不同尺度下的本征分量,原始信号分解出的IMF数量根据原始信号里蕴含的频谱分量自行产生,不需要提前设定。
采用EMD分解PPG信号得到IMF分量如图1所示,图中,原始信号经过分解后得到了9个IMF分量,对应的信号频率从高到低的分布。
图1. PPG 信号分解得到的IMF 分量图
全部IMF信号中低频部分为零点漂移引起的噪声,高频部分为仪器干扰和背景噪声,中间的分量为纯净的PPG信号基频和高频部分。因此,滤除低频和高频部分,就可以较好地还原PPG信号本身。如图2所示,其中图2a为原始信号,图2b为消除噪声后的信号。可以看到,原始信号中因为干扰,无法提取信号的主波波峰和重博波峰,不能对脉搏的舒张期和收缩期进行有效特征提取。而重构信号滤除高频噪声后,能够将该特征较好地表现出来,原始信号中心脏的收缩和舒张产生的主波能够更为明显地区分,见图2c。
图2. 脉搏信号去噪重构
2.PPG频域特征提取
PPG信号重构后,就能够较为容易地提取信号的频域特征,常用的频域特征提取方法有傅里叶变换、小波变换等。为了简单便捷地分析脉搏信号的频域特征,采用快速傅里叶变换对重构信号进行分析。连续信号的傅里叶变换可以表示为公式(2)。
离散傅里叶变换可以表示为公式3。
其中,X[k]为频域信号幅值,k表示频率,x(n)为原始信号。采用公式(2)就可以对离散采样点进行傅里叶变换,将信号从时域转换到频域。
以健康人群为例,采用快速傅里叶变换变换后,可以看到脉搏信号在8Hz左右达到最大值1.43×108,其2次谐波在15Hz左右达到最大值1.29×108,在实现过程中,频谱变化范围比较窄,说明信号的能量较为集中。其3次、4次、5次谐波能量迅速减小,具体情况见图3。
图3. 健康人群的PPG 信号频域特征
在糖尿病患者的脉搏信号中,其频率明显向高频方向偏移,相对于健康人群增大。图4为采集的糖尿病患者PPT信号的频谱,从频谱中可以看到PPG信号的基频最大值向右偏移到9Hz,偏移了12.5%,而且数值也增加为2.34×108,增加了63.64%;二次谐波向右偏移到19Hz,偏移了26.67%,数值增加到1.50×108,增加了16.28%。
图4. 糖尿病患者的PPG 信号频域特征
3.算法在糖尿病患者检测中的应用
为了进一步验证健康人员与糖尿病患者PPG信号特征间的差异,利用频域特征对相关人员有无糖尿病进行预测,选取了42名健康人员和糖尿病患者人群进行深入分析。其中,糖尿病患者的生理指标中空腹血糖浓度高于7.0mmol/L或糖化血红蛋白高于6.5%,所有志愿者均签署了知情同意书,并得到了医院伦理委员会审核。测试过程除了脉搏信号外,还采集了人体基本生理参数,见表2。
表2. 测试人员的基本信息(n=42,±s)
表2. 测试人员的基本信息(n=42,±s)
项目健康糖尿病年龄(岁)65.41±4.19 66±6.40身高(cm)160.84±7.48 156.99±4.66体重(kg)66.7±9.11 70.12±10.23腰围(cm)85.21±5.22 90.33±11.14体重指数(kg/m2)24.20±3.17 27.54±5.33收缩压(mmHg)169.22±17.14 124.21±23.21收缩压(mmHg)84.25±10.15 77.82±17.84脉搏压(mmHg)50.44±15.25 69.19±15.66糖化血红蛋白(%)5.91±0.36 8.34±1.41餐前血糖(mmol/L)4.67±0.60 8.83±3.12
对相关人群采集的脉搏信号进行EMD分解重构消除噪声后,选取反映测试人的PPG信号进行快速傅里叶变换,并对两组人群计算平均值,得到频谱特征,结果如图5所示。
图5. 健康人群与糖尿病患者的PPG 信号频谱特征
图5中深蓝色为健康人群的频谱特征,红色为糖尿病患者的频谱特征。可以看出糖尿病患者和健康人群的频率和最值均有明显差异,糖尿病患者的基频和各次高频的最大值均高于健康人群,最高值所在的频率值也高于健康人群,且测试结果存在统计学意义(P<0.01)。
此类现象存在的主要原因是糖尿病患者糖代谢紊乱,血管的大中血管存在一定的动脉粥状硬化,动脉壁中层钙化,内膜存在纤维状增生,管腔狭窄,毛细血管基底增厚,血液黏度增大,流速降低,每一次心脏收缩泵血过程都需要更大的压力来满足组织的需求。因此,糖尿病患者血管平均血流速度低于健康人群,但动态阻力和脉搏波波速明显高于健康人群,而且血管功能和形态存在异常,导致PPG信号频谱存在显著差异性。
4.小结
作为复杂的生理信号,脉搏波信号蕴含了大量的血液流动和动脉血管健康状态信息。当前,常用的动脉血管状态评估数据包括动脉硬化指数、爬坡时间、爬坡时间比等内容。然而,这些数值主要来自脉搏波的形态时域分析,容易受背景噪声影响,影响数据的准确性;在数据的频域分析中,最大能量的瞬时频率值也是一个比较显著的指标,但该数据计算复杂且看不出基频和多次谐波分量,使用起来需要一定的专业背景[8]。
本次实验通过42人的测试和分析可以看到,通过EMD变换提取本征函数能够较好地消除背景噪声,增强信号特征,呈现出本征信号固有的主波波峰和重博波峰,有着明显的收缩压和舒张压特征。在此基础上,选用快速傅里叶变换频谱分析能够将健康人群和糖尿病患者的PPG信号进行分类,两类信号间存在明显的最大值数值和频率所在位置差异,这种差异在基频和各高次分量中均有存在,可以作为区分糖尿病患者和健康人群的无损检测方法。