APP下载

低方差幂律调制多尺度熵算法及其应用分析

2022-08-17卓雁文杨思琪罗二平谢康宁

空军军医大学学报 2022年3期
关键词:幂律心电复杂度

李 艳,卓雁文,杨思琪,汤 池,罗二平,谢康宁

(1空军军医大学军事生物医学工程学系军事医学装备与计量学教研室,陕西 西安 710032; 2解放军第95788部队60分队,四川 成都 610000)

生理信号可以看作是生物系统的输出变量,其中蕴含着大量有关生物系统的状态信息。人们可以通过分析生理信号来区分人体不同的生理或病理状态,例如借助心电图帮助诊断心律失常、心肌缺血等疾病[1];通过脑电信号判断帕金森、癫痫等精神性疾病[2-4],还可以用于监测术中的麻醉深度以及研究睡眠分期[5-7]。因此,生理信号具有十分重要的研究意义。生理信号的特点决定了其分析的复杂性和多样性,而传统的时频分析等方法更适用于分析线性平稳信号,而对于生理信号这类具有非线性、非平稳等特点的信号分析则存在一定局限。近些年来人们尝试用非线性动力学方法来分析生物信号,得到了较好的结果。其中,复杂度就是时间序列信号非线性动力学的重要特征之一。

多尺度熵(multiscale entropy,MSE)是用于测量时间序列复杂度的常用算法,并被应用于生物医学、交通和金融等领域[8-9]。MSE及其变体作为度量生理信号复杂度的方法之一,被广泛研究。然而,MSE及其改进方法有两个缺点:首先,MSE认为含有白噪声的生理时间序列具有更高的复杂度,而白噪声是一种完全随机信号,无序程度最高,应该具有最低的复杂度。其次,MSE并不能直接表明复杂性,在比较熵值大小的同时还需要考虑熵值变化趋势[8-11]。

为了克服这两个困难,HAN等[12-13]提出了一种新的生物信号复杂度分析方法——幂律调制多尺度熵(power-law exponent modulated multiscale entropy,pMSE),针对MSE的不足和缺陷进行了改进,可以为生理时间序列提供直接的复杂性度量。然而,对于较短的时间序列而言,需要避免未定义的熵值,并减小计算方差。WU等[14]提出的修正多尺度熵(modified multiscale entropy,MMSE),使用移动平均过程代替粗粒化过程,可以在短时间序列上提高精度和避免未定义的熵值。

在本次研究中,我们基于pMSE算法并借鉴MMSE算法的移动平均过程,提出一种改进的定量生理信号复杂度的方法——低方差幂律调制多尺度熵(low-variance power-law modulation multiscale entropy,Lv-pMSE)算法,并通过仿真和真实信号进行验证和测试。

1 pMSE算法和Lv-pMSE算法

1.1 pMSE算法

生理信号的功率谱服从幂律分布,即信号的功率谱随频率的增加呈幂律函数递减,用公式可以表示为:P∝1/fβ,其中P是功率,f是频率,β是幂律指数[8]。当β=0时,信号为白噪声;当β=1时,信号称为1/f噪声或闪烁噪声。

HAN等[12-13]基于MSE算法,将熵和分形的自相似相结合,并借助幂律指数β来描述信号的自相似性,提出了pMSE算法,计算公式为:

(1)

其中τ是尺度因子,MSEτ是第τ个尺度的多尺度熵值,βτ是第τ个尺度上的幂律指数。当以尺度因子τ的自然对数ln(τ)为横坐标时,MSE在各个尺度上的值与ln(τ)成正比,关系表达式为:

(2)

表达式中slopeτ是MSE曲线的斜率,则MSE曲线的斜率slopeτ与βτ之间存在一种线性关系,即

(3)

计算出MSE在各个尺度处曲线的斜率slopeτ,便可以得到估计的βτ近似值。所以pMSE可以写成:

pMSEτ=MSEτ×|slopeτ+0.5|

(4)

1.2 Lv-pMSE

虽然pMSE方法有较好的应用效果,但是在估计幂律指数β的过程中引入了一定误差,导致pMSE分析中的方差较大[12]。同时,粗粒化过程导致大时间尺度下样本熵的统计可靠性和估计准确性降低。

为了降低pMSE在分析信号中的方差,我们借鉴了MMSE中的移动平均过程思想[14],提出了Lv-pMSE,希望可以在保持pMSE好的应用效果的同时,降低其在分析中的方差并适用于小数据分析,提高pMSE运算结果的稳定性。

Lv-pMSE的计算过程结合了MMSE中的移动平均法和pMSE的幂律指数β估计,该算法首先对时间序列xi进行移动平均过程计算,得到尺度τ所对应的移动平均时间序列zτ:

(5)

然后计算尺度因子τ下的时间序列的MMSE:

MMSE(x,m,r,t)=SampEn(zτ,m,r,t)

(6)

其中SampEn是样本熵[15],m是嵌入维数,r是延迟因子,τ是尺度因子,通常取m=2,r=1,τ=20。则Lv-pMSE的表达式为:

(7)

βτ的计算方法与pMSE算法相同,Lv-pMSE最终可以写为:

Lv-pMSEτ=MMSEτ×|slopeτ+0.5|

(8)

2 pMSE和Lv-pMSE数据分析

2.1 仿真信号

白噪声和1/f噪声是两种具有幂律分布特征的特殊单分形信号。β=0时,信号为白噪声;β=1时,信号为1/f噪声。为了验证Lv-pMSE算法的可靠性,首先采用这两种仿真信号对其进行算法验证。

2.1.1 实验方法 ①在Matlab(版本号R2018b)中生成单分形条件下的幂律分布信号。白噪声信号(β=0)和1/f噪声信号(β=1),噪声信号均由LITTLE等[16]提供的函数powernoise.m生成。②研究数据长度对pMSE和Lv-pMSE方法的影响。使用Matlab依次生成30组多种数据长度(N=3 000,5 000,10 000)的白噪声和1/f噪声信号,对不同长度的白噪声和1/f噪声序列进行pMSE和Lv-pMSE的熵值曲线分析,对三种数据长度的两种方法的方差进行统计学分析。每种数据长度均采取30组独立的噪声样本。

2.1.2 实验结果 使用pMSE和Lv-pMSE分别对N=3 000、N=5 000和N=10 000时的白噪声和1/f噪声进行分析。其中在N=3 000时,白噪声的pMSE曲线和Lv-pMSE在各个尺度上均有差异(Mann-Whitney检验,P<0.05);在N=5 000和N=10 000时,仅在少部分尺度上有差异,所以数据长度N=3 000时,Lv-pMSE方法的拟合效果欠佳(图1)。1/f噪声的Lv-pMSE曲线波动小于pMSE,且整体均值更接近1(图2)。结果表明,Lv-pMSE的分析结果更符合ZHANG[17]的结论,即白噪声复杂度为0,1/f噪声复杂度接近于1。

A:N=3 000的白噪声熵值分析;B:N=5 000的白噪声熵值分析;C:N=10 000的白噪声熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:幂律调制多尺度熵;Lv-pMSE:低方差幂律调制多尺度熵。 aP<0.05 vs Lv-pMSE。图1 白噪声的pMSE和Lv-pMSE分析

A:N=3 000的1/f噪声熵值分析;B:N=5 000的1/f噪声熵值分析;C:N=10 000的1/f噪声熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:幂律调制多尺度熵;Lv-pMSE:低方差幂律调制多尺度熵。aP<0.05 vs Lv-pMSE。图2 1/f 噪声的pMSE和Lv-pMSE分析

不同数据长度中,不论是白噪声还是1/f噪声,Lv-pMSE的方差均小于pMSE的方差。在白噪声的pMSE和Lv-pMSE分析中,当N=3 000时,pMSE中方差的中位数为0.575 0,Lv-pMSE中方差的中位数为0.315,可以认为pMSE的方差高于Lv-pMSE的方差,差异有统计学意义(Mann-Whitney检验,P<0.05)。当N=5 000时,pMSE中方差的中位数为0.325 0,Lv-pMSE中方差的中位数为0.023 5,可以认为pMSE的方差高于Lv-pMSE的方差,差异有统计学意义(Mann-Whitney检验,P<0.05)。当N=10 000时,pMSE中方差的中位数为0.023 0,Lv-pMSE中方差的中位数为0.017 0,可以认为pMSE的方差高于Lv-pMSE的方差,差异有统计学意义(Mann-Whitney检验,P<0.05)。在1/f噪声的pMSE和Lv-pMSE分析中,当N=3 000时,pMSE中方差的中位数为0.222 5,Lv-pMSE中方差的中位数为0.140 0,可以认为pMSE的方差高于Lv-pMSE的方差,差异有统计学意义(Mann-Whitney检验,P<0.05)。当N=5 000时,pMSE中方差的中位数为0.146 0,Lv-pMSE中方差的中位数为0.083 5,可以认为pMSE的方差高于Lv-pMSE的方差,差异有统计学意义(Mann-Whitney检验,P<0.05)。当N=10 000时,pMSE中方差的中位数为0.065 0,Lv-pMSE中方差的中位数为0.048 5,可以认为pMSE的方差高于Lv-pMSE的方差,差异有统计学意义(Mann-Whitney检验,P<0.05)。

随着信号数据长度的增加,方差的降低比例也逐渐降低。计算可得,在白噪声的分析中,当数据长度分别为N=3 000、N=5 000和N=10 000时,Lv-pMSE的方差比pMSE的方差分别降低了53.0%、36.0%和34.0%。在1/f噪声的分析中,当数据长度分别为N=3 000、N=5 000和N=10 000时,Lv-pMSE的方差比pMSE的方差分别降低了48.3%、51.0%和44.0%。

2.2 真实心电信号

2.2.1 数据来源与处理 为了验证Lv-pMSE算法对真实数据复杂度评估的有效性,选取了心电信号进行Lv-pMSE评价。心电数据选自PhysioNet数据库[18],从数据库中选取正常窦性心律(normal sinus rhythm,NSR)受试者、充血性心力衰竭(congestive heart failure,CHF)患者和房颤(atrial fibrillation,AF)患者的典型心跳间期时间序列进行分析。分别从每组数据中随机选取14组心电间期信号数据,按上文所述的方法对所选数据进行预处理,然后对各组信号进行pMSE和Lv-pMSE分析。

2.2.2 实验结果 分别在NSR、CHF和AF的心电RR间期时间序列上进行pMSE和Lv-pMSE算法的效果测试,所选取的数据长度为N=10 000。结果显示,虽然三者的pMSE和Lv-pMSE曲线较好的重合,无显著性差异,但方差没有得到显著的降低。与pMSE相比,经Lv-pMSE计算得出的NSR、CHF和AF的心电间期信号的方差分别降低了1%、1%和5%(图3)。

A:正常窦性心律的熵值分析;B:充血性心力衰竭的熵值分析;C:房颤的熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:幂律调制多尺度熵;Lv-pMSE:低方差幂律调制多尺度熵。N=10 000。图3 心电间期信号的pMSE和Lv-pMSE分析

仿真信号中的实验结果表明,随着信号数据长度的减小,方差的降低比例也逐渐增大。同样地,在心电信号中进行验证,从截取的信号中分别随机选取N=5 000和N=2 000的数据段进行分析。

图4A~C分别表示N=5 000时,pMSE和Lv-pMSE对NSR、CHF和AF的心电间期信号分析,结果显示,N=5 000时的各类信号的Lv-pMSE的方差小于N=10 000时的方差。在小尺度上,Lv-pMSE与pMSE的方差几乎相等,但在大尺度上,Lv-pMSE方差降低较多。经计算得出,NSR、CHF和AF的心电间期信号经Lv-pMSE分析后的方差比pMSE分析后的方差分别降低了8%、6%和6%。

A:正常窦性心律的熵值分析;B:充血性心力衰竭的熵值分析;C:房颤的熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:幂律调制多尺度熵;Lv-pMSE:低方差幂律调制多尺度熵。N=5 000,aP<0.05 vs Lv-pMSE。图4 心电间期信号的pMSE和Lv-pMSE分析及其方差对比

图5A~C的结果显示,当N=2 000时,由Lv-pMSE计算得到的三种信号的方差明显降低。在大尺度上,三种信号的pMSE和Lv-pMSE均欠拟合(Mann-Whitney检验,P<0.05),Lv-pMSE的分析方差降低更明显,该结论与N=5 000时的结论一致;pMSE和Lv-pMSE的均值表现出差异,Lv-pMSE在大尺度上的均值要比pMSE更小。经计算得出,NSR、CHF和AF的心电间期信号经Lv-pMSE分析后的方差比pMSE分析后的方差分别降低了22%、16%和11%。

A:正常窦性心律的熵值分析;B:充血性心力衰竭的熵值分析;C:房颤的熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:幂律调制多尺度熵;Lv-pMSE:低方差幂律调制多尺度熵。N=2 000, aP<0.05 vs Lv-pMSE。图5 正常窦性心律、充血性心力衰竭和房颤的心电间期信号的pMSE和Lv-pMSE分析及其方差对比

最后,分别用pMSE和Lv-pMSE对三种信号进行分析,结果如图6所示。其中,图6A~B的数据长度N=2 000,图6C~D的数据长度N=5 000。N=2 000时,Lv-pMSE的方差虽然显著减小,但也无法仅通过值来区分不同复杂度的信号。N=5 000时,Lv-pMSE很好地保持了pMSE对信号的区分能力,即NSR的心电RR间期信号的复杂度大于CHF和AF的心电RR间期信号的复杂度。

A:pMSE对N=2 000的信号测试;B:Lv-pMSE对N=2 000的信号测试;C:pMSE对N=5 000的信号测试;D:Lv-pMSE对N=5 000的信号测试。pMSE:幂律调制多尺度熵;Lv-pMSE:低方差幂律调制多尺度熵;Scale:尺度因子。图6 pMSE和Lv-pMSE分析中正常窦性心律、充血性心力衰竭和房颤信号对比

3 讨论

本研究主要围绕Lv-pMSE算法进行了探索和研究。目前发现导致pMSE方差大的原因主要有两个:①信号幂律指数的估计过程会引入一定的误差;②粗粒化过程会导致样本熵统计学可靠性降低,产生不精确的熵估计或导致未定义的熵。因此,本研究基于pMSE算法,将MMSE与幂律指数相结合,以移动平均法代替了粗粒化过程,提出了Lv-pMSE算法,并通过仿真和心电信号对Lv-pMSE的实际应用效果进行了评估。

本研究主要得到了以下结果和结论:①Lv-pMSE的均值曲线较pMSE的均值曲线更平稳;②Lv-pMSE在大尺度上降低方差的效果较好,且在一定范围内,时间序列数据长度越短,减小方差的效果越好;③Lv-pMSE较好地保持了pMSE对信号的区分效果,并可以在更短的时间序列上进行分析。

本研究不足之处主要有:①选取的心电信号样本类型较少,不能很好地评估Lv-pMSE在其他复杂生理信号中的应用效果;②当时间序列的数据长度N=10 000时,Lv-pMSE的方差几乎没有减小,且运算量比pMSE更大,而在时间序列的数据长度较短的时候,虽然Lv-pMSE减小方差的效果更好,但与pMSE相比,其在大尺度上的均值有所偏差;③Lv-pMSE没有完全解决pMSE在尺度1上均值和方差偏大的问题。

综上所述,本研究结果表明,当生理信号时间序列的数据长度N=5 000时,Lv-pMSE减小方差的效果最好,且保持了pMSE对信号的区分效果。

下一步,本课题组将在更多的生理信号(如脑电信号、姿势信号等)和应用场景中测试Lv-pMSE,以便更好地帮助临床疾病的诊断与康复。

猜你喜欢

幂律心电复杂度
心电向量图诊断高血压病左心室异常的临床应用
基于非接触式电极的心电监测系统
穿戴式心电:发展历程、核心技术与未来挑战
一种低复杂度的惯性/GNSS矢量深组合方法
更正启事
求图上广探树的时间复杂度
四川地区降水幂律指数研究
幂律流底泥的质量输移和流场
某雷达导51 头中心控制软件圈复杂度分析与改进
对抗幂律