APP下载

一种新的胎心率信号压缩方法
——卷积编解码网络

2021-02-27阙与清陈定科陈超敏

南方医科大学学报 2021年2期
关键词:压缩率原始数据心率

阙与清,陈定科,童 蕾,陈超敏

1南方医科大学生物医学工程学院,广东 广州510515;2广东机电职业技术学院,广东 广州510550

由缺氧引起的胎儿窘迫可能危及生命或引起某些先天性疾病,胎儿缺氧主要根据胎儿心率判断[1]。有研究提出了一个基于物联网的母婴监控系统[2],该系统可以完成从胎儿心率采集到用户在家中可穿戴设备进行心电图(ECG)分析的整个过程。在基于物联网的母婴监控系统中,需要使用多普勒超声设备从母亲的腹部收集胎儿心脏数据,进行处理并将其存储在移动设备上,然后通过云平台,获取诊断结果数据。为更准确地了解胎儿的状况,胎儿心率信号的采集应至少12 min或更长时间,但由于数据量较大而面临一些困难,例如传输延迟,带宽限制和高能耗[3]。

基于物联网的可穿戴母婴监控系统,分为传感器数据采集部分、微控制器数据处理、云平台数据传输、用户端和医生端数据分析[4]。在所有任务中,数据传输是物联网节点中最耗能的任务。我们可以在微控制器部分执行数据压缩。数据压缩是一种减少数据量以减少存储空间,提高其传输,存储和处理效率而又不会丢失有用信息或根据某种算法重新组织数据以减少数据冗余和存储空间的方法[5]。目前有两种数据压缩方法,有损压缩和无损压缩。使用无损压缩时,原始数据得到了很好的保护,但是压缩率很低。常见的无损压缩算法包括:Huff-man coding[6],Run-1ength encoding[7],以及Lempe1-Ziv-We1ch[8]。尽管这种算法可以完全保留原始信号的信息,但压缩率非常低。

本文旨在减少数据传输的损失,因此采用有损压缩方法。良好的有损压缩器在删除冗余信息时会保留重要信息,例如,降噪等相对无用的数据。有研究者采用基于小波变换的ECG信号压缩方法[9],该方法平均压缩率为63%,PRD在0.1%~2.1%。此外,还有人提出了一种离散小波变换和误差约束的有损压缩器[10]。压缩感知在数据压缩中使用广泛,有研究使用压缩感知方法压缩ECG信号,取得了不错的结果[11]。有研究使用离散余弦变换和离散小波变换方法压缩了胎儿心电图信号[12]。尽管这些有损压缩算法无法完全恢复原始数据,但是依然保留了解释数据的重要信息,可以换取更大的压缩率。它使用压缩数据进行重建,重建后的数据与原始数据有所不同,但不会影响人们对原始数据表示的信息的理解。然而,压缩感知方法对信号的稀疏性有很高的要求,对噪声信号的重建能力较差。基于小波变换的数据压缩方法计算复杂度高,计算时消耗大量内存,且价格昂贵,无法满足母婴监护系统的实时性和节能性要求。因此,本文提出了一种浅层卷积网络的数据压缩方法,该方法不仅对信号具有较强的自适应能力,而且计算量小。

1 材料和方法

1.1 数据收集和预处理

数据库来自布拉格的捷克技术大学和布尔诺大学的大学医院,其中包含552个ECG记录,这些记录是由2010~2012年在布尔诺大学收集的9164个记录中精心选择[13]。每个ECG都包含一个胎儿心率时间序列和一个子宫收缩信号,每个信号均以4 Hz采样。由于这项研究使用的是未经处理的公共数据集,并且胎儿心率信号主要通过无创多普勒超声收集在母亲的腹部上,因此收集到的腹部胎儿心电图信号将受到诸如母亲运动,设备不稳定,并不可避免地叠加了母亲Impact的生理信号,其中包含许多噪声信号[14](图1A)。因此,数据需要先进行预处理。在去噪之前,首先要清理数据。对于胎儿心率为0 bpm且数据长度大于15的片段,认为这是由于传感器接触不良所致,因此将消除此类片段。对于胎儿心率小于60 bpm或大于150 bpm的数据,将其视为异常值并将其消除,并用样条插值填充[15]。清洗后的信号如图1B。清洗后的数据剔除了胎心率为0的片段,这些数据可能是由于采集设备故障导致的无效数据,会非常影响对信号的分析。对于异常值数据,采用样条插值法,可以缩小异常值的影响。本研究使用经验模态分解(EMD)算法对信号进行去噪。

图1 未处理(A)及清洗后(B)的数据Fig.1 Unprocessed data(A)and data after cleaning(B).

1.2 EMD

有研究提出经验模式分解[15],其原理是将原始信号分解为许多窄带分量,每个分量称为本征模态函数(IMF),分解结果由多个本征信号和一个残差信号组成,然后将其中的高频本征信号与残差信号相加,得到一个重构信号。它是一种新型的自适应信号时频处理方法,特别适用于非线性和非平稳信号的分析和处理。这种方法可以根据信号的特性将信号自适应地分解为几个信号,而无需任何先验知识[16]。本征模函数之和被认为是传统时频分析方法的突破,例如基于线性和固定假设的傅里叶分析和小波变换。根据研究,该方法在低信噪比的信号降噪中表现出良好的性能。EMD算法的原理参考文献[17]。本研究导入包含噪声的胎儿心率信号,并使用EMD分解获得11个本征模函数,然后根据多次实验,根据观察重构信号与原始信号对比图,选择使去噪效果最好的,即IMF3~IMF10(图2)。这些本征模函数的累加以获得重构信号就是本研究的去噪信号。EMD去噪前后的信号数据变得更加平滑,但保留了重要的形态学特征(例如加减速变化、极值点,图3)。

1.3 信号压缩

数据传输和存储是无线传感器网络的主要问题。在基于物联网的胎儿监护系统中,为使信号传输更快、更节能,我们提出一种基于卷积编解码网络(CC-Net)的信号压缩方法,以减少云传输的损失。该网络包含两个模块:编码和解码。在编码模块中,压缩胎儿心率信号;在解码模块中,重建压缩信号。

图2 用于重构信号的本征分量Fig.2 Eigen components used to reconstruct the signal.A: IMF3; B: IMF4; C: IMF5; D: IMF6; E: IMF7; F:IMF8;G:IMF9;G:IMF10.

图3 EMD去噪前后的信号Fig.3 Signals before and after EMD denoising.

CC-Net是神经网络的一种特殊形式,其目的是在输出中生成输入的副本[18]。有研究人员使用卷积网络压缩了ECG信号并获得了较好的结果。我们使用卷积编解码网络应用于胎儿心率信号的压缩。在编码模块中,它可以获得压缩的低维数据,然后将低维数据用作解码模块的输入,以解码以获得重构数据。然后,重建数据与原始数据之间的均方误差更新了隐藏层参数,使重构信号越来越接近原始信号,即使得编码模块压缩的数据中包含的信息特征更加完整。在编码器阶段,将输入矢量转换为隐藏层表示,如公式(1)所示:

其中,x是输入信号向量,y是通过卷积编码获得的特征向量。w是权重矩阵,b是偏差项。f(·)是线性投影或非线性映射的函数。在解码器部分,编码的矢量被重建以形成原始信号。如式(2)所示:

其中,x'是解码后的重构信号,将其与原始信号进行比较以判断压缩的有效性。y是等式(1)中的特征向量。本研究中的卷积自动编码框架如图4。

在本研究中,由于胎心率信号是一维信号,所以采用的是一维卷积网络。一维卷积常用于序列模型和自然语言处理中[19]。假定初始长度为6,卷积核大小为3,步长为1,则一维卷积后的数据维为6-3+1=4(图5)。最大池化层的主要功能是下采样。假定初始维数为8,过滤器维数为2,步幅为2,则最大池化后的数据维数为4(图6)。

Batchnorm是深度网络中经常使用的一种算法,可用于加速神经网络训练,加快收敛速度和稳定性,是深度学习网络必不可少的一部分[20]。本研究也使用了BN层将隐藏层的输入分布从饱和区拉到不饱和区,减小梯度色散,提高训练速度,大大加快收敛过程。

上采样包括反卷积和上池化操作,本文的上池化通常是指最大池化的逆过程。在CNN中,最大池化操作是不可逆的,但是我们可以通过使用一组转换变量来记录每个池化区中最大值的位置来获得近似逆运算结果,上池化操作使用这些转换变量将这些还原从前一层的输入放到适当的位置(当前层),从而在一定程度上保护了原始结构。

图4 卷积编解码网络Fig.4 CC-Net.

图5 一维卷积操作Fig.5 One-dimensional convolution operation.

在数据压缩阶段,它由卷积层和最大池化层组成,实际上类似于特征提取。通过调整内部参数,提取信号最重要的信息,得到低维数据,即压缩成特征向量。重构模块中包括反卷积层和上池化层,为了得到与原始信号误差最小的重构信号。

1.4 评价指标

图6 最大池化层Fig.6 Max pooling.

数据压缩算法的评估指标主要包括压缩率和重构误差(RE)。由于本文是关于物联网数据压缩的,所以还需要考虑压缩成本和传输成本的比较,即算法的运行时间和压缩后减少的数据传输时间的比较,以及存储内存丢失的差异。

一般来说,压缩比越低,重构误差越小,压缩方法越有效。然而,本研究是关于物联网的数据压缩,希望减少数据传输的时间和能量消耗。因此,有必要考虑算法时间和节省的传输时间,以及内存的损失。

2 结果

由于不同的网络结构会有不同的压缩比,不同的压缩比会有不同的重构误差和不同的算法时间,因此本研究需选择合适的压缩比,以确保重构误差和重构时间是最优的,测试了不同压缩比的结果(表1)。

表1 不同压缩比的结果Tab.1 Results of compression at different compression ratios

本研究给出了测试集中的原始数据和重构数据(图7),结果显示重构信号与原始信号虽然几乎相同,有细微的差别,但有用的形态学特征信息完全保留。从压缩比和重构相似度来看,本研究的压缩网络表现良好。然而,这种方法是否有利于物联网中的数据传输,还需要比较算法所损失的时间和传输所节省的时间。在训练过程中,每个epoch算法持续时间为13.2 s,测试集包含1/4的数据,运行时间为2.4 s,它低于数据传输时间。一开始,每个数据长度为3000,字节数为12 000,数据传输时间为10.2 s。经过压缩,数据长度为362,字节数为2896,数据传输时间为2.5 s。因此,数据传输时间节省了7.7 s,大大低于算法的运行时间。

图7 原始数据和重构数据Fig.7 Original data and reconstructed data.

3 讨论

物联网系统中,数据传输是最重要也是最耗时的。在基于物联网的医疗系统中,我们希望数据能够实时传输,设备的耐久力更强,也就是能量损失更少。无损压缩方法可以保证解压缩后的数据与原始数据相同,但压缩比非常高,这与我们在传感器系统中使用数据压缩的初衷不一致。有研究对心电信号或其他生理信号提出了一些有损压缩方法,但很少用于胎儿心率信号,且主要是基于小波变换、压缩感知等方法[11-12]。基于变换的压缩技术的缺点是需要先将原始数据转换成一组系数,然后遵循熵编码步骤对系数进行编码,以获得可接受的压缩率。基于压缩感知的方法对信号的稀疏性有要求,而且信号的噪声分量对压缩影响非常大,算法计算复杂度很高。对于小波变换的方法,缺点主要是自适应能力弱,小波基的选择以及量化阈值的选择对压缩性能影响大,计算复杂度也较高。

有研究对于人体一维的生理信号数据的压缩进行探讨[21-26],这些方法是基于小波变换或者压缩感知,均取得了不错的压缩效果,但算法的运行时间比较长,即使缩短了数据的传输时间,却增加了数据的解压时间。而本文提出的方法在保证较小的重构误差时,有较低的压缩率,并且算法的时间也较低,对于物联网数据实时性有很大的提高。

本文提出的基于卷积网络的压缩方法,由于卷积有强大的表征学习能力,所以该方法的自适应能力强,而且可以通过内部参数的调节使重构误差达到很小。此外,该方法训练完成后在测试集上的的压缩和解压时间短、压缩率低,可以有效的减轻物联网数据传输和存储压力。该方法需要足够的数据量,数据量增大,模型的复杂度也会增大,所以训练时间也会增加。但训练完模型后,测试集不需要消耗更多的时间。该方法改变压缩率是通过改变网络的卷积层和poo1ing层的层数来调节的。当网络层数低时,它的压缩率高,自适应学习能力弱,所以导致重构误差也很高。随着网络层数的增加,它的压缩率降低的同时,网络的拟合能力强,因此重构误差也随之降低。但是网络比较深,数据量不算很大时,再增加网络层数会发生过拟合。所以我们需要选取合适的网络层数,即合适的压缩率。

综上所述,本文提出了一种基于卷积编解码网络的数据压缩方法,包括编码和解码两个模块,通过最小化原始数据与重构数据之间的误差来训练模型。该方法压缩胎儿心率信号的压缩比为12.07%,测试集的重构误差可达0.03,说明压缩方法是有效的。此外,该算法时间消耗小,可以减少物联网中数据的传输时间,从而可以实时获取胎儿的状态。

猜你喜欢

压缩率原始数据心率
心率多少才健康
受特定变化趋势限制的传感器数据处理方法研究
离心率
水密封连接器尾部接电缆的优化设计
缠绕垫片产品质量控制研究
某型飞机静密封装置漏油故障分析
探索圆锥曲线离心率的求解
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
分布式多视点视频编码在应急通信中的应用
对物理实验测量仪器读数的思考