基于心律特征提取和卷积神经网络的运动健康分析算法
2021-03-10马蕾
马 蕾
(西安明德理工学院,陕西西安 710124)
当今社会的经济水平在不断提高,但快节奏的工作和不断上涨的生活成本对人们的健康产生了负面影响,年轻人和中年人的成人体质指数平均下降0.5%[1]。体育运动是保持人体每天健康的有效途径,大量研究表明,使用正确的锻炼方法和获得足够的锻炼可以提高各个年龄段人群的身体素质和健康[2]。
作为体育健康市场的一部分,网络体育健身也得到快速发展。据估计,2019年中国网络体育健身市场规模达到1740亿元,用户数量达到1.95亿。大量的信息和数据蕴含着巨大的价值。智能体育设备和软件已出现在很多领域,专业运动员可以据此收集数据并显示运动体征,以帮助其制定体育运动规划。但上述体育设备和软件更侧重于数据收集和数据可视化显示,缺乏对用户健康数据的进一步分析和挖掘。给用户合理的建议和帮助是智能时代优化体育和健康应用的主要方向。
本研究的目的是分析心音数据,从心音周期特征提取方法和心音神经网络设计角度进行健康预测和识别[3],提出了一种基于心率特征提取和卷积神经网络的运动训练健康分析算法。
1 研究方法
1.1 运动员心音采集设备
在心音采集过程中,心音采集装置设计应注意以下三个方面:(1)应考虑环境噪声。这是所有心音信号采集过程中都会遇到的一个问题,需要额外关注和努力来减少环境噪声的影响。(2)应考虑采集设备的错误和操作员的误操作。在采集过程中,可以改进或避免这种情况发生,例如轻拿轻放,为采集器选择性能更好的传感器。(3)应考虑采集者自身发出的其他生物信号。在人体内,除了心音,还有其他生物信号,例如肺音。因此,如果采集器在采集者剧烈运动后立即拾取心音,则不同于其休息时拾取的心音。
本文采用多普勒TCD智能心音采集设备,并最大程度地避免操作不当造成的干扰。
1.2 心音信号预处理
原始心音信号的采样频率通常为22000 Hz,与心音信号频率相比,采样点相对较大。因为心音信号的频率为101000Hz,两者之间的差异仅是一个数量级,会含有大量原始采样点数据。这些数据中的大部分是无关信号,甚至可能是干扰信号。因此,这样的采样率增加了产生噪声的可能性,大量的数据也增加了信号噪声。处理的时间复杂度和空间复杂度较高,影响心音信号的处理速度。因此,有必要对原始心音信号进行重采样[4]。本节使用2000 Hz的采样率,两种方法对比采样效果如图1(a)和1(b)所示,可见重采样的效果好很多。
图1 信号采样效果对比Fig.1 Comparison of the signal sample effect
1.3 小波去噪
由于心音信号是一种信号强度较低的生物信号,在信号采集或处理过程中容易受到噪声的干扰。如果不去除信号中的噪声,将对心音在疾病诊断中的应用产生影响。因此,不仅需要依靠硬件措施来解决干扰问题,而且需要有专门的信号滤波技术参与,这才可以为心音信号的各种研究奠定良好的基础。
本研究采用小波去噪的方式并选择合适的波基。信号分解层数的确定是影响小波去噪性能的重要方面,如果小波基选择得不好,整个性能将受到影响。如果选择太多的分解级别,心音信号和噪声信号都会被分离,如果分解级别太少,则会过滤掉一些有用的信号。选择波基函数并确定分解层数非常重要,利用小波对心音信号进行去噪的过程可以概括为以下几个基本步骤。
(1)选择最适合心音信号的小波基函数。(2)确定分解层数N。(3)根据分解层数N,心音信号被分解为N层。(4)针对分解后获得的各层高频系数,选择合适的值进行定量处理。(5)如果效果不好,重新操作直到获得最佳效果。
1.4 希尔伯特变换
由于心音是一种准周期信号,而本研究是对心音信号的周期性研究,因此本节采用包络拉伸法,从而不限制心音的位置。事实上,心音时域峰值的高度包含心音信号的特征,可以反映在心音信号的包络中。
在信号分析工具中,希尔伯特(Hilbert)变换是一种重要的方法,通常用于提取信号的相位信息,计算信号中的包络信号,并分析信号的频谱信息[5]。信号Hilbert变换的定义如下:
假设有一个信号x(t),经过Hilbert变换,x^(t)可通过以下方程式得出,即
从式(1)可以看出,输出信号与输入信号除以时间呈线性相关。就像电压和电流的关系,增加了一个滤波器介于两者之间。因此,这种转变是可以扭转的。将滤波器的输出响应设置为h(t),则
上述公式可以在时域中得到信号形式。但是Hilbert变换主要是为了分析信号的频域关系,因此,需要知道Hilbert方程的频率响应H(f)的改变,即
因此,在信号x(t)的Hilbert变换之后,频域中的结果是频谱偏移。正频率信号逆时针旋转90°,在频域中,即相移减小了90°。负频率的信号顺时针旋转90°,在频域中,这会使相移增加90°,两者之间存在180°的差异,即正频率信号和负频率信号。如果输出信号被描述为x^(t),输入信号被描述为x(t),可以获得信号的包络。如果包络信号设置为z(t),则可以得到
分析Hilbert变换的效果,结果原始信号如图2所示。
图2 正常心音的时域波形Fig.2 Time domain waveform of normal heart sound
采用Hilbert变换方法得到的心音包络转换方法如图3所示。
图3 原始信号和获得包络后的心音信号Fig.3 Raw signal and cardiac tone signal affer obtaining the envelope
在Hilbert变换后可以得到与信号长度相同的包络曲线,即该信号的包络特性可以完全表达。
1.5 心音卷积神经网络
深度卷积模型的体系结构可由总深度确定层数n和每个层中的结构数{ai}组成。例如,n=3、a1=4、a2=3、a3=2表示该模型分为三个阶段,且第一、第二和第三阶段的层卷积数分别为4、3和2。在推导出公式之前,定义一些必需的参数符号:输入谱图大小为z、卷积核大小为k和最小层c值为t。随着卷积层的感受场持续增长和卷积层中卷积核的大小保持不变,可以看出最后的c值卷积层最小[6]。等价于确保最后的卷积层c值不小于t,可转换为一组不等式,即
其中2l k是神经网络最后一层感受区域的大小。卷积层顶部的感受野应小于一个心音周期的面积,具体公式如下:
目标函数可以表示为感受野的总数及其最终值,关系等式为
本研究设计的心音卷积神经网络模型如图4所示。
图4 心音卷积神经网络模型Fig.4 Heart-tone convolutional neural network model
2 实验与结果
2.1 实验装置
本研究使用了PyCharm的编译器和TensorFlow深度学习框架。使用构造的心脏声音卷积神经网络,采取小批量学习方法,学习率为0.0001,总共执行1000次迭代。
2.2 数据集
本研究使用PhysioNet/CinC Challenge 2016数据库[7]。所有录音都已重新采样到2000 Hz,录制的持续时间范围为5 s到120 s。这项工作的最终目标是将其分为正常和异常心音。训练集由五个数据组成文件夹(A到E),共包含3240个心音,测试集包含301个心音记录。本研究通过提取5个心动周期作为研究对象,一个谱图的时间长度,共28000次训练获得样品,共有4800个测试样本。
2.3 评价指标
相对误差(RE)以实际值为参考值,通过比较目标数据的预测结果与实际值之间的相对差异进行判断,通常用百分数表示。相对误差值越小,预测结果越接近实际值。也就是说,所构建模型的预测效果越好。一般来说,相对误差可以更好地反映预测结果是否可信[8]。相对误差表达式如下所示:
2.4 实验结果
在所设计的心音神经网络基本结构的基础上,通过改变卷积层数优化模型的复杂度,并对模型进行了实验验证。心音分类模型的参数、训练时间和训练精度如表1所示。
表1 不同样本心音的回旋层的分类效果Tab.1 Classificafion effect of the cyclotron layer of different samples
从表1中可知,当只有一个卷积层时,模型参数庞大,无法准确获取重要特征,训练时间长;当模型中有三个卷积层时,训练时间短,参数数量少,但准确率降低;在两个卷积层的情况下,训练时间可以接受,准确率最高[9]。
本研究通过对结构的改进,实现了对心音信号的自适应设计。为了说明采用本研究提出的方法所设计的模型有效性,使用心音数据集作为数据源。培训步骤的固定数量为10000个步骤。将本节中模型的批次大小更改为不同的值,以进行比较,结果如图5所示。从图5可以清楚地看出,当数量为32时,获得最佳效果。
图5 不同卷积核数量的比较结果Fig.5 Comparison results of the different numbers of convolutional kernels
2.5 创新点
本研究的主要创新点如下:
(1)提出的新方法可以使用当前主流的分类器和基于图像生物信号的卷积神经网络(CNN),并进一步结合CNN和心音特征提取方法,用来识别训练中运动员的心音。
(2)本研究设计的心音卷积神经网络可以解决基于心音周期特征提取的心音识别和分类问题。本研究从心音信号的数学定义出发,推导了心音神经网络的实验方法,研究了心音信号的预处理、特征提取方法以及心音神经网络的结构设计[10]。
(3)采用了参数和计算量较少的神经网络,可以做出快速反应,在可穿戴救生衣等实际应用领域更有竞争力。
2.6 局限性
本研究提出的基于心率特征提取和卷积神经网络的心音信号模型虽然取得了较好的效果,但心音信号是一种时间序列数据,涉及远距离信息的依赖性,而且特征提取有一定的局限性。在以后的研究中,将研究递归神经网络在提取心音信号特征方面的有效性。
3 结 论
从本研究可看出,有效利用收集的体征数据来分析用户的体质并提出合理的运动建议已成为智能运动和健康领域的研究方向。心音信号是一种存在于人类体内的生物信号,通过分析心音信号特征,可以帮助人们检测和监测心脏健康问题[11]。本研究旨在通过心音识别和分析运动员的训练健康状况,使用当前主流的卷积神经网络(CNN)对图像和生物信号进行分类,并将CNN与心音特征提取方法相结合,提出了一种基于运动训练的新方法:基于心律特征提取和卷积神经网络的健康分析算法。经过实验验证该算法准确度超过90%,提高了对运动员训练健康状况的识别和预测的准确性。