深度学习在骨振信号自动判读中的应用
2020-04-29张瑞习文浩宋江玲
张瑞 习文浩 宋江玲
摘要:目前在临床上对膝关节退行性病变进行检查的手段主要包括X光、核磁共振成像等,但这些检查手段操作要求高、花费高昂、且无法便捷使用。相关研究表明,髌股关节软骨摩擦产生的摩擦音(也称为骨振信号)能够有效反映膝关节所发生的病变且获取方式便捷。基于此,文中以骨振信号为源信号,提出了一种基于长短期记忆网络的骨振信号自动判读方法。首先,采用小波变换以及序列插补方法对信号进行去噪、对齐等预处理;其次,采用长短期记忆网络实现骨振信号的自动判读,其中,网络参数使用网格搜索法确定;最后,采用5 126条临床采集的骨振信号(来源于西安某医院骨科)对所提方法进行验证。实验结果表明文中所提方法可达到自动判读的准确率为82%、精确率为79%、特异度为81%、召回率为82%、马修斯相关系数为0.62。
关键词:膝关节退行性病变;骨振信号;长短期记忆网络;马修斯相关系数
中图分类号:TP305
DOI:10.16152/j.cnki.xdxbzr.2020-04-006开放科学(资源服务)标识码(OSID):
Application of deeplearning in automate drecognitionof vibroarthro graphicsignals
ZHANG Rui, XI Wenhao, SONG Jiangling
(Medical Big Data Research Center, Northwest University, Xi′an 710127, China)
Abstract: At present, the non-invasive technologies for diagnosis of degenerative knee disease mainly include X-ray examination, magnetic resonance imaging etc. However, in clinics, these technologies are seemly non-convenient and non-effective for daily examinations. It has been shown that the pathological changes of knee joint could effectively be detected through vibroarthrographic signals, which can be obtained more easily. Based on this, this paper proposes a new automated recognition method of vibroarthrographic signals by using long short-term memory network. Firstly, the vibroarthrographic signal is preprocessed based on the wavelet transformation and sequence interpolation method. Secondly, the long short-term memory network is applied to realize the automated recognition of vibroarthrographic signals, where the hyperparameters are selected by grid search method. Finally, the proposed method is verified by using the real vibroarthrographic signals collected from two hospitals in Xi′an. The experimental results show that the accuracy, precision, specificity, recall and MCC of the proposed method are 82%, 79%, 81%, 82%, 0.62 respectively.
Key words: degenerative knee disease; vibroarthrographic signals; long short-term memory network; Matthews correlation coefficient
膝关节是人体内构造较为复杂的关节,由外侧胫股关节、内侧胫股关节和髌骨关节3部分组成。膝关节退行性病变又被称为膝骨性关节炎,是一种常见的慢性进展性关节疾病,高发于年龄较长者,是导致中老年人活动障碍和残疾的主要病因。其临床表现为膝关节无法正常活动或活动时伴有疼痛、膝关节肿胀与变形,严重患者还可能会出现持续性关节疼痛、肌肉萎缩,从而引起关节无力,最终膝关节行走功能完全丧失等[1]。近年来,由于肥胖以及膝关节长时间受凉所诱发的膝关节退行性病变也开始高发于青少年群体。
临床表明,若能在膝关节退行性病变病情较轻时及时诊断,则可通过针灸、膏药等方式缓解关节僵硬、疼痛,恢复膝关节活动;而一旦病情较为严重,就需要进行膝关节镜手术,甚至置换关节。目前临床上对膝关节退行性病变进行检查的手段主要包括X-光、计算机断层扫描(CT)、核磁共振成像扫描(MRI),这些检查手段不仅操作要求高、花费高昂、无法便捷使用,而且对人体存在一定危害。因此,寻找一种价格低廉、方便快捷的检查方法,用以辅助医生对膝关节退行性病变进行诊断,具有重要的社会意义和临床价值。
已有研究表明,髌股关节软骨摩擦产生的摩擦音(也称为骨振信号)能够有效反映膝关节所发生的病变[2-6],且这一信号能够通过在膝关节外放置声学传感器进行采集[7],方便易得。然而,目前关于骨振信號的理论研究几乎还是空白,更谈不上将其应用于膝关节退行性病变的临床诊断之中。基于此,能否借助机器学习、计算机、人工智能等信息技术,来探索基于骨振信号的膝关节退行性病变辅助诊断方法的研究?这显然是一个非常具有挑战性的工作。
目前有少量工作聚焦于这一方向的研究,主要采用机器学习方法,通过对骨振信号进行特征提取(如基于熵的度量[4]、小波匹配追踪分解的原子数量[8]、均方值方差[8]等),进而结合分类器(如随机森林[4]、朴素贝叶斯模型[8]、支持向量机[9])来完成正常与病变两类骨振信号的分类。然而,特征提取方法大多源于启发式,不仅需要丰富的领域知识,而且往往很难适用于情况复杂的各类病患。
深度学习是一种对数据进行表征学习的方法[10],极大程度上解决了特征提取所带来的上述局限性。基于此,本文聚焦于探索深度学习在骨振信号自动判读中的应用。首先,分别采用小波变换与序列插补方法对骨振信号进行去噪和对齐等预处理;其次,采用长短期记忆网络实现骨振信号的自动判读;最后,采用5 126条临床采集的骨振信号(来源于西安某医院骨科)对所提方法进行验证。
1 方 法
1.1 长短期记忆网络模型
长短期记忆网络(long short-term memory network,LSTM)属于循环神经网络。LSTM中的控制单元能够分析进入模型的信息,通过留下有用信息、遗忘无效信息,不断更新状态并将状态在网络中循环传递。这一特点使得LSTM能够有效解决时间序列的“超长距离依赖”问题。LSTM的网络结构如图1所示,具体包括4个部分。
2.2 数据预处理
收集骨振信号的过程中,由于外界环境与人体自身的干扰,使得收集的信号中包含大量噪声,主要分为两类,一类是由于传感器性能不稳定、环境干扰等导致的基线漂移,另一种是由于关节弹响导致的“咯噔”声。为了去除这两类噪声,本文主要首先采用小波函数为db5的小波变换将骨振信号分解成4层。由于基线漂移与“咯噔”声主要分布在信号的高频频段,因此,进一步结合阈值函数对分解后信号中的高频系数进行阈值处理,然后对处理过的信号进行重构,最终得到去除基线漂移、“咯噔”声后的骨振信号。本文采用此方法对5 126个骨振信号进行去噪处理,图4展示了某一骨振信号去噪前后的结果图。
此外,在采用序列插补方法对每一信号进行对齐处理时,M=583 680。
2.3 性能指标
常见的用于评估分类模型预测能力性能的指标有以下4个:
准确率(accuracy)=TP+TNTP+TN+FP+FN, (9)
精确率(precision)=TPTP+FP,(10)
特异度(specificity)=TNFP+TN,(11)
召回率(recall)=TPTP+FN。(12)
其中:TP代表样本的真实类别为正类,且模型将其预测成正类的样本数;FN代表样本的真实类别为正类,但模型将其预测成负类的样本数;FP代表样本的真实类别为负类,但模型将其预测成正类的样本数;TN代表样本的真实类别为负类,且模型将其预测成负类的样本数。
此外,由于本文所用数据为非平衡数据,为了更好地衡量此类情况下分类器的性能,我们进一步将马修斯相关系数(Matthews correlation coefficient, MCC)作为模型分类性能评价指标,其定义为[13]
MCC=
TP*TN-FP*FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)。(13)
MCC的取值范围为[-1,1],其中,MCC取值为1表示模型预测完全正确,取值為-1表示模型预测完全错误。
2.4 网络超参数选择
深度学习模型中有大量超参数,而超参数的选择对实验结果的影响十分大。本文中最重要的两个超参数为学习率与损失函数类别权重。如果学习率过大,可能会因为步幅过大造成跳过局部最优点的问题;学习率过小,又会导致训练速度较慢。此外,文中所用数据包括1 006个0级骨振信号和4 120个1级骨振信号,为不平衡数据集,因此需要选择一个合适的损失函数类别权重,在损失函数中增加将少数类错误分类带来的损失,以减轻模型对多数类的敏感度。本文采用网格搜索法对模型中的这两个超参数进行确定,即在一定范围内对这两个参数的组合进行评价,结果如图5所示。
图5中x轴与y轴分别代表损失函数中类别权重比例(即α/β)与学习率,z轴表示在确定了权重与学习率时的MCC值,颜色越深表示MCC值越高。由图5可知,当学习率为0.01时,损失函数权重比为1∶45,即α=1, β=45时, MCC值达到最高,MCC=0.64,因此,本文选择这一参数组合作为LSTM的最优超参数组合。
2.5 实验结果与分析
本小节将通过数值实验,验证本文所提出的基于LSTM的骨振信号自动判读方法的可行性与有效性。
为了减少在使用小批量梯度下降中数据的先后顺序、以及模型参数随机初始化对实验结果所造成的影响,本文随机进行了10次实验,进而取10次实验的平均结果作为最终结果,所得结果如表1所示。
可以看出,本文所提方法的准确率可达82%,同时精确率达到79%,召回率为82%,特异度为81%,MCC分数为0.62。结果表明本文所提方法能够有效实现正常与病变骨振信号的自动判读。
3 结 语
本文针对膝关节退行性病变,以骨振信号为源信号,提出了一种基于长短期记忆网络的骨振信号自动判读方法。首先,采用小波变换以及序列插补方法,对骨振信号中蕴含的基线漂移和“咯噔”声等噪声进行去除,并采用序列插补方法对去噪后的骨振信号进行对齐等预处理;其次,采用长短期记忆网络实现骨振信号的自动判读,其中网络参数使用网格搜索法确定;最后,采用从西安某医院骨科获得的5 126条骨振信号数据对所提方法进行验证,结果表明,本文所提方法在正常与病变骨振信号的自动判读中表现性能良好。
参考文献:
[1] 谢昆岭.膝关节退行性病变的物理治疗观察[J].价值工程,2011,30(12):301.
XIE K L.Physiotherapy observation of knee degenerative diseases[J].Value Engineering,2011,30(12):301.
[2] BLODGETT W E.Auscultation of the knee joint[J]. The Boston Medical and Surgical Journal, 1902,146(3):63-66.
[3] 江清泉,刘益瑞,叶建文,等.膝关节病变的髌骨振动[J].医用生物力学,1994,9(2):78-83.
JIANG Q Q, LIU Y R, YE J W, et al. Patellar vibration of knee joint lesions[J].Medical Biomechanics, 1994,9(2):78-83.
[4] NALBAND S, SUNDAR A,PRINCE A A,et al.Feature selection and classification methodology for the detection of knee-joint disorders[J]. Computer Methodsand Programsin Biomedicine, 2016,127:94-104.
[5] NALBAND S,SREEKRISHNA R R,PRINCE A A.Analysis of knee joint vibration signals using ensemble empirical mode decomposition[J].Procedia Computer Science, 2016,89:820-827.
[6] 王迎春,丁明,王卫东,等.膝关节骨性关节炎影像技术和声波振动信号辅助诊断的研究进展[J].骨科,2019,10(3):253-256.
WANG Y C, DING M, WANG W D, et al. Research progress in assisted diagnosis of knee osteoarthritis with imaging technology and sonic vibration signals[J].Orthopedics,2019,10(3):253-256.
[7] KERNOHAN W G, BEVERLAND D E, MCCOY G F, et al. The diagnostic potential of vibration arthrography[J]. Clinical Orthopaedics and Related Research, 1986(210):106-112.
[8] 蔡素贤.基于机器学习的膝关节摆动信号分类算法研究[D].厦门:厦门大学, 2014.
[9] 徐一平.基于VAG信号分析的膝关节损伤检测与辅助诊断[D].大连:大连理工大学,2018.
[10]余凯,贾磊,陈雨强,等.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804.
YU K,JIA L,CHEN Y Q,et al.Deep learning:Yesterday,today,and tomorrow[J].Journal of Computer Research and Development,2013,50(9):1799-1804.
[11]洪浩,伯曉晨,李非.深度学习在生物医学数据中的应用[J].医学信息学杂志,2018,39(3):2-9.
HONG H, BO X C, LI F. The application of deep learning in biomedical data[J].Journal of Medical Informatics,2018,39(3):2-9.
[12]李渊,骆志刚,管乃洋,等.生物医学数据分析中的深度学习方法应用[J].生物化学与生物物理进展,2016,43(5):472-483.
LI Y, LUO Z G, GUAN N Y, et al. Application of deep learning methods in biomedical data analysis[J].Progress in Biochemistry and Biophysics,2016,43(5):472-483.
[13]刘林.分类器评价指标MCC、CEN和ACC的比较研究[D].天津:天津师范大学,2019.
[14]鹿猛.膝关节摆动信号的噪声消除研究[D].厦门:厦门大学,2013.
[15]杨祎玥,伏潜,万定生.基于深度循环神经网络的时间序列预测模型[J].计算机技术与发展,2017,27(3):35-38.
YANG Y Y, FU Q, WAN D S. Time series prediction model based on deep recurrent neural network[J].Computer Technology and Development,2017(3):35-38.
[16]刘桐彤.基于长短期记忆神经网络的短期负荷预测方法[J].黑龙江科技信息,2016(31):81.
LIU T T.Short-term load forecasting method based on long short-term memory neural network[J].Heilongjiang Science and Technology Information,2016(31):81.
(编 辑 李 静)