基于机器学习的帕金森运动症状量化评估
2022-12-05林志榕
林志榕
(中国科学院福建物质结构研究所 泉州装备制造研究所,福建 泉州 362216)
作为仅次于阿尔茨海默病的第二大神经退变性疾病和继肿瘤、心脑血管病之后的中老年“第三杀手”,帕金森病(Parkinson"s Disease,PD)被称为“不死的癌症”,主要症状表现为4个运动障碍症状:震颤、运动迟缓、肌肉僵直和姿态步态异常[1-2]。其中,震颤和运动迟缓作为帕金森病最主要的运动症状,严重影响患者的日常工作和生活质量。
统一帕金森病评分量表(Unified Parkinson"s disease rating scale,UPDRS)是当前临床上诊断帕金森病情程度等级使用最多的量表,其根据症状严重程度分为0~4分的5个等级,0分为正常,4分为最严重[3]。然而,量表的使用受限于医生的临床经验和主观判断,具有个体差异性,而且对于症状不明显的患者,量表评分方式不够准确,特别是缺乏诊断经验的年轻医生,存在一定局限性。因此,帕金森病运动症状严重程度的量化评估至今仍是PD疗效反馈和病情监测中的一个难题。
随着可穿戴传感器技术的发展,国内外的一些科研人员已经基于传感器和计算机系统来量化评价帕金森病的运动症状[4-6]。在评估过程中,帕金森病患者需要演示量表中规定的若干评估动作,并采用运动传感器、光学系统、电磁跟踪系统和肌电检测仪等多种方式来采集相关动作的数据,在此基础上进行数据处理提取相关症状的量化指标,从而评估PD运动症状的严重程度[7-9]。但目前大多数研究都局限于传感器信号量化特征与神经科医生UPDRS量表评分的相关性统计分析,并不能直接得到运动症状的严重程度等级(0~4分)。
鉴于此,本文设计了一套针对帕金森病震颤与运动迟缓症状的量化评估可穿戴式系统,通过MEMS(micro-electro-mechanicalsystems)运动传感器采集患者手部的运动信息,并基于运动传感器数据提取与震颤和运动迟缓症状严重程度相关的特征,作为机器学习分类器的输入,训练机器学习模型,最终得到量化的震颤与运动迟缓症状严重程度等级(0~4分)。在机器学习模型的选择上,本文构建了支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)算法和K最邻近(K-Nearest Neighbor,KNN)这3种适合于小样本的机器学习分类算法进行验证,并进行分类精度对比,从而得到最优的分类评估模型。该研究工作可为PD震颤与运动迟缓症状提供了一种科学有效的量化评估方法,从而辅助神经科医生对PD患者的运动症状进行临床诊断。
1 研究方法
1.1 PD运动症状量化评估系统
如图1所示,本研究设计的PD运动症状量化检测系统包括一个佩戴在用户手腕的可穿戴设备和上位机采集软件。可穿戴设备由佩戴在指尖的九轴惯性测量单元(BNO055,Bosch Sensortec GmbH,德国)、手腕的数据采集芯片(ATmega1284P,AtmelⅠnc.,美国)和WiFi数据传送芯片(ESP-8266,Espressif Systems Pte.,Ltd.,中国)构成,并将所有模块集成通过弹性绷带固定。惯性传感模块包括一个三轴加速度计、一个三轴陀螺仪和一个三轴磁力计,可获取原始的加速度、角速度和磁场信号,也可通过内置的九轴融合算法获取线性加速度、欧拉角、四元数和旋转矩阵等姿态数据。WiFi模块将采集的原始传感器数据发送到上位机软件进行下一步处理,数据采样频率为100 Hz。上位机软件采用LabVⅠEW 2014(NationalⅠnstrumentsⅠnc.,美国)平台进行开发,接收来自可穿戴设备的原始传感器数据,进行解析和保存,并做下一步的数据处理和算法实现。
图1 PD运动症状量化评估系统
1.2 试验设计
本研究共招募45名具有显著性震颤与运动迟缓症状(UPDRS介于1~4分之间)的PD患者和30名年龄相仿的健康人(UPDRS评分为0)参与本次试验,受试者的基本信息见表1。参与本试验的帕金森病人都来自于福建医科大学附属协和医院(福州)神经内科,这些病人都具有较为典型的运动障碍症状,包括震颤和运动迟缓,并由经验丰富的高年资神经科医生进行了UPDRS评分。对照组由身体健康且年龄与病例组相仿的30名参与者组成。
表1 参加试验的病人和健康人的基本情况
标准的临床测试动作可以提高评估的可靠性,因此本文分别采用UPDRS量表第20、21、23项规定的静坐、维持手臂平举向前和手指开合动作测试来评估静止性震颤、姿势性震颤和运动迟缓症状,评估任务的具体描述见表2,实际的试验场景如图2所示。参与试验的PD患者需要停药12 h,保证其处于药效减退症状明显的状态。试验开始前,研究人员指导受试者佩戴好PD运动症状量化评估可穿戴设备,并指导受试者按照表2所描述的动作要领,熟悉各症状的测试动作,之后进行正式测试,每个评估动作采集10 s的数据,同时由一名临床经验丰富的神经科医生对每个测试动作进行UPDRS量表评分。
图2 震颤与运动迟缓量化评估任务
表2 症状评估动作描述
1.3 数据处理和特征提取
1.3.1 震颤特征提取
在新版国际运动障碍学会统一帕金森病评分量表(MDS-UPDRS)中,震颤严重程度的评估采用线性位移来定义,而现有的基于惯性传感器的帕金森震颤量化研究通常是基于角速度、原始的加速度等信息来提取量化特征参数,进而对帕金森震颤进行评估,该种方式可能导致评价结果的不统一和偏差。原始加速度信号中包含了重力信息,线性加速度则去除了重力分量的影响,用来获取刚体运动时的线性位移信息。因此,本文将基于线性加速度提取手部发生震颤时的线性位移特征,并结合角速度提取震颤发生时手指运动的角度信息。
静止性震颤和姿势性震颤的频率范围通常在3.5~7.5 Hz,因此,为了排除受试者在采集数据过程中因为呼吸或者其他高频运动引起的噪声信号,本文采用频率范围为3~10 Hz的FⅠR等波纹带通滤波器对线性加速度和角速度信号进行滤波,在此基础上提取了H1、H2、H3和H44个量化特征,具体计算方式如下
式中:aL是线性加速度矢量;ω是角速度矢量;i=1,2,…;N代表信号的离散时间。H1和H2分别表示线性加速度和角速度矢量的平方和。H3表示线性加速度向量第i次和i+1次之间差异的平方和,反映了线性加速度信号的波动情况。wk(ξ)是角速度矢量ω(i)的快速傅里叶变换(FFT)。H4表示在3.5~7.5 Hz频率范围之间的角速度矢量FFT振幅的最大值。这里,H1和H3基于线性加速度进行计算得到的,能够表示运动过程中的线性位移情况;而H2和H4是通过角速度计算得到的,能够表示运动过程中的旋转情况。
1.3.2 运动迟缓特征提取
临床上对运动迟缓症状的评估主要通过观察患者做手指拍打动作时的幅度和频率,并根据UPDRS量表进行评分,但该评估方式具有较强的主观性,不同医生的评估结果相差较大。因此,本文采用九轴运动传感器对帕金森病患者手指拍打动作进行高精度运动跟踪,基于运动传感器融合输出的姿态角度信息提取手指拍打动作的角度幅度、拍打频率及角度幅度变化情况,以此作为运动迟缓的量化特征参数来评估症状严重程度。
传统的姿态表示方式通常为三维欧拉角,为了减少特征维度,我们采用轴-角表示方法来提取手指拍打动作中的幅度信息。三维空间中刚体的姿态信息可用绕特定旋转向量的角度θ来表示,这就是轴-角表示方法,而该旋转角度θ可以写成下式
式中:q4是四元数矢量q=[q1q2q3q4]的实部分量。θ的角度范围为0~180°。
为了进一步地提取与UPDRS手指开合动作特点(速度、幅度和幅度波动)密切相关的特征,我们定义了3个特征参数来表示手指开合时的状态,具体包括频率、幅度和波动情况。
首先,通过计算10 s任务期间手指开合次数N来得到手指开合运动的频率f
在手指开合动作评估过程中,θ代表了每次手指开合的幅度范围,在整个评估周期内,我们通过计算峰值角度的平均值φ来得到周期内手指开合幅度,具体如下
式中:θmax和θmin代表的是在第i个手指开合周期中张合角度的波峰值和波谷值。
为了描述评估周期内手指拍打幅度的波动特征,本文通过计算标准差(SD)进行描述
1.4 症状等级分类
为了直观上对震颤和运动迟缓症状进行量化评估,得到症状严重程度等级(0~4分),本文基于上述提取的震颤(H1、H2、H3和H4)和运动迟缓特征参数(f、φ和σ|φ|)进行分类研究,将特征参数作为分类模型的输入变量,而医生的UPDRS评分作为真值标签,建立机器学习分类模型,通过训练模型评估症状的严重程度等级。在分类器的选择上,因为数据样本规模较小,本文分别采用了支持向量机(SVM)、K最邻近(KNN)和随机森林(RF)3种适合于小样本的多分类器,通过试验进行精度验证和对比,得到精度最高的量化评估模型。
支持向量机是一种有监督的机器学习模型,其通过核函数将输入参数映射到高维特征空间,然后采用超平面来判断不同类别的特征。SVM本身为一个二值分类器,当面对多类问题时,需要构造合适的多类分类器。本文处理的症状严重程度等级(0~4分)是一个五分类问题,因此通过组合多个SVM二分类器来实现多分类器的构造。本文通过“一对一”(one-versus-one,OVO SVMs)方式来设计多分类器,随机选取数据集中的2个样本设计一个二分类的SVM分类器,因此,如果数据集中的样本有N个类别的话,则需要设计N(N-1)/2个SVM分类器。实际对一个测试样本进行分类测试时,则通过统计得票最多的类别作为测试样本的类别。
KNN是通过测量不同特征值之间的距离进行分类,可以采用Euclidean(欧几里得)、Manhattan(曼哈顿)、Mahalanobis(马氏距离)等距离用于计算。KNN算法思想是在数据集中找到与测试样本最相似的K个样本,假如找到的这些邻居中大部分都归于同一个类别,那么该测试样本则判断为同属一个类型。实际测试中,K的选取通常是不超过20的整数,并根据实际测试效果进行调整。
RF算法本质上是基于决策树算法来实现分类的,它的基本单元是决策树,通过集成学习的思想将多棵树集成随机森林。具体做法是,通过bootstrap重采样技术,从原始样本集中随机重复提取样本,生成新的训练样本集来训练决策树模型,然后重复生成决策树,形成随机森林。根据分类树中投票数形成的分数确定数据分类结果。单个树的分类能力较弱,但在随机生成多数决策树后,测试样本可以根据统计后每棵树的分类结果选择最可能的分类。
本文采用分类精度来评判各分类算法的性能,通过计算正确判断类别的人数占所有参与人数的百分比来得到分类精度,而数据的真实类别则通过UPDRS量表来得到,量表评分邀请来自福建医科大学附属协和医院神经内科具有丰富临床诊断经验的高年资医师进行。
为了验证分类算法的性能,本文采用了留一法交叉验证(Leave-one-out cross validation)对试验数据进行测试。具体做法是,抽取数据集中的某个样本作为测试样本,剩余的全部数据则作为训练样本,通过训练样本训练分类算法来验证测试样本的精度,直到所有的数据都被作为一次测试样本后则结束,而最终的分类精度为所有样本验证后精度的平均值。
2 实验结果和分析
表3给出了震颤特征参数(H1,H2,H3和H4)与临床医生的UPDRS评分之间的相关性分析结果。r表示相关性系数,p<0.01表示统计结果具有明显的显著性。从表3可以看出,本文提取的4个特征参数均与临床UPDRS具有高度相关性,相关性系数r都大于0.8。因此,该特征参数可以用来表示震颤严重程度,并作为症状分类模型的输入特征,进行算法训练,并得到量化的震颤等级。
表3 震颤特征参数与UPDRS评分的相关分析结果
运动迟缓特征参数与临床医生的UPDRS评分之间的相关性分析结果见表4。从皮尔逊相关系数r和相应的p值来看,手指开合动作频率f和开合幅度φˉ都与量表评分有显著的相关性(|r|>0.9,p<0.01),幅度的波动特征σ|φ|则不存在明显相关性(r=0.28)。因此,在分类器的输入参数选择上,本文优选f和来构造分类模型。
表4 运动迟缓特征参数与症状评分的相关性
表5给出了3种机器学习分类算法(SVM、KNN和RF)的测试结果对比,包括敏感性、特异性和分类精度,表中所有测试结果都是基于留一法交叉验证的结果。分类精度通过正确判断类型的人数占总人数的百分比进行计算(真值依据UPDRS量表评分),敏感性表示在患有帕金森病的参与人中,诊断正确的人所占的百分比,特异性表示在未患帕金森病的参与人中,诊断正确的人所占的百分比。从表中可以看出,3种机器学习分类模型的测试结果都比较好,敏感性、特异性和分类精度都高于90%。其中,SVM算法的分类结果最好,分类精度优于96%,证明了该模型对于PD震颤与运动迟缓症状等级量化评估的有效性。
表5 3种机器学习分类模型的结果对比 (%)
3 结论
针对帕金森病运动症状量化评估的难题,本文采用基于运动传感器的可穿戴设备采集帕金森病患者手部运动信息,通过信号处理方法提取量化特征,并基于特征训练多分类算法,输出震颤与运动迟缓症状的病情程度等级。试验结果表明,SVM分类模型对震颤和运动迟缓症状的严重程度分类准确率高达96%以上,优于KNN和RF算法,验证了基于运动传感器和机器学习的帕金森病量化评估方法的可行性。本文提出的帕金森病运动症状量化检测方法可以为临床上诊断PD病情严重程度提供一种有效的技术辅助工具。