卷积神经网络在识别等速运动配合程度中的应用
2020-06-11陈邵文崔丹妮夏晴夏文涛江洁清沈忆文
陈邵文,崔丹妮,夏晴,夏文涛,江洁清,沈忆文
(1.复旦大学基础医学院法医学系,上海 200032;2.复旦大学生物医学研究院,上海 200032;3.司法鉴定科学研究院 上海市法医学重点实验室 司法部司法鉴定重点实验室 上海市司法鉴定专业技术服务平台,上海 200063)
法医临床学鉴定常涉及对肌力的评估,其结果可反映肢体运动功能,并与后续责任划分、赔偿等司法过程密切相关。得出正确鉴定意见的前提是被鉴定人配合检查,在测试过程中发挥最大努力[1]。但由于害怕疼痛或二次伤害,误解检测程序及指示,存在紧张、焦虑、抑郁或从损伤中获益的心理因素,被鉴定人可能不会自主发挥全力,甚至伪装、夸大伤情[2-4]。因此在法医学鉴定实践中,明确被鉴定人的配合程度至关重要。
目前检测肌力主要采用传统的徒手检查法,精确性较差,难以判定受试者的配合情况。等速肌力测试与训练技术(即“等速技术”)是在预先设定的恒定角速度下评估肢体功能、提供康复锻炼的一种技术,广泛应用于运动与康复医学领域,能客观、定量、安全地检测肌力[5-6]。同时,等速运动过程中屈伸肌力矩值随时间变化的力矩-时间图,在受试者配合与伪装膝关节运动时可分别呈现不同的图像类型,具有区分受试者配合程度的潜力[7]。
卷积神经网络(convolutional neural network,CNN)是受动物视觉皮层结构启发而形成的一类深度学习模型,具有局部连接、权值共享、池化和多层结构的特点[8]。CNN最主要的组成部分是交替连接的卷积层(convolutional layer)和池化层(pooling layer),其中卷积层通过卷积操作提取图像局部特征,而池化层则合并语义上相似的特征,从而降低维数及运算量[8-9]。1990年,LECUN等[10]首先提出了梯度反向传播算法训练的CNN模型,用于手写体邮政编码数字的识别。2012年,KRIZHEVSKY等[11]将深度CNN用于大规模图像分类,在ImageNet竞赛中取得了惊人的分类效果。目前CNN已在计算机视觉领域占据主导地位,并广泛应用于各领域的研究。在法医学中,已经开发CNN模型作为骨龄评估[12]、文身检测[13]、人脸识别[14]、牙齿分类[15]等研究的辅助工具,为案件侦查及有关鉴定提供可靠证据。CNN具有强大的图像分类能力,能自动、自适应地提取并学习输入图像各个层次的特征,最终输出分类结果。本研究尝试开发CNN模型用于区分不同用力程度下的等速力矩-时间图,以期在法医临床学鉴定中辅助判断被鉴定人的配合情况。
1 对象与方法
1.1 研究对象
2018年9月—2019年1月共测试了200名健康青年受试者,其中男性92名,女性108名,年龄19~29岁,平均年龄23.3岁。受试者均无膝关节损伤与疾病史,下肢肌力及各关节活动度正常,未参加过专业肢体力量训练,未使用过任何等速肌力测试仪器。受试者均在测试前详细了解实验背景及可能风险,自主决定参与实验,并签署知情同意书。
1.2 测试仪器
等速测试采用瑞士CMV AG公司生产的CONTREX Biomechanical Test and Training系统,每次测试前均采用常规系统校准。CNN模型运行环境为具有4块NVIDIA TITAN Xp GPU的Linux服务器。
1.3 测试方法
实验开始前,向受试者详细说明实验流程与动作,再按仪器说明将受试者正确固定在测试椅上。测试内容为30°/s及60°/s角速度下等速向心右侧膝关节全力和半力屈伸往复运动,测试次数为两次,间隔时间约45 min。全力指受试者完全配合运动时所能施加的最大肌力,半力指受试者自我感知的50%最大肌力,用以模拟伪装控力的情况。
测试流程:受试者首先于30°/s角速度下测试。执行5~10次右侧膝关节亚最大肌力屈伸往复运动作为热身。休息1min后,进行5次全力屈伸往复运动。再休息1 min后,进行5次半力屈伸往复运动。休息2 min后,于60°/s角速度下再次进行热身、全力及半力运动,屈伸次数及动作均与30°/s下一致。测试结束后受试者离开测试椅,充分休息45min后再次固定准备,重复上述测试内容。
1.4 CNN训练
应用 Keras(https://github.com/fchollet/keras/)构建CNN模型(Keras是使用Python语言编写的神经网络框架,可实现深度学习模型的设计与调整,代码来自开源平台GitHub)。损失函数采用AdamOptimizer进行优化[16]。CNN属于有监督的机器学习方式,在训练前先根据测试时的具体情况对每张图像标记类别为0(配合)或1(伪装)。本研究的CNN模型结构如图1所示,输入大小为32×32的RGB图像,框架主要由2个卷积层、2个池化层以及全连接层构成。其中第一个卷积层含20个卷积核,卷积核大小为5×5;第二个卷积层含40个卷积核,卷积核大小为4×4;每个卷积层均用线性整流函数(rectified linear unit,ReLU)激活。池化层均采用最大池化策略,窗口为2×2,步长为2。在全连接层中所有神经元完全连接,使用softmax函数获取预测结果0或1。
图1 鉴别等速力矩-时间图的CNN模型结构Fig.1 Structure of CNN model for identifying isokinetic moment of force-time diagrams
将200名受试者随机分为训练集(140名)和测试集(60名)。用训练集中的力矩-时间图训练CNN模型,再用训练好的模型预测测试集的图形类别,从准确率(accuracy)、精确度(precision)和召回率(recall)3个方面评估模型效力。本研究将伪装定义为阳性,准确率指所有图像中被正确分类的比例;精确度(半力)指所有预测结果为阳性的图像中被正确预测的伪装图像比例;召回率(半力)也称为灵敏度(sensitivity),描述模型检出伪装图像的能力,指所有伪装图像中被正确预测为阳性的比例。此外,计算针对全力配合图像(阴性结果)的预测精确度和召回率。精确度(全力)指所有预测结果为阴性的图像中被正确预测的配合图像比例;召回率(全力)等同于模型特异性(specificity),衡量模型正确判定配合图像的能力,指所有配合图像中被正确预测为阴性的比例。为排除样本异质性产生的误差,共进行3次随机取样与模型开发。
2 结 果
受试者5次屈伸往复运动产生的力矩-时间示意图如图2所示。第一次屈伸的图形由于起始于静止状态而不具有代表性,最后一次可能存在疲劳等因素的干扰,因此仅分别截取中间3次屈伸运动产生的图像[17-18]。
图2 等速膝关节运动力矩-时间图Fig.2 Isokinetic moment of force-time diagram of knee exercise
图3展示了配合与伪装等速膝关节屈伸运动力矩-时间图的常见形状。全力配合测试时产生的图像曲线形状较平滑、规则,呈现为单一的波峰。半力伪装测试产生的图像曲线形状不规则,失去本应呈现的单一“尖峰”,代之以更加低平的形状或出现若干杂峰。
图3 不同配合程度下常见的等速膝关节运动力矩-时间图像形状Fig.3 Common shapes of isokinetic knee exercises moment of force-time diagrams under different levels of efforts
每名受试者于30°/s及60°/s角速度下各重复两次测试,可收集全力及半力等速力矩-时间图各12张,故200名受试者一共收集4800张力矩-时间图(全力及半力条件各2 400张)。训练集140名受试者提供3360张力矩-时间图,测试集60名受试者提供1440张力矩-时间图。训练集中所有图像完整训练模型一次即为一“代”,训练过程中的准确率随迭代次数的增加而不断升高,迭代4000次后准确率稳定在高值,故认定此时的模型已经过充分训练。预测结果如表1所示,充分训练后的3个CNN模型对测试集所有图像的分类准确率为90.49%~92.08%。召回率(半力)即模型预测灵敏度为89.31%~90.14%,召回率(全力)即模型预测特异性为91.67%~94.86%。精确度(半力)为91.47%~94.56%,精确度(全力)为89.55%~90.33%。
表1 CNN模型对全力及半力等速力矩-时间图的区分结果Tab.1 The results of CNN models for identifying isokinetic moment of force-time diagrams under maximal effort and half the effort (%)
3 讨 论
应用等速技术判定配合程度的依据,在于伪装肌力检测结果与配合相比更弱、变异性更大。反映在力矩-时间图上,表现为全力配合的曲线具有更加平滑、规则的外观,膝关节屈伸往复运动产生的连续性曲线具有非常相似的形状,总是在关节达到最佳用力角度时产生峰力矩,在单峰前后曲线平稳下降;而伪装条件下由于刻意控制力量,曲线的形状和幅度与全力配合时相比更加不一致,甚至若干波峰呈现不规则锯齿状[2,17,19]。肉眼观察曲线的操作简便,但不足以分辨受试者的配合程度[4]。这是因为视觉评估涉及检测人员之间及其内部的变异性。分类结果受到主观影响,准确率与经验有关,经验较少者正确率也相应更低。由于图形变异性的界定标准存在争议,检测人员可能倾向于将更多的图形归类为正常与异常的中间地带[17-19]。此外,大量的分类工作加重了鉴定人员的工作负担,使其更易疲劳,产生负面影响。因此,本研究引入CNN模型,希望通过对大量等速力矩-时间图的学习总结规律,达到鉴别配合与伪装用力的目的。
CNN可以自动提取图像特征,训练过程不受疲劳影响,分类结果更加客观、可靠。在实际应用中操作简便、效率高,只需输入力矩-时间图即能得出分类结果。对于缺乏经验者,可把分类结果作为参考,有助于提高鉴定准确性。本研究中训练阶段的学习率为1×10-4,迭代次数达4 000次时准确率已稳定于高值,故选取此时的模型用于图像预测。尽管训练集的图像数有限,本研究最终3次随机取样训练的CNN模型分类准确率分别为91.11%、90.49%和92.08%(表1),均高于90%,只有少量图像被错误分类,可以达到具有3年以上等速经验的临床专家平均区分水平[17],这表明该CNN模型在识别全力和半力等速力矩-时间图像方面初步取得较好的效果。该模型预测的灵敏度数值相对较低,特异性相对较高(表1),表明该模型对测试集中配合图像的识别效果更好,有很少的配合图像被错误地预测为伪装,而有相对更多的伪装图像被错误地预测为配合。
本研究以健康青年为对象,因其依从性高,没有损伤、疾病等因素的干扰,更易获得具有代表性的图像[20]。同时,有研究[7]证实,膝关节附近损伤者的伤侧与健侧肢体在全力配合时产生的等速力矩-时间图类型相同,均与伪装图形具有较大区别。因此,应用健康受试者等速力矩-时间图建立的CNN模型对于这类损伤者理应具有适用性。测试中的伪装条件设置为自我感知的50%全力,这一用力程度常用于模拟伪装,其力矩图形与全力相比具有较明显的差异[2,19]。选择30°/s和60°/s的速度条件同样基于先前的研究,适用于健康人群及膝关节损伤者的肌力检测,并可获取典型的等速曲线[1,7,17,21]。由于这两种角速度下的力矩-时间图类型相同,故图像分析时不考虑速度条件,仅对受试者的努力程度进行分类。本研究为两次相同的重复性测试,执行标准化流程,预先向受试者说明实验步骤,正式测试前进行适度热身,并在测试过程中给予口头鼓励,从而削弱了可能出现的学习效应、不熟悉实验操作或心理因素等对检测结果的干扰[1-2]。
诈瘫鉴别是法医临床学中极富挑战性的难题,等速技术动态、客观、安全的特性为之提供了新的解决思路。基于人体对肌肉离心运动控制力较向心运动更弱的生理特性,许多研究采用等速相关参数DEC区分努力程度,DEC指标准运动范围内两个不同测试速度下离心-向心力矩之比的差值,已经被证实能够识别受试者的亚最大伪装肌力[22-23]。也有研究从图像中提取参数作为鉴别指标,例如ALMOSNINO等[1-2]应用描述力矩曲线形状相似性的互相关函数和量化曲线幅度差异的均方根差值百分比来制定决策方案,有助于明确受试者在测试时发挥全力。值得注意的是,上述方法需要计算额外参数,可靠性尚需进一步论证。同时,这些参数存在个体异质性,基于特定健康人群测试结果所计算的临界值无法直接用于其他群体,更不能用于伤者。
本研究引入深度学习的概念,建立的CNN模型对全力配合与半力伪装的力矩-时间图的分类准确率在90%以上,有助于鉴定人员发现伪装现象,但仍然存在误判的可能。造成少数图像分类错误的原因主要包括以下几点:首先,部分受试者力量较弱或存在注意力发散、疲劳等影响因素,配合运动时无法始终维持全力,在力矩-时间图中形成非特异性杂峰。其次,本研究采用的CNN模型要求输入图像具有相同的长宽比,原本峰值偏低的伪装图像经过拉伸后,可能呈现类似配合图像的形状。此外,鉴定所用的力矩-时间图同时包含膝关节屈肌和伸肌运动的部分,受到重力辅助的影响,屈肌运动比伸肌更难维持最大肌力,变异性更大,可能干扰分类效果[24]。在法医学鉴定中,将受试者的最大用力错误地归类为伪装会造成严重的后果。因此,在今后的研究中,还需不断完善CNN模型,改进实验方案,增加训练集图像数目,从而进一步提高分类准确性。