基于机器学习与神经影像表征的针灸疗效预测研究现状与展望

2020-11-03尹涛何昭璇兰蕾曾芳

世界中医药 2020年11期

尹涛　何昭璇　兰蕾　曾芳

摘要在中国“脑科学计划”的背景下，基于机器学习和神经影像表征的分类预测研究方兴未艾。针对针灸疗效预测的研究也已经起步，必将成为针灸脑科学研究的重要前沿。本文试从机器学习在神经影像学研究中的应用概况、基于神经影像表征的针灸疗效预测研究现状和未来研究的建议3个方面进行简要评述，以期为基于机器学习与神经影像表征的针灸疗效预测研究提供参考与借鉴。

关键词机器学习;神经影像;针灸;疗效预测;支持向量机;人工智能

Abstract In the context of China Brain Project，research on classification and prediction based on machine learning and neuroimaging properties is in the ascendant.The study on the prediction of acupuncture efficacy is just starting，and it will become an important frontier of acupuncture and brain science research.This paper attempted to briefly review the application of machine learning in neuroimaging research and the current status of prediction for acupuncture efficacy based on neuroimaging properties，with a view to providing reference for the research on the prediction of acupuncture efficacy based on machine learning and neuroimaging.

Keywords Machine learning; Neuroimaging; Acupuncture; Efficacy prediction; Support vector machine; Artificial intelligence

中图分类号：R2-03;R246文献标识码：Adoi：10.3969/j.issn.1673-7202.2020.11.007

以机器学习为代表的人工智能在医疗领域广泛应用，为实现客观精准辨别个体差异，辅助医生制定临床决策提供了技术支撑。近年来，机器学习在中医药领域中的运用也在逐步开展，其中利用机器学习算法，基于神经影像数据预测针灸疗效，筛选和评价针灸治疗的适宜人群引起了研究者的极大兴趣。本文试从机器学习在神经影像学研究中的应用概况、基于神经影像表征的针灸疗效预测研究现状和展望3个方面进行简要评述，以期为基于机器学习与神经影像表征的针灸疗效预测研究提供参考与借鉴。

1 机器学习在神经影像学研究中的应用概况

机器学习是通过算法，学习经验以改善系统性能的一门学科[1]。利用机器学习算法，计算机可以对现有知识进行结构划分，并从大量繁杂的数据中自动分析获得规律，训练模型，而后使用训练好的模型对未知个体数据进行分析预测[2]。2019年《Nature Medicine》人工智能专刊系列研究表明，利用机器学习和人工智能技术辅助临床医生诊疗可以显著提高临床工作效率，产生1+1>2的协同效应[3]。根据算法的复杂程度不同，机器学习可划分为传统机器学习和深度学习。其中传统机器学习包括支持向量机、随机森林、决策树、朴素贝叶斯等算法，这类算法具有模型简单、可解释性强、易于提取特征、小样本结果稳定的优点。而深度学习是近年来机器学习研究领域的热点，其模型主要包括卷积神经网络、递归神经网络和生成对抗网络等[4]。相较于传统机器学习算法，深度学习模型更加复杂，它可以基于深层构架进行分层学习，解决很多传统机器学习不能较好解决的问题，被广泛应用于模式识别、信号处理等领域。

自2001年Haxby等[5]开创性地进行了第一项基于功能磁共振成像数据的多变量模式分析研究以來，神经影像和机器学习结合的研究逐年增多，也促使了神经影像研究由传统的组水平分析模式向个体水平转换。研究者以高维神经影像表征作为输入特征，基于机器学习算法建立起了针对多种疾病的分类和诊断模型，实现了个体水平相对精准的疾病诊断[6-8]。此外，神经影像和机器学习结合的研究方法还被应用于个体疾病预后及疗效预测研究中。研究者使用支持向量机、随机森林、卷积神经网络等算法，开展了大量基于神经影像标志物的疗效预测研究[9-12]。这些研究结果表明，患者基线期的特定神经影像表征可以为预测干预后临床症状的变化提供重要信息。如Redlich等[9]以前扣带皮层灰质体积为特征，采用支持向量回归算法成功实现了从个体水平预测电惊厥疗法改善重型抑郁的临床疗效，为精准筛选对电惊厥疗法敏感的重性抑郁患者提供了客观证据。而Cash等[11]的研究则表明，静息状态下默认网络和情感网络之间的功能连接可以作为支持向量机识别对经颅磁刺激敏感的重型抑郁患者的重要神经影像标志物。

2 基于神经影像表征的针灸疗效预测研究

针灸是独具特色的传统中医外治法，也是世界范围内运用最为广泛的补充替代疗法，它通过刺激机体穴位和特定部位以激发经气、调理脏腑、平衡阴阳、纠正机体失衡状态而发挥治疗作用。患者的机体状态是影响针灸方法选择和治疗效应的重要因素。因此，察色按脉、分别阴阳、明辨机体状态以恰当地选穴施术是针灸临床治疗的前提，也是提高针灸疗效的关键。然而，由于疾病临床表现的模糊性、传统四诊资料的主观性和医生辨证的经验性，有可能造成医生对于患者机体状态的把握和治疗方法的选择存在偏差，进而影响针灸疗效的取得。因此，客观、精确地辨别机体状态特征，拓展医生的判断视野，辅助医生制定适宜的治疗策略对于提高针灸临床疗效具有重要价值。

针灸作为一种外源性的物理刺激，中枢整合是实现其临床疗效的关键。自上世纪90年代以来，基于神经影像技术的针灸中枢机制研究广泛开展，迄今为止，有近400篇中文和200余篇英文针灸神经影像研究论文发表。针灸影像学也逐渐发展成为一门新兴的交叉学科[13]。受到经颅磁刺激等物理疗法疗效预测研究的启发，近年来开始有研究尝试融合机器学习与神经影像表征开展针灸疗效预测，并取得了较好的预测效果。如Liu等[14]在2018年发表了第1篇基于白质微结构的安慰针刺治疗偏头痛疗效预测研究，在该研究中，作者使用了纤维示踪技术提取了偏头痛患者内侧前额叶与杏仁核之间白质纤维微结构参数，并将其作为疗效预测模型的输入特征，而后使用一般线性核函数支持向量机和留一交叉验证法，较为准确地预测了8周假针刺治疗后偏头痛患者的应答程度，总体识别正确率超过84%。而Tu等[15]在近期的一项研究中，使用了基线期默认网络、凸显网络、执行控制网络和感觉运动网络网络内部及网络间的静息态功能连接作为识别特征，采用基于径向基核函数的支持向量回归算法，结合网格参数寻优，构建回归模型预测真假针刺治疗4周后慢性下腰痛患者的疼痛缓解，结果发现内侧前额叶和脑岛、壳核、尾状核之间的功能连接可以有效预测患者针刺治疗后的疼痛缓解，而内侧前额叶和背侧前扣带回、顶上小叶之间的功能连接则对预测假针刺治疗效果具有较大贡献。本团队近期也开展了一项基于静息态功能脑网络的针刺治疗功能性消化不良应答程度预测研究[16]。在该研究中，基线期全脑116个脑区之间的功能连接被选择为输入特征，并使用显著差异连边递增的方法进行特征筛选，而后基于一般线性核函数支持向量机，预测针刺治疗4周后功能性消化不良患者对针刺治疗的响应程度，取得了84.9%的总体分类正确率，并提取出右脑岛-左楔前叶、左中部眶额回-左丘脑、左脑岛-左前扣带回等多条连边作为区别针刺高低响应功能性消化不良患者的重要识别特征。除以上三项基于支持向量机的疗效预测研究以外，早期研究者[17]还尝试过基于模糊神经网络，使用脑电双频指数改变、末梢灌注指数等脑电图参数作为输入特征，预测即时电针刺激过程中疼痛相关物质β-内啡肽改变，结果发现预测值和实测值高度一致，间接提示使用脑电图数据预测针刺镇痛效应的可行性。

以上研究初步证实了机器学习和神经影像表征结合开展针灸疗效预测的可行性和有效性，进一步促进了针灸神经影像学研究由传统的单变量、组水平向多变量、个体水平发展，也为针灸脑科学研究领域开辟了新的研究方向。

3 优化研究设计促进针灸疗效预测研究水平的提升

当前基于机器学习和神经影像表征的针灸疗效预测研究尚处于起步和探索阶段，还有诸多问题亟待解决。结合当前神经影像和机器学习领域研究前沿，本文从样本量、特征选择、模型选择以及模型评价4个方面对后续研究提出如下建议：

第一，增加样本量以提高研究结果的稳定性和可重复性。一方面，研究结果可重复性低是制约当前神经影像学研究成果向临床转化的重要瓶颈，增加样本量，降低样本间异质性是提高神经影像研究结果稳定性和可靠性的有效手段。另一方面，机器学习，尤其是深度学习模型的稳定性和泛化能力也受到训练集数据多少的显著影响，增加训练样本以帮助计算机找到更为稳健的识别特征，是提高模型预测性能的可靠方法。因此，在开展基于机器学习和神经影像表征结合的针灸疗效预测研究时，应当特别重视样本量的问题。本团队前期的文献研究[18]结果提示，截至2014年，基于神经影像学的针灸中枢机制研究平均单组样本量为15例，这和Chen等[19]提出的神经影像学研究单组样本量应当大于40例以保证研究结果的稳健性和可靠性还有很大的差距。而Scheinost等[20]的研究则认为，当训练样本数大于200，基于神经影像表征的预测研究结果才能维持在相对高的稳定状态，而之前的几项预测研究中样本量最大为94例，均未能达到该要求，相关研究结果有待在更大样本中重复。

第二，重视预测特征的选择以增强预测结果的准确性和可解释性。单一模态神经影像提供的信息相对有限，基于多模态影像表征建立的疗效预测模型能够更加精准地捕获大脑与临床特征之间的关联，以取得更好的分类或者预测效果。多项研究[8，21-22]结果提示，以多模态神经影像表征为输入特征可以取得较单一模态更高的分类准确率和更好的预测性能。近3年来，国家自然科学基金委资助了多项基于神经影像表征的针灸疗效预测研究，从这些研究题目中不难看出，多模态神经影像表征融合以及神经影像表征与疾病特异性临床表征的融合将是以后针灸疗效预测研究特征选择的重要发展方向。除多模态融合以外，对于神经影像表征的选择还应当具有目的性，即根據明确的先验假设选择适当的预测特征。相较于数据驱动的特征选择方法，以先验假设为导向，选择特定感兴趣特征开展的疗效预测研究结果具有更高的可解释性，其逻辑链也更加严密。同时，由于排除了其他冗余特征的干扰，基于目的驱动选择特征构建的模型一般具有更好的预测性能。而在选择临床表征作为疗效预测特征时，还应该充分体现中医特色，将一些相对客观可量化的中医指标（如得气量表评分）作为预测特征之一，以构建更为契合针灸临床实际的疗效预测模型。

第三，选择合适的预测模型以提高模型的鲁棒性和泛化能力。一般而言，复杂程度越高的模型，在训练样本中表现出的性能越好，但同时也更容易出现过拟合现象，导致在其他未知样本中泛化能力下降。相较于深度学习算法，支持向量机等传统机器学习算法在样本量较小的情况下可以表现出更强的泛化能力。Davatzikos等[23]开展的一项基于灰质体积预测被试年龄的研究认为，使用一般线性核函数支持向量回归算法取得的预测结果显著优于多层人工神经网络，提示在解决线性可分问题时，传统机器学习算法可能更加合适。不同于一般的模式识别研究只重视识别结果的准确性，基于神经影像表征建立疗效预测模型的最终目标还包括确定神经影像表征与临床指标之间的潜在关联，挖掘重要的识别或预测特征。因此，在选择算法构建预测模型的时候，还应该注意模型是否会影响预测结果到预测特征映射的建立。通过深度学习算法建立的预测模型可能具有更好的预测性能，但由于其普遍存在的黑箱现象，预测结果很难映射到具体影像表征上[24]。相比之下，支持向量机、随机森林等传统机器学习算法可以更加清晰地构建预测结果和预测特征之间的映射，最终为理解大脑特征与临床指标之间的关联提供更多的神经生物学信息[25]。基于以上两点原因，在使用较小样本量构建基于神经影像表征的疗效预测模型时，应当优先选择支持向量机等传统机器学习算法，以提高模型的预测性能和泛化能力。

最后，还应当特别注意在新的独立样本中对预测结果进行验证。为尽可能减少模型建立尤其是深度学习模型建立过程中由于神经影像数据维度过高以及模型参数选择等原因导致的模型过拟合现象，研究者普遍认为非常有必要在新的独立样本中对已有模型及结果进行验证，进一步评价模型的泛化能力[20，26]。同样，基于神经影像表征构建的针灸疗效预测模型的泛化能力也应当在完全独立的样本中进行验证，并且独立验证集数据的选择应当根据研究目的和研究阶段的不同有所侧重。对于重点在明确影像表征和临床指标关联的研究，应当尽可能选择同一中心、同一扫描参数的异质性相对较小的被试构建独立验证集;而对于以临床应用为主要目标的预测研究，则应该选择来自不同中心的被试进行独立验证，以更大程度地评价模型的泛化能力。

4 小结

综上所述，尽管基于机器学习和神经影像表征的针灸疗效预测研究尚处于探索阶段，但已有的研究已经初步证明其可行性和有效性，该研究方向必将成为针灸脑科学研究的前沿。基于前期的研究经验和相关学科发展趋势，今后的研究应当进一步增加样本量，同时注重特征的选择，综合使用多模态神经影像表征、疾病特异性临床表征以及可量化的中医学指标为特征建立疗效预测模型，并做好预测结果的独立验证，以提高模型的预测性能和泛化能力。

参考文献

[1]周志华.机器学习[M].北京：清华大学出版社，2016：10-13.

[2]Deo R C.Machine Learning in Medicine[J].Circulation，2015，132（20）：1920-1930.

[3]He J，Baxter S L，Xu J，et al.The practical implementation of artificial intelligence technologies in medicine[J].Nature Medicine，2019，25（1）：30-36.

[4]田启川，王满丽.深度学习算法研究进展[J].计算机工程与应用，2019，55（22）：25-33.

[5]Haxby J V，Gobbini M I，Furey M L，et al.Distributed and overlapping representations of faces and objects in ventral temporal cortex[J].Science，2001，293（5539）：2425-2430.

[6]Walter M，Alizadeh S，Jamalabadi H，et al.Translational machine learning for psychiatric neuroimaging[J].Prog Neuropsychopharmacol Biol Psychiatry，2019，91：113-121.

[7]Jollans L，Boyle R，Artiges E，et al.Quantifying performance of machine learning methods for neuroimaging data[J].Neuroimage，2019，199：351-365.

[8]Ahmed M R，Zhang Y，Feng Z，et al.Neuroimaging and Machine Learning for Dementia Diagnosis：Recent Advancements and Future Prospects[J].IEEE Rev Biomed Eng，2019，12：19-33.

[9]Redlich R，Opel N，Grotegerd D，et al.Prediction of Individual Response to Electroconvulsive Therapy via Machine Learning on Structural Magnetic Resonance Imaging Data[J].JAMA Psychiatry，2016，73（6）：557-564.

[10]Tetreault P，Mansour A，Vachon-presseau E，et al.Brain Connectivity Predicts Placebo Response across Chronic Pain Clinical Trials[J].PLoS Biol，2016，14（10）：e1002570.

[11]Cash R F H，Cocchi L，Anderson R，et al.A multivariate neuroimaging biomarker of individual outcome to transcranial magnetic stimulation in depression[J].Human Brain Mapping，2019，40（16）：4618-4629.

[12]Tian S，Sun Y，Shao J，et al.Predicting escitalopram monotherapy response in depression：The role of anterior cingulate cortex[J].Human Brain Mapping，2020，41（5）：1249-1260.

[13]許能贵，方继良.针灸影像学[M].北京：人民卫生出版社，2018：3-4.

[14]Liu J，Mu J，Chen T，et al.White matter tract microstructure of the mPFC-amygdala predicts interindividual differences in placebo response related to treatment in migraine patients[J].Hum Brain Mapp，2019，40（1）：284-292.

[15]Tu Y，Ortiz A，Gollub R L，et al.Multivariate resting-state functional connectivity predicts responses to real and sham acupuncture treatment in chronic low back pain[J].Neuroimage Clin，2019，23：101885.

[16]尹涛，孙睿睿，何昭璇，等.基于静息态功能脑网络预测针刺治疗功能性消化不良临床疗效[J].中华中医药杂志，2020，35（5）：18-21.

[17]郝旺身，朱训生，王祥瑞，等.模糊神经网络预测电针镇痛中生化指标的变化[J].上海交通大学学报，2008，42（2）：177-180.

[18]Qiu K，Jing M，Sun R，et al.The Status of the Quality Control in Acupuncture-Neuroimaging Studies[J].Evidence-based complementary and alternative medicine：eCAM，2016，2016：3685785.

[19]Chen X，Lu B，Yan C-G.Reproducibility of R-fMRI metrics on the impact of different strategies for multiple comparison correction and sample sizes[J].Human Brain Mapping，2018，39（1）：300-318.

[20]Scheinost D，Noble S，Horien C，et al.Ten simple rules for predictive modeling of individual differences in neuroimaging[J].NeuroImage，2019，193：35-45.

[21]Nicholson A A，Densmore M，Mckinnon M C，et al.Machine learning multivariate pattern analysis predicts classification of posttraumatic stress disorder and its dissociative subtype：a multimodal neuroimaging approach[J].Psychol Med，2019，49（12）：2049-2059.

[22]Lee J，Mawla I，Kim J，et al.Machine learning-based prediction of clinical pain using multimodal neuroimaging and autonomic metrics[J].Pain，2019，160（3）：550-560.

[23]Davatzikos C.Machine learning in neuroimaging：Progress and challenges[J].NeuroImage，2019，197：652-656.

[24]Lecun Y，Bengio Y，Hinton G.Deep learning[J].Nature，2015，521（7553）：436-444.

[25]Shen X，Finn E S，Scheinost D，et al.Using connectome-based predictive modeling to predict individual behavior from brain connectivity[J].Nature Protocols，2017，12（3）：506-518.

[26]Tu Y，Zeng F，Lan L，et al.An fMRI-based neural marker for migraine without aura[J].Neurology，2020，94（7）：e741-e751.

（2020-05-10收稿責任编辑：徐颖）