APP下载

精神障碍研究中机器学习的应用——基于EEG 的特征提取

2020-05-08李丹阳张晶晶

科学技术创新 2020年8期
关键词:精神障碍精神分裂症机器

李丹阳 张晶晶

(新疆师范大学,新疆 乌鲁木齐830054)

1 概述

精神障碍(mental disorder)是由多种原因所引起的严重程度不同的脑功能失调或者紊乱的精神疾病,并伴有不同的临床症状(张劲松,2012)。其特征为认知、情绪、行为等方面发生改变,这些改变使得患者感到痛苦、功能受损或增加患者死亡、残疾等的危险性(张理义,&耿德勤,2018)。精神障碍可分为“器质性”精神障碍(如脑炎、慢性脏器衰竭所致的精神障碍)和“功能性障碍”,而功能性障碍又分为精神病性障碍(如精神分裂症)和轻性精神障碍(如焦虑、抑郁症、应激所致的精神障碍)。目前,我国约有精神病性障碍1600 万和3000 万抑郁症患者,而精神障碍的识别率、治疗率较低是我国的精神卫生事业的巨大挑战之一(郝伟,&于欣,2013)。

传统精神障碍的主要诊断一般是采用结构性访谈和家族史追溯等方式,临床心理医师在诊断病患时常常会面临沟通困境,例如患者故意隐瞒真实近况而不能实现问卷及访谈的信效度,而医生在依据检查形成症状学判断时也有一定的主观色彩,使得在不同的医疗环境背景下,诊断结果的一致性较低。

许多学者为此试图运用神经影像学技术探索可以使精神疾病诊断标准客观化和准确化的生物标记物,而在多种神经影像技术中,脑电图(EEG)由于其低成本和毫秒级时间分辨率得到了很多研究者的青睐(Miseon Shim,2016)。低成本可以使基于EEG 的辅助诊断投入临床应用成为可能,而高时间分辨率则能帮助研究者更好的监测到各类精神障碍心理机制的动态过程。

在精神障碍的神经影像学研究中,机器学习由于图像处理方面的突出优势而逐渐成为有力工具。基于机器学习和神经影像的计算机辅助诊断研究也成为领域热点(张家宁,2017)。我们期望通过EEG 的数据结合机器学习算法建立精神障碍的分类模型来辅助或完成临床诊断,进而提高精神类疾病的整体诊断效率、降低医疗成本、提高医疗资源的普惠性。

2 机器学习概念及优势

机器学习(machine learning)是一门涉及多领域的交叉学科,它是人工智能的核心,涉及到算法的选择、分类器的构建。计算机程序基于经验E 学习任务T,完成任务的表现记为性能P,如果其习得性能P 随着经验E 的增大而不断增长,则称为机器学习(Tom Mitchell,1997)。广义上说,机器学习即无需进行明确的编程而让计算机具有学习的能力。

机器学习有多种类型,可以根据:(1)其用来训练算法的训练数据是否包含标签,分为监督学习(多用于分类和回归问题)、非监督学习(如可视化算法和异常检测)和半监督学习(如图片存储标记服务);(2)是否可以动态渐进学习,分为在线学习和离线学习;(3)是否只是通过简单地比较新的数据点和已知的数据点,或者在训练数据中进行模式识别,以建立一个预测模型,分为基于实例学习和基于模型学习;(4)根据是否需要人工提取特征,分为传统浅层学习(支持向量机、K 近邻等)和深度学习(卷积神经网络、循环神经网络等)(Géron,2017)。

机器学习较传统方法的优势表现在以下几点:(1)对于需要进行大量传统编程调整或需要有复杂规则才能解决的问题,机器学习算法通常可以简化代码、提高效率。(2)当环境波动时,机器学习算法可以适应新数据,而无需人工进行繁琐的修正维护。(3)使用机器学习方法可以挖掘大量数据,发现原本数据中并不显著但重要的规律,有时可能会发现新颖的关联和趋势,有助于对问题本身更好的理解。

20 世纪80 年代至今,机器学习达到了一个繁荣时期,由于这一时期物联网大数据以及硬件GPU 的出现,使得机器学习开始爆炸式发展,也由于其本身较传统方法的优势,成为了一门独立热门学科并被应用到数据标记类别、推荐系统、信息检索与排序、医疗决策支持等各个领域。

3 研究现状

精神障碍患者疾病意识的不足、早期筛查方法的缺乏及传统诊断方式的固有缺陷导致患者在被诊断时大多已发展至重性障碍。为改善现状,近年来机器学习被逐渐应用到多种精神障碍的预测、识别、辅助诊断和治疗决策中。

3.1 抑郁症

抑郁症(Depression),也称抑郁障碍(Depressive disorder)(American Psychiatric Association,2013),其主要特征为持久而显著的情绪低沉,具有慢性、反复发作、迁延不愈、自杀率高的特点。大约有8%的男性和15%的女性在他们的一生中会患上抑郁障碍,严重影响生活质量,且其中有近15%的人选择了自杀(Gold,Machado Vieira,& Pavlatou,2015)。

据世界卫生组织(World Health Organization,WHO)预测,到2020 年,抑郁症将代替癌症成为世界第二大疾病。因此,对抑郁症患者的诊断精度的提升需求迫在眉睫。

结合机器学习算法及EEG 数据建立抑郁症辅助诊断模型的基本原理为采集抑郁症患者及健康对照组的EEG 数据,将进行预处理和归一化后的数据按一定比例分为训练集和测试集,训练集数据用于对机器学习算法进行训练,测试集数据则用于对模型进行性能评估,并在验证评估过程中对模型进行不断优化。其思路框架如图。

基于EEG 的机器学习抑郁症预测模型思路框图

刘岩、李幼军和陈萌(2017)对重度抑郁患者及健康对照组的EEG 进行特征提取,并建立支持向量机和线性分类模型,其分类准确度最高达到90.0%;该团队又基于仅进行滤波降噪处理的脑电信号建立深度学习卷积神经网络分类模型,分类准确度达96.7%,由此得到基于深度学习卷积神经网络的抑郁症分类效果比需要进行特征提取的传统机器学习模型更好。

Bailey 等(2019)研究显示利用支持向量机基于抑郁症患者治疗一周时的静息脑电信号EEG 的PSD、wPLI、theta cordance值的特征,可以预测患者对rTMS 治疗是否应答,从而指导无应答患者尽早选择其他适合的治疗方法,避免其盲目接受无效、延误治疗时期且昂贵的rTMS 治疗。

Hasanzadeh 等(2019)研究显示利用K 近邻基于抑郁症患者治疗前的静息脑电信号EEG 的非线性特征可以预测其对rTMS 治疗是否应答,其基于Beta 频率的能量谱特征的分类精度达到91.3%,高于Bailey 团队,并省去了患者为期一周的rTMS 高额治疗费用。

3.2 注意缺陷多动障碍(ADHD)

注意缺陷多动障碍(attention deficit and hyperactivity disorder)是最具危害性的儿童青少年精神障碍之一,发病率在学龄儿童的3%~8%,近半数起病于4 岁以前,男孩多于女孩(张家宁,2017)。注意缺陷多动障碍患者多表现为明显的注意力不集中,注意持续时间短暂,活动过度和冲动,并常伴有学习困难或品行障碍,ADHD 患者与品行障碍的同病率高达30%~58%。遗传、生物化学因素、神经解剖和神经生理、发育异常、心理社会因素等都为本病的发病相关因素。(张理义,&耿德勤,2018)。

研究表明,ADHD 患者中65%的病例持续到成年期(Faraone SV,Biederman J,&Mick E,2006),而成年ADHD 患者的临床症状又易与精神分裂或人格障碍等精神疾病产生混淆,使得传统诊断方法下,成年ADHD 的误诊率偏高。

在多动症患者感觉和认知处理缺陷的背景下,有大量证据表明患者事件相关电位(ERP)发生了改变。Andreas Mueller(2010)采用支持向量机分类方法,用年龄和性别匹配的两组成人(74 名ADHD 患者,74 名对照组)进行视觉双刺激GO/NOGO任务。利用独立成分分析方法(ICA)将ERP 数据分解为独立成分。特征选择算法定义了一组独立的成分特征,这些特征被输入到支持向量机中,采用10 倍交叉验证方法,其分类准确率达92%。该研究首次尝试使用支持向量机对成人ADHD 进行分类,并证实基于ERP 数据非线性特征的分类模型在临床诊断中的可行性。

3.3 考试焦虑症

高度考试焦虑在各级学生中的比例都超过20%(陈睿,刘潇楠,周仁来,2011),在一些地区的初中生中这一比例甚至高达35%(陈祉妍,2002)。

考试焦虑对个体的身心健康有着严重危害。首先,在面临重要考试的时候,考试焦虑者会体会到一种强烈的担忧和情绪反应,包括心慌、紧张的情绪体验及一系列生理反应,如出现与植物性神经活动失调相关的身体反应症状(如心跳加快、出冷汗、呼吸急促、颤抖等),并且由此影响个体的生理健康,影响内分泌,降低免疫功能,增加感染性疾病、胃部不适及睡眠障碍等躯体疾病(闫慧,卢莉,2014)。

高度的考试焦虑往往与抑郁情绪相联系(陈睿等,2011),而抑郁症发病得越早,越可能影响至终生,且复发率和自杀率越高(王玮文,谢希,邵枫,2008)。因此,对考试焦虑进行早期的准确诊断十分必要。

章文佩、沈群伦(2019)使用ERPs 技术采集并分析高、低考试焦虑者在情绪Stroop 中对考试相关威胁词与中性词下的ERP成分(P1,P2,N2,P3 和LPP),结合7 种常见的机器学习算法对个体考试焦虑程度进行进一步的诊断。结果表明相较6 种浅层学习算法,深度学习算法中的卷积神经网络(CNN)对考试焦虑诊断的分类效果最好,其准确率达86.5%。

3.4 精神分裂症

精神分裂症是一种病因不明、临床分类众多且多发病于青壮年的重性精神障碍,患病率约为1%,患者表现出思维方式和行为举止怪异、感知觉扭曲、认知失调等症状并且常伴有情感迟钝、社会退缩等特征(Carpenter & Buchanan,1994)。精神分裂症可在发病后持续发展。个别患者的进展可能有显著差异。早期发现精神分裂症的发病和发展阶段,对于及时有效地预防或减轻疾病的进一步恶化具有重要意义。

最近,越来越多的研究人员尝试使用脑电生物标记的机器学习方法来区分精神分裂症患者和健康对照组。其中一些研究使用了传感器水平的脑电生物标志物。比如ERP 的振幅和潜伏期作为分类的特征。Neuhaus(2011)使用视觉和听觉异常范式诱发了被试N100 和P300 的振幅/潜伏期来区分40 个精神分裂症患者和40 个健康对照组,得到了72.4%的分类准确率。2013年,Neuhaus 改变实验任务,使用视觉目标锁定范式诱发的ERP成分作为数据源,将分类准确率提高至79%。

Miseon(2016)使用从听觉oddball 任务诱发的ERP 信号中提取的传感器级和源级特征来对精神分裂症患者和健康对照组进行分类。研究人员记录了34 名精神分裂症患者和34 名健康对照组的脑电图信号,同时要求他们注意奇怪的音调。结果表明,当源级特征与传感器级特征一起使用时,与仅使用传感器级特征时相比,具有更高的分类准确率,为88.24%。

3.5 阿尔兹海默症(AD)

阿尔兹海默症(Alzheminer's disease,AD)是一种原发性退行性脑病变疾病,多起病于老年期,临床上以智能损害为主(郝伟,&于欣,2013)。它的特点是下降至少两个认知域(例如失去记忆、注意、语言、执行功能),严重到影响患者的社会或职业功能。随着社会老龄化的发展,全球范围内该病的发病率呈逐年上升的趋势。预计在2050 年,AD 患者的数量预计将从4440 万增加到1 亿3550 万(宋昕,洪羽蓉,&胡秋莹,2015)。

AD 已经与心脑血管疾病、肿瘤、脑卒共同成为老年人的四大杀手,严重的危害老年人的身体健康和老年生活质量。提高AD 的早期诊断率,可以避免病患错失最佳的治疗时期,及时选取合适的治疗缓解症状病情的恶化。

Lucas R. Trambaiolli 等(2011)开发了定量脑电图(qEEG)的处理方法,并结合支持向量机建立了AD 分类模型,用以区分AD 患者与健康对照组。该研究记录了19 名正常受试者(14 名女性/5 名男性,平均年龄71.6 岁)和16 名可能有轻度至中度症状的AD 患者(14 名女性/2 名男性,平均年龄73.4 岁)的脑电图进行模型的建立,最终得到87%的高分类准确率。

Sonja Simpraga 等(2017)利用接受东莨菪碱(scopolamine)治疗的受试者的EEG 数据,建立了由14 个脑电图生物标志物组成的鼠毒碱乙酰胆碱受体拮抗剂(mAChR)指数。研究得出mAChR 指数比单一脑电图生物标志物具有更高的分类性能。该研究将mAChR 指数结合机器学习算法建立了AD 诊断模型,获得了92%的分类准确率。这一研究证实可以通过整合多个脑电图生物标记物的方式提高疾病或药物干预的模型识别准确率。

4 局限与展望

基于EEG 技术的机器学习在精神障碍的计算机辅助诊断研究目前仍存在一定的局限性。

4.1 样本量不足。样本量不足是现阶段精神障碍诊断领域机器学习研究面临的一大问题(Bailey,2018)。样本量不足的主要原因包括数据提取成本高、样本的特殊性和数据共享困难。精神障碍患者受到临床症状和药物副作用的影响,在采集数据时需要耗费更多的人力和物力,采集难度大,因此与精神障碍有关的脑神经科学研究样本量通常较小。

4.2 样本及特征代表性有限。对精神障碍如自闭症、精神分裂症等亚类型的样本选择偏歧会导致样本类内差异过大而影响分类模型的效能。而利用机器学习选择不同的生物标志物作为预测特征,其预测准确度会存在差别。我们应在同时考虑准确度和成本情况不断寻找最佳的预测特征来构建精神障碍诊断分类模型。

不可否认的是,近年来机器学习在精神障碍智能诊断及预测研究中进步巨大,并有很大的研究空间。

未来,多个研究机构可以建立能够保障被试隐私和数据安全的协议,规范数据入组标准,在不违背伦理的情况下实现多中心数据共享,增大样本量,以解决当前与精神障碍有关的脑神经科学研究样本量通常较小的问题。研究者在需要利用降维和特征选择的方法保留有用的大数据特征,从而提高特征的有效性。研究者更可以在获得大样本数据的基础上,尝试使用更高分类能力的深度学习算法进行建模,以期提高机器学习算法诊断模型的准确率和泛化能力。

据国务院发布的《全国精神卫生工作规划(2015-2020年)》,目前我国精神卫生服务资源十分短缺且分布不均,全国仅有精神卫生专业机构1650 家,精神科医师2 万余名。我们期待当EEG 技术、精神诊断与机器学习算法各领域的合作日趋成熟后,在医疗资源有绝对优势的地区训练、验证精神障碍的计算机辅助诊断模型,而后在欠发达地区投入使用,以期平衡我国精神障碍诊治水平的地域差异性,促进医疗资源共享,推动精神卫生事业全面均衡发展。

猜你喜欢

精神障碍精神分裂症机器
自拟醒脑汤联合体外反搏治疗癫痫所致精神障碍的效果
机器狗
脑器质性精神障碍病因及临床特征分析
食品防腐剂治疗精神分裂症,靠谱吗
奥氮平在老年期精神分裂症患者治疗中的成效分析
机器狗
阿立哌唑与利培酮在难治性精神分裂症治疗中的应用
拨开精神分裂症的迷雾
社会工作介入精神障碍患者康复的策略分析
未来机器城