人工智能与医疗大数据在胰腺疾病中的应用
2019-01-03刘雨赵胜兵李兆申
刘雨 赵胜兵 李兆申
海军军医大学附属长海医院消化内科,上海 200433
【提要】 随着计算机科学技术的发展,人工智能和大数据在各个领域都有了关键性突破,医疗卫生领域也受到巨大影响。尽管胰腺疾病诊断及治疗相对困难,监测及管理也较为棘手,但近年来人工智能和医疗大数据在胰腺疾病的诊疗和管理方面也有了较多的拓展应用,并体现出明显的应用优势及发展潜能。
随着电子计算机技术的飞速发展,人工智能和大数据技术如雨后春笋般兴起并冲击着各个行业,其中,医疗卫生领域也受到影响。人工智能和医疗大数据在疾病的诊治及监测与管理中逐渐显现出重要地位。胰腺疾病是消化病中诊断及治疗相对较为复杂的疾病,胰腺疾病的复杂性为人工智能与医疗大数据的应用带来一定的挑战,同时也带来巨大的发展空间和应用前景。
一、人工智能与医疗大数据相关概念
1956年约翰·麦卡锡将机器智能命名为“人工智能”[1],麦卡锡与尼尔斯·尼尔森后来解释人工智能为智能的自动化,即知识的自动化[2],指让计算机模拟人的思维信息进行传统意义上的依赖人的智力才能进行的复杂工作,其中涉及计算机科学、心理学、统计学等多学科。机器学习是人工智能的重要方法之一,是一系列通过任务处理累积经验,进而自动调整参数、提高效能的算法。近几年,源于机器学习的人工神经网络和深度学习颇受关注。人工神经网络是仿照人类神经元的连接方式,建立多层“神经元”结构,每层“神经元”从上层接收数据并进行计算,再将输出值传递给下层“神经元”;深度学习则是在人工神经网络的基础上进一步优化形成,有更多的隐藏层,可凭借这些分层发掘更高级别的数据特征[3]。目前,人工智能已被广泛应用于疾病的诊断治疗、预后评估等多个方面。
大数据(big data)一词早在20世纪80年代就已经出现,但当时多与计算机学科相关,未对计算机以外的领域产生明显影响。2008年《Nature》杂志出版“Big Data”专刊,介绍了大数据在多学科的机遇与挑战。3年后《Science》又推出专刊强调大数据在科学研究中巨大潜在价值。同年在达沃斯世界经济论坛发布了以大数据为主题的《big data, big impact》报告,大数据正式登上科学研究的舞台,迅速成为各领域的研究热点[4]。
大数据又称为巨量数据、海量数据等,指涉及的数据信息规模巨大,不能通过人工在合理时间内获取、处理、管理、加工、分析、整理成为人类所能理解和解读的信息。医疗大数据指在医疗卫生领域产生的数据,其类型和规模以前所未有的速度增长,故仅靠现有的工具和软件,很难在合理的时间内获取、管理并整合成能够供医疗服务参考或能为医疗决策提供指导的信息[5]。医疗大数据主要来源于4个方面,一是来源于与生命科学研究和药物研发生产等相关的机构和企业,这些单位常常存储着规模庞大的健康医疗信息;二是来源于医疗机构临床诊治和科学研究的相关信息数据,覆盖面广泛,从就诊患者的基本信息资料到诊疗过程、辅助检查结果(如检验、影像检查等)所有的医疗机构的数据;三是来源于医疗保险的运营管理信息和医患行为的交互信息;四是来源于患者健康管理咨询、网络医疗咨询、疾病穿戴式监测设备、家用医疗监测设备等个人健康信息数据。随着科学技术的进步及互联网的普及,这方面的数据规模迅速增长,其数据量未来可能无法估计[6]。
人工智能与医疗大数据在医学领域的应用密不可分,二者相互结合,在胰腺疾病的诊断、治疗、监测及管理中都有了较多的应用,体现出巨大的潜力。
二、人工智能与医疗大数据在胰腺疾病诊断及治疗中的应用
胰腺位于腹上区和左季肋区,胃和腹膜后约平第一腰椎椎体处,横卧于腹后壁。由于解剖位置相对深,胰腺疾病在早期症状不典型,且简便的检查如腹部B超等对其病变的检出率较低,故大部分胰腺疾病(急性胰腺炎、慢性胰腺炎、胰腺良恶性肿瘤等)的诊断都必须依靠胰腺CT或MRI等影像学检查或超声内镜等侵入性检查。传统影像学检查需要人工读片,工作繁琐,耗费时间,对胰腺不典型病变的检出很大程度上依赖影像学医师临床经验的积累。由于人工智能和大数据技术分析处理速度快,效率高,故人工智能和医疗大数据技术的应用在胰腺疾病的诊断(如胰腺病理的识图、胰腺影像的阅片、胰腺疾病易感基因的明确等)方面有广阔的应用空间。
细针穿刺活检是诊断胰腺肿块良恶性的准确方法,但对于部分非典型病例,诊断其良恶性仍然是个挑战。一种人工智能的多层感知神经网络系统可通过检测胰腺肿块活检病理切片,鉴别胰腺肿块的良恶性,对非典型病例良恶性的预测准确率达到77%,可帮助临床医师与患者做出最佳治疗方案选择[7]。慢性胰腺炎和胰腺癌的鉴别诊断是临床胰腺疾病诊断中的一大难题,多项研究证实人工智能在慢性胰腺炎与胰腺癌的鉴别诊断中有重要价值,可做出快速而准确的诊断[8-11]。复旦大学团队研发了一套计算机辅助诊断胰腺浆液性囊性肿瘤与其他胰腺囊性肿瘤的鉴别诊断方案,该方案是一个包含24个浆液性囊性肿瘤临床及影像学特征和385个高通量筛选特征的放射组学系统,经过与经验丰富的放射学医师评估的结果对比验证后,证实该计算机辅助诊断方案准确可靠,可用于对患者的术前评估,提高术前诊断的准确性,帮助临床医师做出准确的治疗决策[12]。Ikeda等[13]使用从放射学图像数据库中提取的数据区分肿块性胰腺炎和胰腺导管腺癌,也发现人工神经网络评估结果与经验丰富的放射学医师评估结果相当。Kuwahara等[14]将3 970例行胰腺切除术的术前内镜超声图像进行人工智能的深度学习后,发现人工智能诊断恶性导管内乳头状黏液性肿瘤(intraductal papillary mucinous neoplasms,IPMN)的灵敏度、特异度和准确率都达到92%以上,人工智能诊断IPMN可能比人类专家诊断更准确、更客观。Li等[15]建立的基于PET/CT图像的胰腺癌计算机辅助诊断模型,在鉴别诊断胰腺癌的准确率、灵敏度和特异度方面均超过95%。Kurita等[16]利用基本临床资料,如血癌胚抗原、糖类抗原CA19-9和CA125、囊液淀粉酶、囊肿位置等进行机器深度学习,构建了囊性病变良恶性鉴别的模型,发现人工智能可提高胰腺囊性病变的良恶性鉴别能力。也有学者构建了通过多种血清标志物诊断胰腺癌的神经网络模型,发现其诊断准确率优于应用单一肿瘤标志物和logistic模型的准确率[17]。总之,人工智能和大数据技术凭借在胰腺影像阅片、病理图片识别、辅助诊断模型构建等方面的优势,在胰腺疾病的良恶性鉴别诊断及胰腺肿瘤的定性诊断中有广阔的应用前景。
胰腺疾病病因复杂,许多病变机制不清。有研究指出肠道微生物在急性胰腺炎、慢性胰腺炎、胰腺癌等胰腺疾病的发生发展中扮演着重要角色[18],但肠道微生物失调的原因和后果,以及不同菌群数量的变化在胰腺疾病发生发展中所起的作用仍须探索。遗传因素在胰腺疾病的发生发展中扮演着重要角色,SPINK1、CFTR、PRSS1、CTRC等基因均被证明能促进胰腺炎症或纤维化进程,且近年来不断有新的易感基因被报道。东西方人种在遗传背景方面的差异较大,不同致病突变类型对胰腺疾病的临床病程影响不同,但尚无确切的研究揭示各种基因突变在胰腺疾病病理生理机制中的作用[19-20]。基因测序是检测基因突变的良好工具,然而目前通过基因测序能明确分析的数据量仅占冰山一角,大量的信息尚未被挖掘。综上所述,未来在胃肠道微生物组及其代谢效应、胰腺疾病遗传基因突变测序方面,若能积极利用人工智能结合大数据分析,将有助于发现和明确胰腺疾病新的潜在病因。
人工智能不仅可以用于良恶性肿瘤的鉴别诊断,而且可以用于区分肿瘤的边界。Niazi等[21]提出了一种基于Ki67染色活检图像的深度学习方法来自动区分胰腺神经内分泌肿瘤的边界,证实基于深度学习的人工智能模型将在很大程度上减少病理学者的工作量,可以较好地区分肿瘤边界,为临床医师的治疗决策提供一定指导。Fu等[22]利用深度学习胰腺影像的胰腺分段解剖,建立了检测胰腺癌边界的模型,可用于指导手术的范围。胰腺癌的立体定向放射治疗需要在向肿瘤提供消融剂量的同时保护敏感的周围组织(十二指肠、胃、小肠)。为了解决这个难题,有研究者开发了基于专业知识的人工神经网络剂量模型来预测特定治疗部位的放射剂量分布,该模型经过检验具有良好的准确性,可用于预测特定治疗部位所需的合适剂量,从而避免过大剂量导致的周围器官损伤[23]。
三、人工智能与医疗大数据在胰腺疾病监测及管理中的应用
人工智能与医疗大数据还可用于胰腺疾病严重程度的预测[24-25]。既往研究发现,人工神经网络对急性胰腺炎的严重程度预测能力优于广泛应用的急性生理与慢性健康评分(APACHEⅡ评分)、修正的Glasgow评分[26-28]。与临床评分系统相比,人工神经网络模型可以使用更少的变量、更早地完成急性胰腺炎患者严重程度的评估,患者入院6 h内即可完成评估,有利于医护人员为患者制定更合适的治疗、护理策略。Mofidi等[26]将人工神经网络模型与修正的Glasgow评分和APACHEⅡ评分就预测疾病严重程度方面进行了比较,发现人工神经网络模型的灵敏度(0.89)和特异度(0.96)都为最优;该研究还比较了3种评分系统预测患者住院第1周内发生多器官功能障碍综合征概率和住院期间病死率的准确性,也发现人工神经网络模型在这两方面都优于Glasgow和APACHEⅡ评分。Halonen等[27]开发了一个预测急性胰腺炎严重程度的模型,受试者工作特征(ROC)曲线下面积(AUC)为0.847,大大优于Ranson评分(AUC为0.656)、原始Glasgow评分(AUC为0.536)、APACHEⅡ评分(AUC为0.817)和多器官功能障碍评分(AUC为0.781)。除了人工神经网络以外,其他机器学习算法也被用来预测急性胰腺炎的严重程度。例如,Pearce等[25]使用Kernel逻辑回归模型预测急性胰腺炎的严重程度,发现使用入院时的临床和实验室检查结果预测急性胰腺炎的严重程度时,Kernel逻辑回归模型比APACHEⅡ有更高的灵敏度和特异度。在预测急性胰腺炎患者住院时间方面,人工智能与大数据技术也有良好的应用前景[29]。Keogan等[30]使用影像学和实验室检查数据,发现人工神经网络模型预测准确率优于Balthazar和Ranson评分。Pofahl等[29]建立的人工神经网络模型能够使用入院时即可收集的数据预测患者的住院天数是否会超过7 d,而传统的评分系统需要等待至少48 h。
重症急性胰腺炎(SAP)病情变化较快,需要早期监测病情变化。Vistisen等[31]通过自动化的持续微创监测结合机器学习算法,可以早期识别生命体征的细微变化,从而帮助指导早期治疗,预防血流动力学灾难性事件,确保患者安全,改善预后。有研究者收集217例SAP患者的临床和实验室资料,通过胰腺坏死程度、乳酸脱氢酶、血红蛋白氧饱和度等基本资料即可建立神经网络模型,预测SAP合并急性肺损伤的风险,以便对高风险人群早期制定对策预防急性肺损伤的发生[32]。预测急性胰腺炎后门静脉、脾静脉、肠系膜静脉血栓的发生是一项较困难的工作。有研究者构建了人工神经网络预测门静脉-肠系膜静脉血栓的发生,证实了与传统的logistic回归预测模型比较,人工神经网络总体预测能力优于logistic回归模型,可更好地帮助指导患者管理及并发症预防[33]。Walczak等[34]研究了人工神经网络预测胰腺癌患者生存期的方法,该人工神经网络模型能准确预测胰腺癌患者7个月的生存率,为医师和患者制定最佳的治疗方案提供依据,帮助患者最大限度减少遗憾并提高生活质量。Ansari等[35]也构建了基于淋巴结转移、肿瘤分化程度、体重指数、年龄等临床参数的人工神经网络模型,预测胰腺导管腺癌根治术后患者的长期生存时间,发现该模型Harrell′s一致性指数为0.79,提示该模型可较好用于预测患者术后的长期生存时间。
南京大学团队利用大数据挖掘技术分析了江苏省2014年至2016年间急性胰腺炎的流行病学特征,发现未婚人群中发生SAP的人数较多,且SAP患者中AB型或B型血占比较高,江苏北部比南部发生急性胰腺炎的患者更多,这可能为江苏急性胰腺炎的预防管理提供一定参考[36]。
除上述对于患者的在院管理外,人工智能与医疗大数据技术在慢性病患者的长期管理、远程管理方面也将有很大潜力[37-39]。利用智能穿戴设备、家用血糖监测仪等设备,慢性病患者(如慢性胰腺炎病情稳定的患者、胰腺良性肿瘤术后稳定的患者等)可在家中自己监测生命体征及其他常规健康指标,利用互联网平台将数据实时反馈给医师,便于医师对患者的长期管理及随访。这种管理模式不仅节约了医疗资源,而且减少了就医次数,方便了患者。
四、小结
尽管目前仍有很多胰腺疾病的发病机制不清,治疗措施有限,大多数仅能对症治疗,无法阻断甚至逆转胰腺病变的发展,但伴随着人工智能和医疗大数据的研究深入,胰腺疾病的智能化诊断、治疗、监测、预后判断和疾病管理等方面都取得了长足的进展,胰腺疾病的病因与诊断实现了进一步明确。相信在不远的将来,阻断甚至逆转胰腺病变的方法也有望在智能化诊疗的辅助下成为现实。
利益冲突所有作者均声明不存在利益冲突