2型糖尿病并发症预测模型研究进展
2021-11-28马浩鸣周佩如
马浩鸣,周佩如
1.暨南大学护理学院,广东510632;2.暨南大学附属第一医院
糖尿病(diabetes mellitus,DM)作为困扰全人类的一种非传染性慢性疾病,是遗传和环境相互作用引起的一组以血糖升高为主要特征的临床综合征[1]。目前,全球每11位成年人中就有1位患有糖尿病,其中约90%的病人属于2型糖尿病(type 2 diabetes mellitus,T2DM)[2]。2型糖尿病又被称为非胰岛素依赖型糖尿病,其患病率高,发病隐匿,早期症状不明显,导致未确诊的糖尿病病例大量增加,加上2型糖尿病治疗技术的进步,意味着病人普遍老龄化,导致2型糖尿病并发症的发病率大幅上升,代价高昂[3]。据国际糖尿病组织的数据估计,2017年全球约有4.51亿例糖尿病病人,预计在2045年将增加到6.93亿例;2017年全球糖尿病病人医疗保健支出约为8 500亿美元[4]。根据国内糖尿病流调数据显示,我国成年人的糖尿病患病率已高达11.6%,约1.14亿例[5],位居糖尿病第一大国。
2型糖尿病最主要的危害在于其伴随而来的急性、慢性并发症,是导致病人死亡以及医疗成本加重的最主要原因[6]。2型糖尿病并发症患病率非常高,在一项亚洲、非洲、南美和欧洲28个国家的观察研究中,2型糖尿病病人中有一半的病人患有微血管并发症,有27%的病人患有大血管并发症[7]。一项纳入多国数据的研究表明,没有并发症的糖尿病住院病人的费用占人均收入的11%~75%,其中有并发症的病人住院费用是没有并发症的住院病人的3倍[8]。
随着社会对卫生保健服务需求的日益增加,且基于对成本效益的考量,各国都相继在2型糖尿病的管理指南中强调了对并发症风险评估及早期预防的重要性,美国糖尿病协会(American Diabetes Association,ADA)[9]、英国国家卫生和临床技术优化研究所(National Institute for Health and Care Excellence,NICE)[10]都在2型糖尿病指南中建议定期进行糖尿病并发症风险评估和多学科管理。Wan等[11]在我国香港2018年的一项大型基于真实世界的前瞻性研究表明,通过糖尿病5年并发症预测模型的筛选,将糖尿病并发症高危病人进行多学科分层干预管理,与对照组相比,试验组患心血管风险降低了56.6%,死亡率降低了66.1%,显示通过糖尿病并发症预测模型进行风险分层和早期多学科糖尿病控制和危险因素管理对延缓疾病进展和预防并发症的重要性。因此,积极开发面向病人、医护人员以及卫生政策系统的2型糖尿病并发症风险预测模型并构建实用性评估工具,对2型糖尿病管理具有重大意义。现将2型糖尿病并发症预测模型的发展和应用进展综述如下。
1 疾病预测模型概述
疾病预测模型在疾病诊断及管理领域扮演着越来越重要的角色,对于一些发病隐匿、进展缓慢的疾病来说,预测模型可以很好地协助临床进行诊断和管理[12]。预测模型通常按方法学分为2种,第一种是最为经典的,即建立在大量的病人数据上,经过数学模型的拟合回归,如Cox回归模型和Weibull回归模型等可以筛选出健康相关的危险因素,预测个体未来某一特定时间内的发病概率,并进行相关风险的评分。模型可以进一步以概率切点来进行危险分层,可以提高临床的实用性,如心血管领域中最著名的弗明翰心脏研究(Framingham heart study),此模型将人群按并发心血管事件的概率分为最低危风险、低风险、中度风险、高度风险和最高危风险,是最早的,也是运用最广的预测模型[13]。另一种是通过对现有的、散在的研究进行二次研究合成,如Meta分析、合成分析(synthesis analysis)等,通过对现有研究的严格评价和纳入,在无法进行严格大规模的队列研究的前提下,也是一种建立预测模型的可靠方式,基于循证的原理获得综合性的模型,从而更好地为医疗资源的合理配置、卫生服务的合理开展以及卫生政策的合理制定等提供依据。现有糖尿病并发症风险预测模型通常指上文提及的第一种,其科学性较大依赖于研究的设计是否严谨,大多建立在前瞻性或回顾性队列研究中,前者指在糖尿病并发症发生之前,获取并发症相关危险因素的信息,通过随访获得发病信息;后者指通过病历回顾,寻找对照组和试验组的危险因素与是否发生并发症之间的关系,根据临床数据建立相关并发症的风险预测模型。以此为基础,也可以开发出相关的风险评估工具,如列线图和计算软件等[14]。
2 国外糖尿病并发症预测模型起源及研究现状
2型糖尿病并发症模型最早起源于英国著名的糖尿病前瞻性队列研究(UKPDS),是糖尿病研究领域内一项具有里程碑意义的随机对照试验[15]。该研究历时14年(1977年—1991年),共纳入5 102例糖尿病病人,平均随访时间为10.7年。此研究表明,严格的血糖控制和血压管理可以大幅降低新诊断2型糖尿病病人未来发生糖尿病相关并发症的风险。而基于此研究所得的数据,从2001年起,学者们逐步开启了对2型糖尿病相关并发症预测模型的探索。首个糖尿病并发症预测模型由Stevens等[16]率先开发,模型纳入了年龄、性别、种族、吸烟史、糖化血红蛋白、收缩期血液压力和总胆固醇/高密度脂蛋白胆固醇比率作为预测因子,并着重预测2型糖尿病病人心血管并发症的风险。第2个基于UKPDS数据的模型在2004年由Clarke[17]等开发并验证,该模型运用Weibull回归发展了7个数学方程来预测与糖尿病相关的并发症风险,包括脑卒中、心力衰竭、致命或非致命心肌梗死、糖尿病肾脏病、截肢以及失明。第2个模型除纳入第1个模型所使用的预测因子之外,也纳入了病人的既往史,如既往糖尿病相关不良事件的发生和体质指数(BMI)。最新一版UKPDS模型由Hayes等[18]在2013年发表并对之前的版本进行了修改,加入了关于微量或大量蛋白尿、肾小球滤过滤、心率、白细胞计数和血红蛋白等详细的生化指标信息,使模型更敏感,具有更高预测效应。随着越来越多糖尿病并发症模型的开发,一些基于模型的评估软件也逐渐形成,但其推广性有待进一步提高。其中较为著名的是Hippisley-Cox等[19]在1998年—2014年开展的一项前瞻性队列研究,研究通过英国Qresearch数据库收集纳入了454 575例糖尿病病人的病例信息,构建并验证了糖尿病病人10年内失明和截肢风险的模型,并以此模型开发了Qdiabetes网页。糖尿病病人通过在该网页输入各项数据指标即可得出未来10年内失明和截肢的绝对风险值。但该模型仅给出了罹患并发症的绝对值而并没有划分出高危人群和低危人群的界限,不利于临床的使用推广。Eddy等[20]开发了Archimedes大型糖尿病模型,该模型较为复杂,可以理解为一项由计算机模拟测试人体自然生理学、疾病干预和卫生保健的多个过程,现多用于临床研究与卫生系统决策,临床推广有限。
3 适用于我国糖尿病并发症模型的探索
由于种族、社会及文化环境的差异,越来越多的证据表明,不同国家、地区和种族糖尿病病人并发症风险不尽相同,如与发达国家相比,发展中国家糖尿病病人发生肾脏并发症和脑卒中的风险更高,但是发生心血管疾病的风险较低,照搬其他国家及地区的2型糖尿病并发症预测模型显然会存在较大偏移[21]。在这种背景下,我国学者们逐步开始探究适合我国病人的糖尿病并发症预测模型,并取得一定进展。2006年,李戈等[22]运用人工神经网络的方法,对现有病例进行数据挖掘,构建了5种糖尿病并发症发病风险预测模型,可以分别对糖尿病病人的心血管病变、下肢动脉病变、肾脏病变、神经病变以及视网膜病变进行风险预测,预测准确率为64.71%~82.35%,其中除糖尿病神经病变的预测灵敏度和特异度欠佳,其余并发症的风险预测效果良好。这项研究模型具有对数据容错率高、便于操作等优点,但研究数据体量较小,且仅做了病例资料回顾研究。因此,有可能一定程度上造成预测结果的偏倚。利用大型临床数据进行随访追踪可以得到偏倚较小的模型。香港大学学者Wan等[23]回顾了香港医管局2010年137 935例糖尿病病人的病历资料,通过5年的随访,构建了我国2型糖尿病病人心血管疾病的风险预测模型,并显示出较好的准确度(一致性指数为0.705)。Miao等[24]使用2013年江苏省疾病预防控制中心在社区开展的“糖尿病预防控制综合研究”项目的数据,纳入了11 771例符合条件的糖尿病病人,通过4年随访,使用Cox回归模型建立了我国糖尿病病人肾病预测模型,经检验准确度较好。
基于近年来国内外对于2型糖尿病并发症相关危险因素已有较多的数据积累,许多学者尝试通过二次研究进行模型构建。刘小钰[25]通过文献评价搜集截止2016年有关糖尿病并发症的相关文献,对符合条件的文献进行二次分析,提取2次数据并进行危险因素比值比(OR值)的合并,运用Logistic回归模型建立了糖尿病3种并发症的预测模型,并进行了低、中、高风险层次的分级,临床使用价值较好。但文献中纳入的高质量文献较少,且文献二次归纳分析中容易造成信息丢失,最终形成模型的可靠性也有待进一步检验。随着大数据(big data)时代的来临以及人工智能(AI)领域的不断发展,基于人工智能的数据挖掘技术逐渐被运用于糖尿病并发症的管理中。我国学者王洁等[26]通过对国家人口与健康科学数据共享服务平台上糖尿病病人的较大真实数据集进行基于机器学习的数据挖掘,使用Logistic回归和多层神经网络模型,对2型糖尿病并发症进行预测分析。模型采用Python语言编写,经过多次修改训练参数及调整试验数据,最终得出训练模型的最优结果,并显示出较高的准确率。但该研究由于缺乏医疗团队的加入,在并发症纳入的定义上以及纳入数据的代表性上有所不足,最终导致模型的实用性较低,没有被临床投入使用。为了更好地利用大数据辅助临床对糖尿病并发症的诊断,崔纯纯[27]利用机器学习方法,对北京市某医院的信息系统进行数据处理和挖掘,构建了基于BP神经网络的糖尿病并发症预测模型,并将其运用于北京市某医院信息管理系统中,完成了对系统的测试,真正实现了运用预测模型在临床决策中辅助医生进行糖尿病并发症的诊断和管理。由此可见,通过医疗、人工智能与大数据领域的结合实现糖尿病并发症预测是未来发展的重要趋势。
4 小结及展望
综上所述,目前2型糖尿病并发症风险评估模型一般通过前瞻性队列研究设计或大型临床数据集,随访收集临床数据,选取合适的数学统计模型,构建不同并发症的预测模型,以此评定2型糖尿病病人各种潜在的并发症风险,不仅为病人和家属提供了客观的数据指标,提升其自我管理的内在动力,也为医护人员在2型糖尿病病人中发现高危人群,并开展有针对性的干预提供了依据。随着越来越多的研究发表,基于循证和研究合成的预测模型也开始出现,为开发更具综合性以及实用性的模型提供了思路。而与大数据和人工智能领域的结合无疑是未来糖尿病并发症预测模型发展的热门方向之一,如何利用大数据和人工智能在海量的医疗数据中找到最有诊断价值的信息以及如何在预测模型的实用性与精确度寻求平衡,是亟待学者们解决的问题。
由于各国、各民族文化、习惯和社会环境等差异的存在,不同国家或地区在引进或者发展2型糖尿病预测模型时,首先都应该对其适用性进行验证,或根据本地区人群的特点进行调整,以建立本土化的2型糖尿病并发症风险预测模型。我国糖尿病并发症预测模型虽然已有大样本的回顾分析,但大样本的前瞻性队列研究仍然缺乏,涉及2型糖尿病预测模型在临床的应用较少,且主要集中于临床的辅助诊断,鲜少用于疾病的早期管理和预警。此外,现有的2型糖尿病并发症模型纳入的危险和保护因子仍不够全面,模型的预测准确度和临床实用性有待进一步发展。综上所述,目前我国仍未建立起涵盖全面、预测效应良好且实用性强的2型糖尿病并发症风险预测模型,且模型的应用与推广较为缺乏,2型糖尿病并发症预测模型应加强在疾病早期阶段的应用。未来仍需在模型的发展与应用领域做进一步的研究。