APP下载

临床预测模型:基本概念、应用场景及研究思路

2018-02-14谷鸿秋周支瑞章仲恒周权

中国循证心血管医学杂志 2018年12期
关键词:诊断模型因子预测

谷鸿秋,周支瑞,章仲恒,周权

当医学模式从经验医学发展到循证医学,再到精准医学,数据价值得到前所未有的重视,大数据时代数据的获取、存储及分析与预测技术的迅速发展,使得个性化医疗的远景越来越成为可能[1]。临床预测模型作为风险与获益评估的量化工具,可为医生、患者及卫生行政人员的决策提供更直观、理性的信息,因此其应用也越来越普遍。本文将从临床预测模型的概念、应用场景及研究思路三个方面做一总结。

1 临床预测模型的基本概念

临床预测模型(Clinical Prediction Models,CPMs),又称临床预测规则(Clinical prediction rules)、风险预测模型(Risk prediction models)、预测模型(Predictive models)或风险评分(Risk scores),是指利用数学公式估计特定个体当前患有某病或将来发生某结局的概率[2-5]。临床预测模型包括诊断模型(Diagnostic models)和预后模型(Prognostic models)(图1)[3]。诊断模型关注的是基于研究对象的临床症状和特征,诊断当前患有某种疾病的概率,多见于横断面研究;预后模型关注的是在当下健康状况下(健康或患病),未来一段时间内发生某结局(发病、复发、死亡,伤残及并发症)的概率,多见于队列研究。狭义的预后模型特指被诊断患某病后,未来一段时间内疾病复发、死亡,伤残或发生并发症的概率。临床预测模型中,常见结局为患病、发病、疾病的复发、死亡,伤残及并发症。常见的预测因子(Predictors)包括社会人口学特征(如年龄、性别)、疾病史、用药史、体格检查结果、影像、电生理、血样尿样检查、病理检查、疾病阶段与特征以及组学(基因组学、蛋白组学、代谢组学、转录组学及药物基因组学等)指标。预测因子在其它文献中也称作预后因素(Prognostic factors)、决定因素(Determinants),或者是更接近统计术语的协变量、自变量。诊断模型与预后模型的划分只是从应用场景的角度来区分的,从统计建模的角度来说,二者并无本质差异。例如,模型的结局多为是否发生,属于二分类变量;研究效应指标均为结局出现的绝对风险,即发生的概率,而非相对危险度(RR)、比值比(OR)或者风险比(HR)等相对效应指标;在模型的技术层面,也都需面临预测因子的选择、建模策略的制定、模型性能的评价等环节(图2)。

图1 临床预测模型的概念

图2 诊断模型与预后模型的异同

与临床预测模型紧密关联的概念是预测模型研究(Prediction model studies)和预测研究(Prognosis/prediction research),但文献中未见具体定义。按照“预测研究策略”(PROGRESS)研究组提出的框架,临床预测模型研究包括四个方面[7-10]:①基本预后研究,即自然状态以及当前医疗质量下疾病的进程;②预后因素研究,即与预后相关的特定因素;③预后模型研究,即建立、验证预测个体未来结局风险的统计模型,并评估其影响;④分层医学研究,即利用预后信息调整个体或是具有相同特征人群的治疗决策。其中前两点分别对应传统流行病学研究中疾病的基本描述与危险因素研究,第三点对应本文所讨论的预后模型,最后一点所提及的“分层医学”与“精准医学”相对应[11]。笔者认为,临床预测模型,既可为循证医学提供高质量的证据,也可做为精准医学应用和普及的有利工具。《个体预后与诊断的多变量预测模型透明报告》(TRIPOD)研究组将预测模型研究分为五大类[3]:①寻找预后与诊断因子的研究;②无外部验证的预测模型建立研究;③有外部验证的预测模型建立研究;④预测模型验证研究;⑤预测模型影响研究。五类研究的差异见图3,其中寻找预后与诊断因子的研究及模型影响研究同其它三类在目的、研究设计以及结果报告上有所不同。寻找预后与诊断因子的研究旨在识别出诊断或是预后的独立因子,而非为个性化预测建立最终的预测模型。预测模型影响研究旨在比较应用与不应用预测模型在医生和患者医疗决策及患者健康结局上的效果差异。与其它四类不同,预测模型影响研究应遵循比较干预研究设计,而非单个队列研究设计。预测模型影响研究最理想的设计类型是整群随机试验。各类研究在结果报告上的差异,具体可参考TRIPOD声明清单[3]。

图3 五类预测模型研究

2 临床预测模型的应用场景

临床预测模型在医学研究与实践中非常普遍。借助临床预测模型,临床研究者可以更精准的筛选合适的研究对象,医生和患者可更好的做出医疗决策,政府部门与卫生管理者也可更好的进行医疗质量管理,合理配置医疗资源。此外,临床预测模型的作用也体现在疾病的三级预防体系中:①一级预防:临床预测模型可以给患者和医生提供基于当前的健康状态下,未来患有某病的量化风险值(概率),为健康教育和行为干预提供更直观、有力的科学工具。例如,基于福明翰心脏研究的福明翰心血管病危险评分明确了降低血脂、血压可以预防心肌梗死[6]。②二级预防:诊断模型常借助无创的、低成本、易采集的指标,构建高灵敏度和特异度的诊断方案,践行“早发现,早诊断,早治疗”的疾病预防理念,具有重要的卫生经济学意义。③三级预防:预后模型可对疾病的复发、死亡,伤残及发生并发症的概率给出量化的估算,指导对症治疗和康复方案的制定,防止疾病复发、降低病死率,减少伤残,促进功能恢复,提高生存质量。

3 临床预测模型的研究思路

临床预测模型并非单纯拟合一个数学模型那样草率简单。从模型建立到应用,临床预测模型有一套完整的研究流程。多个学者都曾讨论过临床预测模型的研究思路[2,12-15]。笔者综合文献及个人研究经验,总结其研究步骤如下(图4)。

图4 临床预测模型的研究思路

3.1 研究问题的确立与研究类型的选择临床预测模型适合回答疾病的诊断或预后相关问题,不同问题需采用不同的研究设计类型。例如,对于诊断类问题,其预测因子与结局均在同一时点或很短时间内,适合采用横断面研究数据构建诊断模型;对于预后类问题,其预测因子与结局有纵向时间逻辑,适合采用队列研究数据拟合预后模型。诊断模型研究中,需要有“金标准”来单独诊断疾病,且“金标准”的诊断应该在“盲法”状态下进行,即“金标准”的诊断不能借助预测模型中的预测因子信息,以避免诊断评估偏倚(Diagnostic review bias)。预后模型研究中,预测因子与结局的本质就是纵向关系,且研究者通常希望获得在自然状态下疾病的转归,因此前瞻性队列研究是预后模型最常见,也是最佳研究设计类型。

3.2 设计与实施,数据管理与质控若为全新研究,则应从研究方案、研究者操作手册、病例报告表、伦理批件等相关文件的准备开始,并进行数据管理与质控;若为基于其它研究数据开展的回顾性研究,也应对数据质量进行评估,并根据实际情况确定用于建模和验证的数据集。

3.3 临床预测模型的建立与评价建立模型前,应明确已知的、已报道的预测因子,确定入选预测因子的原则及方法、选用模型的类型(传统模型通常包括适合二分类变量的Logistic回归模型、适合生存数据的Cox回归模型,以及适合频数资料的泊松回归模型)。拟合模型、估算模型参数后,运用区分度(Discrimination),校准度(Calibration)等指标评估模型的性能。

3.4 临床预测模型的验证预测模型的效果很有可能因场景、人群的改变而变化。因此,完整的预测模型研究应包括模型的验证。验证内容包括模型内部效度和外部效度。内部效度体现模型的可重复性(Reproducibility),利用研究项目本身的数据通过交叉验证(Cross-validation)、Bootstrap验证等方法来回答;外部效度体现模型的普遍性(Generalizability),需利用研究项目本身以外的数据(从时间上、地理上独立或完全独立的数据)来回答。

3.5 临床预测模型的应用与影响评估临床预测模型的最终意义在于应用临床预测模型是否改变了医生/患者的行为、改善了患者的结局或成本效应,此即临床预测模型的影响研究。与临床预测模型的验证不同,评估模型影响研究需要设计随机对照试验,且通常为整群随机对照试验来评估。

3.6 临床预测模型的更新即便是经过良好验证的临床预测模型,由于疾病危险因素、未测量的危险因素、治疗措施及治疗背景等随时间变化,模型性能因此下降,此即校准度漂移(Calibration drift)。因此,临床预测模型需不断进化、动态更新。

临床预测模型的本意是借助少量的、易收集的、检测成本低廉的预测因子来预测疾病的状态和预后。因此,大多数预测模型都是短小精炼型的。这在信息技术不发达、数据收集、存储、分析成本高的时代是科学而理性的。但随着经济的发展、技术的进步,数据的收集、存储成本大大降低,数据分析技术日益提高,临床预测模型也应突破固有的观念,采用更大量丰富的数据(大数据),复杂的模型和算法(机器学习、人工智能),以更精准的结果服务于医生、患者及医疗决策者。

猜你喜欢

诊断模型因子预测
我刊2021年影响因子年报
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
一些关于无穷多个素因子的问题
影响因子
扮靓爱车拒绝潜伏危险因子
基于模糊优选反问题的电机电气故障诊断模型
对于电站锅炉燃烧经济性诊断模型的研究