APP下载

健康人群肺结节风险的列线图预测模型构建

2023-08-02张晓丰华文娟王同

临床肺科杂志 2023年8期
关键词:线图筛查结节

张晓丰 华文娟 王同

肺癌的发病率仅次于乳腺癌[1],中晚期肺癌5年总生存率约5%,而Ia期则为80%以上,因此,早期诊断尤为重要[2]。影像学表现为直径≤3cm的局灶性、类圆形、密度增高的实性或亚实性肺部阴影被称为肺结节[3],其中约有5%左右最终发展为肺癌[4]。低剂量CT用于肺癌早期筛查可以显著降低肺癌死亡率[3,5],但如何确定筛查对象非常重要[6],国内外指南、专家共识均对肺癌早期筛查人群做出推荐[3,7]。但是,自新型冠状病毒爆发以来,意外发现了很多肺结节和肺癌的患者[8]。这说明我们对于肺癌早期筛查对象的选择仍需进一步探讨。目前,肺结节可能风险因素的研究结果还是有较明显差异[9-10]。本研究旨在探讨现阶段本地健康人群中肺结节的可能风险因素,并以此构建列线图风险预测模型。

资料与方法

一、研究对象与实验分组

筛选安徽医科大学第二附属医院健康管理中心2022年11月至2022年12月所有行胸部CT检查的体检人群共7310人,去除不能配合和/或不愿配合问询的人员后共入组3631人。纳入标准:①年龄≥18岁;②精神正常,认知清晰,可配合完成问询。排除标准:①明确诊断恶性肿瘤患者;②有严重心肝肾等疾病。③妊娠期或哺乳期者。将所有患者按7:3的比例随机分为建模组和验证组,分别为建模组2544人,验证组1087人。本研究内容受试者均知情同意,已通过安徽医科大学第二附属医院伦理委员会审批(YX2023-048)。

二、数据收集

从安徽医科大学第二附属医院健康管理系统中获取人口统计学数据和胸部CT结果及各种检验结果。补充问询采集吸烟史、运动情况、职业、学历等信息。

三、统计学方法

采用SPSS 23.0进行数据分析。本研究中连续变量均为非正态分布,用中位数(四分位数)表示,分类变量用频数(n)和百分比(%)表示。连续变量的组间差异采用非参数检验。分类变量的比较采用卡方检验。用多因素Logistic回归模型分析危险因素,列线图和DCA分别采用R(4.1.2)中的rms程序包和rmda程序包。用受试者工作特征(ROC)曲线和校准曲线及曲线下面积(AUC)评价模型。用Hosmer-Lemeshow拟合优度检验和决策曲线分析(DCA)检验模型,P<0.05为具有统计学意义。

结 果

一、单因素分析危险因素

建模组人数共2544人。肺结节阴性组1396人,占建模组总人数的54.9%。肺结节阳性组1148人,占建模组总人数的45.1%。

肺结节阴性组与肺结节阳性组之间,年龄、年龄≥38岁、吸烟或经常被动吸烟、近3年精神压力大、暴露职业(建筑及装修、厨师、有污染的工厂等)、高血压、癌胚抗原升高(>5.00 ng/mL)、白细胞计数、淋巴细胞计数、血小板计数、红细胞计数、嗜酸性粒细胞计数、白蛋白、白球比例A/G、天冬氨酸氨基转移酶、低密度脂蛋白、空腹血糖、尿素氮、血尿酸均有统计学差异(P均<0.05)(表1,2)。

表1 肺结节阴性组和肺结节阳性组一般资料比较[n(%)/M(P25,P75)]

表2 肺结节阴性组和肺结节阳性组实验室指标的比较[n(%)/M(P25,P75)]

二、多因素Logistic回归分析

将上述P<0.05的各项指标纳入多因素Logistic回归模型分析,结果显示年龄≥38岁、吸烟或经常被动吸烟、近3年精神压力大、暴露职业(建筑及装修、厨师、有污染的工厂等)、癌胚抗原升高均为肺结节阳性的风险因素(P<0.05)(表3)。

表3 多因素Logistic回归分析

三、建立肺结节风险的列线图预测模型

在多因素Logistic回归结果的基础上,建立列线图预测模型,对各风险因素赋分(图1)。

图1 肺结节风险预测模型列线图

四、预测模型的效能评估和验证

建模组(内部)和验证组(外部)的ROC曲线下面积(AUC)分别为0.787和0.779,灵敏度为0.659,特异度为0.763,该模型诊断效能良好(图2)。Hosmer-Lemeshow检验显示,模型的拟合曲线与建模组(内部)和验证组(外部)的理想曲线间均无统计学差异,拟合优度良好(P=0.961,P=0.451)(图3),该模型预测肺结节阳性的概率与实际发生概率一致性较好。DCA显示,该模型在较大的阈值内均有较高的获益性,此模型有临床意义(图4)。

图2 肺结节预测模型ROC曲线

图3 肺结节预测模型拟合优度检验

图4 肺结节预测模型决策曲线分析

讨 论

关于肺结节筛查的对象选择,国内外均有指南或专家共识推荐。但是随着新的临床研究结果的公布[11],指南推荐也相应有所调整[5],说明目前的推荐仍然不能十分精准地筛选目标人群,前文提到的新冠肺炎期间意外发现了较多肺部结节和早期肺癌的病人也说明了这一点。而且对于不同风险模型价值的研究,结果也并不一致[12-13]。

本研究共纳入建模组2544人,检出肺结节阳性共1148人,阳性占比45.1%。国内外指南及专家共识常见的风险因素均纳入了研究[3,7],包含性别、年龄、吸烟情况、饮酒情况、职业暴露、家族史等,并且加入了近3年的心理压力状态、运动锻炼情况及常见的基础检验指标。结果提示,年龄≥38岁、吸烟或经常被动吸烟、近3年精神压力大、暴露职业(建筑及装修、厨师、有污染的工厂等)、癌胚抗原升高为肺结节阳性的风险因素。本研究的一个不足之处是没有对吸烟程度、年龄、职业等风险因素做深度的分层分析,主要是为了简化列线图模型,提高临床使用的简易性和便捷性。国内有其他的临床研究对特定的风险因素进行分层研究可供参考,季明等的研究就发现教师人群相较于非教师人群的肺结节检出率更高[14]。另外,国内的肺结节诊治专家共识建议筛查对象的年龄是≥40岁[3],本研究尝试选择了35~40岁之间的各年龄作为组别进行分组,最终发现≥38岁的模型统计学效能最高。本研究发现,近3年的精神压力大更容易检出肺结节,与王伟红[10]等人的研究结果是一致的,后期还需要更多不同地区的临床研究来验证结论。吸烟或被动吸烟、暴露职业已被多项研究证实与肺结节阳性有关[6,9-11],并且被国内外指南和专家共识推荐作为筛查因素[3,7]。本研究中癌胚抗原升高的个别病人,考虑有早期肺癌的风险,已根据情况做进一步的处理或随访。而专家共识中推荐筛查的风险因素包括有肺癌家族史和有肺部慢性基础疾病[3],本研究的结果提示肺结节阴性组和阳性组间并没有统计学差异(P=0.120,P=0.115)。但是对照两组的检出率,肺结节阴性组和肺结节阳性组三级亲属有肺癌病史的比例分别为19.7%和22.2%;肺结节阴性组和肺结节阳性组有慢性肺部疾病(慢性阻塞性肺病、肺结核、间质性肺炎)的比例分别为4.2%和5.6%。考虑两组间无统计学差异可能和样本量有关,后期可以增加样本量进一步研究。

研究中利用列线图建立的肺结节阳性风险预测模型,操作简便,对于临床使用有实际意义。利用ROC曲线和AUC、Hosmer-Lemeshow检验和DCA经过内部和外部验证,结果显示该模型预测效能、拟合优度和临床意义均较理想。但是由于本研究为单中心研究,外部验证使用的是本中心的数据集,所以其广泛的适用性还需要进一步的研究验证。

本研究实际上有2个目的,其中一个是为了建立肺结节风险的列线图模型,给临床确定筛查对象提供帮助。另一个是为了下一步的良恶性肺结节研究入组研究对象。目前的良恶性肺结节风险因素临床研究,其研究对象主要是手术病人。但这样有一个很大的问题是选择性偏倚,入组的基本上都是倾向于肺癌可能的病人。而前瞻性的队列研究则可以排除该偏倚,其结果更有价值。但是考虑到肺癌的发病率和病程,需要的样本量非常大,这一研究将需要漫长的时间和不小的人力成本,希望有更多的同道能参与进来。

猜你喜欢

线图筛查结节
点赞将“抑郁症筛查”纳入学生体检
肺结节,不纠结
发现肺结节需要做PET/CT吗?
从气、虚、痰、瘀辨治肺结节术后咳嗽
预测瘢痕子宫阴道试产失败的风险列线图模型建立
预防宫颈癌,筛查怎么做
NRS2002和MNA-SF在COPD合并营养不良筛查中的应用价值比较
基于箱线图的出厂水和管网水水质分析
智力筛查,靠不靠谱?
体检查出肺结节,我该怎么办