乳腺癌化疗药物性肝损伤风险预测模型构建
2021-08-31常文千崇英之王依泽邵苗苗刘韩熠珈裴盛斐杨璐铭吴冬雪耿雪倩赵贺贺冯福民景丽伟
李 雪,常文千,崇英之,王依泽,邵苗苗,刘 越,刘韩熠珈,裴盛斐,杨璐铭,吴冬雪,王 雪,耿雪倩,赵贺贺,薛 扬,冯福民,景丽伟
药物性肝损伤是由治疗剂量的药物本身及其代谢产物直接损伤肝细胞或由药物诱发过敏反应所引起的肝脏损伤,其中90%以上为急性药物性肝损伤,多发生在药物应用后5~90 d。据世界卫生组织统计,药物性肝损伤已经上升为全球肝病死亡原因的第5位。在中国,药物性肝损伤占住院肝病患者的1%~5%,占急性肝炎患者的10%,占爆发性肝炎患者的12%。
乳腺癌是发生在乳腺腺上皮组织的恶性肿瘤,全球乳腺癌发病率自20世纪70年代末开始一直呈上升趋势。乳腺癌常见的治疗方法有手术治疗、化疗、放疗等,其中化疗常用紫杉醇类、蒽环类、铂类及烷化剂等药物,这些化疗药物毒副作用大,治疗周期长,通常采用联合用药方案,使药物对肝脏的毒性叠加,对肝脏的损伤远大于一般的药物,成为乳腺癌治疗过程中不可忽视的问题。肝脏作为人体最重要的代谢和解毒器官,负责代谢及清除大部分化疗药物,在这一过程中就常引发肝功能损伤。
研究显示,在中国最常引起药物性肝损伤的药物中,抗肿瘤药物居第5位;并有研究发现因药物性肝损伤引起的急性肝衰竭中,抗肿瘤药物位居第2位;多种药物的混合使用可使药物性肝损伤的发生率明显增加。
化疗引发肝损伤在临床中十分常见,但对于化疗引起的肝功能损伤影响因素的研究却比较少。因此,该研究通过对乳腺癌患者化疗时的年龄、分子分型、Ki-67的表达、肿瘤的病理学类型、TNM分期、化疗方案、疾病史、用药史、实验室检测值等因素进行统计学分析,总结出乳腺癌化疗过程中诱发肝损伤的影响因素,建立乳腺癌化疗期间肝损伤的风险预测模型,对乳腺癌化疗药物性肝损伤的早期预防具有指导意义。
1 材料与方法
1.1 病例资料
选取2019年5月4日—11月30日期间在唐山市人民医院住院化疗的乳腺癌患者进行流行病学问卷调查,并收集临床生化检测结果和血样标本。在此期间,唐山市人民医院共收治675例乳腺癌患者,均为女性。纳入标准:将接受化疗并发生肝损伤的初治乳腺癌患者纳入肝损伤组;将接受化疗且并未发生肝损伤的初治乳腺癌患者纳入非肝损伤组。
排除标准:治疗乳腺癌前即存在肝功能异常者;患有可引起肝功能异常的其他疾病者如:病毒性肝炎、自身免疫型肝炎、酒精性肝病、脂肪肝等;服用其他可引起肝功能异常的药物者如:对乙酰氨基酚、复方新诺明等;转移性乳腺癌患者;未签署知情同意书者。
按照研究对象的纳入与排除标准,发现人口学信息、临床生化指标以及血样标本均收集完整的乳腺癌患者共640例。
1.2 问卷调查
由经过统一培训的公共卫生与预防医学专业学生采用1 ∶1面对面方式进行问卷调查。调查问卷是在查阅大量文献的基础上自行设计,经流行病学专家及临床医生进行评定,通过预调查反复修订后正式使用。内容包括:乳腺癌患者的年龄、民族、婚姻状况、是否绝经、有无长期服药史等。同时收集乳腺癌患者化疗期间的临床病历资料,主要包括:肿瘤病理学分型、肿瘤TNM分期、肿瘤分子分型、细胞增殖抗原标记物(Ki-67)的表达、化疗类型、化疗方案等。1.3 乳腺癌化疗药物性肝损伤的诊断标准
乳腺癌化疗药物性肝损伤诊断依据为Danan标准:使用乳腺癌化疗药物前肝功能指标,包括丙氨酸氨基转氨酶(alanine aminotransferase,ALT)、天门冬氨酸氨基转氨酶(aspartate transaminase,AST)、总胆红素(total bilirubin,TBIL)和碱性磷酸酶(alkaline phosphatase,ALP)均正常,当进行化疗治疗6个月内ALT或TBIL超过正常最大值的2倍,或AST、ALP、TBIL三者共同升高且其中之一超过正常最大值的2倍时,即可诊断为药物性肝损伤;若仅有AST、ALP或TBIL高于正常最大值的2倍,或ALT、AST、TBIL、ALP升高值处于正常最大值的1~2倍之间时,则不应诊断为药物性肝损伤。图1为非肝损伤组和肝损伤组对应的ALT、AST、TBIL和ALP的箱形图,可以判断样本肝损伤组的ALT和AST是非肝损伤组的2倍,符合Danan标准。
图1 非肝损伤组和肝损伤组的判断
1.4 乳腺癌患者化疗方案
将化疗方案分为四组,分别为紫杉醇类组(包括单纯使用紫杉醇类药物或烷化剂+紫杉醇类药物)、蒽环类组(包括单纯使用蒽环类药物或烷化剂+蒽环类药物)、联合用药组(紫杉醇类药物+蒽环类药物或紫杉醇类药物+蒽环类药物+烷化剂)、其他用药组(其他类药物)。1.5 建立决策树模型的理论依据
决策树是数据分割的优良方式,构建的分割算法主要有ID3、C4.5、CART三种,其中ID3和C4.5是分类树,CART是分类回归树,其中ID3是决策树最原始的算法,而C4.5和CART发展后的算法。在R语言“rpart”函数中,利用基于熵的information gain进行分割节点的选择,其中information gain的计算方式为:其中D
表示原始训练数据集,D
表示父节点根据某一个特征分割后的第j个子节点中的数据集,其中j=1,2,3…k,N表示数据类别数,ρ表示类别i样本数量占所有样本的比例。把是否肝功能损伤作为分类目标(二分类),参与分类的节点为年龄、是否绝经、长期服药史、肿瘤病理学分型、肿瘤TNM分期、肿瘤分子分型、Ki-67数值、化疗类型、化疗方案等。此时的数据不需要标准化,因为分割数据依据的information gain算法与回归分析的参数估计不同,不需要要求解释变量与目标变量的直接线性关系。决策树建立后叶子节点停止分裂的条件是:① 最大节点数;② 信息增益小于阈值;③ 决策树的深度达到指定的条件;④ 所有特征已经使用完毕,不能继续进行分裂。1.6 血液标本的收集与处理
将采集后的外周血样本在4 ℃温度中放置1 h,然后以4 000 r/min离心5 min,将离心后的上层血清转移至冻存管中,迅速置与-80 ℃冰箱保存备用。2 结果
2.1 研究对象一般情况
本次调查的640例乳腺癌患者均为女性、汉族,未发现吸烟、饮酒患者。经化疗后,106例乳腺癌患者发生肝损伤,占比16.56%。肝损伤组年龄最高72岁,最低28岁,平均年龄(50.5±9.7)岁;非肝损伤组年龄最高78岁,最低26岁,平均年龄(54.8±10.4)岁(表1)。肝损伤组的ALT、AST明显高于非肝损伤组,差异有统计学意义(P
<0.05)(表2)。表1 乳腺癌患者的基本特征(n=640)
表2 乳腺癌患者肝损伤指标特征
2.2 乳腺癌患者一般情况与肝损伤的关系
由表3结果可知,肝损伤发生率与年龄、是否绝经、长期服药史有关,差异有统计学意义(P
<0.05)。<40岁年龄组的乳腺癌患者发生药物性肝损伤的人数最少,4例,占该年龄组总人数的6.67%;60~80岁年龄组发生药物性肝损伤的患者人数最多,47例,占该年龄组总人数的22.82%。经趋势检验,乳腺癌患者药物性肝损伤的发生率随着年龄的增加呈上升趋势(P
<0.05)。已绝经的乳腺癌患者发生肝损伤的比例(21.17%)高于未绝经的乳腺癌患者发生肝损伤的比例(14.11%),差异有统计学意义(P
<0.05)。有长期服药史的乳腺癌患者发生药物性肝损伤的人数(106例)明显高于无长期服药史的患者,差异有统计学意义(P
<0.05)。表3 乳腺癌患者一般情况与肝损伤的关系
表4 乳腺癌患者肿瘤特征与肝损伤的关系
2.3 乳腺癌患者临床特征与肝损伤的关系
结果显示,肿瘤病理学分型、肿瘤TNM分期及化疗方案均与乳腺癌患者药物性肝损伤发生率相关,差异均有统计学意义(P
<0.05)。肿瘤病理学分型为浸润性导管癌的患者发生肝损伤的人数最多(99例),高于其他分型,差异有统计学意义(P
<0.05)。肿瘤TNM分期为Ⅱ期的乳腺癌患者发生肝损伤的人数(59例)高于其他分期的患病人数,差异有统计学意义(P
<0.05)。化疗方案中联合用药组的肝损伤发生率为20.67%,明显高于其他药物组别,差异有统计学意义(P
<0.05)。2.4 研究对象的化疗药物使用情况
2.4.1
烷化剂与乳腺癌患者肝损伤的关系 结合收集的临床数据发现,用于治疗乳腺癌的化疗药物主要有紫杉醇类、蒽环类及烷化剂,我们首先分析烷化剂在研究对象中使用是否存在差异。由结果可知,化疗方案中未使用烷化剂的乳腺癌患者发生肝损伤的例数为54例,肝损伤发生率为19.08%;化疗方案中使用烷化剂的乳腺癌患者发生肝损伤的例数为52例,肝损伤发生率为14.57%,两组之间差异无统计学意义(P
>0.05)(表5)。并且在四组化疗方案中是否加入烷化剂与肝损伤的发生无相关性(P
>0.05,表6)。因此提示烷化剂不是乳腺癌患者化疗期间发生肝损伤的影响因素。表5 烷化剂与乳腺癌患者肝损伤的关系
表6 烷化剂在不同药物分组中使用情况
2.4.2
不同药物与乳腺癌患者肝损伤的关系 结果显示,单纯使用紫杉醇类药物进行化疗的乳腺癌患者发生肝损伤的例数最多,43例,肝损伤发生率为18.94%;使用紫杉醇类+蒽环类化疗方案的乳腺癌患者肝损伤例数为37例,肝损伤发生率为20.67%;单纯使用蒽环类药物化疗的乳腺癌患者发生肝损伤的例数为23例,肝损伤发生率为12.50%,差异有统计学意义(P
<0.05),证明不同化疗药物的使用与乳腺癌患者化疗期间发生的肝损伤有显著相关性(表7)。表7 不同药物与乳腺癌患者肝损伤的关系
2.5 乳腺癌化疗药物性肝损伤风险预测模型的建立
2.5.1
决策树模型的建立 利用R语言中的“rpart package”,分类的节点变量不重复使用,建立基于information gain的二分类决策树,决策树的深度达到了3层(包括原始父节点和叶子节点),如图2基于信息增益的决策树,变量的赋值说明见表8。首先,利用肿瘤TNM分期分割100%的数据(肿瘤TNM分期作为父节点),把肿瘤TNM分期小于4作为判断标准,符合的情况分为一组(93%),不符合的情况分到另一组(7%),也就是两个子节点;以7%的数据组为例,7%的数据作为父节点,以年龄小于等于2(既≤54岁)作为判断标准,把符合的2%判断为非肝损伤组,不符合的5%作为另一类,也就是形成了两个二级子节点;最后对5%的数据组处理,5%的数据作为父节点,以是否为联合用药组作为判断标准,把不是联合用药组的3%预测为非肝损伤组,是联合用药组的1%预测为非肝损伤组,达到了停止分裂的条件。图2 肝损伤预测的决策树(1-否,2-是)
表8 决策树筛选出变量的赋值情况
2.5.2
剪枝-
防止过拟合 图2基于信息增益的决策树有3层,建立的决策树带入的指标变量没有重复使用,直观上不存在过拟合的情况。通过统计学方法进行验证,关于决策树过拟合,改良的方法有多种,最有效的是剪枝和组合树,将在本文尝试用决策树剪枝的方法进行决策树过拟合的优化。complexity parameter也可以称为复杂度参数(简称为cp值),可以作为决策树分裂规模(nsplit)判断的重要指标,与决策树的分裂规模成反比(数规模过大则存在过拟合风险)。Rel error表示所建立的决策书树与空树之间的平均偏差比值,xerror为交叉验证误差,xstd为交叉验证误差的标准差。可以看到,当nsplit为3的时候(即有四个叶子结点的树),要比nsplit为4(即五个叶子结点的树)的交叉误差要小,而决策树剪枝的目的就是为了得到更小交叉误差(xerror)的树。如表9复杂度参数的表现结果,当cp值为0.021的时候,rel error、xerror和xstd取得最小值。选择cp值为0.021可以较好的控制决策树模型复杂度,提高模型精度,进而建立合适的分类模型,提供有用的分析信息。利用R语言中“prune”命令进行剪纸,控制cp=0.021,可以得到剪枝后的决策树,决策树不会变化,建立的决策书没有过拟合的现象。
表9 复杂度参数的表现结果
以上描述的是80%的训练集建立的模型,用20%的检测集(128个观测值)进行检测后得到的混淆矩阵是一个2×2的矩阵,通过混淆矩阵可以确定模型预测的精确度为92.19%。见表10。
表10 基于预测模型的混淆矩阵(n)
决策模型对检测集的敏感度和特异度计算:
2.5.3
决策树模型的分析 通过决策树左侧的第一条路径可以发现,肿瘤TNM分期Ⅰ、Ⅱ和Ⅲ期无论接受何种治疗,肝损伤的风险较小(85%非肝损伤),与图3中肝损伤对肿瘤TNM分期相吻合;决策树预测模型中右侧的第一条路径(年龄和烷化剂),年龄>54岁且联合用药组=1(紫杉醇类和蒽环类药物同时使用)可以提纯出绝大多数的肝损伤病例(78%)。值得关注的是,年龄偏大的患者倾向于肝损伤,偏小的患者倾向于非肝损伤,这与图3中肝损伤与否对年龄的箱型图相吻合。图3 不同肝损伤情况下年龄、肿瘤TNM分期的对比
3 讨论
乳腺癌是全球女性最常见的恶性肿瘤之一,且发病率呈逐年上升趋势。近十几年,乳腺癌的治疗主要以手术为主,并辅助化疗、放疗、内分泌治疗及靶向治疗的多学科综合治疗模式。其中化疗是乳腺癌综合治疗非常重要的一环。但化疗药物所产生的毒副作用,严重影响了其临床的应用和疗效,是导致治疗失败的重要原因之一。临床中常见的肿瘤化疗药物毒副作用主要有骨髓抑制、过敏反应及脏器损伤等,而药物性肝损伤是化疗过程中常见的脏器损伤。药物性肝损伤临床表现复杂多样,轻者无任何症状,仅表现为肝功能异常,严重者可在较短时间内进展为急性肝衰竭甚至死亡。因此,明确乳腺癌化疗药物性肝损伤的影响因素、构建乳腺癌化疗期间肝损伤的风险预测模型,对乳腺癌化疗药物性肝损伤的预测及防治具有重要意义。
本研究显示,年龄、是否绝经、长期服药史与乳腺癌患者药物性肝损伤的发生有关,且肝损伤的发生率随着年龄的增加呈上升趋势。这与Sharma et al的研究结果相一致,提示老年乳腺癌患者在化疗期间发生肝损伤的几率较大。发生的原因可能是由于随着患者年龄增大,身体各器官功能减退、代谢紊乱以及药物的联合作用,导致肝脏的代谢异常,最终造成肝损伤。
通过对乳腺癌患者临床数据分析发现,肿瘤病理学分型、肿瘤TNM分期及化疗方案均与乳腺癌患者药物性肝损伤的发生相关。其中化疗方案中联合用药组的肝损伤发生率最高,为20.67%;紫杉醇类组的肝损伤发生率为18.94%;蒽环类组的肝损伤发生率为12.50%;其他药物组的肝损伤发生率最低,为 6.00%。通过对化疗方案进一步的分层分析发现,在四组化疗方案中是否加入烷化剂与肝损伤的发生无显著相关性,因此提示烷化剂不是乳腺癌患者化疗期间发生肝损伤的影响因素。单纯使用紫杉醇类+蒽环类化疗方案的乳腺癌患者肝损伤发生率为20.67%,高于单纯使用紫杉醇类药物、单纯使用蒽环类药物及其他药物进行化疗的乳腺癌患者,证明不同化疗药物的使用与乳腺癌患者化疗期间发生的肝损伤有明显联系。
结合以上影响因素对乳腺癌化疗药物性肝损伤进行风险预测模型构建,共筛选出3个预测肝损伤风险的观测指标:肿瘤TNM分期、年龄和联合用药,这三个指标对肝损伤风险预测的正确率为92.19%,其中灵敏度和特异度分别为86.36%和93.40%。本课题组将继续在临床中对该风险预测模型进行实践应用,找到对患者肝脏损伤最小的化疗方案,实现患者个体化治疗,从而保障乳腺癌患者化疗顺利进行。