基于决策树的中西医结合治疗输卵管妊娠的预后因子分析
2016-09-08郜洁黄艳茜胡昀昀刘晓静邓高丕
郜洁, 黄艳茜, 胡昀昀, 刘晓静, 邓高丕
(广州中医药大学第一附属医院妇科,广东广州 510405)
基于决策树的中西医结合治疗输卵管妊娠的预后因子分析
郜洁,黄艳茜,胡昀昀,刘晓静,邓高丕
(广州中医药大学第一附属医院妇科,广东广州510405)
【目的】采用决策树回顾性分析中西医结合治疗输卵管妊娠影响因子权重及预后的风险因素,为中西医治疗早期输卵管妊娠的预后提供临床证据。【方法】收集广州中医药大学第一附属医院妇科采用中西医结合治疗的住院病例350例,采用SPSS 19.0建立数据库,并导入Clementine 12.0进行统计分析,建立CART决策树模型。【结果】成功构建了决策树模型。从模型中的12个变量中共筛选出中西医治疗组的5个重要预后变量,即血人绒毛膜促性腺激素(HCG)值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史,其权重值分别为0.388、0.236、0.125、0.125、0.125。其中血HCG值和首次孕酮值是治疗预后的最重要的因素。【结论】所构建的决策树模型符合输卵管妊娠临床诊断规律,可较准确地预测中西医结合治疗早期输卵管妊娠的预后。
输卵管妊娠/中西医结合疗法;预后因子;决策树
异位妊娠作为妇科常见疾病,严重影响妇女生殖健康,其中输卵管妊娠约占异位妊娠发病率的95%[1],早期诊断未破损期输卵管妊娠已普及。1958年山西医学院第一附属医院首先使用宫外孕Ⅰ号及Ⅱ号方保守治疗异位妊娠,之后采用中医或中西医结合的方法保守治疗异位妊娠取得了巨大进步[1]。由于未生育患者数量明显增加,这些患者对于保留患侧输卵管具有强烈的愿望,药物治疗早期输卵管妊娠能最大限度地保留患者的生育能力。邓高丕教授专注于输卵管妊娠中西医结合诊疗研究20余载,前期研究创立“输卵管妊娠病情影响因子评分”及“输卵管妊娠中西医结合治疗方案”[2],并通过采用贝叶斯函数方程[3],对早期不明位置妊娠进行预判。该治疗方案根据早期输卵管妊娠的临床实际变化,改进了教材中的辨证分型,已被纳入了国家中医药管理局重点专科病种的临床路径,并应用于30家基层医院,节约了医疗资源,最大限度保全了女性的再生育能力。
决策树(decision tree)是解决实际应用中分类问题的一种主要数据挖掘方法。分类和回归树(classification and regression trees,CART)模型是决策树模型的一种分支,可对患者的风险进行分层处理,且能发掘因素之间的交互作用,已经应用于多种疾病的临床研究工作,主要用于分类统计及疾病预后的预测[4-5]。本课题组采取CART决策树回顾性研究输卵管妊娠中西医治疗病例,分析影响输卵管妊娠最重要的病情影响因子,以期为经过中西医结合诊疗方案治疗该病的预后评价提供新的证据。现将研究结果报道如下。
1 资料与方法
1.1病例来源收集2011年4月至2015年4月于广州中医药大学第一附属医院妇科采用中西医治疗,出院时明确诊断为早期未破损输卵管妊娠[1]的住院患者350例。患者平均年龄(29.2±2.3)岁,孕次(4.8±0.2)次,产次(2.2±1.1)次。
1.2疗效评价标准[1]有效:腹痛、阴道流血症状消失,血、尿人绒毛膜促性腺激素(human chorionic gonadotropin,HCG)降至阴性,B超下盆腔包块不增大或缩小,盆腔积液不增多或减少。无效:腹痛、阴道流血症状加重,甚至出现失血性休克,血、尿HCG不降反升,B超下盆腔包块持续性增大,盆腔积液增加,最终转至手术治疗。
1.3数据处理以SPSS 19.0录入数据,建立数据库并导入Clementine 12.0进行统计。异位妊娠病情影响因子相关变量名称及赋值情况见表1。其中,下腹疼痛评价标准采用数字评价量表(numerical rating scale,NRS)记分量化疼痛情况,无痛计为0分,隐痛计为1~5分,剧痛计为大于5分。
表1 异位妊娠病情影响因子相关变量赋值Table 1 Variable assignment to prognostic factors for early tubal pregnancy after treatment with TCM-WM therapy
1.4统计方法以Clementine 12.0进行决策树算法运算。数据收集过程中,少部分病例初次孕酮值存在丢失的情况,需将缺失值予以脱落处理,通过Clementine 12.0中“过滤缺失值”功能,可完善数据。利用软件构建CART模型,将根据前期研究[2]得出的12个变量信息,计算信息增益量值大小,绘制决策树和受试者工作特征(ROC)曲线。
2 结果
2.1单因素分析根据前期研究[2]结果显示,停经周数、HCG值、盆腔包块、宫内节育环、盆腔炎史、首次孕酮值、有无阴道流血、月经是否规律、有无自然流产史、有无异位妊娠史、腹痛情况、盆腔积液共12个变量对输卵管妊娠预后的影响有统计学意义,纳入CART模型。本研究通过对中西医治疗350例输卵管妊娠患者进行回顾性研究,得到CART决策树模型(见图1),并从模型中的12个变量中筛选出影响中西医治疗输卵管妊娠预后的重要变量,其中血HCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史这5个变量信息增益最大,这5个变量的信息增益分别为0.388、0.236、0.125、0.125、0.125,可作为分裂属性变量,其余变量信息增益可忽略不计。
2.2CART分析结果研究结果构建了树深为4、子树为8的中西医治疗输卵管妊娠的决策树模型,见图1。根据纳入标准收集中西医治疗组病例数总计350例,其中有效325例,无效25例,总有效率为92.857%,无效率为7.143%。在入选的12个变量中,血HCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史这5个变量对判别输卵管妊娠预后具有重要意义,且使预后结果进行分层。
图1 中西医治疗输卵管妊娠的决策树模型Figure 1 Decision tree model for predicting the prognosis of fallopian tube pregnancy after treatment with TCM-WM therapy
2.3模型评估绘制ROC曲线(图2)分析本次生成的CART决策树的预测能力,结果显示CART模型的曲线下面积(AUC)为0.663,根据前期CART分析结果可知HCG及首次孕酮值在CART模型中权重较大,并能较好地预测输卵管妊娠患者的预后。
图2 CART模型的ROC曲线Figure 2 ROC curve of the CART model
3 讨论
根据决策树结果(见图1),当血HCG值≤2449.39 U/L时,输卵管妊娠治疗有效率达96.855%,无效率为3.145%。当停经周数>5.5周,存在盆腔包块,同时孕酮值<81.07 nmol/L,血HCG值>2 449.39 U/L时易致治疗无效,此类患者占4.286%。结合临床分析,考虑HCG值越高,胚胎组织活性越强,而存在盆腔包块、孕酮值<81.07 nmol/L、停经周数>5.5周可视为早期宫内妊娠的排除条件。而在血HCG值<2 449.39 U/L时,中西医治疗输卵管妊娠无效均发生在孕酮小于3.410 nmol/L时,占2.857%。考虑此时为输卵管妊娠已破损期,此时血清中表现出的HCG值及孕酮已较未破损期明显下降,因此使用药物治疗,无论是中西药均效果欠佳,且有持续异位妊娠可能,建议此部分患者必要时行手术探查。其中,5个变量的信息增益量总共为1.0。血HCG值、首次孕酮值在全部变量中占主导地位。HCG是滋养细胞分泌的一种糖蛋白,作为胚胎活性判断指标[5],HCG值越低,药物治疗异位妊娠的效果越显著,HCG值与滋养细胞对输卵管各层组织的侵蚀力密切相关。而计算出一个判断疾病预后的HCG值分界点,则对临床治疗决策有一定的指导作用。Klein等[6]认为当HCG<2 500 U/L时,药物(甲氨蝶呤)治疗的成功几率较高。而本研究发现,当血HCG值≤2 449.39 U/L时,中西医治疗组成功率为96.552%,比高于此血HCG值时的成功率明显提高,与文献报道相符合。一般认为,孕酮值越低,异位妊娠的手术风险越低[7]。由于在早期妊娠中,滋养细胞在输卵管中的生长活性不如正常宫内妊娠,导致黄体功能不全而生成的孕酮较低。因此认为血清孕酮的测定不仅有助于早期发现异位妊娠,而且使异位妊娠的破裂率降低,最后有利于保留生育功能。
随着HCG定量测定和彩超的准确率提高,输卵管妊娠的早发现、早诊断、早治疗已成为现实。本研究结果显示,CART模型能直观、简便地反映输卵管妊娠预后的影响因子,给出了与文献研究相一致的常用临床指标判定结果:对于各病情影响因子对输卵管妊娠的预后影响强弱的分析显示,血HCG值、首次孕酮值、月经是否规律、有无阴道流血、有无自然流产史为最重要的5个预测变量,也给出一个量化的比较(权重赋值分别为0.388、0.236、0.125、0.125、0.125),这将为临床决策提供更精准的依据。但数学模型亦有其不足之处。为防止CART模型对数据的过度拟合[8],需纳入自变量限制,且今后应扩大样本量进行多中心的比较,以提高该模型的可信度。
[1]罗颂平.中医妇科学[M].北京:高等教育出版社,2011:147.
[2]邓高丕,何虹,何燕萍.病情影响因子对输卵管妊娠患者分期辨证论治的影响[J].中医杂志,2004,45(6):447.
[3]Fonarow G C,Adams K F Jr,Abraham W T,et al.Risk stratification for in-hospital mortality in acutely decompensated heart failure:classification and regression tree analysis[J].JAMA,2005,293(5):572.
[4]Garzotto M,Beer T M,Hudson R G,et al.Improved detection of prostate cancer using classification and regression tree analysis [J].J Clin Oncol,2005,23(19):4322.
[5]岳晓燕.输卵管妊娠治疗现状与趋势[J].实用妇产科杂志,2002,18(3):149.
[6]Klein M,Graf A,Kiss H,et al.Impact of trophoblast penetration through the basal membrane on the efficacy of drug therapy in tubal pregnancies[J].Human Reprod,1995,10(2):439.
[7]Guha S,Ayim F,Ludlow J,et al.Triaging pregnancies of unknown location:the performance of protocols based on single serum progesterone or repeated serum hCG levels[J].Hum Reprod,2014,29(5):938.
[8]方俊群,罗家有,姚宽保,等.C5.0决策树法在出生缺陷预测中的应用[J].中国卫生统计,2009,26(5):473.
【责任编辑:贺小英】
Application of Decision Tree for Analysis of Prognostic Factors of Tubal Pregnancy After Treatment with Chinese and Western Medicine
GAO Jie,HUANG Yanqian,HU Yunyun,LIU Xiaojing,DENG Gaopi
(Dept.of Gynecology,the First Affiliated Hospital of Guangzhou University of Chinese Medicine,Guangzhou 510405 Guangdong,china)
ObjectiveTo retrospectively analyze the weighting and risk of prognostic factors for early tubal pregnancy after treatment with traditional Chinese medicine(TCM)and western medicine(WM)through the application of decision tree classification analysis,thus to provide clinical evidence for TCM-WM therapyfor early tubal pregnancy prognosis.Methods We collected the data of 350 cases of gynecology in-patients from the First Affiliated Hospital of Guangzhou University of Chinese Medicine,and all of the cases received TCMWM therapy.Database was established with SPSS 19.0 software,and then the data were loaded into Clementine 12.0 for the establishment of classification and regression tree(CART)model.Results CART model has been established successfully.Analysis of CART model showed that 5 factors were the important prognostic factors from 12 variables,and the 5 important factors were blood human chorionic gonadotropin(HCG)value,the initial progesterone value,menstruation regularity,vaginal bleeding,history of spontaneous abortion,and their weighting values were 0.388,0.236,0.125,0.125,0.125,respectively.The blood HCG value and the initial progesterone value were the most important factors of the therapeutic outcomes.Conclusion The established CART model can accurately predict the prognosis of fallopian tube pregnancy after treatment with TCM-WM therapy.
tubal pregnancy/TCM-WM therapy;prognostic factors;decision tree
R714.22;R271.41
A
1007-3213(2016)04-0494-04
10.13359/j.cnki.gzxbtcm.2016.04.012
2016-04-11
郜洁(1982-),女,博士研究生,副主任中医师;E-mail:gjfkts@qq.com
邓高丕,男,博士研究生导师,教授,主任中医师;E-mail:denggaopi@126.com
国家自然科学基金面上项目(编号:81173295);广东省中医药管理局重点优势病种“早期输卵管妊娠”突破项目(粤中医函[2015]19号);广东省高等学校优秀青年教师基金(编号:YQ2014043)