APP下载

南疆地区女性压力性尿失禁的预测模型构建

2021-10-12王元毅王勤章

现代泌尿外科杂志 2021年9期
关键词:南疆异质性变量

王元毅,曾 凯,郝 雨,李 晨,倪 钊,李 强,王勤章

(石河子大学医学院第一附属医院泌尿外科,新疆石河子 832000)

目前我国女性压力性尿失禁(stress urinary incontinence,SUI)的患病率为18.8%,这一数据正在逐年上升并一直维持在较高的水平[1],有文献报道我国新疆南疆地区汉族女性SUI患病率达38.7%[2],而维吾尔族女性则高达43.5%[3]。如此高的患病率,不仅给患者身体及心理上带来痛苦,而且还增加个人的医疗经济负担及国家医疗资源支出[4]。因此有效地预测SUI的发生,并给予提前干预措施,从而减少女性SUI的患病率非常必要[5]。近年来,随着人工智能的兴起与发展,对于疾病的诊断及预测愈发成熟。目前关于SUI的预测模型仅围绕产后等特定范围及时间段[9-11],不具有普适性;而本研究以我国女性SUI危险因素Meta分析结果作为预测变量,建立南疆女性SUI的预测模型,以期通过对SUI的风险预测,达到早预防、早治疗,从而减少女性的患病率及经济负担。

1 资料与方法

1.1 资料来源课题组于2019年4-8月通过分层整群抽样方法在南疆地区进行《南疆地区盆底功能障碍性疾病流行病学调查研究》,本研究从中选取有关SUI建模所需数据。

1.2 纳入及排除标准纳入标准:所选区域2010年第六次人口普查登记的常住人口及流动人口(在调查点居住>6个月),年龄18周岁以上神志清楚、理解能力正常、自愿参加该调查的个人,能够完成相关临床检查,并自愿签署知情同意书的人群为总体。

排除标准:①具有严重基础疾病或严重遗传性疾病者不适合完成相关检查;②被调查者字迹不清、无法辨认者;③被调查有漏填现象,被调查结果明显失真、有逻辑错误。

1.3 资料获取及诊断标准

1.3.1一般信息 通过填写一般信息调查表获取,内容包括:性别、年龄、文化程度、职业、婚姻状况、就医情况、是否伴发躯体器质性疾病、饮酒史、既往史等。

1.3.2SUI 根据国际尿控协会(International Continence Society,ICS-2002)定义[12],并填写国际尿失禁咨询委员会尿失禁问卷表简表(International Consultation on Incontinence Questionnaire-short form,ICIQ-SF)。

1.3.3便秘 参照罗马Ⅳ标准,并需要排除肠道及全身器质性因素、药物及其他原因导致的便秘。并行专科查体及填写便秘患者生活质量量表(Patient Assessment of Constipation Quality of Life Questionnaire,PAC-QOL)。

1.3.4妇产科相关信息 由妇产科医师询问相关情况(孕产史、绝经时间、手术史、妇科相关疾病史等)并行妇科检查及盆底超声检查。

1.4 方法

1.4.1文献检索及分析 通过计算机检索中文数据库:中国知网、维普、万方、中国生物医学;外文数据库:PubMed、Web of Science、The Cochrane Library、Clinicalkey。搜集我国女性SUI危险因素的横断面研究、病例-对照研究及队列研究,检索时限均从建库至2020年5月。此外,追溯纳入文献的参考文献,以补充获取相关文献。对纳入文献横断面研究采用美国卫生保健质量和研究机构(Agency for Healthcare Research and Quality,AHRQ)[13]推荐的偏倚风险评价量表进行评价。病例对照研究和队列研究的偏倚风险评价采用纽卡斯尔-渥太华量表(Newcastle-Ottawa scale,NOS)[14]。采用Excel 2019和RevMan 5.3对提取的数据进行统计分析,纳入研究的异质性用Q检验进行分析(检验水准为α=0.1),同时结合I2定量判断异质性大小。若各研究结果间无统计学异质性,则采用固定效应模型进行Meta分析;若各研究结果间存在统计学异质性,则进一步分析异质性来源,在排除明显临床异质性的影响后,采用随机效应模型进行Meta分析。对纳入文献≥10篇的结局指标绘制漏斗图并结合失安全系数评价发表偏倚。

1.4.2数据整理及建立模型 从《南疆地区盆底功能障碍性疾病流行病学调查研究》数据库中筛选及整理符合纳入标准的资料数据。运用Spss Modeler Subscription 建立多层感知器(multi-layer perceptron,MLP)神经网络模型,其中将中国女性SUI危险因素的Meta分析结果作为预测变量,输出目标为SUI。

1.5 统计学处理采用Epidata3.1对原始数据进行双录入,SPSS 25.0对数据进行筛选,Spss Modeler Subscription 进行MLP神经网络模型构建。采用灵敏度、特异度、准确度、接受者操作特性曲线(receiver operating characteristic curve,ROC)及曲线下面积(area under curve,AUC)、基尼系数(gini index)评价模型。

2 结 果

2.1 流调资料在南疆地区共收集928例样本,其中排除男性、缺失身高、体重等数据者368例,最终纳入560例构建模型,其中发生SUI者216例。

2.2Meta分析及结果经过文献检索、评价及筛选,共纳入35篇文献行Meta分析,包括横断面研究31篇,病例对照研究4篇,涉及国内15省样本量共计94 043人。相关危险因素有20个,最终结果提示我国女性SUI的危险因素:年龄、体质指数(body mass index,BMI)、劳动强度、饮酒史、高血压、便秘、呼吸系统疾病史、泌尿系统疾病史、妇科疾病史、孕次、产次(≥3次)、第一胎胎儿体重、会阴裂伤、阴道分娩、绝经、盆腔手术史、子宫脱垂,剖宫产为保护因素(表1)。

表1 中国女性发生SUI相关危险因素

2.3 建立SUI预测模型运用SPSS Modeler Subscription 数据挖掘软件建立MLP神经网络模型。输入预测变量为年龄、BMI等上述Meta分析结果。其中年龄、BMI、第一胎胎儿体重为连续型变量,劳动强度、孕次为有序变量,其余为标记变量。输出目标为SUI。分区选择培训70%(408例),测试15%(77例),验证15%(75例)。选择可重复的随机分配,随机种子为7 462 243。模型构建选项:创建标准模型,构建两个隐藏层,隐藏层1有20个神经元,隐藏层2有15个神经元。中止规则为默认选项,选择可复制结果,随机种子为477 534 151。运行结果提示模型准确性达86.8%(图1A)。预测变量重要性排序提示年龄、BMI对SUI预测最为重要(图1B)。

A:模型概要;B:预测变量重要性排序。

2.4 模型评价通过灵敏度、特异度、准确度、ROC曲线、AUC及Gini系数进行模型的评估,结果提示模型的准确度在86.76%(表2)。对模型进行测试提示模型准确度为84.42%(表2)。而通过75例样本,利用训练完成的模型进行判断是否发生SUI。结果提示模型的灵敏度为93.1%,特异度为80.43%,准确度为85.33%,AUC为0.924,Gini系数为0.848。AUC及Gini系数越接近1,表明二分类模型更好[15]。说明该模型在判断南疆女性在是否发生SUI上具有较好的预测能力(表2、图2)。

表2 模型的性能评价指标

图2 压力性尿失禁(SUI)神经网络模型[培训(A)、测试(B)]及验证的ROC曲线(C)

3 讨 论

SUI是让女性羞于启齿同时也让女性痛苦的疾病,严重影响女性患者的生活质量[16]。然而,目前SUI的病因及发病机制仍不明确,对SUI的治疗方案多种多样,但治疗效果参差不齐。因此,通过早发现、早干预来预防SUI的发生,就变得非常重要[5]。本研究以SUI的危险因素作为预测变量,通过人工神经网络构建预测模型,以期为广大女性及医务人员在SUI的预防及干预提供参考依据。

本研究显示年龄、BMI、第一胎胎儿体重、子宫脱垂、孕次等是女性发生SUI的预测变量,其中年龄和BMI是最重要的预测因素,国外HANNESTAD等[17]的研究显示,女性随着年龄的增加,SUI的患病率也随之增加。国内ZHANG等[18]关于国内地区的SUI研究表明,年龄是我国女性发生SUI的高危因素,其中尤其以40~49年龄组为重。本研究也表明年龄是预测SUI的重要因素。关于BMI对SUI的影响,AUNE等[19]的研究表明BMI每增加5 kg/cm2,腰围每增加10 cm,体重每增加10 kg,尿失禁的相对风险增加20%、18%和34%。DIOKNO等[11]建立的尿失禁预测模型表明BMI是影响尿失禁发生的第一重要因素。而本研究结果提示BMI是SUI的重要预测因素。

目前人工神经网络在疾病的诊断、预测等方面应用非常广泛,并且模型预测效果良好[6-8]。而关于SUI的预测模型,目前国内有学者陈晓敏、陈玲等[9-10]建立了线列图预测模型,但该预测模型仅限于孕期及产后,同时预测变量较少,而引起SUI的危险因素却是多样性的[5],故不适用于整个女性群体。国外DIOKNO等[11]通过家庭采访形式对尿失禁的危险因素进行筛查并将危险因素以排列组合的形式建立预测模型,其模型的灵敏度和特异度分别为 78.6%和 65.1%,但其样本数据92.1%来自白人,7.5%来自黑人,这将导致该模型不适用于其他人群。

本研究的优势:首先相较于其他研究的特定人群及单一因素,本研究通过对我国女性发生SUI的危险因素进行Meta分析,确定预测变量,使得预测变量更加全面,更具有可信度及普适性,同时也更符合我国女性的基本情况。第二,人工神经网络模型具有非线性映射能力,已证明三层的神经网络就能以任意精度逼近任何非线性连续函数,这使得其特别适合解决内部机制复杂的问题。同时,神经网络具有自学习和自适应能力。

本研究的局限性:①模型纳入数据相对较少,不过,后期可通过课题组再次补充样本数据,对模型进行优化及再训练;②本模型是回顾性研究,缺少前瞻性验证,后期可通过课题组构建的基于南疆地区盆底功能障碍性疾病集成诊疗及大数据云平台,进行每年的跟踪随访,以验证模型的准确性;③人工神经网络模型也存在样本依赖性问题,不仅依赖大样本数据,同时需要样本的典型性及代表性。而本研究采用SUI的危险因素作为样本数据,使得样本在最大程度上具有典型性及代表性。

综上所述,根据建立的南疆女性SUI风险预测模型,可以较好地对女性发生SUI进行风险预测,并可以针对相关危险因素采取干预措施,如BMI超标、多孕多产者等,可采取减重、盆底肌肉锻炼等方式,加强盆底肌功能,以期减少女性SUI的发生。

猜你喜欢

南疆异质性变量
Meta分析中的异质性检验
城市规模与主观幸福感——基于认知主体异质性的视角
临床常见革兰阴性菌异质性耐药研究进展
基于可持续发展的异质性债务治理与制度完善
抓住不变量解题
南疆木棉红似火
绝色南疆之大漠与少女
南疆水城(外一章)
南疆干部
分离变量法:常见的通性通法