数据挖掘构建幽门螺杆菌感染患者的预测模型和防治策略
2022-09-15杜结玲袁一鸣洪慧斯韦翠花卢苑香
幽门螺杆菌(Helicobacter pylori,
)感染已经成为我国的一个公共卫生健康问题
。国内对
感染途径和危险行为尚无一致意见
,由于
感染有一定地区差异,特别是家庭聚集和饮食习惯,国内对
的危险因素和预判模型研究较少。关于
感染的流行病学最关切的问题是传播途径。
感染的临床过程是高度可变的,受微生物和宿主因素的影响
,几乎所有
感染者都存在慢性活动性胃炎,这属于一种感染性疾病,即使是无症状者也推荐治疗。由于我们无法了解传播的动态,因此很难提出预防方法
。人工智能技术及大数据技术可以在研究和辅助分析方面发挥重要作用。拟通过回顾性分析
患者的病例资料,利用数据挖掘探究相对的特征数据和结局之间的线性关系,充分应用机器学习的可视化和可解释性,进一步挖掘
不同特征对患者的不同影响,通过不同特征对机器学习模型计算的影响进行分析,描述不同特征数据的重要性
。本研究采用Logistic回归分析建立
患者的预测感染模型,为无症状感染者提供参考。
1 资料与方法
选取2021年7月至2022年4月在中山市中医院、中山市东凤人民医院、中山市南区医院在内窥镜室及体检中心接受
C、
C呼气试验或胃镜下取黏膜试验,检查
项目的健康体检人群共1 425名为研究对象。纳入标准:中山市户籍或长期在中山市居住的人群,通过
C、
C呼气试验或做胃镜进行
的快速尿素酶试验;未经过任何
治疗者。排除标准:非中山市户籍或在中山市短暂居住的人群;以往有感染或再次感染
者。
研究者根据专家和文献资料自行设计与
感染相关的二分类及多分类组成的非量表电子调查表
,由经过统一培训的调查员到医院进行现场调查,征得研究对象同意后进行调查,于检查前,调查员指导研究对象扫调查表二维码填写,收集研究对象的基本信息表、临床表征表、生活和饮食习惯表。调查员使用统一指导语当场就问卷或变量有疑问的研究对象进行解析,调查后由专人保管并对5%~10%的研究者数据资料进行核查。核查结束后,另一研究人员以研究对象的
C或
C呼气试验结果和病理结果为结局变量,分为感染组和未感染组,最后资料由统计人员分析,排除如资料不全、对自我症状描述不清、回答结果矛盾,缺失值以众数最多值处理。
问卷表分为3个维度63个变量:(1)患者基本信息表:包括患者的年龄、性别、教育程度、居住楼层、睡眠时间、家庭成员
感染史。(2)临床表征表:① 患者的临床表征:胃痛、反酸、胃胀、嗳气、无食欲/早饱、口气口臭、口苦、恶心呕吐、肠鸣音、饥饿感。② 慢性及基础疾病:高血压、糖尿病、冠心病、骨科关节炎、痛风高尿酸、精神类及抑郁疾病、咽炎、消化溃疡、胃炎伴消化不良、贫血、肾科疾病、肛肠科疾病、皮肤科疾病、甲状腺疾病、口腔疾病、耳鼻疾病、男科或妇科疾病。(3)生活和饮食习惯表:家里是否使用桶装水、净水机;宵夜和食零食习惯;早餐、午餐、晚餐的就餐方式(打包、堂食、家庭煮)。饮食和行为喜好:食辣、食火锅、食鱼生河鲜、喝茶或咖啡奶茶、购买或点外卖(冷热)饮品、喝酒、吸烟、公共泳池游泳的喜爱或频率程度、使用公筷情况、是否有使用公筷习惯、是否与感染
同居家人生活。
训练组和验证组
曲线下
分别为0
7334(95
:0
709~0
784)、0
7153(95
:0.6729~0.7577)。当截断值为0.52时,约登指数最大为0.389,灵敏度为73.8%,特异度为64.8%。Hosmer-Lemeshow拟合优度检验为14.45(
=0.071)。经分析,该模型预测处于良好水平(见图4)。
将临床表征表、生活和饮食习惯表的变量使用单因素卡方及二阶聚类进行降维(见表2、图1),将各自有统计学意义的变量放入二元Logistic回归,选择
曲线下
最大的作为最终降维方法(见图2)。以单因素卡方变量回归后
曲线下
为0
735(95
:0
6952~0
7714),二阶聚类的变量回归后
曲线下
为0
6343(95
:0.5984~0.6688),最终以单因素卡方方式降维。
纤维素是自然界中丰富的可再生有机资源之一,是由D-葡萄糖基以β- 1,4苷键连接起来的链状高分子化合物。目前,已有多种文献报道了纤维素通过一定的转化途径生成5-HMF[7- 10]。首先,纤维素在酸性催化剂的作用下水解为葡萄糖,葡萄糖通过异构作用转化成果糖,最后果糖在催化剂的作用下生成特定的中间体,中间体通过脱去3个水分子生成 5-HMF。反应过程如图2所示[5,11]。
2 结果
正所谓机遇越多,挑战越大,周桥肩上的担子更重了,经常忙到深夜才回家。几乎每天晚上都能吃掉一大碗的夜宵。
对上述显著风险因素采用向前逐步回归法似然比检验作为自变量筛选和引入回归方程的方法,确定
感染和暴露因素。根据
值统计赋值(见表3、图3),构建预警模型。二元Logistic回归方式为:ln(y/1-y)=0.685+0.646×胃胀+0.941×口气口臭-0.529×午餐(在家煮)-0.957×在家无,外出有使用公筷+0.678×一直都不习惯使用公筷+0.785×同居家人有
感染-0.586×居住4~10层。
工作队在入户走访时发现,一些落后的风俗习惯是曼来村部分佤族村民致贫的重要原因。例如,一些佤族村民下田干活,上山砍柴,出门打工都要“算日子”(即通过占卜选时间),但往往“日子对了,机会也没了”,既没有庄稼收成,也错过打工的机会。有的村民生病不看医生,而是按旧俗“杀鸡驱鬼”,杀一只鸡病不好就杀两只,还是不好就杀猪,往往病没好,好不容易养大的家禽家畜却都杀光了。
截至2022年4月,共收集到1 425份电子问卷,排除回答矛盾后共计962份,其中完全填报无缺失值的有938份。
大陆歌手的个人演唱会数量逐年递增,前往台北举办个人演唱会的大陆歌手数量也越来越多。1980年至2008年,仅有一名大陆歌手在台北举办过一场演唱会,即腾格尔于1992年在台北举办的演唱会,这也是大陆歌手在台湾举办的首场个人演唱会。[1]402,[2]60此后的15年间,再无一位大陆歌手在台北举办个人演唱会。(表5)自2008年起,大陆歌手又开始去台北举办个人演唱会。虽然大陆歌手在台北举行个人演唱会的数量不多,但仍显现了大陆流行音乐突飞猛进的趋势,优秀歌手不断涌现,竞争力增强,个人演唱会市场不断扩大。随着大陆流行音乐在华语流行乐坛的影响力不断扩大,大陆已逐渐成为华语流行音乐的中心之一。
未感染组与
感染组比较,居住楼层相比,差异有统计学意义(
<0.05),性别、年龄、教育程度、晚上睡觉时间差异均无统计学意义(
>0.05)(见表1)。
最终从收集的案例中,按7.5∶2.5随机抽取为训练组和验证组,构建二元Logistic回归模型,对前述显著风险因素采用向前逐步回归法似然比检验作为自变量筛选和引入回归方程的方法,确定感染和暴露因素。根据
值统计赋值,构建预警模型;同时根据训练样本确定最优的风险划分概率值。剩余案例用作对构建的模型进行验证。灵敏性和特异性用以评估风险预警模型的预测效果,
曲线下的面积和Hosmer-Lemeshow检验来描述模型确定
感染风险的预测准确性。
经多因素Logistic回归分析,发现胃胀、口气口臭、午餐在家煮、居家及外出使用公筷情况、使用公筷习惯、同居家人感染
、居住的楼层是感染
的影响因素,差异有统计学意义(见表3、图3)。
3 讨论
通过构建多因素Logistic回归分析发现,有胃胀、口气口臭是感染
后的主要特征,有胃胀、口气口臭的人群与无胃胀和口气口臭的人群相比,分别有1.908倍和2.563倍的概率感染
,差异有统计学意义(
=1
908,95
:1
297~2
805,
=0
001;
=2
563,95
:1
711~3
840,
=0.000)。午餐在家煮者与午餐不在家煮者相比,感染
概率会降低0.589倍,差异有统计意义(
=0
589,95
:0
416~0
835,
<0.05)。同居家人感染
的人群与不知道同居家人是否感染
的人群相比,有2.192倍的概率感染
,差异有统计学意义(
=2
192,95
:1
366~3
517,
<0.05)。家庭居住4~10层者相比家庭居住1~3层者,感染
的概率会降低0.557倍,差异有统计学意义(
=0.557,95%
:0
376~0
824,
<0.05)。外出使用公筷者相比外出未使用公筷者,能降低1/3感染
的概率,差异有统计学意义(
=0
384,95
:0
223~0
66,
<0.05)。一直都不习惯使用公筷与一直有使用公筷习惯相比,会使感染
的概率提升1.97倍,差异有统计学意义(
=1
97,95
:1
239~3
132,
<0.05)。
我又回到码头,前前后后仔细搜寻,逢人就问,见冇见过一个四岁的男伢儿,左边耳朵缺了半边儿的?见冇见过两个风水先生,背个黄牛皮箱子的?上下码头的过客匆匆忙忙,影子似的从我的眼前飘过。我感到我的狼剩儿正离我越来越远,我可能再也见不到你了!那两个看风水的究竟把你带到了哪方天啊?你这会儿也是在路上奔波吗?你还那么小,受得了那个苦吗?泪水又夺眶涌出,不断线地往下掉。我爬上江堤,望着茫茫大江,放声呼号,我的狼剩儿啊——你在哪方天啊——你回啊——狼剩儿——
感染均以人口传播为主,感染初期无特别症状,潜伏期长,对地区的饮食生活习惯有关,本试验以中山市2021年7月至2022年4月体检的人群为研究对象,本研究以人口感染传播途径设计,通过单因素和多因素回归分析,探索感染
的特征和高危日常行为。在单因素与多因素Logistic回归分析中发现,中午在家煮食的就餐方式可以降低
感染率,推测可能在外堂食或打包的食物源或共餐人员有关,当今办公生活模型,中午就餐时间相对短、与同事或朋友就餐机会提高,如果当中有感染
的人或污染食材,可能会间接通过进食感染。首次将检测者居住楼层也作为研究变量,发现居住低楼层是高风险暴露因素,可能与镇区自建房屋和小区低楼层非二次供水问题有关。胃胀与口气口臭为主要特征可以作为一定特征因素。研究发现,贫血与
有一定相关性,也符合医学逻辑和证据,在相关文献有记录,联合叶酸、B12治疗胃溃疡和慢性萎缩胃炎会提升治疗效果,提示
感染与胃炎、溃疡和贫血的关联性
。使用公筷习惯在预防
有统计学意义,表明这样可以降低
感染传播风险,进一步推测
传播通过进食传播。由于新冠疫情爆发增强了人们使用公筷的意识,而
有一定潜伏期,本研究增设了以疫情前后的时间戳,作为模型的研究变量,提高模型准确性。
作为高度致癌因素,不仅危害人类健康,巨大的感染基数增加复发和耐药情况,增加根除卫生保健负担,因此,根除
以及减少相关疾病的发生已是守护大众健康的重要任务
。由于
有家庭链感染风险,这与中国式饮食有关,我们提出“社区-家庭-护理”多学科督导模式,家庭成员利用
感染预测模型构建防治策略,检测者可以居家检测,当模型计算的值>0.5则判定为存在感染风险,再到医院进行吹气或内镜检查。社区护士负责登记区内的家庭感染群组情况,应鼓励公众提高对疾病筛查的认识,实现对人群的高低风险分类管理,家庭组护士及医师负责监督家庭感染者的预防、用药及预后指导,逐渐实现家庭到社区感染率下降。
治疗药品使用有严格服用要求,治疗药品使用四联治疗方法:一种质子泵抑制剂、两种抗生素、一种铋制剂,一旦服药不规律,出现耐药,同类抗生素则不能使用。当今社会生活节奏快,医护人员可以与药学部门联动,利用互联网技术跟进感染和接受治疗人群用药情况,利用二维码让治疗者登记打卡用药情况,短信提醒用药规范,质子泵抑制剂和铋制剂在饭前使用,抗生素药品在饭后使用,监督提醒患者用药时间。护理人员可以通过媒体手段传播忧患意识和健康科普,提高公众预防胃癌的知晓度,充分了解
感染的危害,有助于我国
感染控制和胃癌的防治
。
综上所述,本研究分析了
的感染特征及危险行为因素,为探索
感染途径提供方向,依据构建的模型制定预治策略,把科学的治疗手段、科普教育的预防、感染的因果关系,组合成一个科、教、研的防治策略。从上至下开展筛查,实现区内到全国
感染率逐步下降。
[1] 盛建民, 孟晓红, 刘雅琦, 等. 幽门螺旋杆菌感染治疗的研究进展[J]. 德州学院学报, 2021, 37(6): 58-59, 65. DOI: 10.3969/j.issn.1004-9444.2021.06.013.
[2] 祝春梅, 孙萌潞, 徐锦江, 等. 健康体检人群幽门螺旋杆菌检出结果分析[J]. 锦州医科大学学报, 2020, 41(1): 39-40, 46.
Zhu CM, Sun ML, Xu JJ, et al. Analysis on the detection results of Helicobacter pylori in healthy people [J]. J Jinzhou Medical University, 2020, 41(1): 39-40, 46.
[3] McColl KEL. Clinical practice. Helicobacter pylori infection [J]. N Engl J Med, 2010, 362(17): 1597-1604. DOI: 10.1056/NEJMcp1001110.
[4] 邱先桃, 任建萍, 任理仙, 等. 杭州地区健康体检人群Hp感染现状分析[J]. 现代医药卫生, 2022, 38(4): 638-641. DOI: 10.3969/j.issn.1009-5519.2022.04.023.
[5] 凌霞, 钱进, 田尧. 南通地区人群幽门螺旋杆菌感染状况及相关因素分析[J]. 公共卫生与预防医学, 2021, 32(5): 141-144. DOI: 10.3969/j.issn.1006-2483.2021.05.033.
Ling X, Qian J, Tian Y. Status and related factors of helicobacter pylori infection in Nantong Area [J]. Pub Health Prev Med, 2021, 32(5): 141-144. DOI: 10.3969/j.issn.1006-2483.2021.05.033.
[6] 叶剑虹, 索南巴吉, 蒋映雪, 等. 高原地区成人幽门螺旋杆菌感染现状及其相关因素[J]. 岭南急诊医学杂志, 2021, 26(5): 484-486. DOI: 10.3969/j.issn.1671-301X.2021.05.014.
Ye JH, Suonanbaji, Jiang YX, et al. The status and relative factors of Helicobacter pylori infection among health adult examination population in the plateau region of China [J]. Lingnan Journal of Emergency, 2021, 26(5): 484-486. DOI: 10.3969/j.issn.1671-301X.2021.05.014.
[7] 李炜. 机器学习概述[J]. 科技视界, 2017, (12): 149. DOI: 10.3969/j.issn.2095-2457.2017.12.110.
[8] 郝欣, 王海涛. 承德地区常见消化系统疾病与幽门螺旋杆菌感染的关系[J]. 承德医学院学报, 2017, 34(6): 471-473.
Hao X, Wang HT. Relationship between common digestive system diseases and Helicobacter pylori infection in Chengde area [J]. Journal of Chengde Medical College, 2017, 34(6): 471-473.
[9] 崔俊芳, 张亚婷, 刘倩楠, 等. 健康体检人群中幽门螺旋杆菌感染现状的调查及分析[J]. 东南国防医药, 2016, 18(5): 496-497, 510. DOI: 10.3969/j.issn.1672-271X.2016.05.014.
Cui JF, Zhang YT, Liu QN, et al. Investigation on the Helicobacter pylori infection in population received health examination [J]. Military Medical Journal of Southeast China, 2016, 18(5): 496-497, 510. DOI: 10.3969/j.issn.1672-271X.2016.05.014.
[10] 雷蓉, 杨丹, 袁芳桃, 等. 10661例体检者幽门螺杆菌感染情况及其相关危险因素分析[J]. 基础医学与临床, 2022, 42(1): 126-130. DOI: 10.3969/j.issn.1001-6325.2022.01.021.
Lei R, Yang D, Yuan FT, et al. An investigation of Helicobacter pylori infection and potential risk factors of colonization found in 10661 cases from routine physical examination [J]. Basic & Clinical Medicine, 2022, 42(1): 126-130. DOI: 10.3969/j.issn.1001-6325.2022.01.021.
[11] 石娜. 胃溃疡患者与健康体检人群幽门螺旋杆菌检测结果的比较分析[J]. 中国医药指南, 2019, 17(24): 52-53.
[12] 张竞超, 郭绍举, 龙莎, 等. 叶酸联合四联疗法在Hp阳性慢性萎缩性胃炎患者中的应用意义[J]. 中外医学研究, 2021, 19(10): 4-6. DOI: 10.14033/j.cnki.cfmr.2021.10.002.
Zhang JC, Guo SJ, Long S, et al. The significance of folic acid combined with quadruple therapy in patients with Hp positive chronic atrophic gastritis [J]. Chinese and Foreign Medical Research, 2021, 19(10): 4-6. DOI: 10.14033/j.cnki.cfmr.2021.10.002.
[13] 程霞, 牛民强, 王宁, 等. 雷贝拉唑四联疗法联合维生素B12叶酸治疗幽门螺杆菌相关慢性萎缩性胃炎对照观察[J]. 临床心身疾病杂志, 2022, 28(2): 121-123. DOI: 10.3969/j.issn.1672-187X.2022.02.028.
Cheng X, Niu MQ, Wang N, et al. A retrospective study of rabeprazole quadruple therapy and vitamin B12, folic acid tablets in the treatment of patients with helicobacter pylori-related chronic atrophic gastritis [J]. J Clin Psychosom Dis, 2022, 28(2): 121-123. DOI: 10.3969/j.issn.1672-187X.2022.02.028.
[14] 国家消化系统疾病临床医学研究中心(上海), 国家消化道早癌防治中心联盟, 中华医学会消化病学分会幽门螺杆菌学组. 中国幽门螺杆菌根除与胃癌防控的专家共识意见(2019年,上海)[J]. 中华健康管理学杂志, 2019, 13(4): 285-291. DOI: 10.3760/cma.j.issn.1674-0815.2019.04.004.
[15] 胡奕, 吕农华. 我国幽门螺杆菌感染防治中面临的问题与对策[J]. 现代消化及介入诊疗, 2019, 24(3): 219-221. DOI: 10.3969/j.issn.1672-2159.2019.03.001.
[16] 以家庭为单位“组团”防控幽门螺旋杆菌感染[N]. 医师报, 2021-06-10(B04). DOI: 10.44211/n.cnki.nysbz.2021.000513.
Family-based ″groups″ to prevent and control Helicobacter pylori infection [N]. Physician, 2021-06-10(B04). DOI: 10.44211/n.cnki.nysbz.2021.000513.