APP下载

机器学习及其算法在社区老年2型糖尿病血糖控制影响因素评估中的应用价值

2024-05-23刘美宏董利平

河北医药 2024年9期
关键词:基线关联规则

刘美宏 董利平

2型糖尿病(type 2 diabetes mellitus,T2DM)患者数量占全部糖尿病总数比例达95%[1-3]。有研究表明,提高和加强T2DM患者的临床和护理管理水平能够有效避免其病情发展[4-6]。目前,国内针对T2DM患者的临床和护理管理重点主要在健康饮食、合理运动和药物使用[7-9]。通过上述手段,T2DM患者的血糖水平得到了一定的控制。然而,T2DM患者中老年群体的临床和护理管理存在一定难度[10]。老年T2DM群体通常病情更为复杂,护理依从性更差,管理难度更大。因此,在老年T2DM患者临床和护理管理中,血糖控制影响因素的研究较为重要。通过探究老年T2DM患者血糖控制影响因素,医疗单位可提前采取更具针对性的处置措施,从而改善预后。目前,国内主要通过logistic回归分析预测老年T2DM患者的血糖控制影响因素[11-13],该方法结果存在一定的单一性。作为一种新型数据挖掘技术,基于卷积神经网络的机器学习及其算法近年来逐步应用于医疗领域并在医学统计、分析和预测中发挥了重大作用[14-15]。该方法或许可用于老年T2DM患者相关研究,并弥补logistic回归分析法的单一性。因此,本研究开展了基于机器学习及其算法的社区老年T2DM患者血糖控制影响因素研究,报道如下。

1 资料与方法

1.1 一般资料 收集2021年6月至2022年7月河北省张家口地区4个社区老年2型糖尿病患者124例。经筛选后获得符合纳入标准者94例,收集其各项资料用于前瞻性研究。本研究获得医院医学伦理委员会的批准,患者或家属签署了知情同意书。

1.2 纳入与排除标准

1.2.1 纳入标准:①年龄≥60老年人;②查尔森合并症指数(CCI)≤ 4;③卡氏评分(KPS)≥60;④研究涉及的基线资料完整;⑤思维和情绪正常,能够配合完成调研。

1.2.2 排除标准:①除T2DM外的其他严重慢性疾病;②T2DM并发症;③患有影响血糖控制的其他疾病。

1.3 方法 本研究分为4个层次:空腹血糖水平统计、调研、空腹血糖水平分类和关联规则分析。(1)统计患者空腹血糖水平。(2)通过调研获取患者基线资料。(3)通过基于K-means算法的自动分箱分析和基于Apriori算法的关联规则分析分别对患者空腹血糖水平进行分类和计算兴趣类空腹血糖水平患者的基线资料间有效强关联规则。

1.3.1 调研:调研内容分为三类,由临床和护理人员根据患者情况进行勾选。见表1。

表1 基线调研集合

1.3.2 血糖水平分类:采用基于K-means算法的自动分箱分析对患者血糖水平分类。①随机从血糖水平集合中抽取若干数据,将其设置为K并作为初始分箱中心。②以初始分箱中心为参考,计算集合中全部血糖水平数据相对其最小欧式距离方差。③仍以不同初始分箱中心为参考,将集合中全部血糖水平归入“簇”中。④以“簇”内血糖水平均值为参考,重新计算分箱中心。⑤重复①~④,通过“肘部图”计算最佳分类“簇”,即K值[14-15]。

1.3.3 有效强关联规则分析:将兴趣类血糖水平患者的基线资料导入Python语言,采用Apriori算法计算有效强关联规则[16-17]。分别设置关联规则分析的支持度(S)阈值为0.70,置信度(C)阈值为0.90,提升度(L)阈值为3.00,标准化卡方检验阈值为0.800。通过S筛选包含相应血糖水平项的频繁项集,通过C筛选强关联规则,通过L筛选有效强关联规则,通过标准化卡方检验有效强关联规则的独立性。

2 结果

2.1 血糖水平分类和关联规则分析 患者空腹血糖水平为(11.04±1.28) mmol/L。类别分析肘部图:横坐标第1个点至第3个点间簇内欧式距离平方和下降快,第3个点以后下降慢。因此,最优分类簇值K=3,即患者血糖水平分为3类。三类血糖水平差异有统计学意义,分类效果明显(F>2,P<0.05)。以最低类血糖水平为研究对象,即兴趣类,纳入患者40例,基线资料640条,计算获得有效强关联规则5条。有效强关联规则前项包括“合理血糖控制药物配伍:是”、“动态血糖监测系统:应用”、 “合理饮食配伍:是”、 “及时发现、报告和处置不良事件:是”。见图1,表2、3。

图1 最佳分类"簇"(K值)示意图

表2 血糖水平分类情况

2.2 影响因素分析 “动态血糖监测:应用”出现了4次;“合理血糖控制药物配伍:是”和“及时发现、报告和处置不良事件:是”均出现了3次;“合理饮食配伍:是”出现了2次。由此可见,“动态血糖监测:应用”在最低类血糖水平患者群体基线资料中占比最高,通过该项建立起的有效强关联规则最多,关联性最强。该项基线资料是导致最低类血糖水平的主要原因,对于血糖的控制最为重要。“合理血糖控制药物配伍:是”和“及时发现、报告和处置不良事件:是”在最低类血糖水平患者群体基线资料中占有一定的比例,通过这两项建立起来的有效强关联规则比较多,关联性较强。这两项基线资料是导致最低类血糖水平的次要原因,对于血糖的控制较为重要。“合理饮食配伍:是”在最低类血糖水平患者群体基线资料中占比最少,通过这两项建立起来的有效强关联规则最少,关联性比较弱。该项基线资料对于血糖的控制影响相对来说比较小。见表3。

表3 包含最低类血糖水平的有效强关联规则

3 讨论

目前,中国T2DM发病率持续上升,其中成人发病率已达13%[3]。中国成人T2DM人数约为1.41亿,约占世界总患者数量的25%[4]。有研究表明,年龄是导致T2DM发生的主要因素,T2DM发生率随着年龄的升高而显著升高[10],老年T2DM患者已成为相关研究的重点。然而,老年T2DM患者存在诸多管理困难,例如临床配合度低和护理依从性差等。因此,对于老年T2DM患者血糖控制影响因素研究非常重要。医疗卫生单位可参考老年T2DM患者血糖控制影响因素提前采取针对性措施,从而获得最佳血糖水平。本研究通过不同于以往Logistic回归分析的机器学习及其算法,挖掘到影响老年T2DM血糖控制影响因素,取得较为理想的结果。

机器学习及其算法已广泛应用于医疗各领域,本研究同既往基于相同算法的研究比较具有显著优势。既往研究中,机器学习算法的应用较为单一,往往仅应用了K-means算法或Apriori算法中的一种[14-17]。相比既往研究,本研究联合应用了两种算法于研究中,两种算法分别解决了研究中的重要问题。本研究中自动分箱算法将患者血糖水平进行了科学的区分。通过K-means算法从全体患者血糖水平中挖掘到了最低类血糖水平群体,即兴趣类群体;通过Apriori算法挖掘到了最低类血糖水平群体基线资料间有效强关联规则,进一步明确了最低类血糖水平,即血糖控制的影响因素。机器学习的两种算法联合应用是既往研究所欠缺的,解决了既往研究中方法的单一性和承接性问题,获得了更科学和丰富的结果。

另外,本研究还将机器学习及其算法同Logistic回归分析进行了比较。机器学习及其算法不仅得出了类似logistic回归分析中独立风险因素的前项集合,还得出了每个前项的多种组合形式。logistic回归分析仅能够给出各个独立风险因素的OR,但其组合形式无从得知。本研究有效强关联规则结果第5条不仅得出了类似logistic回归分析中独立风险因素的3个前项:“合理血糖控制药物配伍:是”、“动态血糖监测系统:应用”、“及时发现、报告和处置不良事件:是”,还可得出其共同出现的概率为96%(置信度)的结果。对于同时存在上述三个前项的患者需要特别加以注意,防止其基线资料影响血糖控制。因此,相比logistic回归分析,机器学习及其算法更具逻辑性和应用价值。

本研究发现,动态血糖监测系统的应用是老年T2DM患者血糖控制的最主要影响因素。动态血糖监测系统通过连续、科学的结果为合理用药、合理饮食配伍和运动安排提供了有价值的参考。医疗卫生单位可通过上述参考,提前采取有针对性措施有效控制老年T2DM患者血糖和避免相关并发症的发生。通过机器学习及其算法挖掘患者血糖控制影响因素并应用了动态血糖监测系统后。根据动态血糖监测系统的反馈,进一步合理配置了T2DM相关药品,提高了膳食搭配科学性,最后建立了更加完善的不良事件处理机制。

综上所述,基于机器学习及其算法的数据挖掘技术能够探寻到影响老年T2DM患者血糖控制的因素。本研究方法和结果对社区老年T2DM的防治具有一定指导意义,其中动态血糖监测系统的应用值得推广和普及。

猜你喜欢

基线关联规则
撑竿跳规则的制定
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
适用于MAUV的变基线定位系统
数独的规则和演变
航天技术与甚长基线阵的结合探索
“一带一路”递进,关联民生更紧
奇趣搭配
让规则不规则
智趣
TPP反腐败规则对我国的启示