基于医疗大数据的老年骨质疏松性骨折院前急救分类优化研究
2023-09-21浦同青周志聪陆春梅邓学林陈朝明
沈 蓝, 浦同青, 周志聪, 陆春梅, 邓学林, 谢 好, 陈朝明
(云南省滇南中心医院/红河州第一人民医院, 1. 急诊医学部, 2. 重症医学科, 云南 蒙自, 661199)
据统计,全球范围内中老年人群骨质疏松性骨折具有4个特征,即高发病率、高致残率、高致死率、高医疗费。但国内流行病学研究[1]发现,包括老年骨质疏松性骨折在内的骨骼疾病诊疗依旧处于低诊断率、低治疗率、低治疗依从性和低规范性的状态。而随着医疗大数据技术概念的提出与实践,越来越多的研究[2-3]证实,由于老年骨质疏松性骨折有其自身特殊性,以科学、合理的方式对老年骨质疏松性骨折的院前急救的结构、过程及结果的相关指标进行针对性分类研究已迫在眉睫,有其现实意义与价值。但需注意的是,运用现代数理模型对医疗大数据下的老年骨质疏松性骨折院前急救的结构、过程、结果指标分类的多学科交叉研究却鲜有涉猎,本文以医疗大数据为背景,构建该病院前急救分类模型并验证,现报告如下。
1 老年骨质疏松性骨折院前急救分类算法与统计学方法
1.1 院前急救的K-means算法建模
K-means算法判定包括3项,一是目标函数,二是欧几里得距离,三是误差的平方和(SSR)。基本步骤包括:首先随机选取K个对象,将每个对象视作一个聚类质心,按就近原则将对象与各聚类质心之间的距离进行匹配并分配至相近聚类子集中;其次,对每个聚类中心的质心进行计算并命名为新质心[4];第3步为重复前2个操作流程,直至获取稳定,不再变化准则下的函数。故按本文研究目标设医疗大数据下的结构、过程、结果指标分类要素定义为一个含n个点的d维数据集,即D={χ1,χ2Λ,χn}, 聚类分析后所产生的类别集合C={C1,C2,C3, …,Cm}的一个数据集,故可将院前急救的K-means算法的目标函数SSE的公式表示如下:
(1)
(2)
该目标函数中,第j个簇类的中心点为cj=(cj1,cj2,cj3, …,cjd), 含有d个不同属性。在此可获3个定义函数:
(3)
(4)
(5)
(3)中的dis(χi,cj)表示χi和ci之间欧几里得距离; (4)中的cj表示同一簇类的中心点,同一簇类Øj中数据的个数为N(Øj)。
通常而言,K-means算法的最终目的主要是为了找到最小化的SSE聚类结果,最优解。但从最终结果来看,其操作更为简单易懂、操作方便,因此应用范围较为广泛。简而言之, K-means算法利用迭代方式对聚类结果进行更新的过程,其实就是将SSE最小化的过程。
但需注意的是,虽然K-means算法的可伸缩性很强,但若处理不当也会影响最终的聚类结果的准确性。故如表1所示,进行数据处理时必须严格按照其操作步骤推进。在此过程中,还需注意以下问题:一是评估各数据的分类属性,因为K-means算法对具有分类属性的数据无法处理; 二是K-means算法对初始中心点的选择极敏感,操作不当可能影响聚类结果; 三是K-means算法对噪声点和离群点同样敏感,故应减少上述潜在或已在干扰因素。
表1 K均值算法的操作步骤
1.2 院前急救的DeepFM预测模型构建
为建立一套科学、合理、系统且敏感基于医疗大数据的老年骨质疏松性骨折院前急救的中医证候要素分类评估质量指标,为老年骨质疏松性骨折的院前急救与临床治疗提供参考借鉴依据,还需在K-means算法的基础上按院前急救的结构-过程-结果理论构建DeepFM预测模型。DeepFM预测模型主要由深度神经网络(DNN)和因子分解机(FM)2个组件构成[5-6], 有极强的交互性,即将FM和深度学习整合在一个新的神经网络体系结构过程。见图1。
图1 DeepFM预测模型总体结构
院前急救作为院外对危重症老年骨质疏松性骨折患者进行急救的最有效的方法之一,其带有很强的随机性和流动性,因此对院前急救进行针对的分类处理极有必要。故本文将按Donabedian结构-过程-结果理论[7-8]将文中的院前急救情况分成结构指标、过程指标和结果指标,其中结构指标主要包括物质、人力资源和组织结构3类,过程指标是指医患、医护、护患之间相互作用的过程,结果指标则为经过院前急救服务后结果,含危重症老年骨质疏松性骨折患者满意度。接着构建DeepFM预测模型,如图1所示, DeepFM包括FM和DNN 2个部分,所以该模型的初始输入与最终输出也只可能由这2个部分构成。其中,该模型的一阶线性交互的特征构成情况主要集中在FM组件学习系统,且建模特征之间也存在二阶交互现象。与此同时, DNN对特征之间的交互作用主要表现为高阶性。故FM和DNN 2个组件的输出共同构成DeepFM预测模型。
(6)
即将FM的输出与DNN的输出结合起来,共同构成最终结果预测,故可得FM、DNN组件的数学公式:
(7)
公式(7)的一阶特征权重主要反映在加法单元中,二阶特征交互的影响主要反映在内积单元中。第1层的输出、权重及偏差分别由a(1)、W(1)和b(1)表示,而H表示隐藏层的数量。结合既往研究来看,由于Donabedian结构-过程-结果理论中的3个指标之间有显著的高阶交互性,便可根据上述公式绘制老年骨质疏松性骨折中医证候要素分类的训练权重过程图。
图2显示,在老年骨质疏松性骨折中医证候要素分类的DeepFM预测模型训练权重过程中,其特征主要表现为由输入特征向量向输出特征过度,通过计算实际输出与理想输出之间的差距不难发现,老年骨质疏松性骨折院前急救指标的最佳预测结果参数优化结果均在调整层与层之间的权值后方。
图2 老年骨质疏松性骨折院前急救分类预测模型训练权重过程
1.3 德尔菲专家函授小组
本研究的德尔菲专家函授小组成立原则均满足代表性、权威性。职称构成: 主任医师、护师各1名,副主任医师、护师各7名,主管护师9名,急诊科护士4名,其中三甲、三乙、二甲医院各21名(72.41%)、5名(17.24%)、3名(10.34%)。专家纳入标准: 根据院前急救的研究目的、对象及德菲尔法特点制订,包括医院级别、医院类型各为三甲、三乙、二甲医院,综合医院或专科医院,且具有主管护师、副主任医师、护师及以上职称,对研究有高度积极性和自愿参与函授,护士均满足5年以上的急诊护理工作要求。以专家权威程度[(判断依据+熟悉程度)/2]表示专家意见权威程度,决定因素由专家打分判断依据(Ca)和专家对评估内容熟悉程度(Cs)构成,影响程度包括大、中、小3个方面(判断依据与对专家判断的影响程度如表2所示),专家系数程度量化值(自评)分为很熟悉、熟悉、一般、不熟悉和很不熟悉5类,量化值分别为1.0、0.8、0.6、0.4、0.2。检验水准α=0.05。根据专家入选标准与德尔菲法的相关要求综合评估后证实,文中各指标条目重要性、数据收集可操作性、计算方法合理性均达标,保留项目的重要度评分均≥4分,且变异系数<0.3(≥0.3则删除或修改)。
表2 判断依据对专家判断的影响程度
1.4 统计学方法
建立Excel 2007数据库后,将所有老年骨质疏松性骨折的各项基线资料与研究数据纳入SPSS 21.0软件处理,专家基本信息采用频数、构成比等进行描述,指标赋值采用均数、标准差、变异函数等描述。专家提出的意见协调系数用W表示,W>0~<1,W越大,意见协调度越高,检验效果越好。
2 结 果
经第1轮函询筛选(24项,即B01~B24)及修改后最终获得符合院前急救分类项目(第2轮函询)21项(B01~B21)。老年骨质疏松性骨折院前急救分类项目的指标类型、权重、编号、指标名称及指标重要性、计算方法合理性、数据采集可操作性的变异系数(CV)、权重、组合权重、权重排序等见表3。
表3 第2轮函询及权重计算结果统计
结合表3和图3来看,将结构指标(B01、B02、B03、B04、B05)、过程指标(B06、B07、B08、B09、B10、B11、B12)和结果指标(B13、B14、B15、B16、B17、B18、B19、B20、B21)作为老年骨质疏松性骨折院前急救分类指标是可行的。其中各指标重要性的CV值在0.05~0.24, 计算方法合理性的CV值在0.07~0.25, 数据采集可操作性的CV值在0.06~0.25, CV值均<0.3。
接着按层次分析法的操作步骤与要求将老年骨质疏松性骨折院前急救分类指标中的结构指标、过程指标、结果指标进行权重矩阵构建。假设某一维度中任意2项指标赋值均数分别为Zij、Zik, 且Saaty标度=3、5、7、9时,依次满足Zij-Zik≥0.25~≤0.50,Zij-Zik≥0.75~≤1.00,Zij-Zik≥1.25~≤1.50和1.75 图4显示,经最后的矩阵分析发现,结构指标、过程指标、结果指标的一级指标中的各维度的权重分别为0.332 4、0.139 5、0.527 6, 各矩阵的一致性检验结果(CR)值均<0.1, 专家意见间的协调性好(CV和Kendall协调系数),其中结构、过程、结果指标各为0.034 5、0.039 4和0.039 5, 符合检验要求。 图4 结构、过程、结果指标的判断矩阵 医疗大数据所涉及的范围相对宽泛,如疾病患者基本信息、疾病主诉、检验数据、影像数据、诊断数据、治疗数据等[8]。但由于其尚属探索阶段,针对某种疾病的医疗大数据应用仍有诸多需要完善之处。因此应用现代数理模型提取基于医疗大数据下的老年骨质疏松性骨折院前急救的结构指标、过程指标、结果指标分类要素,并进行多学科交叉分类优化研究,分析其相关特征非常必要。 戴明环(PDCA)管理理论自引入临床医学以来,已被广泛地应用于医院质量管理的各个领域,但随着大数据技术的普及化,现代医院中的医务人员,尤其是医生与护士在做决策的过程中,越来越重视“数据”的价值,而数据的运用对避免主治医生、责任护士对疾病的主观臆断帮助极大[9]。因此,本研究在综合既往研究的基础上采用K-means算法、DeepFM预测理论与层次分析法,将老年骨质疏松性骨折院前急救过程中存在的结构、过程、结果指标进行了定性、定量处理并最终达到分类优化的目的。首先,结构指标主要包括物质、人力资源和组织结构3类,过程指标是指医患、医护、护患之间相互作用的过程,结果指标则为经过院前急救服务后结果,含危重症老年骨质疏松性骨折患者满意度;再次,构建DeepFM预测模型,发现老年骨质疏松性骨折院前急救指标的最佳预测结果参数优化结果均在调整层与层之间的权值后方。为进一步优化老年骨质疏松性骨折院前急救过程中各指标的权值大小,进一步采用德尔菲专家函授小组评估各指标条目重要性、数据收集可操作性、计算方法的合理性,并得到意见协调系数,进而得到老年骨质疏松性骨折院前急救分类项目的指标类型、权重、编号、指标名称及指标重要性、计算方法合理性、数据采集可操作性的变异系数、权重、组合权重、权重排序等,根据相关指标和相关权重系数最终达到分类优化的目的。 本研究最终构建了院前急救的结构-过程-结果3个层级(21项指标,即B01~B05、B06~B12、B13~B21)并对其进行了验证,其中B01、B02、B03、B04和B05等5项指标均较好地契合了Donabesian结构-过程-结果理论中的人力资源、物质资源和组织结构理论中的相关管理理念,其中B03、B04的组合权重分别为0.121 7、0.084 5, 权重排序分别位于结构指标的前2位,说明专家们认为在老年骨质疏松性骨折院前急救过程中急救仪器和急救药品的有效性对该病的抢救成功与否有极其重要的影响,能提高院前急救工作效率与抢救成功率,这与郭剑等[10]研究结果相近。而从文中整体结构来看,结构指标中的5个指标的整体权重排高于过程指标,低于结果指标而排在第2位。但考虑到目前中国现代临床医学正在向国际医学迈进并与之接轨的趋势,故虽然在老年骨质疏松性骨折院前急救全过程中依据强调和注重结果,但结构指标依旧不容忽视,因此需有效监测。同理,本研究中B06、B07、B08、B09、B10、B11、B12这7个过程指标整体的权重为0.139 5, 显著低于结构指标与结果指标。这种现象出现的根本原因与当前院前急救整体现状及自身特点密切相关[11-13], 包括老年骨质疏松性骨折在内的危重症疾病的院前急救全过程,均存在显著的急救现场情况不稳定、病因复杂、病种呈多样性及疾病发展速度快等特征,因此导致过程指标并不能实现对院前急救全过程、全方位的监测、检测覆盖[14-15]。针对此,本研究在进行过程指标选择方面,主要以质量控制为重点。而通过比较文中的结果指标来看, B13、B14、B15、B16、B17、B18、B19、B20、B21这9个指标中权重排名第1位的是老年骨质疏松性骨折患者满意度(B21), 即0.222 5, 矩阵分析中的权重为0.527 6, 显然这与当前大力推行的“以患者为中心”的院前急救及相关护理理念相吻合。为达到更科学、合理的评估效果,本研究还将患者家属的满意度调查也纳入其中,效果较好。在结果指标中权重排名第2位的是急救现场静脉通道建立成功率(B13), 即0.178 5。说明对于危重症老年骨质疏松性骨折患者而言,其院前急救的重要任务之一就是给患者建立急救现场静脉通道,最大限度争取抢救成功率。还需注意,结果指标中数量最多的为不良事件监测,对这些指标进行针对性监测,是制订和实施院内诊疗措施的关键环节之一,故应将其作为重点监测。另外,从文中模型实际应用来看,在近些年的各项研究中均有所涉及,如慢性心力衰竭临床护理路径构建[16]、医院临床路径药学评价体系构建[14]、肿瘤影像[17]、电子病历[18]等均证实K-means算法与层次分析法在临床医学应用中均有较高的可信度与可行性。同时,郑帅等[19]发现,与传统模糊K-means算法和基于减法聚类的FCM算法相比,基于均衡分配法的模糊K-means算法的迭代时间分别降低了26.0%和70.0%, 迭代次数各降33.0%和82.0%, 数据聚类效率与质量提高更明显。但将K-means算法、DeepFM预测理论与层次分析法应用于医疗大数据下的老年骨质疏松性骨折院前急救的结构、过程、结果指标分类要素的探究乃首次,能更准确地为不平衡数据中的簇类学习[20-22]提供更广阔的软子空间,帮助老年骨质疏松性骨折患者提供更好的围术期决策支持[23-25], 所达效果与预期吻合,有探索与应用价值。但其是否能真正在骨质疏松性骨折院前急救的实际过程中普及与推广,仍有待更多的研究数据与实践理论佐证。 综上所述,随着数据库技术和计算机通讯技术的良性发展,医疗大数据在危重症老年骨质疏松性骨折患者的院前急救过程中必然发挥更大的价值,而对院前急救的结构、过程、结果指标进行分类研究,对科学、合理地制订院内诊断计划、治疗方案均可提供更系统的大规模、高增速、多结构、高价值和真实准确的的诊疗数据集合。本研究证实,以医疗大数据为基础,采用K-means算法、DeepFM预测理论与层次分析法对老年骨质疏松性骨折患者的院前急救指标进行分类处理可行,可为该病后期诊疗提供理论依据,但将其标准化、格式化、统一性仍是未来研究的重点,是将其价值最大化的前提。3 讨 论