基于统计分析及关联规则的住院老龄患者共病规律的研究
2023-05-30汪涛朋汤义卢思阳
汪涛 朋汤义 卢思阳
关键词:共病;共病特点;频繁项集;数据挖掘
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2023)03-0066-03
共病(multimorbidity) 是指患者在同一时间同时或相继患有2 种或2 种以上疾病,即一个患者符合一种以上综合征的诊断标准而有多个诊断,这些诊断涉及患者的全部症状、体征和病程[1]。共病已成为的公共卫生问题,未来几十年医疗行业将要面临的最大挑战。共病之间既可以相互关联,相互伴随,也可以是不相关的平行关系[2],随着人均预期寿命的持续延长,如何正确地认识和控制共病是目前健康管理的关键问题。通过对共病规律探究,可以全面了解患者的共病特点,有利于制定合理的临床诊疗方案,同时可以为此类人群疾病管理提供参考。
1 资料与方法
1.1 资料来源
选取2020年1月1日-2020年12月31日在某院住院病案首页疾病诊断数>1且年龄≥60的病例为研究对象,收集病案首页主要诊断、主要诊断编码、其他诊断、其他诊断编码、年龄、性别等数据。其余予以剔除,共18811 例。其中共病患者人数为17528,占比93.18%。
1.2 研究方法
诊断编码按照国际疾病分类法第10版( ICD-10)标化;年龄按照组距10进行分组,增加“共病数量”字段。运用SPSS的频数分析、列联表卡方检验分析共病病种的分布及不同特征的差异性,运用SPSS Mod?erler软件关联规则中Apriori算法,计算规则的支持度、置信度,从频繁项集中发现疾病共存、伴随的特点。
1.3 关联规则算法中的数据准备
规则需要达到一定支持度,根据病案首页的诊断ICD10 的编码依从属性关系,细目都归类亚目,如S82.01(开发性髌骨骨折)取编码为S82.0(髌骨骨折); 导出的病案首页诊断的二维表经过数据转换为事务性表格,同一个病人为一个事务ID,所患疾病为属性字段,符合关联规则数据挖掘的数据要求。
2 结果
2.1 一般情况
2020年龄大于等于60,住院患者共18811例,共病患者数量为17528例,院患者的93.18%,整体年龄中位数年龄71 岁,平均值为72.35,标准差8.31;60岁~69 岁占比43.77%,数量为7672,70~79 岁占比35.67%,数量为6253,80~89 岁占比17.10% 数量2998,90岁以上占比3.45%数量605,呈现偏态分布。性别上,男性占比52.00%,数量9115,女性占比48.00% 数量8413。共病个数情况,2 至4 占比39.05%,5至7占比35.48%,8及以上占比25.47% 。
根據共病患者出院诊断,构建共病前10病种的频率分布表,顺位最高的出院诊断包含2型糖尿病,频数为3291个,频率为16.31%,前十位频率分布表。
2.2 不同特征人群共病差异分析
从男女作为分组条件,共病发生率别为92.78% 和93.61%,通过列联表卡方检验,卡方值为5.088,P>0.01,检验水准为0.01,两样本差异无统计学意义,即认为住院患者共病率在性别上无差异。
从年龄段作为分组条件,共计分成四段,发生率见下表,形成了多独立的样本R*C列联表资料,通过多列联表的卡方检验,卡方值为148.464,P<0.01,检验水准为0.01,两样本差异有统计学意义,即认为住院患者共病率在年龄分组上有显著差异,可以看出随着年龄增加共病发生率增加。
2.3 共病患者疾病组合关联规则分析
每个病人为一个事务或项集,同一病人一种患病为此事务的一个项,T是一个项集也是一个事务,不同的事务一起组成了事务集D,它构成了关联规则发现的事务数据库。A、B均为项集的子集且均不为空集,且A交B为空,支持度(support)为:
支持度是指项集出现的次数在集合总数中出现的概率,数值越大,该疾病组合出现的频率越高;置信度是指后项出现的次数在包含前项的集合中的占比,数值越大,在前项所代表疾病出现的情况下后项所代表的疾病出现的概率更高,B伴随A发生的情况频率大。
采用SPSS MODEL 14.1中Apriori节点模型,对病案首页疾病诊断事务型数据库,进行关联规则数据挖掘,各频繁项集结果如下:
患病2种及以上的,按照支持度排序为:
患病2种及以上的,按照置信度排序为:
3 讨论
3.1 共病患者疾病发生的特点
老龄患者共病现象普遍存在,研究结果显示共病患者占同期住院患者的93.18%,共病数量的描述统计平均值为5.34,标准差为2.10,大部分患者集中在5个左右,可见患者共病数量比较高。
在年龄方面,年龄与共病发生率有密切相关性,不同年龄段之间的差异有统计学意义,随着患者的年龄增加,患者的共病发生率逐渐增大;同时不同性别共病住院患者的发生率并无显著差异。
从共病患者病种的频率分布进行分析,发现前十位的从多到少依次为2型糖尿病、高血压病3级(极高危)、腔隙性脑梗死、冠状动脉粥样硬化性心脏病、脑梗死、前列腺增生、腰椎间盘突出、甲状腺结节、肝囊肿、脂肪肝。可见心血管循环系统疾病、脑病都是排序靠前的。同时腰椎间盘突出也排名靠前,这与数据来源于中医院有关,此病是中医治疗的特色病种;甲状腺结节出现在顺位第8,此病是医院的特色病种,该院超声引导下甲状腺结节的手术也全身处于领先位置。
3.2 共病患者的疾病共存、伴随特点
由于频繁项目集中包含的项目同时发生的可能性很高,因此可以从频繁项目集中了解项目之间的关系[3],依据一定的支持度与置信度,可以计算出疾病ICD10的频繁项集;从上述关联规则支持度结果看,高血压、糖尿病、脑梗死三类疾病同时发生的比率最高,其次是高血压、糖尿病、冠心病,顺位第三、四组合的是高血压、脑梗死、冠心病。都是相关性较高心脑血管疾病,与相关研究中慢性非传染性疾病是人健康的最大威胁,主要包括脑梗死、慢性缺血性心脏病、原发性高血压[4]。
从置信度来看,具体的疾病集合置信度都较高的有(前项:冠心病;后项:心绞痛,其他类型)、(前项:冠心病;后项:心绞痛,其他类型、高血压)、(前项:高血压;后项:肾终末期疾病、糖尿病)、(前项:高血压;后项:脑梗死、冠心病、糖尿病)、(前项:高血压;后项:肾终末期疾病、贫血)。老年冠心病患者一般都有心绞痛的发生;高血压是冠心病发生、发展的独立危险因素,有70%冠心病患者合并高血压。高血压会促使动脉硬化恶化,增加心血管事件发生风险;而冠心病又会加重高血压病情,两种疾病相互促进,形成恶性循环[5-7]。有文献报道高血压患者血压升高加速了动脉粥样硬化的发展,从而使急性脑梗死的发生率明显增加[8],目前公认的急性脑梗死危险因素有年龄、吸烟、高血压、糖尿病等。
通过共病特点分析,可以临床医师诊断与治疗提供参考,同时为社会疾病预防提供指导。本研究也存在一定的局限性,标本量主要来自某一医院,尚未覆盖一定的地域,待进一步验证。