高血压患者合并重大慢性病关联规则分析*
2019-04-18朱碧云黄艳群乔伯文
朱碧云 王 妮 黄艳群 乔伯文 李 博 陈 卉
(首都医科大学附属北京地坛医院 北京 100015) (首都医科大学生物医学工程学院 北京 100069) (北京市石景山区卫生信息中心 北京 100043) (首都医科大学生物医学工程学院 北京 100069)
1 引言
高血压是临床中比较常见的一种心血管病症[1],其病程长且无法治愈,对人们的健康有着极大的影响。流行病学调查发现近些年来高血压发病率逐年上升[2],给患者及社会带来了巨大的经济负担。有研究表明一些慢性病常常相互伴随发生,如高血压、肥胖、糖尿病、血脂异常等[3-5],而且患者的性别、年龄、婚姻状况等人口学因素[6-7]以及吸烟、饮酒、锻炼、饮食等生活习惯[2,8]都对慢性病的发生有一定影响。因此对高血压患者的共患病现象和其他潜在关联因素进行分析将对高血压的预防和治疗有借鉴意义。
关联规则挖掘是一种数据挖掘技术[9],用于探索事物之间的关联性,目前已被用于中医中药、临床医学、流行病学等方面的研究,如发现脑卒中危险因素[10]、住院跌倒患者的防范[11]、患者就诊规律挖掘[12]、慢性阻塞性肺疾病的协同疾病[13]、儿童安全用药[14]、中医药处方配伍规律[15]等。本研究利用北京市石景山区社区公卫系统数据集,通过关联规则挖掘,探讨高血压与糖尿病、冠心病之间的关联性及关联强度,分析其他潜在关联因素,研究高血压患者的共患病现象,提供有效防治建议。
2 资料和方法
2.1 数据来源
为2018年北京市石景山区社区公卫系统数据集,其中包括人口学数据(性别、年龄、婚姻状况等)、生活习惯(锻炼、饮酒、吸烟、饮食等)、家族史、慢性病患病情况(糖尿病、冠心病、脑卒中)、生活条件(饮用水、燃料类型、厨房排风设施等)等106个指标。为了减化计算并尽可能挖掘出有效的关联规则,本研究从中提取性别、年龄(>60岁定义为老年人)、婚姻状况、身高、体重、是否患高血压、是否患糖尿病、是否患冠心病、是否患脑卒中、父亲有无高血压、母亲有无高血压、锻炼(经常锻炼、锻炼无规律、不锻炼)、饮酒(经常饮酒、饮酒无规律、不饮酒)、吸烟(经常吸烟、已戒烟、不吸烟)、睡眠(睡眠困难、入睡困难、早醒、梦游、嗜睡等)、饮食习惯(偏咸、偏甜、偏油、嗜热食、素食、辛辣等)共16个指标。此外根据身高和体重计算体重指数BMI,参考世界卫生组织的标准,将BMI>24 kg/m2定义为肥胖。
2.2 关联规则挖掘算法
2.3 分析方法
将原始数据导入Access软件,提取所有高血压患者的相应分析指标作为研究内容建立数据集并进行数据清理。采用Python(https://www.python. org/)数据挖掘软件进行Apriori算法分析,挖掘支持度>10%、置信度>5%的规则并定义提升度>1的规则为强关联规则。采用Gephi(https://gephi.org/)软件绘制关联规则的网状图,以节点表示特征,用节点间连线的粗细直观地展示特征间关联性的强弱。
3 结果
3.1 高血压患者合并慢病情况
从总数据集中共确定73 894名高血压患者,年龄为67.5±12.0岁。所有高血压患者中,55 649人(75.3%)至少合并冠心病或糖尿病之一。其中32 992人(44.6%)合并冠心病,28 427人(38.5%)合并糖尿病,16 185人(21.9%)则同时合并这两种慢病。男性高血压患者合并冠心病和糖尿病的发生率(42.7%和38.4%)高于女性(38.9%和35.8%,P值均<0.001),老年患者(49.8%和39.8%)高于非老年患者(38.0%和36.7%,P值均<0.001),见表1。
表1 高血压合并冠心病、糖尿病患者的性别、年龄分布(n[%])
3.2 高血压合并糖尿病关联规则
表2列出了有1个或两个条件(先导)的部分强关联规则(提升度分别>1和1.25)。从第1条规则可知高血压患者同时合并冠心病和糖尿病的概率是21.9%;在所有合并冠心病的患者中有将近一半(49.1%)的人还患有糖尿病;高血压患者合并冠心病使其合并糖尿病的风险增加30%。此外年龄、饮食习惯和锻炼情况都与糖尿病有关联性。
表2 高血压合并糖尿病的关联规则挖掘结果
3.3 高血压合并冠心病关联规则
表3列出了包含有1个或两个条件(先导)的部分强关联规则(提升度分别>1或1.25)。结果显示高血压合并糖尿病的患者其冠心病的发生率达56.9%,而合并糖尿病且有睡眠障碍使冠心病的发生风险提高到60.4%。此外年龄、家族史、饮食习惯和锻炼情况都与冠心病有关联性。表2和表3列出的强关联规则中所有单一先导规则的关联网络,见图1。可见高血压患者合并糖尿病与合并冠心病间有很强的关联性,饮食偏咸、锻炼不规律与两种慢病都有关联,老年高血压患者常常伴随发生糖尿病与冠心病。
表3 高血压合并冠心病的关联规则挖掘结果
图1 关联规则分析网络
注:图中线的粗细与规则提升度成比例
4 讨论
4.1 高血压患者合并糖尿病关联因素
4.2 高血压患者合并冠心病关联因素
冠心病是目前世界范围内最首要的疾病死亡原因[20]。高血压是冠心病发生的重要危险因素,控制高血压不仅是预防冠心病的关键,也是减轻心血管疾病所造成的沉重经济负担和保证患者生命及生活质量的关键[21]。临床和流行病研究显示中老年人高血压伴糖尿病与冠心病存在密切联系,冠心病的发生率显著提高[22-23]。本研究发现伴糖尿病使高血压患者合并冠心病的可能性增加12.3%,与其他研究结果一致。高血压合并糖尿病的患者冠状动脉病变程度更重,临床预后差[24],因此积极治疗高血压和糖尿病将有利于冠心病的防治。本研究人群中睡眠障碍导致高血压伴糖尿病患者发生冠心病的可能性增加3.5%。其他研究揭示睡眠与高血压、糖尿病和冠心病的发病都具有一定的关联性,睡眠时间过短或过度睡眠均会提升高血压、糖尿病和冠心病的发病率[25]。高盐饮食可进一步导致高血压合并糖尿病患者发生不良心血管事件[24],与本研究发现的饮食偏咸会导致高血压伴糖尿病患者发生冠心病的风险增加(从56.9%提高到58.6%)一致。此外年龄一直以来都是重大慢性疾病的危险因素,高血压伴冠心病的老年患者的糖尿病患病率提高了1.8%,高血压伴糖尿病老年患者的冠心病患病率提高了3.1%,社区高血压管理的重点仍将放在中老年人群上。
5 结语
本研究利用数据挖掘技术中的关联规则挖掘方法,基于社区居民健康档案数据,对近74 000名社区高血压患者合并慢病及其影响因素进行分析。研究结果提示社区慢病管理中应倡导健康生活方式(如高质量睡眠、适当锻炼、低盐饮食、控制体重),定期监测高血压、糖尿病、冠心病的发生和变化,避免共患病的出现。通过关联规则挖掘,全面分析高血压患者合并其他慢性病的关联因素,使得相关疾病的预防和干预更具有针对性,同时也能提高慢病管理效率。