APP下载

数据挖掘在合并症患者管理中的应用进展*

2017-01-21四川大学商学院610065冯成蓉练书豪张峰祎

中国卫生统计 2017年4期
关键词:合并症数据挖掘医学

四川大学商学院(610065) 罗 利 冯成蓉 练书豪 张峰祎

数据挖掘在合并症患者管理中的应用进展*

四川大学商学院(610065) 罗 利△冯成蓉 练书豪 张峰祎

伴随人口老龄化的加剧,我国疾病谱骤然巨变,慢阻肺、哮喘、糖尿病等疾病发病率逐年上升,不仅如此,越来越多的患者伴有更严重的合并症。如果不能有效控制和监管疾病的发展,未来将出现合并症的增加而导致医疗费用的“井喷”,一方面给患者带来身体和心理的痛苦,另一方面给国家、社会和家庭带来巨大的经济负担。

合并症患者管理在我国仍未得到太多重视。除大型综合医疗机构外,县级、社区级医疗卫生机构尚未认识到其中的严重性。即使一些医院认识到合并症的重要性,但并没有建立真正的管理体系。原因可能是合并症患者健康保健负担较重,医疗决策共享受阻,使大多数医生在管理合并症患者上存在专业孤立感,同时对于常见的慢性疾病集群的临床指南不足。

合并症不单影响患者生存质量和医生临床决策,是早期预后治疗的显著影响因素,甚至给医疗健康服务运营管理带来诸多难题和挑战。大多数研究表明,数据挖掘技术是提前发现合并症的重要手段之一,在现代医学诊断中具有广泛的应用前景,同时也为现代医学诊断开辟了新途径。诸如DNA分析、医学影像数据自动分析、多种生理参数监护数据分析等都取得了突破性进展[1-2]。以数据挖掘方法为基础的大数据分析方法体系的演进,为解决合并症患者管理方面的研究提供了信息平台和技术手段。本文梳理了数据挖掘技术在合并症患者管理研究中的相关文献,并就三个主要应用领域加以综述、评价,即疾病关联分析、合并症对患者预后影响和合并症患者医疗费用分析,介绍数据挖掘技术在合并症患者管理中的重要作用,以及对正确认识合并症、提高诊疗决策水平提出建设性意见。

疾病关联分析

关联是指两个或多个变量的取值之间存在某种规律性。关联分析就是用于发现隐藏在大型数据集中令人感兴趣的联系,所形成的联系可以用项集的形式表示。最先被应用在商业交易数据库分析,同时,医学领域也存在这样的关联现象。

早期基于数据挖掘的疾病关联分析是Tai等人[3]对18321例注意力缺陷多动障碍成年患者进行的分析,实验首先验证了临床分类诊断的18种主要疾病与注意力缺陷多动障碍疾病的共病率和相对风险率,选定注意力缺陷多动障碍最常见伴发精神类疾病,然后对13种精神类特定疾病进行相对风险分析和关联分析,依照事先确定的最小支持度和置信度,得出注意力缺陷多动障碍与发育迟缓、焦虑等六种精神疾病具有很强的关联性。类似地,Kim[4]等与Valent[5]等为探究糖尿病常见合并症,以健康管理数据为基础建立了关联规则模型,并引入卡方检验过程对结果进行论证,均得出原发性高血压是糖尿病患者最常见的伴随疾病。其他类似研究还可参考慢阻肺[6]、原发性高血压[7]、糖尿病[8]等疾病的合并症研究。数据挖掘技术在医疗领域的应用尚处于起步阶段,关于合并症疾病的研究相对较少,但研究思路基本类似。

关联规则(association rule m ining,ARM)是疾病关联分析最常用工具,它包含两个主要阶段,先从大量数据中找出高频项集,然后由频繁项集产生关联规则[9]。关联分析在医学领域中具有很大的实用价值,尤其是对大型医保数据库的合并症患者管理研究,对疾病辅助诊断,减少主观判断的失误,科室之间的合理设置,方便患者管理,提高医院的服务竞争力都有很大帮助。但是,此法也有一定的局限性,如支持度、置信度和提升度的阈值设定缺乏统一的标准,有时会产生多余的模式[10]。在实际中,学者可根据研究假设及医学资料对模型进行适当的改进,提高结果可信度,但应注意把握好模型的精确性(拟合程度)和简洁性(可操作性),尽可能充分地利用实际数据,建立合适的模型,从而得出科学有据的结论,提供合理的决策依据。

合并症对患者预后影响

临床研究发现合并症对患者生存率及预后有明显影响,在老年患者中发生率较高。合并症的存在增加了术后局部和全身性并发症的发病率[11],这些并发症是辅助治疗延误的主要影响因素[12]。同时,多合并症患者与单合并症患者在术后发病率和资源占用都有明显差别[13]。

早在1987年Charlson[14]等在总结临床经验的基础上将合并症加权创建评分系统,形成查尔森合并症指数(Charlson comorbidity index),对合并症患者预后质量进行评价。当前,大多数研究以Cox回归模型评估合并症对患者预后影响。Cox比例风险回归模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响。Sarfati[15]等在调整年龄、性别、种族、地区、吸烟、疾病状态等因素后,在合并症总数、查尔森合并症指数和特定合并症三种情况下进行讨论,建立Cox基准模型,并通过似然比检验来评估三种情况下合并症对结肠癌患者特异性死亡率和全因死亡率的影响。Detema[16]等对1371名新诊断的头颈部鳞状细胞癌患者追踪分析,发现合并症的发病率达到36.4%,合并心血管疾病、呼吸系统疾病、胃肠道疾病和糖尿病的癌症患者总体生存率和短期死亡风险都较高。夏俊[17]等发现,合并COPD是行手术治疗老年肺癌术后并发症发生率高的独立危险因素,影响肺癌患者术后12个月生存率。何丹[18]等使用趋势检验和多元线性回归模型对孕产妇死因构成指标逐年变化趋势进行分析,指出内科合并症致死已成为孕产妇主要死因之一,并强调多学科合作管理降低孕产妇死亡率。总之,合并症从根本上影响患者生理负担和治疗选择,最后影响患者生存,临床上应积极预防和治疗,并尽可能做到专科治疗,以提高疗效[19-20]。

除回归模型外,人工神经网络、决策树、逻辑回归和随机森林等也逐渐在患者预后风险评估、健康改善状况评估等方面发挥价值。临床上,对于患者疾病诊断及治疗策略的制定、患者预后改善,合并症患者的有效管理都有重要参考价值。

合并症患者医疗费用分析

合并症患者除了承受疾病痛苦外,还增加了各项医疗资源的使用,给社会和家庭造成了巨大的经济负担。费用往往是国家和个人对医疗资源使用情况的重要衡量指标,准确地预测相关费用是解决这一问题关键性的一步。早期研究人员聚焦于经典的回归模型预测总医疗费用[21-22]。随着现代信息技术的迅猛发展和医院信息系统的逐步完善,数据挖掘成为准确识别高费用患者和预测医疗成本一强大而有效的工具[23]。Konnopka[24]等曾对531名背部疼痛患者进行回访,采用随机系数模型和Bootstrap回归技术分析合并精神病对患者医疗费用的影响,结果显示合并精神疾病的背部疼痛患者需要承担更多的治疗费用。其另一项研究通过Bootstrap回归技术分析患者在有无伴随精神病的情况下,分析背部疼痛患者椎间盘切除术医疗费用的差异,结果表明,由于受个体心理健康的影响,临床医师应该考虑精神疾病对患者带来的困扰以及取得心理健康专业人士的支持[25]。合并症使患者面临更昂贵的医疗费用[26-27],承受极大心理障碍,对整个社会经济和资源的使用都有消极作用。

当前我国医疗费用和人口老龄化的快速增长,使医疗保险基金面临日益严峻的收支形势。合并症加重了患者的医疗负担,占据更多卫生资源。在这样的大环境下,最优的选择应该是着眼于大数据驱动的数据挖掘技术在医疗领域的应用,有效利用计算机技术辅助我们解决医疗费用的管理问题,解决患者的经济负担等问题。

小结与展望

随着老龄人口的不断增加,预计未来多合并症患者也将持续增加。合并症严重影响患者疾病发病和预后情况,对社会造成极大的经济负担和健康保健负担,而且医生在治疗合并症患者过程中面临各种挑战,临床决策共享受阻,许多医师还表示在管理多合并症患者中存在专业孤立感。因此,如何使治疗决策更有利于患者病情的发展,制定以患者为中心的最佳治疗方案并实现信息决策共享,如何通过患者自我疾病管理,改善预后,减轻患者经济负担,建立一套适用于中国医疗服务行业的医疗保健体系,也是国内医疗工作者应该关注的课题。

关于数据挖掘在合并症患者管理的相关研究已涉及许多常见的高发疾病,从挖掘隐藏的疾病关系,到预测发病几率,再到降低医疗费用,优化医疗资源等各层次。但还需要进一步分析疾病的病例特征、治疗方式的选择、临床分期等变量的影响。由于医学数据的特殊性,在一定程度上加大了数据挖掘的难度和速度。如何通过进一步的研究和临床实践明确不同疾病合并症的发病机制、诊断和治疗,优化医疗资源,正确进行医疗决策,将是国内外合并症研究的重点。除此之外,合并症患者管理的相关研究还需要在以下两个方面获取新的发展:

第一,综合干预措施改善合并症患者机能。目前,许多合并症的治疗还是以控制主要疾病为主,对于合并症的用药尚没有明确临床指南。英国国家健康调查机构正在研究综合干预措施对合并症患者的作用,主要包括对患者生活质量的评估,疾病状态衡量,最佳药物治疗方案等。合并症的影响因素也很多,尤其是外界因素,诸如患者吸烟状态、季节等。有时候单纯药物治疗也不能达到治疗疾病效果,需要更多的临床实验认识其复杂性,尤其对于慢性疾病及其合并症一直都是医学界关注的重点。随着医疗信息系统的不断健全,利用数据挖掘技术构建先进的医疗决策信息系统和有效的诊断方案,对提升医院管理能力具有重大意义。

第二,建立健全合并症医学科研体系。数据挖掘最早起源于欧美国家,由于他们较早地应用前沿智能信息技术开展医学方面的研究,已经有一套比较成熟的理论和技术,并建立了一套完善的医学诊疗体系,产生了巨大的经济效益和社会效益。我国学者关于数据挖掘的理论和技术的意识比较传统和局限,专业的数据挖掘人才对于医学专业知识了解甚微。因此,相对缺少医学上应用数据挖掘的复合型人才。面对这一情形,数据挖掘亟待成为解决我国医学研究领域的重要技术。

合并症患者治疗过程复杂,需要建立适合本土的合并症患者医学科研体系,确保医生能实时把握患者的健康状况,为医学科研和临床工作搭建一个好的平台,将最新的理论和技术应用于医学科研工作中。这种健全的医学科研系统有望提高医生的诊断水平,对合并症的管理和研究也必有帮助。

[1]侯玉梅,朱亚楠,朱立春,等.决策树模型在2型糖尿病患病风险预测中的应用.中国卫生统计,2016,33(6):976-978.

[2]瞿爱珍,庄天戈.计算机辅助医学诊断系统的数据挖掘和知识发现研究.国外医学生物医学工程分册,2002,25:97-102.

[3]Tai YM,Chiu HW.Comorbidity study of ADHD:applying association ruem ining(ARM)to National Health Insurance Database of Taiwan.International Journal of Medical Informatics,2009,78(12):e75-e83.

[4]Kim HS,Shin AM,Kim KK,et al.Comorbidity study on type 2 diabetesmellitus using data m ining.Korean Journal of Internal Medicine,2012,27(2):197-202.

[5]Valent F,Tillati S,Zanier L.Prevalence and comorbidities of known diabetes in northeastern Italy.Journalof Diabetes Investigation,2013,4(4):355-360.

[6]Sode BF,Dahl M,Nordestgarrd BG.Myocardial infarction and other co-morbidities in patients w ith chronic obstructive pulmonary disease:A Danish Nationw ide Study of 7.4 m illion individuals.European Heart Journal,2011,32(19):2365-2375.

[7]Shin AM,Lee IH,Lee GH,et al.Diagnostic Analysis of Patientsw ith Essential Hypertension Using Association Rule M ining.Healthcare Informatics Research,2010,16(2):77-81.

[8]余辉,张力新,刘文耀,等.医学数据挖掘系统研究-糖尿病并发症流行病学知识发现.计算机工程与应用,2006,42(18):229-232.

[9]Saxena P,Jain R.Association rule m ining.International journal of computer science and engineering,2014,2(5):153-158.

[10]Li J,Fu AW,Fahey P.Efficient discovery of risk patterns in medical data.Artificial Intelligence Medicine,2009,45:77-89.

[11]Janssen-Heijnen ML,Mass HA,Houterman S,et al.Comorbidity in older cancer patients:influence on patient care and outcome.European Journal of Cancer,2007,43(15):2179-2193.

[12]Tetsche MS,Dethlefsen C,Pedersen L,et al.The impact of comorbidity and stage on ovarian cancermortality:a nationw ide Danish cohort study.BMC Cancer,2008,8(1):1-9.

[13]Suh HS,Lee KH,Kim HC,et al.The postoperative impact of comorbidity in colorectal cancer surgery.The Korean society of coloproctology,2003,19(5):299-306.

[14]Charlson ME,Pompei P,Ales KL,etal.A new method of classifying prognostic comorbidity in longitudinal studies:development and validation.Journal of Chronic Diseases,1987,40(5):373-383.

[15]Sarfati D,Hill S,Blakely T,et al.The effect of comorbidity on the use of adjuvant chemotherapy and survival from colon cancer:a retrospective cohort study.BMC Cancer,2009,9(1):1-10.

[16]Datema FR,Ferrier MB,Schroeff M,et al.Impact of comorbidity on short-term mortality and overall survival of head and neck cancer patients.Head&Neck,2010,32(6):728-736.

[17]夏俊,于在诚,聂弘,等.合并慢性阻塞性肺疾病对老年肺癌患者术后并发症及预后的影响.中国老年学杂志,2015,35(11):3066-02.

[18]何丹,杨莉,王岚,等.2004-2013年重庆市孕产妇死亡率变化趋势及影响因素分析.中国卫生统计,2016,33(3):433-434.

[19]刘冬生,邵燕,欧阳菊香,等.脑梗死预后影响因素的累积logit模型分析.中国卫生统计,2010,27(4):381-382.

[20]Land LH,Dalton SO,Jensen MB,et al.Influence of comorbidity on the effect of adjuvant treatment and age in patients w ith early-stage breast cancer.British Journal of Cancer,2012,107(11):1901-1907.

[21]Zhao Y,Ellis RP,Ash AS,et al.Measuring population health risks using inpatient diagnoses and outpatient pharmacy data.Health Services Research,2001,36:180-193.

[22]Zhao Y,Ash AS,Ellis RP,et al.Predicting pharmacy costs and other medical costs using diagnoses and drug claims.Medical Care,2005,43(1):34-43.

[23]Bertsimas D,Bjamadottir MV,Kane MA,et al.Algorithmic prediction of health care costs and discovery ofmedical know ledge.Operations Research,2007,56(6):1382-1392.

[24]Konnopka A,Lobner M,Luppa M,et al.Psychiatric comorbidity as predictor of costs in back pain patients undergoing disc surgery:a longitudinal observational study.BMC Musculoskeletal Disorders,2012,13(1):472-480.

[25]Konnopka A,Heinrich S,Zieger M,et al.Effects of psychiatric comorbidity on costs in patients undergoing disc surgery:a cross-sectional study.The Spine Journal,2011,11(7):601-609.

[26]Sayers S,Hanrahan N,Kutney A,et al.Psychiatric Comorbidity and Greater Hospitalization Risk,Longer Length of Stay,and Higher Hospitalization Costs in Older Adults with Heart Failure.Journal of the American Geriatrics Society,2007,55(10):1585-1591.

[27]Hochlehnert A,Niehoff D,Wild B,et al.Psychiatric comorbidity in cardiovascular inpatients:Costs,net gain,and length of hospitalization.Journal of Psychosomatic Research,2011,70:135-139.

(责任编辑:郭海强)

国家自然科学基金重点项目(71532007;71131006)

△通信作者:罗利,E-mail:chengrong9211@163.com

猜你喜欢

合并症数据挖掘医学
本刊可直接使用的医学缩略语(二)
改进支持向量机在特征数据挖掘中的智能应用
安庆农村老年高血压患者合并症的影响因素
探讨人工智能与数据挖掘发展趋势
医学的进步
针对性护理在妊娠合并症患者中的作用及效果分析
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
预防新型冠状病毒, 你必须知道的事
软件工程领域中的异常数据挖掘算法
医学、生命科学类