医疗健康大数据的应用前景分析
2016-01-14朱琴芬
朱琴芬
摘要:随着居民的就医和健康需求不断增加,信息化建设持续推进,医疗卫生领域已积累了规模可观的大数据,如何利用这些大数据,充分挖掘医疗健康大数据的价值,促进医疗卫生行业发展,将成为我们探索的目标。
2009年年初,中共中央、国务院向社会公布了关于深化医药卫生体制改革的意见,新医改开始正式实施,医疗保障体系逐渐完善,医疗保障水平稳步提高,百姓的就医人次连年增长。据统计,2014年我市各级各类医疗卫生机构累计总诊疗2679.39万人次,与2009年的总诊疗1817.85万人次相比,年总诊疗人次增长了923.9万。与此同时,医疗卫生信息化建设在这几年中得到了长足的发展,各医院从单纯以财务为中心的信息系统发展到以病人为中心的信息系统,各地相继建设了区域卫生信息平台,建设了数据中心,存储了丰富的医疗健康数据。
我市自2011年起组建卫生信息专网,自2012年起采集市内九大医院的医疗数据以及八十多家社区卫生服务中心或服务站的公共卫生及医疗数据,如今数据采集已经成为常态化的工作。但数据采集只是第一步,对数据加以分析利用才是采集的目的。如何合理有效地利用,真正发挥数据的价值,还值得我们进一步思考与实践。
1.医疗健康大数据的特点
医疗健康大数据与其他领域的大数据一样,具备4个重要特征,称为4V 特征,即Volume(大容量)、Velocity(快速更新)、Variety(多类型)和Value(高价值)。以医院电子病历数据为例,它是典型的大数据。首先,电子病历的数据量大。以一家三甲医院为例,年诊疗人次为200万左右,每年将产生大量的电子病历数据信息,而且院方还必须保存往年的电子病历,根据《医疗机构管理条例实施细则》规定,医疗机构的门诊病历的保存期不得少于十五年;住院病历的保存期不得少于三十年。其次,数据的更新速度快。现代化的医疗越来越依赖于各种检验检查结果,检查化验的人数快速增加,其数据也在快速更新。第三,电子病历的数据包括了文本、图像、图形和视频等多种类型。第四,电子病历数据中隐藏着极有价值的医疗和医学信息,通过数据挖掘方法可以挖掘出有价值信息,以便医生进一步分析患者的病因,形成更好的治疗方案。
2.医疗健康大数据的应用
医疗健康大数据的应用至少应该包括治疗疾病的应用,医学教学或研究的应用,健康信息统计的应用等等。以贯穿全生命周期的健康档案为例,居民健康档案是收集、记录居民健康信息的重要工具,通过居民健康档案,能够了解和掌握居民的健康状况和疾病构成,了解居民主要健康问题和公共卫生方面的流行病学特征,为筛选高危人群,开展疾病管理,采取针对性的预防措施等奠定基础。
2.1有助于科学决策
对管理者或行政部门来说,采集的数据有统计学的意义。信息系统可充分利用海量数据,从需求出发构建各种统计分析报表,用于监控分析医疗质量、运营情况、成本情况,为科学决策提供参考和建议。
2.2有助于公共卫生管理
公共卫生管理部门可以通过综合卫生信息管理系统查看区域内高血压、糖尿病等慢病统计数据,进行疾病监控。同时相关部门通过分析医疗大数据的变化,获得来自各地的患者出现相同或类似症状并迅速在人群中蔓延的信息,从而可预测某些流行病的爆发,为人类阻止或减缓流行病的发展提供依据。
在甲型H1N1流感在美国爆发的几周前,谷歌公司的工程师们就发表了一篇论文,文中解释了谷歌为什么能够预测冬季流感的传播。谷歌通过观察人们在网上的搜索记录来完成这个预测,而这种方法以前一直是被忽略的。谷歌公司为测试这些检索词条,总共处理了4.5 亿个不同的数字模型。在将得出的预测与2007 、2008 年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的预测与官方数据相关性高达97%,而且他们的判断非常及时。这是大数据应用于公共卫生领域的一个例证[1]。
2.3有助于精准医疗
美国总统奥巴马在2015年国情咨文演讲中推出“精准医学计划”(Precision Medicine Initiative),提议在2016财年向该计划投入2.15亿美元,以推动个体化医疗的发展,精准医疗引起全世界的关注。
精准医疗,简而言之就是以个体化医疗为基础,伴随着基因组测序、生物信息和大数据等技术交叉应用而发展起来的新型医疗模式。
精准医疗更重视“病人”的深度特征和“药物”的高度精准性;是在对病人和药物深度认识的基础上,完成更个体化的诊断和治疗。精准医疗的发展,离不开信息技术与生命科学和医疗技术的深度融合。所以说高性能计算在商业领域的普及应用,以及大数据分析技术和工具的出现,为医疗行业迎来了更为广阔、更具想象力的成长空间。
2.4有助于科研教学
医疗大数据系统保存了成百上千万患者的全部真实数据,如患者个人基本信息,包括居住地信息、家族疾病史等。通过大数据系统的挖掘分析,可以得知哪些癌症会有明显的家族遗传性,从而可进一步分析其发病与基因变化的关系,以找到降低这种癌症发病率的方法。通过挖掘分析大数据中疾病与地区区域的关系,可以得知哪些疾病容易在某些地区发生,以便进一步分析该地区的环境因素与疾病发生的关系,使得人类去有意识地改变环境,去除导致疾病发生的诸多因素[2]。
2.5有助于健康生活
随着健康档案对居民的开放查询,通过手机、电脑或电视,居民可以查询到个人的历次体检信息、就诊信息、检验检查信息,便于居民实时了解自己的健康状况。随着各地健康小屋的诞生、可穿戴式设备的普及应用,居民可以通过自助的方式获取健康相关信息,包括所消耗的食物、睡眠质量、运动量等行为数据,进行分析、处理,监测人们的身体状态,从而帮助人们改变不健康的行为习惯,实现积极健康的生活方式。
3.数据采集存在问题分析
3.1采集数据不够全面
我市各医疗机构尚未实行身份证实名制就诊,区域卫生信息平台中收集的能与身份证关联的才是有效信息。非医保患者仅凭医联卡就诊,这些就诊信息无法与身份证关联,成为无效信息。有待于下一步推行实名制就医来改善上述状况。
3.2采集数据不够准确
目前仍存在持他人的医保卡看病就医的情况,这种情况下所产生的就诊用药记录也会加载到医保卡持有人的健康记录里,导致健康信息不准确。各医疗机构内部信息系统较多,向区域卫生信息平台上传数据的来源和统计口径不同,导致上传数据不够准确。
3.3采集数据不够完整
由于各医疗机构信息系统建设在前,上级部门上传数据标准出台在后,以及各医疗机构信息化建设水平不一,导致目前各医疗机构向市级区域卫生信息平台上传的数据字段数与上级要求存在偏差。
4.医疗健康大数据应用的制约因素
4.1信息安全制约
信息公开与信息安全是一对矛盾。在推广医疗健康大数据的应用时,存在以下安全隐患:一是黑客入侵导致的数据被篡改、丢失等,二是信息在存储、传输、访问时导致的信息泄露、失真等,三是健康档案在管理上存在的相关法律法规不完善、责权机制不明确、信息安全意识不强、信息安全保障能力不足等导致的安全隐患[3]。
我市区域卫生信息平台中收集的信息包括居民个人基本信息、公共卫生信息和医疗就诊信息,其中包括国家基本公共卫生服务项目要求的0—6岁儿童、孕产妇、老年人、慢性病和重度精神疾病患者等各类重点人群的健康管理记录。很多信息涉及公民的隐私权,因此,如何在合理利用大数据和保护个人隐私之间取得平衡,是一个很现实的问题。对于提供这些个人信息的居民来说,一方面他们是公共卫生服务的受益者,另一方面也是信息权利的所有人,他们最关心的问题便是能否保障个人信息安全。
4.2大数据处理技术制约
随着各领域的技术飞速发展,对大数据处理技术提出了更高要求。如生物遗传学领域近几年开展的一项巨大工程——人类基因组计划,要对人类23 对染色体基因中30 亿个碱基对进行测序,其数据量之巨大,以至于当前高性能计算机系统都难以在可接受的时间内完成[2]。
4.3跨行业的合作共享制约
互联网的本质就是开放和共享。区域卫生信息化涉及公安、人社、民政、物价、药监、教育等非卫生部门。长期以来,我国的信息化是以部门为中心展开的,客观上形成了行业垂直的信息化体系,在地方上形成了条块分割的“信息孤岛”,数据开放需要层层审批,造成了信息在部门之间共享的难度。
4.4大数据应用意识和应用能力制约
目前我市已在数据统计分析、决策支持、慢病管理等方面开展了一些大数据应用,但总体来说大数据应用意识不强,应用能力有待提高。以我市统一开发的健康档案浏览器为例,该浏览器已嵌入到各医疗机构的HIS系统,通过医生工作站便可直接访问健康档案浏览器,了解患者的高血压、糖尿病、传染病等各类专项档案信息以及患者既往诊疗信息,但据统计目前的使用程度并不高。
随着医疗和健康数据的急剧增长,如何充分利用包括影像数据、病历数据、检验检查结果、诊疗费用等在内的各种数据,进一步挖掘其在药品研发、基本药物临床应用分析、创新医疗服务模式等方面的价值,为广大患者、医务人员、科研人员及政府决策者提供服务,将会成为未来信息化工作的一个方向。