大数据在健康管理中的应用研究
2021-04-15李立清管梦琪舒召慧
李立清,管梦琪,舒召慧
(湖南农业大学 公共管理与法学学院,湖南 长沙 410128)
健康管理以预防疾病发生、控制疾病发展、减轻医疗负担、提高健康水平为目的,用有限的资源实现健康效果最大化,在实现健康中国进程中将担任重要角色。随着大数据的出现和迅速发展,国家陆续出台《关于促进和规范健康医疗大数据应用发展的指导意见》等多个战略性文件,表明健康医疗大数据是国家重要的基础战略资源[1],推动了大数据在健康医疗领域的迅速发展和全面深化,大数据与健康管理的结合应用迎来新的发展机遇。
一、大数据与健康管理结合的意义
当前,我国健康保障事业面临新的巨大挑战。一是慢性病成为影响人民健康的重要隐患。慢性病具有易致残、难痊愈、治疗贵等特点,不健康的生活方式和饮食习惯是其主要的发病原因,其导致的死亡人数已经占总死亡人数的88%,导致的疾病负担占总疾病负担的70%以上[2]。二是人口老龄化给健康保障带来巨大压力。我国老龄化进程迅猛,截至2019年12月31日,60岁及以上的老年人口数增长至2.54亿人,约占总人口的18.1%,65岁及以上老年人口达到1.76亿人,占总人口的12.6%。然而,目前我国老年人口的健康状况不容乐观,只有约30%的老年人口健康状况较好。心血管疾病、癌症、肺部感染和非胰岛素相关糖尿病等成为老年人疾病负担的主要来源,由这些慢性病所带来的疾病负担将因快速老龄化在未来20年内至少增加40%[3]。三是康复管理已成为健康保障的明显短板。对于很多疾病来说,出院后的康复对疾病治疗来说既重要又漫长。以我国死亡率排名靠前的心脑血管疾病为例,我国这类患者出院后依从性普遍很差,自行停药、听信偏方、护理不周等依从性差的状况普遍存在,再加上我国临床医疗中只注重临床治疗、出院后健康管理长期缺位,使得其复发率和死亡率高居不下。疾病复发带来的反复治疗不仅耗费了大量医疗资源、加重了疾病负担,而且严重危害患者的生命健康。健康管理是通过健康信息采集、健康评估、健康干预和监测追踪等手段并辅以健康宣传教育,以不断提高人民对自身健康的管理意识和水平、改善生活方式中威胁健康的因素,旨在达到预防疾病发生、控制疾病发展、减轻医疗负担和提高生命质量的目的,用最少的医疗卫生资源实现健康效果最大化的过程。它可以推动健康保障事业关口前移,坚持以预防为主,通过有效的干预手段对人民全生命周期健康进行维护,这对于降低医疗费用、减小医保基金压力和推动健康保障事业进一步发展都至关重要。四是健康保障智能化已成为推动老年群体便捷享受服务的必要之举。当下不少老年人不会上网、不会使用智能手机,身体出现健康隐患时不能通过搜寻健康信息做到预警,只有当疾病发生时,主动就医才能享受到健康服务,又因老年人记忆衰退,自诉发病前症状信息不完整不准确导致医生难以做出准确诊断,极易导致病情误诊,降低了医疗服务效能,不利于维护老年群体健康安全。老年群体大部分只能依赖线下的健康服务,在健康管理上无法充分享受智能化服务带来的便利。国务院办公厅印发的《关于切实解决老年人运用智能技术困难实施方案的通知》强调要保障居家老年人基本服务需要,推动老年人充分享受智能化服务带来的便利。健康保障作为老年群体日常生活涉及的重点需求,推动健康管理的智能化是增进老年群体福祉的必要之举,能够让老年群体在健康服务中有更多获得感、幸福感、安全感。
大数据在我国医疗健康领域的变革中扮演着重要角色,大数据可以通过整合多来源卫生数据预测和跟踪流行疾病,通过对健康危险因素的识别、监测和分析,为我们提供健康生活方案,预防、预警和尽早发现疾病,通过对临床数据、用药数据、治疗效果和医疗费用等海量数据的分析为个性化的预防保健和健康体检方案制订、临床决策和个性化治疗方案制订提供科学有效的支撑,通过便携式医疗设备和可穿戴医疗设备加强对患者的出院后管理。大数据在这些领域的应用与发展为健康管理提供了新的思路和技术支持,健康管理迎来前所未有的发展机遇。
二、大数据在健康管理中的创新应用
随着医疗卫生信息化的快速发展,医疗数据的规模和类型都经历了前所未有的高速发展,丰富多样的医疗数据和健康数据集聚在一起,形成了能够描绘全生命周期健康画像的健康医疗大数据。根据数据来源的不同可将其分为医疗大数据、健康大数据、生物大数据和运营大数据[4]。其除具有一般大数据规模大、结构多样、增长快速、价值巨大的特点外,还具有多态性、不完整性、时间性及冗余性等医疗领域特有的一些特征。同时,健康医疗大数据的采集、预处理、存储和挖掘分析等大数据技术应运而生,进一步促进了大数据在健康管理中的创新应用。
(一)健康信息采集与建档
健康信息是健康管理的前提和基础,主要包含医疗卫生服务信息、健康体检信息、生物指标信息和日常行为信息等。相比于传统的访谈法、实地考察法等信息采集方式,大数据时代健康信息的采集更为灵活、便捷和全面。2009年至今,国家出台了一系列政策支持建立电子健康档案,并于2013年着手建设了人口健康信息平台。目前,我国省级人口健康信息平台已全面建成,市级和县级人口健康信息平台的建设也正处于稳步推进中。例如,贵阳市依托大数据和云计算技术搭建的人口健康信息平台包含电子健康档案和电子病历等数据库,目前已接入290多家医疗机构,汇聚了近12亿条包含诊疗记录、影像资料、健康档案等多种数据类型、数据规模超过60T的健康医疗大数据。同时,还通过“健康贵阳”APP向居民推送电子病历和健康档案,居民可以通过这个APP实时更新自己的健康档案,医生也可以实时阅览居民的健康变化情况[5]。一方面,医疗卫生机构、卫生管理机构与居民之间的信息共享和实时交互使得健康管理更具互动性、时效性;另一方面基于大数据技术的多维度、多视角的数据分析应用使得健康管理更具全面性、科学性。这为我国健康管理事业的全面开展与进一步推进提供了强有力的数据基础和技术支持。
(二)健康评估
健康评估是一个将健康状态和疾病风险进行量化的过程,主要包括健康状态评估、疾病风险评估、疾病危险程度评估和群体风险评估四个部分,是健康管理的重要一环。其主要思想是通过各种疾病风险模型,对个体的目前生理和心理健康状态、未来一段时间患某种疾病的可能性、已患疾病的未来走向及并发症发生概率和特定群体在特定环境下患某种疾病的可能性进行评估,对于预防疾病发生、降低医疗费用至关重要[6]。国外将大数据应用于健康评估的研究较为丰富,Choi等基于循环神经模型(RNN)对心衰概率进行预测[7];Khera等构建多基因风险评分模型(GPS)根据基因组预测冠心病、房颤、2型糖尿病、炎症性肠病和乳腺癌的患病概率等[8]。国内将大数据应用于健康评估的研究虽起步较晚,但发展迅速且取得了一些成绩。安徽省阜阳市第二人民医院自2015年来先后研发出肺癌、肝癌、食管癌、宫颈癌、脑卒中、急性心梗六大疾病的大数据风险预测平台,有效降低了疾病发病率,为国家节约了数千万元的医保基金[9]。重庆智能疾病预测与筛查模型整合上万维度数据因子进行建模,可提前一周预测流感、手足口病等传染病的发生情况,对慢阻肺筛查成本的减少和筛查效率的提高作用明显。
(三)健康干预
健康干预是根据健康评估的结果,针对不同健康状态群体分别采取相应措施对影响健康的生活方式、饮食习惯和疾病危险因素进行干预,以改善健康状态、实现健康促进的过程。主要包括健康咨询与健康教育、营养与运动干预、健康风险控制和引导就医等。大数据时代的健康干预相对于一般的健康教育与促进更提倡个性化和动态性。一是健康教育与咨询。健康管理系统根据居民的就医记录、身体指标状况和高频搜索关键词准确了解其健康需求,推送定制化的健康知识,并提供专业的线上健康咨询。二是营养与运动干预。健康管理系统根据居民的具体身体情况为其制定个性化的膳食方案和运动计划,并通过积分等激励措施督促其落实,以保证营养摄入的合理性和恰当的运动量,达到促进居民健康改善的目的。三是健康风险管理。健康管理系统对心率、心电、血压等生命体征以及特定疾病危险因素进行实时监测,监测指标一旦发生异常,系统将通过互联网进行健康状态报警,家庭签约医生提醒就医并制订个性化治疗方案。四是就医指导。健康管理系统根据居民的疾病种类与危险程度、所处地区、医疗成本和医院特色等推荐就医医院和科室,促进分级诊疗的落实。目前,我国已有上海健康云、春雨健康大数据实验室等多个平台通过互联网和大数据技术的综合运用实现了个性化和动态性的健康干预。
(四)跟踪监测
在健康评估和干预的基础上对疾病危险因素开展动态追踪,对动态评估干预效果、疾病的康复管理、降低疾病复发率和并发症发生率意义重大。近年来,健康物联迅速兴起,大体分为血糖仪、数字血压计、数字脉搏和心率监视器等便携式医疗电子设备和谷歌眼镜、智能手环、智能手表等可穿戴设备两部分。大数据与物联网、互联网技术的综合应用在疾病跟踪监测中大有可为:老年痴呆症可以监测生命体征、活动及身体各项指标,慢阻肺可以监测一秒用力呼气量和空气质量,糖尿病可以监测葡萄糖和糖化血红蛋白,心力衰竭可以监测心脏压力、血流、体重和血压等。通过便携式医疗设备和可穿戴设备收集这些监测数据,将它们通过互联网传送到健康管理平台,经过大数据技术分析将其用于健康干预和康复情况的评估,并及时从中发现异常情况、采取相应措施将疾病损害降到最低。
三、大数据在健康管理应用中的困境
(一)健康医疗大数据采集范围有待拓宽,数据全面性不足
目前,各种慢性病、心理疾病的发病率呈逐年上升趋势,已成为威胁居民健康的头号杀手,其发生与不良生活方式、心理行为、社会活动等多种因素密切相关。关注亚健康、亚疾病状态,消除健康隐患,防患于未然,已成为个体健康管理不可忽视的需求,人们在日常生活中对生理、心理健康指标的记录和监测的重视程度也越来越高。健康医疗大数据应涵盖生物、临床、心理、行为、社交、环境、商业等与人类健康活动具有直接或间接相关性的所有数据源,但当下只形成对基因组学、转录组学等生物数据、就医诊疗信息数据、治疗成本、医疗报销等运营数据的常态化采集,对其他数据源信息的采集重视程度不够。具体表现为对个体身高、体质量、体质量指数(BMI)、腰围、臀围、血压、末梢血胆固醇及甘油三酯、末梢血空腹血糖等生命体征的连续、动态生理健康状态检测数据采集不足,对运动频率、烟酒习惯、生活规律等生活方式的数据采集不重视,缺乏对人的心理行为量化评估数据进行连续客观采集,忽视对近人体的自然环境(如居住环境、工作环境)和社会环境(如职业类别、婚姻状况)的定性数据进行关联采集。
(二)健康医疗大数据质量有待提升,数据标准化程度不高
健康医疗大数据既包含电子病历、医学影像、住院用药等医疗数据,个人健康档案、个人体征数据等健康数据,也包含基因组学、转录组学等生物数据和治疗成本、医疗报销等运营数据。它们来源于不同机构的多个数据系统,数据结构多样、冗余明显、完整性欠缺。目前大数据分析技术只能对经过标准化处理的数据进行分析,如何对纷繁复杂的海量数据进行数据清理和标准化处理,从中提取出尽可能多的有价值信息,这是横亘在健康管理领域大数据创新应用的一大难题,影响着健康评估、健康干预与跟踪监测的进一步发展。例如,健康评估的准确性与健康信息的全面性高度相关,CT、核磁共振等医学影像资料中蕴含了丰富的健康信息,但由于其数据的非结构性,目前大数据技术对其蕴含的健康信息挖掘十分有限。
(三)各机构间信息系统的互联互通程度不高,信息孤岛现象仍然存在
目前,我国健康医疗数据主要存储在医疗机构、卫生管理部门和各健康科技公司,各机构之间的信息系统缺乏互联互通,信息“孤岛现象”仍然存在。一是数据分布较为分散,缺乏集成的数据互联互通平台。就医院内部来说,它的门诊及病房数据、检验报告数据、医学影像数据和病历数据分别存储在HIS、LIS、PACS和EMRS四个系统中,由于统一患者标识缺乏、信息系统与业务匹配度低等,各系统之间的信息调阅成本高、难度大。二是数据标准化、结构化不足,阻碍了机构间数据信息互联互通[10]。例如,目前各专业之间的临床用语尚未规范、同一疾病可能名称不同;电子病历中既包含结构化信息,也包含非结构化信息和图像信息,后两者难以识别。三是各机构的大数据研发目的不同、方向各异,医疗机构倾向于提高医疗水平和治疗效果,卫生管理部门倾向于公共卫生事业管理,健康科技公司倾向于健康管理服务的商业化。各机构之间相互独立、自成一派,缺乏动力推动数据互联互通。这些信息孤岛现象的存在使得现有健康管理平台功能欠全面,大数据在健康评估、健康干预和跟踪监测中的应用落地难,严重制约了健康管理事业的发展。
(四)健康医疗大数据安全管理和应用体系尚未建立,伦理问题突出
健康医疗数据对于推动健康管理事业发展、促进全人类健康和建成“健康中国”意义重大,但这并不意味着对健康医疗大数据的挖掘可以是无节制、无底线的。健康医疗数据涉及个人隐私、全面健康和种族安全等,具有多源性和高隐私性,对其进行挖掘的过程中容易产生伦理和法律问题,确保数据安全非常重要[11]。一是健康医疗数据的采集、运用权限和患者隐私权之间的边界缺乏相关法律的明文规定[12],大数据应用在采集、挖掘和分析环节都容易侵犯患者隐私权,公共利益与个人权利如何协调值得探讨。二是数据安全法律体系不健全、数据安全意识不足、加密和防范技术不到位、从业人员素质有待提高,健康医疗数据如果没有安全防护会变得赤裸裸,将面临严重的安全威胁。《2019年健康医疗行业网络安全观测报告》指出健康医疗行业网络安全风险处于较大风险级别,存在恶意程序、大数据泄露和网站篡改等多种网络安全风险,安全隐患众多,防范攻击能力较弱[13]。三是健康医疗大数据规模巨大、结构多样,数据的存储与维护给大数据开发应用的“硬实力”和“软实力”都提出了较高要求。目前顶尖大数据科技公司较少,医疗健康信息工程技术较弱,大数据人才特别是复合型人才缺口较大,难以满足需求。
(五)健康医疗大数据技术尚未成熟,大数据陷阱不容忽视
2008年“谷歌流感预测(GFT)”的出现备受瞩目,被认为开启了公共卫生领域的大数据变革。然而GFT在2009年甲流预测中遭遇失败,并于2012—2014年间持续高估了美国的流感趋势,偏差高达140%[14]。这期间GFT经历了三次大的调整,最终仍因预测偏差过大而黯然退出历史舞台。GFT的失败警示我们,大数据分析中常用的相关关系并不能完全代替现实存在的因果关系,大数据技术在不同领域的具体应用尚未成熟、模型预测偏差不容小觑,在大数据的应用中要警惕大数据陷阱。实际上,大数据陷阱除了模型本身的缺陷外还面临着利益集团的操纵陷阱。大数据技术根本上是基于模型的分析技术,模型由人研发、调整和应用,存在巨大的人为操作空间。健康管理领域蕴含了巨大的经济利益和发展潜能,很多利益集团对其虎视眈眈,有可能利用大数据存在的人为操作空间对大数据在健康管理的具体应用环节进行操控,诱导用户进行不必要的医疗检查和治疗,赚取超额利润甚至造成严重健康损害和卫生资源浪费。
四、推动大数据在健康管理中的应用发展对策建议
目前,我国大数据在健康信息采集、健康评估、健康干预与跟踪监测等健康管理各个环节的创新应用取得了一些成绩,但由于健康医疗大数据采集不全面、数据质量不高、信息孤岛现象仍然存在、数据安全面临威胁和大数据技术尚未成熟等问题,大数据在健康管理中的进一步创新应用面临阻碍,可从以下几个方面进行改进。
(一)拓宽健康医疗大数据采集范围,提高数据全面性
形成对生命体征监测数据的常态化、连续性采集,将生命体征监测数据种类拓展到更为广泛的心理、营养、运动、行为等方面,以期在健康状态辨识和风险预警中,为人体健康状态评估及干预提供关键靶点和数据支持。丰富健康医疗数据多维度的采集方式,保证数据采集的纵深度和全面性。推广利用移动终端健康信息采集,充分发挥移动互联网和便携式、可穿戴式医疗技术的优势,通过开发国家个人健康指标手机APP记录监测预警平台,研发配套的便携式、可穿戴式医疗电子设备,构建全新的个人健康指标数据采集系统,对数据进行统一标准采集和连续记录监测[15]。通过采集的健康数据整体评估个人健康水平,对存在健康隐患的用户进行及时预警,做到疾病预防关口前移,实现从“治已病”向“治未病”的转变,同时也可为个体临床诊疗提供快速准确的临床决策支持,有望解决过去医生根据病人自诉及观察而存在的信息不完整、决策困难等问题,为健康管理提供更严格和全过程的科学证据[16]。
(二)加强健康医疗大数据标准体系建设,提升数据质量
明确国家卫生健康委员会在健康医疗大数据标准体系制定中的统筹地位,促进医疗机构、各级卫生部门、科研单位和健康科技公司多元主体协同参与体系制定以满足多方需求。在现有通用大数据标准基础上根据健康医疗行业特色制定包含基础类标准、数据类标准、技术类标准、安全与隐私标准、应用与服务标准、管理类标准等模块的健康医疗大数据标准体系,努力做到标准统一、术语规范和数据结构化,保证数据质量。同时,要建立相关责任机制,做到责任明确、权责一致,并对健康医疗大数据标准体系的实行情况进行监督和评估,及时调整。
(三)多元主体共建大数据互联互通平台,消除信息孤岛
国家卫计委医疗卫生信息化“46312”工程持续推进,打造统一的健康医疗数据共享平台,促进医疗临床数据、生物信息数据、公共卫生数据、智能穿戴数据和医疗保险数据等多源数据的接入[17]。统一疾病诊断编码、临床术语、药品编码以及数据接口和传输协议等,消除机构间数据互联互通障碍。更新数据管理理念,构建政府主导、多元主体共同参与的协同模式,寻求各机构间的共同利益和利益平衡点,消除各机构间及机构与社会公众间的数据壁垒,共同推动健康医疗大数据共享,避免数据重复采集和资源浪费。
(四)加快健康医疗大数据安全体系建设,保证数据安全
健康医疗数据权属明晰是保证数据安全的基础,要出台相关法律厘清健康医疗数据所涉及各主体的权利义务关系和大数据开发应用的边界。加快健康医疗大数据安全体系建设,对隐私数据进行脱敏处理,制定健康医疗数据适用的网络安全标准,强化数据接口和传输协议安全,防范恶意程序、大数据泄露和网站篡改等风险威胁,保障数据采集、传输、存储、分析和发布多个环节的安全,并推动数据安全检测、预警和应急处置机制建设的跟进。加强医疗健康信息工程技术“硬实力”与健康医疗信息化复合型人才“软实力”建设,加大财政投入,培育大数据健康产业,通过提供技能提升课程和训练专业IT人员的方式培养并保留交叉跨界人才,保证健康管理信息化核心系统的自主可控与稳定安全运行。
(五)加大健康医疗大数据技术攻关,警惕大数据陷阱
健康医疗大数据技术对推动大数据在健康管理的创新应用至关重要。国家要继续加大对健康医疗大数据技术发展的支持,各相关部门、科研工作者和社会力量要形成合力共同助力健康医疗大数据技术攻关克难,提高预测的精度以减少大数据陷阱。同时,应制定健康医疗大数据行业标准,提高行业准入门槛,规范大数据技术开发应用流程,提升从业者道德与专业素养以及企业社会责任感,改善行业乱象。另外,相关部门应加强对健康医疗大数据行业的监管,重点监管有人为操作空间的环节和有利益操纵风险的企业,警惕大数据利益集团操纵陷阱,为推动大数据在健康管理领域的创新应用扫除障碍,创造更优质的应用环境。