“健康中国”背景下的健康医疗大数据发展
2022-02-03胡瑶琳余东雷
胡瑶琳,余东雷,王 健,3
(1.武汉大学 董辅礽经济社会发展研究院,湖北 武汉 430072;2.武汉大学 政治与公共管理学院,湖北 武汉 430072;3.武汉大学 健康经济与管理研究中心,湖北 武汉 430072)
2015年7月国务院发布的《国务院关于积极推进“互联网+”行动的指导意见》是我国第一份明确提出加快大数据发展的权威文件,[1]该意见指出要加强大数据在医疗卫生和健康养老等领域的利用。2022年印发的《促进大数据发展行动纲要》(下文简称《行动纲要》)和2016年印发《关于促进和规范健康医疗大数据应用发展的指导意见》(下文简称《指导意见》)进一步确定了健康医疗大数据作为国家重要基础性战略资源的地位。严格来说,大数据并不是一项新的技术突破,而是数字化时代的一种发展结果。[2]在大量非结构化和半结构化数据积累的基础上,借助数据挖掘和分析工具,于逻辑推导的因果关系外,得以发现更多现实中不曾被注意的相关关系,借以提供决策支持和预测依据。
大数据的“4V 特征”,即海量(Volume)、高速(Velocity)、多样(Variety)、真实(Veracity),①也有文献认为第五个V应该为Value,指大数据具有价值大但密度低的特点。揭示其能在健康医疗领域发挥重要作用:患者、医疗机构、支付方、监管方均有大量健康医疗数据;因为我国人口基数大、健康医疗资源分配具有较强的复杂性,我国健康医疗数据呈现明显的高频变化和复杂多样的特征;而在就诊、治疗、支付等主要环节,对数据真实性均有较高的要求。但目前对健康医疗大数据的研究更加集中在医疗领域大数据的研究。《“健康中国2030”规划纲要》提出“把健康融入所有政策”。大数据作为一种可以在健康医疗领域发挥重要作用的技术应用,在“健康中国”的背景下应被赋予更加具有健康战略意义的理解。
一、健康医疗大数据的内涵、特征及分类
(一)健康医疗大数据的内涵
健康医疗大数据即为健康医疗领域的大数据,从逻辑上讲属于大数据的一个子集。《行动纲要》指出医疗健康服务大数据工程的实现需要建设覆盖公共卫生、医疗服务、医疗保障等环节的大数据应用体系。可见健康医疗大数据的范畴主要围绕健康管理、医疗医药和公共卫生治理目标的达成。目前的文献多关注健康医疗大数据的来源和特征,少有明确指出健康医疗大数据的内涵。文章认为,健康医疗大数据指为实现健康医疗和公共卫生目标而生成或挖掘的大量数据,包括但不限于在诊疗过程中所产生的数据①目前对健康医疗大数据的界定多局限在医院诊疗过程中所产生的数据,在“把健康融入所有政策”的战略思想指导下,其实可以看到如果真正要达成健康医疗和公共卫生的目标,健康医疗大数据的范围绝不能局限在医疗机构的诊疗数据之内。[3][4],健康医疗大数据主要用于协助医疗健康和公共卫生目标的实现。
(二)健康医疗大数据的特征
目前不少文献将海量、多态、缺失和冗余作为健康医疗大数据的特征,文章认为虽然健康医疗大数据相比某些产业数据确实数据量更大、数据表现更多元、数据缺失和冗余的情形更加明显,但这些特征实质是大数据的基本属性,并不能因为健康医疗大数据相比某些数据子集表现更显著就视其为健康医疗大数据的基本特征。在某些大数据的基本属性上,健康医疗大数据未必具有更突显的表征,比如就海量这一特征而言,当健康医疗大数据是和交通旅游大数据相比,很难说健康医疗大数据的规模就高于交通旅游大数据。对健康医疗大数据特征的考察必须结合医疗健康和公共卫生领域的特性,文章据此提出健康医疗大数据的三个特征,即高度专业性与广泛全面性并存、强人格属性与公共治理价值并存、数据形态非结构化与结构化并存。
1.高度专业性与广泛全面性并存
高度专业性源于医疗卫生领域具有的专业门槛,许多高价值医疗卫生数据的采集、分析和应用都以专业医疗操作为前提。在“健康中国”的视野下,对健康的理解要覆盖全人群和全生命周期。健康医疗大数据的来源不仅可以来自医疗机构和疾病防控机构,也可以来自于饮食、运动、睡眠等日常场景。在公共卫生治理中,还常需援用来自交通、农业和工业等领域的大数据。健康医疗大数据的广泛全面性是充分挖掘数据价值的重要条件,这也与医疗健康和公共卫生管理目标的复杂性相关。健康医疗大数据高度专业性与广泛全面性并存的特点是大数据嫁接至医疗健康和公共卫生领域后呈现的独特状态,既显示了医疗卫生领域的特殊性,也验证了大数据的技术路径。
2.强人格属性与公共治理价值并存
大数据所涉及的隐私问题是大数据研究绕不开的共性问题。但相比教育文化、交通旅游、日常消费等方面的大数据,对健康医疗大数据隐私保护的争议更为激烈。从保护方式上来看,对健康医疗大数据的保护主要存在人格权保护和财产权保护这两种路径。在隐私信息保护问题的争议上,以王利明教授为代表的学者认为应该将个人信息权利作为独立的人格权。[5]但也有学者指出人格权的保护路径限制了医疗数据的流通。[6]文章认为这一争议的根源在于对健康医疗大数据范围认识的差异,在“健康中国”背景下,健康医疗大数据既包括根据现有法律必须披露、应该公示或者可以共享的医疗、疾控、公共管理等相关数据,也包括涉及公民隐私或商业秘密的数据。对于那些具有高度私密性并且可能会因公开而给信息所有权人带来困扰的“敏感信息”,[7]因其具有明显的人格权属性,更适宜采用人格权的方式予以保护;而对于那些并不属于敏感信息,并且在法律框架下应然或者经授权可以公开或共享的大数据,如果其存在较高的公共治理价值,则应该在合法合理的基础上推进数据共享。“健康中国”背景下,我国健康医疗大数据的范围已然不局限于医疗领域的数据,健康医疗大数据所呈现的强人格属性与公共治理价值并存的局面要求我们必须加快对相关数据权利保护的研究,在保障公民人格权利的同时,充分发挥健康医疗大数据的价值。
3.数据形态非结构化与结构化并存
医疗行业是具有严格信息记录“传统”的行业。诊疗部门需要按要求记录病人诊疗信息,检验部门和医药部门也有严格的信息存档要求,疾控机构需按法律规定进行信息报送等。大数据概念未提出之前,在医疗健康和公共卫生部门运营的过程中,已存在以病历、用药医嘱、检验数据、信息报告等为代表的结构化数据,这些结构化数据保障了相关机构的管理和风险控制。大数据在医疗领域的使用,不仅提高了这些结构化数据的电子化水平和管理效率(最典型的如医院信息系统的建立),还促进了医疗机构非结构化数据的信息挖掘和利用。概括来说,在引入大数据技术之前,医疗领域的数据即呈现出明显的非结构化与结构化并存的特征,在引入大数据技术之后,大数据技术进一步提高了健康医疗领域结构化数据和非结构化数据的价值。一定程度上可以认为,健康医疗领域的数据挖掘和分析是大数据技术验证其功能的重要场域。
(三)“健康中国”背景下对健康医疗大数据的一种新分类
在“健康中国”的背景下,健康医疗大数据的分类应始终围绕全民健康目标的实现。在这一逻辑基础上,文章认为健康医疗大数据可以划分为健康生活大数据、健康医疗服务大数据、医疗医药保障大数据、环境与安全大数据、健康产业大数据、配套与管理大数据六个方面的大数据。
健康生活大数据主要与居民日常健康行为及健康管理相关,包括饮食监测、运动跟踪、心理状态等方面的数据。慢性病的高发率和高致死率已对我国居民健康构成了较大的威胁,我国居民慢性病患病率整体呈指数增长,1993年慢性病患病率约为169.8‰,到2013年已达330.7‰。[8]通过借助可穿戴设备、远程会诊和线上健康咨询,可以实现对慢性病的持续监测和日常健康行为管理。
健康医疗服务大数据主要与我国医疗医药和公共卫生服务相关,包括传染病监测预警、计划生育管理、医疗资源分配、诊疗服务等方面的数据。通过大数据分析,更好地根据人口及其健康情况匹配健康医疗资源,以实现公平的资源分配。
医疗医药保障大数据主要与医疗保障和药品供应保障相关。通过医保智能监控保障医保支付制度和对药品与医疗器械的大数据监测真正落实药品出厂价格信息可追溯机制、药品储备制度和应急供应机制,大数据技术已经在医疗医药保障上得到了较广泛的应用。
环境与安全大数据主要指影响健康的相关环境数据和食品药品安全等数据。近几年我国环境污染事件和食品药品安全事故依然时有发生,大数据在这一领域的应用价值主要是监测和预警。通过对环境指标跟踪和食品药品数据溯源,可以更好为居民生活和相关部门决策提供参考。
健康产业大数据主要与医疗健康产业发展相关。我国健康产业发展方兴未艾,通过发展各种健康服务新业态不仅能保障居民的健康需求,还能拉动内需、促进经济发展。对健康产业大数据的利用,可以为产业从业者提供更客观更全面的依据。
配套与管理大数据主要指为保障健康医疗发展的公共管理大数据。比如生物医学大数据的布局涉及许多科研机构、医疗机构和产业部门,需要建立跨部门的数据共享平台,而跨部门数据共享的实现需要良好机制的保障。
二、我国健康医疗大数据的发展现状
我国健康医疗大数据技术在短期内取得了较快的发展,以医疗信息化市场的统计数据为例,2009年至2017年我国医疗信息化市场规模增速保持在20%以上的较高水平。[9]健康医疗大数据目前的发展现状可以概括为战略先行、国家统筹、产学研协作、高效落地。文章将从战略规划、治理现状、研究现状、应用现状予以概述。
从战略规划历程来看,2015年可以被称为我国健康医疗大数据的“政策规划元年”。在2015年短时间内相关部门接连颁发以《全国医疗卫生服务体系规划纲要(2015-2020年)》等为代表的文件,强调大数据在促进医疗资源配置、提供医疗服务水平和保障居民健康方面的重要作用。之后相关部门又相继颁布推动大数据在医药卫生体制改革、中医药发展、人口健康信息等方面的具体应用规划。从规划框架看,我国目前健康医疗大数据的战略规划主要以《行动纲要》和《指导意见》为核心。通过这一系列的战略规划,我国已经确定了健康医疗大数据的基础性战略资源地位。[10]
从治理现状来看,国家卫健委内设规划发展与信息化司,指导卫生健康服务体系及信息化建设。2018年7月12日国家卫健委颁发《国家健康医疗大数据标准、安全和服务管理办法(试行)》,该办法指出由国家卫健委负责统筹规划和制定全国健康医疗大数据标准,由省级卫生健康行政部门(含省级中医药主管部门)负责监督指导评估本地区健康医疗大数据标准的应用工作。综合来看,目前我国健康医疗大数据主要由国家卫健委统筹,省级卫健委(含省中医药管理局)负责区域执行,形成了中央和省级两个层面联动的治理体系。
从研究现状来看,国家卫健委管理的国家一级学会——中国卫生信息与健康医疗大数据学会在医疗健康大数据部署工作中担任了重要的“智囊”工作;为充分发挥高校科研和人才培养的职能,目前已经在北京大学等高校成立了健康医疗大数据国家研究院;在推动研究和产业结合上,近几年通过联合科研机构和企业,共同建立了医疗大数据应用技术国家工程实验室、国家人口与健康科学数据共享平台、全国健康医疗大数据应用共享平台等,[10]避免了研究与应用对接的“脱节”,充分调动了产学研机构的共同参与。
从应用现状来看,我国健康医疗大数据目前的应用布局可以概括为“1+6+X”,也就是一个国家数据中心,六个区域数据中心,和若干个地方性的应用和发展中心。一个国家数据中心是指建立容纳全民健康数据的国家健康医疗大数据中心,这对于打破信息孤岛困境具有重要作用;六个区域数据中心是指福建、江苏、山东、安徽、贵州、宁夏六个国家健康医疗大数据中心与产业园建设国家试点;“X”个地方中心是指在一个国家数据中心和六个区域数据中心的影响下,各级地方建立当地的健康医疗大数据技术应用和发展中心。深度参与这一布局落地的主要是国家卫健委牵头成立的中国健康医疗大数据产业发展集团公司等三家国资公司。但要注意的是目前一个国家数据中心目标的实现的需继续加大投入,六个区域数据中心和X个地方中心也暂未达到理想效果,我国健康医疗大数据的布局依然在发展之路上。
三、“健康中国”背景下继续推动健康医疗大数据技术发展的意义
“健康中国”战略深化了我们对健康医疗大数据的认知和期待,健康医疗大数据的发展也是保障“健康中国”目标实现的重要工具。数字信息社会经济中,充分发挥健康医疗大数据的价值具有重要意义。概括而言,大力发展健康医疗大数据是实现“全民健康”的基础工程、主动发展健康医疗大数据是保障“数据安全”的重要前提、创新发展健康医疗大数据是启动“新基建”的有力保障。
(一)大力发展健康医疗大数据是实现“全民健康”的基础工程
对于“全民健康”目标的实现,《“健康中国2030”规划纲要》指出可以从健康生活、健康服务和健康保障等方面去落实。从健康医疗的产业结构来看这几个实现路径,健康生活的主体为健康医疗市场的需求方,即有健康诉求的公民个人;健康服务的主体为健康医疗市场的供应方,包括各种形式的医疗医药机构;健康保障的主体为健康医疗市场的支付方,在我国主要为医保机构。健康医疗大数据对实现健康医疗市场需求方、供应方和支付方的健康保障目标均有基础性作用。
在需求方的健康生活场景中,健康医疗大数据最直接的应用为参与对需求方健康行为的管理监测。世界卫生组织研究发现,在影响个人健康和寿命的四大因素中,生物学因素占15%、环境影响占17%、医疗服务占8%、行为与生活方式占60%。[11]2017年4月国家卫计委联合体育总局等部门制定了《全民健康生活方式行动方案(2017-2025年)》也是旨在通过倡导健康文明的生活方式为健康中国建设提供有力支撑。通过健康医疗大数据的应用,需求方改变了以往完全依赖医疗机构数据记录的局面,可以通过各种可穿戴设备和移动应用随时观测诸如体温、体脂、血糖、心率等基础健康数据,并通过数据在云端的上传与管理自行查找健康指标,参考健康医疗大数据给出的健康建议乃至预警。同时,通过对气象和环境污染等大数据的分析,居民个人可据此采取应对环境影响的健康措施,减少环境影响造成的健康威胁。同时,“互联网+医疗”应用过程中的诊疗大数据,可以为需求方的问诊决策提供更加全面的参考,在一定程度上促进了分级诊疗的实现。
在供应方的健康服务场景中,健康医疗大数据已在医院信息化管理、公共卫生监测以及医药安全流程溯源等方面验证了其基础性作用。上海市儿童医院总结的智慧医院5R模型较好体现了我国目前医院信息化的框架,5R系统的基础是医疗资源、诊疗信息和科研信息等方面的相关数据,这些系统的应用都离不开健康医疗大数据的采集、存储和分析等。[12]在公共卫生领域,疫苗质量管理和监测、传染病直报和预警系统、公共卫生信息公开等都不再只依靠人工记录和报送,大数据技术的应用让公共卫生职能的履行更加智能。我国目前已通过《中医药法》和《药品管理法》建立了药品追溯制度,大数据技术是药品追溯制度成功构建的关键,通过数据编码对药品流通进行监控,实现“来源可查、去向可追”。
在支付方的健康保障场景中,“智能医保”是大数据技术效用的直接体现。随着我国居民对健康需求愿望的提高,医保基金承载了全民的健康希望和压力。如何既保障健康目标,又实现医保基金的运营需要对医疗需求、医保支付和绩效评估等全流程进行有效监管。通过对不同区域、不同医疗机构、不同病种大数据的识别和分析,可以更客观的了解医疗需求,同时监测出如医保欺诈等异常数据;通过对医保支付环节的大数据监测,可以大幅降低人力资本的投入,避免人工失误,在设定的审计标准基础上迅速识别出违规支付行为,让事后审计逐步走向事前提醒和事中控制。《“健康中国2030”规划纲要》指出要通过全面实现医保智能监控,将医保对医疗机构的监管延伸到医务人员。通过对医务人员上传的数据进行比较分析,在多维数据验证的基础上,对医务人员的示警乃至考核亦成为可能。
(二)主动发展健康医疗大数据是保障“数据安全”的重要前提
信息时代的数据已经成为一国重要的战略资源,并且“对经济发展、社会治理、国家管理、人民生活都产生了重大影响。”以美国为代表的其他国家同样意识到数据的重要性,将大数据布局上升到国家战略。大数据的发展水平已经成为一国综合实力的重要衡量指标。
健康医疗大数据涉及国民隐私和健康信息,具有高度敏感性,属于具有国家安全战略级别的重要数据,但发展健康医疗大数据所存在的安全风险始终犹如悬在头上的达摩克利斯之剑。单从数据暴露的风险来看,根据IDC市场研究公司的预计,到2020年,全球42%的电子健康数据处于无保护状态。[13]
2020年2月,习近平总书记在中央全面深化改革委员会第十二次会议中指出,“要从保护人民健康、保障国家安全、维护国家长治久安的高度,把生物安全纳入国家安全体系。”生物安全涉及公共卫生、生物技术研发、人类遗传资源与生物资源,甚至包括防范生物武器和生物恐怖的威胁。这几个方面恰是大数据技术能发挥重要作用的场域,涉及这些方面大数据的泄漏、盗用和滥用等行为,将给国民健康乃至国家安全造成极大的负面影响。
没有国家安全何谈国民健康之保障,没有国民健康又何谈国家长远之发展。在数字经济时代,健康医疗大数据不仅是实现全民健康的重要技术手段,其本身也是具有重要国家安全价值的重要信息资源,具有多重战略属性。因此,不论从作为国家发展战略资源的角度,还是从生物安全体系构建的角度,健康医疗大数据都具有极其重要的国家安全战略地位。对健康医疗大数据的布局、建设、运营和发展,必须从国家层面采取主动姿态,自主构建具有主权控制力的国家健康医疗大数据保护网,以防御对我国健康医疗大数据领域的不法侵犯,保护我国公民健康,捍卫国家安全。“健康中国”背景下,采取主动姿态发展健康医疗大数据是保障全民健康和国家安全的重要前提。
(三)创新发展健康医疗大数据是启动“新基建”的有力保障
2020年5月22日,李克强总理在第十三届全国人民代表大会第三次会议《政府工作报告》中指出,要通过加强新型基础设施建设来扩大有效投资;在推动制造业升级和新兴产业发展上,要继续出台支持政策,全面推进“互联网+”,打造数字经济新优势。相比传统基础设施建设的代表“铁公机”,“新基建”主要是指以5G、数据中心、人工智能等为代表的数字化信息技术的开发与运用相关的基础设施建设,通过构建数字经济时代的关键基础设施,实现经济社会数字化转型。在对产业领域的贡献上,“新基建”强调对教育、医疗、社保等民生消费领域的升级[14],借此既扩大内需,又切实保障居民生活生平的提升。
在启动“新基建”的宏观指导下,健康医疗大数据的重要性进一步凸显。“新基建”不仅强调数据技术的基础性,也强调对以医疗为代表的民生问题的“攻关”。健康医疗大数据是深切符合“新基建”内涵的基础资源。当前我国健康医疗大数据中心的布局尚未完全构建,运营也尚不成熟,在实际运行中依然存在信息共享、人才短缺和数据安全等方面的挑战。在发展“新基建”的过程中,如果要实现健康医疗领域的数字化升级,首要任务就是提高健康医疗大数据的管理质量。
健康医疗领域的“新基建”是“健康中国”目标实现路径上新的战略思想成果。健康医疗大数据之于健康医疗领域的新基建就如水泥之于公路建设,如何让这场新基建联通四方、服务民生,需要进一步创新健康医疗大数据平台的构建,需要进一步创新健康医疗大数据技术的应用,需要进一步创新对健康医疗大数据的管理规定。
四、“健康中国”背景下发展健康医疗大数据技术的挑战
虽然我国健康医疗大数据的发展取得了一定的成绩,并为我国健康医疗体系的完善做出了一定的贡献,但我国目前的健康医疗现状距离“健康中国”目标的全面实现还有差距。就健康医疗大数据技术发展过程中所面临的困难而言,目前主要有专业人才短缺、技术推广障碍、数据共享困难、安全隐私保护四个方面的挑战。
(一)专业人才短缺
科技发展,人才先行。从健康医疗大数据技术所具有的高度专业性与广泛全面性并存等特征,可以推测健康医疗大数据领域的人才门槛之高。经过几年的快速发展,大数据的通用性或一般性技术在我国的人才市场并不是稀缺技能,但因于健康医疗领域的特殊性,如何确定健康医疗数据的采集范围、如何评价健康医疗数据的价值、如何兼顾伦理和隐私要求等一系列问题都需要依赖丰富的专业健康医疗经验和较高的伦理评价能力。一定程度上,目前我国健康医疗大数据发展现状与预想的差距主要在于缺乏人才。刘春富和陈红敏指出解决这一人才困局较好的方法是从目前专业医疗队伍中培养“半路出家”的健康医疗大数据人才。[15]这是一个解决短期问题值得借鉴的思路,从长期发展来看,在经济社会数据转型的阶段,健康医疗大数据作为健康医疗领域的必然发展趋势,对相关复合型人才的培养本就应该尽快被提上议程。
(二)技术推广障碍
我国健康医疗资源的分布存在地区差异较大的特点,这是导致健康医疗大数据难以全面推广的一个原因。对于医疗资源本就稀缺的中西部地区的基层医疗机构,在应对医疗需求之余已腾挪不出足够的人力和财力支持大数据技术的发展,对于这些医疗机构的信息化发展,更多要依靠从上至下的财政和技术支持。另一个影响技术推广的主要原因在于健康医疗大数据应用场景中因为隐私保护或数据共享所导致的困境。比如健康医疗大数据对数据粒度要求的矛盾,一方面因为法律或伦理对健康医疗大数据的涉密保护会加大某些数据的粒度,可另一方面健康医疗大数据的许多分析又对数据精确性提出了较高的要求,对于那些处于这种法律或伦理矛盾区域的大数据,很有可能成为即使收集上来却也无法使用的数据。再比如,许多智能诊断辅助所需要的大数据支持对数据来源有较高的全面性要求,但因为医疗检测结果和病历信息在信息化技术发展不足的医疗机构依然主要以半结构化或非结构化的形态存在,而这些信息化水平较低的医疗机构一般不会有将这些数据进行大数据技术处理的意识,这一部分数据就存在流失的情况。健康医疗大数据这些应用中的困境影响了数据在采集和分析步骤的质量,进而妨碍了健康医疗大数据价值的实现。
(三)数据共享困难
大数据分析首先以海量数据为基础,大数据价值的实现需以数据流通为前提。“健康中国”背景下的健康医疗大数据突破了以往医疗机构数据的局限,是跨及医疗健康、公共卫生和其他影响全民健康的领域。但在健康医疗大数据技术尚未实现全面推广应用的现状下,目前相关政府部门、医疗机构、商业主体等因为路径依赖、激励不足等原因均存在拒绝数据分享的情形,这进一步加剧了信息孤岛或信息烟囱的现象。[16]数据共享并不是指无条件的共享,可以共享的数据主要指按法律规定可以共享或经数据所有人同意共享且不因共享损害公共利益或其他公民合法权益的数据。以医疗机构为例,目前存在医疗机构内部各科室之间拒绝分享数据、医疗机构之间拒绝分享数据、医疗机构拒绝与其他机构分享数据的情形。对于这类拒绝数据共享的情形,并不适宜一味否定,而是应该分析医疗机构不愿意共享数据的原因。这些原因包括数据保护规定的不完善、相关主体对数据共享价值认识的欠缺以及习惯性的部门利益保护,这些原因导致相关主体对数据共享既没有动力也没有信任。与其指责相关主体拒绝共享数据,更应该从本质上着力解决数据保护立法等方面的问题,为数据共享提供更加安全可靠的环境。
(四)安全隐私保护
健康医疗大数据的安全涉及国家利益,健康医疗大数据的隐私信息事关公民权利。[17]如何既充分实现大数据价值又维护安全隐私,是大数据发展路途上至今没有明确解决的伦理和法律问题。在健康医疗领域,这个矛盾尤其显著。大数据技术实现的关键是数据的超级融合,但数据所有者的知情同意权在大数据技术的每个环节呈现复杂的法律保护状态,比如,对于患者为了诊疗在医疗机构如实告知的信息,医疗机构在未再次确认前可以做非直接服务于该患者的(包括公共卫生领域)大数据技术处理吗?再比如,穿戴式设备的广泛普及让许多科技机构收集了大量用户的健康信息数据,当科技机构为了产品升级使用这些数据时,是否应该经用户同意?对于个人,涉及健康医疗的数据一旦泄露极易对个人的生活带来困扰,甚至背上“污名”负担;对于机构,储存健康医疗数据的平台一旦被侵入、被篡改、被盗用等,不仅会导致信任危机,也会破坏机构本身的运营决策;对于国家,在未建立全球化的数据隐私安全保护体系前,健康医疗数据的泄露更是波及国家安全的负面事件。
五、“健康中国”背景下继续推动健康医疗大数据发展的建议
(一)人才体系新思路:何为健康医疗大数据人才?
健康医疗大数据人才区别于健康医疗人才和大数据人才。“健康中国”背景下的健康医疗大数据人才首先需要对健康医疗和公共卫生等领域有一定理解,其次才是掌握相应程度的大数据技术。在大数据人才培养方面,自教育部2016年2月16日在《2015年度普通高等学校本科专业备案和审批结果》中首次增加“数据科学与大数据技术专业”以来,我国高校已经培养了首批大数据人才,为相关产业提供了一定的智力支持。但目前我国大数据人才依然存在复合和高端人才紧缺的现状,并且在区域分配上呈现向东部沿海集中的不均分布。而在医疗人才培养方面,最明显的问题是人才体系的结构性问题:基层医疗机构医疗人才素质偏低,高端医疗人才又培养不足。虽然健康医疗大数据人才并不是简单的大数据人才和健康医疗人才的叠加,但大数据人才和医疗人才在目前培养体系中所反映出来的问题值得我们思考。
首先,对健康医疗大数据人才的培养目标要做结构区分,既要有基础性人才,也要有相当比例的中高端人才。对于基础性人才重点在于掌握健康医疗大数据的基本技术应用,保障我国健康医疗大数据国家布局的技术型人才供给。对该类人才的培养以实务问题的解决为教学导向,要增加学生的实践动手能力。对于中高端人才,在掌握基本的健康医疗大数据技术和理论的基础上,需要根据他们的职业导向进行区分。健康医疗大数据管理人才、风控人才、科研人才等职业在定位、知识和核心能力上均有所不同,对相应人才的培养体系也应有所不同。
其次,对于健康医疗大数据人才地域分配不均的问题需先正视人才需求地域分配不均的问题。比如以贵州为代表大力支持大数据人才培养的西部省份,在当地相应的市场环境并未对等形成的情形下,人才外流的情形难免会发生。在提供更多就业机会的前提下,再借助人才政策支持,人才在区域间供求不匹配的情况才有可能得到部分解决。
最后,除了新培育的人才,可以对既有的健康医疗人才和大数据人才通过再次教育、在职培训等方式帮助其转型成为健康医疗大数据人才。比如对医疗机构的信息化建设,可以在医疗机构的既有员工中以“自愿申请+单位遴选+委托培训”的方式进行健康医疗大数据人才培养;比如对既有的大数据人才,可以通过与医疗机构开展教学合作或科研合作的方式让大数据人才具有更深刻的行业认知。对既有人才资源的深度开发不仅降低了健康医疗大数据人才的培养成本,也大大缩短了培养周期,切合我国目前健康医疗大数据布局的人才需求。
(二)技术推广和共享新方案:“软硬兼施”
对于促进我国健康医疗大数据的应用发展,《指导意见》极具前瞻性地强调数据平台共建共享的重要性。但一方面受限于人才、资金、市场和标准的区域差异,目前许多区域的健康医疗数据尚未很好纳入进来;另一方面囿于利益保护、意识薄弱和规则缺力,尚未形成良好的数据共享氛围。对此,必须“软硬兼施”,同步采取多项措施,推动健康医疗大数据的全面应用和协同协作。
所谓“软措施”主要指非直接依赖于国家部门强力干预的措施。在促进健康医疗大数据技术推广和共享上,主要可以采取的“软措施”包括广泛宣传、财政支持与配套完善。之所以强调宣传的重要性,是因为许多健康医疗机构因为对大数据技术不够了解,所以没有动力参与大数据技术的推广和共享。这种不了解既有担心数据泄露的风险,也有对数据技术的怀疑。以国家卫健委为代表的部门可以通过自上而下的知识普及和宣传,消除相关机构对大数据技术应用的知识盲区和心理顾虑;在财政支持上,以我国医院信息化为例,目前80%以上医院的信息化需要依赖自有资金,且信息化的年投入在医院的总投入中占比仅为0.5%左右。而且因为信息化技术应用效果的反馈周期较长,对其投入多为一次性投入。[18]这就要求财政在健康医疗大技术的建设支持上需要更加积极更加持续,通过和参与部门充分沟通,了解资金需求并更精准地提供资金支持;健康医疗大数据的配套完善主要包括标准的统一和制度的支持。虽然我国目前已颁发以《国家健康医疗大数据标准、安全和服务管理办法(试行)》等为代表的规定,但在数据技术的执行应用中依然存在标准不统一的问题,数据依然无法跨平台对接,且许多细化规定依然尚未制定。这提示我们必须继续推进健康医疗大数据基础标准的统一并进一步完善相关配套支持规定。
所谓“硬措施”主要指相关参与部门的组织联动与执行。健康医疗大数据是一个跨及多个部门的大工程,要保障其切实落地需要可行的顶层设计,以及强有力的推进,在此基础上方能充分统筹资源,共建共享。或许受限于目前我国健康医疗大数据建设的阶段性特点,相关部门“各自为政”的情况依然有所发生,但在数据时代的背景下,各级政府部门有必要改善运行机制以提高治理能力,[19]文章认为可以探讨以国家卫健委等部门作为主要推动方,通过对参与部门进行绩效考核,以促进跨部门之间的共享合作。
(三)数据隐私安全新战略:防御下的前进
近几年其他国家加快对个人数据信息的立法保护,[20]考虑到数据信息对国家安全的战略意义,我国也加快了立法步骤。2020年5月28日经由全国人大通过的《中华人民共和国民法典》将个人信息保护上升到前所未有的高度,同时我国的《个人信息保护法》《数据安全法》也在立法规划之中,这既是对数字经济时代转型中出现的各类新问题的回应,也体现了国家对公民隐私和国家信息安全的高度重视。健康医疗大数据的建设必须坚持国家的安全、公民的人权;健康医疗大数据的发展始终应该以更好地服务于人民的健康为目标,以侵犯公民权利而获得的技术发展并不符合技术初衷。
对健康医疗大数据安全风险隐患的关注本质是对数据自主权的关切。即便在数据信息时代,我们关于自由的思考依旧适用——没有绝对的自由。绝对的数据自主权与健康医疗大数据的发展必然是矛盾的,绝对的数据自主权会导致数据收集、数据流通、数据分析等寸步难行,[21]大数据也因此没有价值空间。在“健康中国”背景下,对健康医疗大数据安全风险的防范可以采取“防御下前进”的发展战略,即在保护国家安全和公民权利的前提下推动健康医疗大数据的发展。这对权利保护提出了非常高的要求,也意味着要对数据时代呈现的复杂法律关系进行更全面的分析,逐步构建更全面的法律保护体系。
鉴于健康医疗大数据中安全隐私问题的复杂性,可以考虑在数据权利保障体系完善的过程中协同相关机构、行业组织和专家代表等共同组建独立的健康医疗大数据安全风险评价机构,对于涉及健康医疗大数据的安全和隐私纠纷出具专业意见,同时积累个案经验,为法律完善提供参考。
六、结语
“健康中国”战略提高了我国政策制定的要求,也深化了健康医疗大数据的内涵。“健康中国”背景下的健康医疗大数据突破了以往医疗专业机构诊疗数据的局限,覆盖了健康医疗、公共卫生和其他影响全民健康的领域。在数字经济社会转型的过程中,要充分认识到健康医疗大数据的战略资源定位,更要意识到其在实现“全民健康”“数据安全”和“新基建”目标中的重要作用。发展健康医疗大数据必然要面对诸如安全隐私保护的相关问题,但在采取相应防范措施的前提下,健康医疗大数据技术的发展给全民健康所带来的“利”要大于“弊”。如何在健康医疗大数据技术的发展过程中应对这些问题和挑战,是数字经济时代给我们提出的新考验,我们无法通过拒绝技术发展去回避这些问题,只能用更多的勇气和谨慎去应对挑战。