健康医疗大数据研究的公众参与及其模式探析*
2021-04-27弓孟春马永慧
陈 琪,弓孟春,马永慧**
(1 厦门大学医学院生命伦理中心,福建 厦门 361102,qichen0914@163.com;2 神州数码医疗科技股份有限公司,北京 100022)
目前,中国已步入健康医疗大数据时代。每分每秒都有大量新的与疾病、医疗和健康有关的信息在产生、流动和储存,等待或者正在被挖掘、分析和应用。中国作为世界人口大国,能够产生和分析的数据体量非常庞大,这为我国的健康医疗大数据研究提供了数据基础,但是同时也令数据使用者面临更加严峻的挑战。因为健康医疗大数据自身的一些特点,使其在应用的过程中存在着一些不容忽视的伦理问题,如个人信息安全问题、知情同意问题、人文关怀缺失问题[1]。如何应对这些挑战,是当前亟须解决的问题。健康大数据研究作为新兴的科学技术,其发展迫切需要公众贡献自身健康数据,而公众对其缺乏了解和认识,科学家往往不会对公众解释研究的原理和机制以及风险;加之近年来,公众对新兴技术可能造成的环境和健康伤害愈发担忧,导致公众对科学家和政府的信任度下降,对这一技术的理解和治理,显然不能沿用过去科学家教育公众这一单向的模式。于是各界开始反思科技与社会、科技与公众之间的关系定位,试图寻求解决之道。借鉴国外纳入公众参与决策的先例来看,纳入公众的观点显得尤为必要,公众作为新技术应用的受益者,有责任参与到健康医疗大数据的研究当中去,了解什么是健康医疗大数据,它可能的应用领域,以及它将产生什么样的作用。同时,公众又是新技术应用不良后果的承担者,有知情的权利,也有参与科技决策的权利。形成科学决策的公众参与模式已是必然之势,本文试图探讨健康医疗大数据研究中公众参与的形式、程度和意义,以及中国健康医疗大数据发展现状下公众参与的模式。
1 健康医疗大数据研究现状及应用领域
1.1 健康医疗大数据概念及其特征
健康医疗大数据(healthcare big data)是随着近几年数字化浪潮和信息现代化而出现的新名词,是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的健康数据的集合[2],是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长和多样化的信息资产[3]。也有学者提出,健康医疗大数据是指无法在较快的时间内用传统的方法处理的庞大、复杂的生命与健康数据集[4]。健康医疗大数据涵盖人的全生命周期,既包括个人健康数据,也有涉及医药服务、疾病防控、健康保障和食品安全、养生保健等多方面数据的汇聚与聚合[5]。健康医疗大数据具有4V特征,即数据规模大(volume)、数据种类多(variety)、增长速度快(velocity)、数据价值高(value)[6-7]。有学者提出,健康医疗大数据可分为医院医疗大数据、区域卫生服务平台医疗健康大数据、疾病监测大数据、自我量化大数据、网络大数据和生物大数据六类[1,8]。医疗大数据将在临床辅助决策、医疗质量监管、疾病预测模型、临床试验分析、个性化治疗等医疗服务领域发挥巨大作用。
1.2 健康医疗大数据研究现状和应用领域
自人类基因组计划启动至今,以美国国家人类基因组研究所(NHGRI)为代表的组织机构展开了层出不穷的生命与健康领域的大型测序项目,如欧洲的维康信托基金(the Wellcome Trust)资助了千人基因组计划(1000-Genome Project),为推动美国精准医学计划(PMI),美国国立卫生研究院(NIH)提出“All of Us Research Program”(我们所有人研究计划),以加速精准医学研究、改善健康状况,进一步深化精准医学[9]。发达国家的政府很早就已经注意到生命与健康医疗大数据的收集和分析,意识到了其重要性,不断为项目投入大量资金,美国国会每年拨付给美国国家生物技术信息中心(NCBI)的经费从1990年的507.3万美元增长到2014年的最高值583.3万美元。同时,欧洲建立了生物信息学研究所(EBI),日本也建立了DNA数据库(DDBJ)等机构,国外已经逐步形成了完整的生命与健康数据中心布局。
我国大数据领域近期也有长足的发展。目前,我国国内各种类型的健康医疗大数据中心也相继建成,具有代表性的有:国家基因库(深圳)、上海生物医学大数据中心、微生物资源与大数据中心、国家人口与健康科学数据共享服务平台、全国公安机关DNA数据库、北京基因组研究所生命与健康医疗大数据中心等[4, 10]。
目前,健康医疗大数据已经被越来越广泛地应用在临床医疗、健康管理、公共卫生等领域,为公众和医疗从业人员提供了很多便利。应用主要涉及以下几个方面:①用于医疗健康医疗大数据分析方法研究;②用于智能健康管理;③用于医疗服务;④用于疾病控制与应急管理;⑤用于卫生综合管理;⑥用于医疗保障监管;⑦用于精准医疗与医药研发等[10]。
2 大数据在医疗健康领域的风险特征
在现代诊疗技术和信息技术支持的条件下,健康医疗大数据资源已经成为患者、医院、政府等机构组织争相抢占的资源和关注的重心。随着大数据的应用愈加广泛,医疗大数据潜在的价值被更多的人发掘,目前医疗机构和科研机构使用医疗数据进行研究分析需求不断增加;但是,鉴于健康医疗大数据的风险特征,不免引发对其应用的一些担忧。
英国牛津大学的Mittelstadt和Florid通过文献分析归纳出健康医疗大数据研究的五个重点关注领域:①知情同意;②隐私保护;③所有权;④认识论与客观性;⑤大数据鸿沟[11]。我国也有学者指出,正是医疗大数据自身的特点,给其应用带来一些伦理问题,包括但不限于:①信息安全与个人隐私问题;②知情同意与个人自主性问题;③风险与收益的评估问题;④医疗大数据建设面临的思维挑战[12];⑤资源分配的公正性等问题[13]。我们结合以上关注点对健康医疗大数据的风险特征作进一步讨论分析。
首先,健康医疗大数据具有数据集成的广泛性[1]。由于数据体量极大且价值高,不法之徒试图窃取信息的可能增加,保护信息安全和隐私的难度大大提升,个人和群体都存在信息泄露、隐私被侵犯的风险。在个人层面上,一方面,在收集、储存、使用、传输或去其他数据库串接时,尽管强调了用加密、匿名化等技术“去识别化”(de-identification),但有学者提出,即使大型数据库使用了“去识别化技术”,仍存在用户身份可被利用剩余信息(如性别、年龄、种族、职业、医疗记录等)重新识别的可能[14],个人身份可以通过数据连接技术操作而重新确定[15];另一方面,由于数据长期储存在云端,信息泄露的风险是长期性的,且由于储存的长期性,物联网传输个人数据时,可能跨越自然、社会、时间和空间的隐私边界。在群体层面上,生物样本库和数据库提供大规模人口群体为基础的信息特征,导致数据库的集成使用带来的影响不再局限于参与者个体,若研究人员通过数据分析发现某个地区的人口具有某种严重疾病的高患病率,将可能造成其他群体对该地区人的歧视,如就业歧视。即便信息应通过加密或“去识别”,无法识别出特定个人,但通过集成不同种类的数据库,如癌症、死因、地理信息、处方信息,仍然可以识别出某一类型的公众,冲击到家庭、种族、地域层面[16]。
其次,健康医疗大数据具有敏感性、隐私性。数据记录与集成揭露出个人的偏好与隐私,设备可能产生一些隐性数据,个人对于自身信息的知情权与信息公开与否的权利愈趋薄弱[17],具体表现为:用户经常无法掌握哪些机构拥有自己的数据、拥有哪些数据、提交和储存的数据是否可以更正或删除、数据是否会被转移给第三方、转交给第三方又有何种用途等。如要实现用户的知情同意,让用户能行使所有权,又需要花费大量的时间和金钱成本。
最后,健康医疗大数据具有数据增幅大的特性,因此带来了数据挖掘和管理困难的问题。斯坦福大学Trevor Hastie教授用“‘在一堆稻草里面找一根针’来比喻大数据时代的数据挖掘,问题是很多稻草长得像针一样,‘如何找到一根针’是现在数据挖掘问题上面临的最大问题,海量数据带来显著性检验的问题,将使我们很难找到真正的关联[18]。”维克托·迈尔-舍恩伯格在其著作《大数据的时代》中也指出这一点,“数据量的大幅增加会造成结果不准确,一些错误的数据会混进数据库[19]。”这意味着从开发到应用需要很长的时间成本,提供数据的人或许不能从该研究中受益,这对数据提供者来说合理吗?而研究成果对他们后代的适用性处于未知状态,再加上错误数据的混入,其研究成果的有效性仍需检验。美国在全国范围内推行电子健康档案,对全国个人敏感信息的长期监测与管理,引发了学者的一些担忧:哪些机构或个人有权从中读取数据进行整理和分析?哪些机构或个人有权获得电子病历系统(EHR)的数据?当不同机构在争夺数据的获取或处理权利时,谁有权从中裁决?有学者认为,巨大体量的数据共享与挖掘是导致伦理问题的技术原因,可能导致主体身份数据化的社会性后果[20]。Wartenberg等[21]认为,美国联邦政府、州对人口数据的愈发严格的访问政策和监管,已经对公众健康研究产生了不良影响。以上现实担忧给我国健康医疗大数据管理以警示,在此种形势下,健康医疗大数据的监督和管理极为迫切。
3 公众参与健康医疗大数据研究的必要性
以上伦理问题体现了各方利益相关群体在伦理、人权、社会价值与利益上的冲突,如何调节并形成数据收集运用的共识,成为大数据科技未来发展的关键。2015年英国生命伦理研究机构纳菲尔德生命伦理委员会(Nuffield Council on Bioethics)于大数据在健康与医疗领域的研究报告中,也提出将“公众参与原则”作为数据治理活动的核心要求[22]。报告强调:①大数据在健康医疗领域的应用发展,往往面临多元价值的冲突,有必要建构隐私标准的社会规范;②建议治理机构应针对数据治理的愿景,包括数据收集、使用规范、个人价值与利益、“公共利益”厘清、保护隐私利益采取何种措施等,通过公众与利益相关者进行审议讨论;③权威机构应重视利益相关者所关注的问题,在决策过程中,让社会中不同的偏好与利益表达出来,公平的呈现损益利弊;④透过公共参与、审慎思辨的过程,界定出相关隐私规范与治理措施,有助于强化社会信任与合作的关系。
所谓公众参与是指参与或介入政策过程和决策制定的角色不只是通常的业内专家、政策分析师和决策者,还包括更广泛的社会角色,包括非营利组织、地方社区、利益群体的代表以及有能力参与的市民[23]。对于科学技术领域来说,公众一般指传统的科学技术决策主要角色 (政府机构、 大学研究所和企业 )之外的个人和社会组织[24]。对患者而言,健全可靠的数据保护制度和透明的信息实际上可能比积极参与数据收集的前景更重要,所以践行公众参与的基础是相关机构能够保证数据的安全性,数据提供者有权随时退出研究,以及在研究的全过程中保持信息公开、透明[25]。
健康医疗大数据研究是因为科技发展而出现的具有争议性的新议题,其争议性来源并非纯然的技术问题,还依赖特定的社会文化情境,不能仅仅靠科学共同体来面对和解决争议所引发的问题[26]。在治理的架构中,不仅要纳入专家的意见,公众观点也应得到关注与重视。公众参与健康医疗大数据研究是必然之势,之所以这么说,有几方面的原因。
首先,就健康医疗大数据本身而言,它属于大数据研究的一种,但是公众参与健康医疗大数据研究的必要性更为显著,原因是:和其他大数据相比,健康医疗大数据涵盖人的全生命周期,既包括个人健康,又涉及医药服务、疾病防控、健康保障和食品安全、养生保健等多方面数据的汇聚和聚合,其研究成果和人类生命息息相关,身体健康是人能够实现一切其他功能和目标的基础,故以促进全民健康为目的的健康医疗大数据研究需要公众参与决策。
其次,精英治理模式存在缺陷。传统科技决策模式多以专家为主导,公众的角色被视为缺乏相关知识与信息,无法理解复杂的科技政策,因此,在决策上排除了一般公众参与的可能。其背后的治理逻辑是:一方面,当社会公众对科技产生疑虑与不信任时,回应侧重厘清公众误解,并重申科技带来的利益与安全性;另一方面,公众疑虑的问题之所以会发生,来自极少数科学家或信息的使用者伦理道德缺乏。他们认为科学家们倘若能恪守医学研究或应用的伦理原则,相关风险和问题将迎刃而解。然而,专家与公众之间的分歧经常难以化解,许多环境、科技与健康政策的争议,甚至演变成为大规模的社会抗争事件,持续挑战精英决策模式,有些时候,公众与专家学者产生矛盾,还会互相污名化。这些现象成因复杂,具体说来,第一,科技治理长期高度仰赖科技专家的评估和判断,但专家之间也存在分歧的风险架构见解,许多领域都存在知识的不确定性或未知状态,限制了风险评估的准确性。第二,科技争议并非纯粹涉及科学事实问题,往往牵涉到社会、政治或伦理等复杂的风险特质,仅靠专家和政府官员很难考虑全面。第三,不同行动者对科技的风险认知有相当差异,纳入不同的利益相关方有助于综合考虑风险,由科学家教育公众来理解科学的模式,越来越难以适应公众对新兴技术可能造成的环境和健康伤害的担忧。第四,在面对争议性科技议题时,公众对科技、政府、专家的信任逐渐在经济全球化的发展框架下腐蚀[27],以往的精英决策模式难以服众,公众对风险衡量有自己的标准,他们会在社会关系导向的背景下认识风险,用一般日常生活的认知框架去理解风险问题,为了应对复杂性争议中的风险和不确定性,公众作为庞大的利益相关群体参与其中的必要性愈加凸显。
再次,科学技术的应用单靠科学知识不够,还需要结合其他“本土性知识”。科学技术越来越多地为解决实际政策问题提供依据,这些问题常常与地方的自然条件以及社会、经济、政治等因素联系在一起。公众的参与有诸多益处,第一,公众参与可以提升风险评估对所在地社会文化的敏感度[28];第二,公众也可以是生产知识的主体,而非只是知识的被动学习者,公众作为地方性知识拥有者,可以弥补专家知识的不足[29]。
最后,公众参与是民主进程实践的重要标志,公众参与国家或社会政治、经济、文化生活的程度,彰显着一个国家或社会民主推进的程度。不仅是科技决策,在风险界定、评估、风险管理与损害管控等阶段中,也应该强化信息透明与开诚布公,并且尽可能思考纳入研究所在地公众以及多元利益相关者的参与,寻求具有社会强韧性(social robust)的治理知识与共识[30],以解决公共争论中的歧视与恐慌。公众参与科学技术决策自20世纪90年代以来成为世界许多国家的发展趋势,建立一种新型的政府-公众-科学之间的和谐关系对现状改善是可取之道。
但是在健康医疗大数据研究中引入公众参与目前仍存在一些困难,诸如公众参与健康医疗大数据决策的能力不足、公众参与健康医疗大数据决策的影响力不够、公众参与健康医疗大数据决策的制度保障不完善等。明确了这些问题,我们就需要在制定公众参与模型时将缓解上述问题的方法融入进去。
4 公众参与的模式
公共参与有程度上的不同,形式可以包括:①相关规则制定者和管理者向公众提供信息;②政府通过问卷或焦点小组等方式向公众征询意见;③公众代表积极参与决策过程。在这几种方式中,公众参与的程度由低到高,对决策的影响也不断增强。在西方发达国家,已发展出各种形式的公众参与,普遍包括政府、公众和科学界三者之间的互动,分为提升公众参与意识、咨询、赋权三大类[31]。例如,共识会议(consensus conference)、 社区为基础的研究(community-based research,CBR)、情景研讨班 (scenario workshops)和审议民主(deliberative democracy)等, 这些方式也逐渐被越来越多的国家采纳,用于城市规划、环境建设和政治活动。
自公众参与理念传入中国,迅速被各界吸纳回应,在城市规划管理、生态建设、基层民主、政府事务、政策法律规定、社会治理等广泛的领域加以运用。具体到健康医疗大数据研究的公众参与实践中,考虑到健康医疗大数据研究获得的数据连续性和其成果带来的影响的持续性,连续型的公众参与应当是最为合适的。公众参与的途径包括以下几种:
图1 公众参与的模式分类
①公开征询。公开征询的方式一般有信息公开和问卷调查,进行该种参与方式的目的是获取足够的反馈信息。该方式的弊端是可能无法获得足够的信息,或者获得的信息太多导致信息整理的时间成本过高,但是该采集方式成本低,而且广泛的征询将健康医疗大数据的信息充分传播给公众,帮助项目方识别了利益相关群体,为深化公众参与提供了基础。我国在行政领域早已引入此法,一般通过网络和新闻媒体公布试行条例或在官网,如2020年2月司法部公布了《外国人永久居留管理条例(征求意见稿)》,同时,提供了电子邮件、信函、官网意见征集栏三种途径发表公民意见,健康医疗大数据的信息公开可以仿效此例。此种类型适用于对公众参与程度要求较低的研究项目,如电子处方、电子病历、电子健康档案等。
②定向征询。定向征询通常以座谈会的形式进行,座谈会的议题是确定的,通过座谈会获得的信息多为定向信息,有助于研究项目的利益攸关方增加对健康医疗大数据研究的决策的认可度,与公开征询共同使用更具效用。英国国家健康研究所(NIHR)专门成立了国家级公众参与中心和咨询小组(INVOLVE),在研究的各个阶段帮助确保患者与公众的有效参与,过去20年里,在提高公众参与意识,认识公众参与的重要性和提高公众参与质量方面,INVOLVE一直处于世界领先地位,是世界上同类计划中为数不多的几个之一,也是其中持续时间最长的。对健康医疗大数据研究而言,该形式适用于特定人群的意见对研究项目有效性有决定性作用的研究,如康复辅助器械、可穿戴设备和智能电子健康产品的研究。
③公开听证会。听证会起源于英美,听证会模拟司法审判,由意见相反的双方互相辩论,其结果通常对最后的处理有拘束力。目前,我国在行政程序和立法过程中引入了听证制度,健康医疗大数据的公开听证会可以将研究项目的利益相关者聚集起来进行辩论和谈话,让各方充分阐述自己的意愿和诉求,研究项目的决策者可以据此调整研究方案,其益处在于可以协调各方利益,提升研究项目的有效性,困难之处在于寻找和筛选合适的听证陈述人,决策成本较高。该形式更适合公众参与度较高,且研究项目经费充足的研究,如用于医疗的人工智能机器人、3D打印技术等。
④公民共识会议。共识会议是指:先提供易懂与客观的信息背景,让公众对相关政策议题发展有清晰的理解;同时,期待立场不同,观点不同的参与者,在平等参与的前提下,针对该公共议题进行理性、知情的对话讨论,并在聆听对话的过程中,促成澄清修正,甚至带动立场和态度的转化,形成共识的可能。共识会议有助于参会的人群达成对健康医疗大数据的认知一致性,为构建有效的健康医疗大数据研究项目提供路径;但是我国是一个人口大国,此外,我国各民族大聚居、相到小散居、交错居住的分布特点以及各民族间、各地区间的风俗文化差异,这些可能导致区域性的共识会议成果可能无法在全国范围内适用。该类型主要作为听证会的铺垫,便于公民对未知或认识不深的领域有一定的了解。
公众参与健康医疗大数据研究,为公众参与科技议题与公共事务提供了机会,带动公众关心健康医疗大数据研究的意愿、能力和共识,让不同社群、多元立场的专家与公众对话,提供各方相互理解与学习的机会,达到双向互动的社会沟通效果。多种形式的公众参与,吸纳了不同人群的意见和建议,不仅能提升政策的正当性,还可以强化治理的公共信任对于公共争议形成更好的判断与政策方案。
5 国情背景下的健康医疗大数据研究公众参与
我国健康医疗大数据资源丰富,科学技术的研究和发展为健康医疗大数据研究奠定了基础,为提升健康医疗服务效率和质量,扩大资源供给,不断满足人民群众多层次、多样化的健康需求。2016年6月24日国务院办公厅发布了《关于促进和规范健康医疗大数据应用发展的指导意见》,国内各项医疗健康大数据应用更如新笋般生产和发展。但是我国目前的健康医疗大数据研究缺乏公众参与,治理相对薄弱,相关的法律法规和操作细则尚不完善。而人民当家作主是社会主义民主政治的本质和核心,新时代的人民民主,将公众观点和诉求内涵到科技发展应用的过程中,更合乎社会主义制度的要求。中国社会的多元化、互联网和社交媒体的普及赋予了公众发言权,即便在科学议题上,公民也表现了极强的民主参与的愿望,这种愿望会因为热点事件在微博上迅速引爆舆论,诉诸网络的情绪化表达并非是有效的公众参与,不过以这种方式表达了公众参与科技议题的诉求,使得各种形式的公众参与科技活动成为中国科技治理和科学传播活动的必然选择。
但现实情况是,科学共同体的网络参与度相当低,网友对科学的质疑往往与其对政府管理的不满和对传统权力的颠覆有关。中国科学家长期以来缺乏与媒体和公众交流的意识和能力。微博及其他新媒体所带来的公众对科学问题的直接质询,更是给中国科学界和科学传播界增加了压力。在这种情况下,只有结合中国国情,坚持对公众参与科学模型的实践与探索,开展包括在线参与健康医疗大数据相关知识讨论等多种形式的公民参与活动,让科学家及政府科技部门就热点科技与公众平等交流,让公众充分表达自己的关切并通过共识会议和听证会等使公众的价值诉求能反映到健康大数据的研究和治理中,我们才有可能确保公众广泛支持健康医疗大数据发展。