论健康数据科学研究合法性基础的证成与适用

2025-01-03姚旭鑫

科技与法律 2025年1期

摘" " 要：现有的个人信息处理合法性基础框架难以满足健康数据科学研究的需要。将科学研究作为健康数据处理的合法性基础，是国家促进、实现科学研究自由和健康权的要求，并可通过对“公共利益”的解释得到证成。科学研究主体应当隶属于以科学研究为主要目的范围的组织机构。科学研究不排斥商业目的，但商业程度的不同，决定了研究主体是否需要向数据主体付酬。科学研究主体对健康数据的访问需要依托健康数据协调机构加以实现。在适用科学研究这一合法性基础对健康数据进行处理时，应将对数据主体的影响控制在最小范围。原则上对健康数据去标识化，对科学研究有重要意义的标识符可依申请予以保留。标识符的保留和健康数据科学研究的黑箱属性，决定了要对健康数据科学研究课以更高标准的公开透明要求。同时相关规则具有较大自由裁量空间，自由裁量应以风险收益平衡原则为基本遵循。科学研究和其他合法性基础可能存在重合或冲突，只有在数据主体未明示反对的前提下，才可适用科学研究这一合法性基础。当科学研究与其他法定数据处理情形相重合时，科学研究作为特别情形，应优先于一般情形的适用。

关键词：健康数据；科学研究；合法性基础；适用规则

中图分类号：D 912" " " " " 文献标志码：A" " 文章编号：2096-9783（2025）01⁃0057⁃11

健康数据用途广泛，可用于科学研究、公共卫生、商业运营等众多领域。当前健康数据在科学研究领域的流通利用面临获取困难、联通不畅、共享不易的困局。出于隐私保护、商业秘密保护等因素的考量，数据主体对自身健康数据的开放共享抱有顾虑，医院等数据持有者也对其持有的健康数据人为设置壁垒。在法律层面，健康数据的科学研究同样面临障碍。科学研究难以通过法律解释被纳入《中华人民共和国个人信息保护法》（以下简称《个人信息保护法》）第十三条规定的个人信息处理的合法性基础当中。诚然，现有的合法性基础框架为健康数据的科学研究提供了一定可能。根据《个人信息保护法》第十三条第一款、第二十九条之规定，在征得数据主体单独同意的前提下，可对敏感个人信息进行处理。然而健康数据科学研究的固有特征给知情同意带来了挑战：健康数据之间存在关联，导致个体同意与群体共识的冲突；科学研究具有不确定性，导致具体同意难以实现；科学研究持续时间较长且具体研究内容可能发生改变，极大增加了同意成本。此外，为履行法定职责、应对突发公共卫生事件或在公开的合理范围内等情形下，可对健康数据进行处理。但科学研究场景广泛，现有的合法性基础难以全面、适当地为出于科学研究目的对健康数据收集、存储、使用提供正当性依据，不适应健康数据科学研究的现实需要。虽然去识别化的数据可排除《个人信息保护法》的适用，但科学研究需要保留必要的识别特征，去识别化规则也难以为健康数据科学研究提供足够助力。

健康数据具有高度敏感性，对健康数据的访问和处理应该审慎为之。欧盟《通用数据保护条例》（GDPR）第9条原则上禁止对健康数据（data concerning health）进行处理，但在特定情形下不受此限。第2款第（j）项将“科学研究目的”（scientific research purposes）作为健康数据处理的合法性基础。这一规定有利于促进健康数据的流通利用，提升科学研究效率和质量，我国或可予以借鉴。但问题在于：将科学研究作为健康数据处理合法性基础的法理依据何在？健康数据科学研究应以什么样的规则展开？科学研究主体在处理健康数据时应受到怎样的限制？

一、科学研究作为健康数据处理合法性基础的证成

健康数据兼具私益性和公益性，在制定健康数据的治理规则时，不仅要保护数据主体的权益，还要充分发挥健康数据的社会价值。科学进步和健康促进是社会价值的重要维度，科学研究自由和健康权是公民的基本人权，国家对人权负有实现和促进义务。可通过法律解释将“科学研究”目的解释为“公共利益”的目的，在我国现行法律框架下对科学研究作为健康数据处理的合法性基础加以证成。健康数据科学研究有利于推动健康领域的科学研究，有利于促进和实现人民健康。应将科学研究作为健康数据处理的合法性基础，从制度层面打破健康数据科学研究的壁垒，切实保障公民的科学研究自由和健康权。

（一）数据处理者享有科学研究自由

公民享有科学研究自由。学界对于科学研究自由的具体意涵存在争议。单一权利属性说认为，科学研究自由是“消极人权”，国家不得肆意干涉公民的科学研究行为[1]。双重权利属性说认为，科学研究除防御属性外还有着积极的面向，即国家需要提供相应的物质、制度保障，积极帮助公民实现科学研究自由[2]。人权的生成和保障是随着社会经济文化条件的发展而变化的，对科学研究自由内涵的探讨必须是历史的、实践的，要以人权的普遍价值为基础，结合大数据的时代背景进行诠释。

人类对医学的探索，经历了从直觉猜想到基于实验的实验医学模式，到依赖经验的生物医学模式，再到通过整合证据和经验的循证医学模式，并在大数据时代演变为基于数据科学和显著确定性实践的系统医学模式、精准医学模式[3]。健康数据具有关联性和整体性，研究者自身持有的健康数据是有限的、狭隘的，欲全面、客观地认识研究对象，需要海量数据的支持，数据资源只有在广泛共享过程中，才能最大程度地接近真理[4]。个体孤立地开展科学研究不适应大数据时代的需要，健康数据科学研究需要不同主体之间的协作。科学研究自由不能仅凭借研究人员作用于客观世界的“主体性逻辑”加以实现，更有赖于研究人员与国家、社会多维度对话和互动的“主体间性逻辑”[5]。《中华人民共和国宪法》（以下简称《宪法》）第四十七条规定，国家鼓励和帮助公民进行科学研究。《中华人民共和国科学技术进步法》（以下简称《科技进步法》）、《中华人民共和国促进科技成果转化法》（以下简称《科技成果转化法》）等法律中也体现了国家对科学研究提供帮助的义务。因此，立足于时代背景和我国现行法律，认定科学研究自由具有双重属性更为妥当，国家对科学研究自由负有积极促进和实现义务。

然而现实中，健康数据并未充分开放共享，难以发挥出规模效应在健康数据科学研究中的优势。健康数据持有者常常将健康数据封锁于机构内部，形成“健康数据孤岛”甚至“健康数据垄断”，研究主体难以从第三方获取健康数据，使得海量的健康数据难以有效发挥对科学研究促进之效能。科学研究自由不是空洞的自由，科学研究的开展需要以原材料为基础。健康数据之于健康领域科学研究的作用，类似于反垄断法意义上的“必需设施”[6]。健康数据访问、流通的不足阻碍了健康数据科学研究的开展与进步，国家有义务对上述困境予以纾解。健康数据开放难、流通难本质上是制度问题，只有在制度层面合理配置健康数据处理规则，才能从源头上破除这一障碍。“十四五”规划要求“整合优化科技资源配置，促进资源要素顺畅流动，破除制约要素合理流动的堵点；充分发挥海量数据和丰富应用场景优势，统筹数据开发利用，赋能传统产业转型升级”。将科学研究作为健康数据处理的合法性基础，是国家积极履行对科学研究自由促进义务的应有之义，符合我国相关法律以及科技战略的总体要求和价值取向。

（二）国家对健康权负有实现和促进义务

科学研究的理想状态是价值无涉，但实际上科学研究并不具有中立性，而是在价值理性的引导和匡正下展开。科学研究不只是改造自然的一种选择，更多的是一种制度安排[7]。 “真善美”是科学研究所追求的目标，“善”是科学研究的“底线要求”，科学研究必须确保道德无害和道德完善，不能给人类自身及其社会文明带来伤害。《世界医学协会赫尔辛基宣言》指出：“在进行研究的人群有合理的可能从研究结果中受益的情况下，医学研究才是正当的。”健康对于个人和社会而言均具有重要意义，2000年联合国经济、社会和文化权利委员会通过的《享有能达到的最高健康标准的第 14 号一般性意见》（下文简称《第14号一般性意见》）将健康权界定为基本人权，旨在促进健康的科学研究，目的具有正当性、合理性。

“健康”并不是一个价值中立的概念，而是蕴含着特定时期、特定社会的价值判断[8]。纵观“健康”概念的演变历史，健康的内涵不断丰富，从一维的身体健康演变为“体格、精神与社会之完全健康状态”。社会适应健康强调人的健康最终要依靠社会来实现。同时，健康权的要求也随之转变，从单纯的健康防御权拓展到健康受益权[9]。根据《宪法》第二十一条、第三十三条的规定，国家尊重和保障人权，并负有发展医疗卫生事业、保护人民健康的义务。健康权不仅体现为主观权利，更呈现一种客观价值秩序的面向[10]。国家对健康权的义务亦需从消极义务转向积极义务，从不得侵害公民健康转向积极采取措施促进公民健康，国家要尽可能为公民提供健康制度保障。《第14号一般性意见》规定“享有健康权应当被理解为一项享有实现能够达到最高健康标准所必须的各种设施、商品、服务和条件的权利”，并明确了国家的促进医务研究（medical research）义务。《中华人民共和国基本医疗卫生与健康促进法》第四条、第八条也强调了国家要为人民健康服务，推动医学研究的发展，促进医学科技成果的转化和应用。

健康数据的应用为医疗服务和健康产业发展带来了新的契机，健康数据科学研究有助于提高全社会的健康权实现能力[11]。首先，健康数据科学研究可以拓展科学研究的领域。数字建模使得研究人员得以尝试现实领域中难以开展的相关研究。如有研究团队根据采集到的受试者腰椎骨骼的数据，构建形状性能综合数字孪生体，研究不同人体姿势下真实腰椎的生物力学特性。其次，健康数据科学研究可以从真实医疗环境中选取海量数据，根据患者的实际病情和意愿而非随机选择开展治疗，并对相关干预措施进行长期评价，样本更加全面合理[12]。最后，健康数据科学研究可以提升医疗服务的个性化程度和精确程度，迈向精准医疗。

然而现实中健康数据未能得到充分利用，健康数据的科学研究价值未能充分发挥。当前健康数据开放利用困境的根源在于制度障碍，现有的个人信息处理合法性基础难以为健康数据科学研究的开展提供足够的支持。当数据主体、数据处理者等主体之间难以就健康数据的科学研究利用问题达成共识，则需要国家的介入以实现数据主体、数据处理者、研究者等主体之间的协调。将科学研究作为健康数据研究的合法性基础，有利于促进健康数据在科学研究场景的流通利用，是国家履行实现和促进健康权义务的重要举措和必然要求。

（三）科学研究系维护公共利益的个人信息处理行为

《中华人民共和国民法典》（以下简称《民法典》）第一千零三十六条第三款规定，行为人为维护公共利益或者该自然人合法权益，合理实施的个人信息处理行为，不承担民事责任。能否将科学研究纳入本款规定之公共利益，需要对个人信息保护相关法律中的公共利益进行解释。

首先，对“公共利益”进行文义解释。《民法典》《个人信息保护法》等相关法律中，对公共利益的内涵和外延没有明确界定。实际上，“公共”和“利益”的概念均具有不确定性，也难以从规范层面给出明确定义，需要依靠不同场景进行价值判断。

其次，对“公共利益”进行体系解释。根据《个人信息保护法》第十三条第四款规定，“为应对突发公共卫生事件，或者紧急情况下为保护自然人的生命健康和财产安全所必需”，个人信息处理者可对个人信息进行处理。本款表明立法者对“公共卫生”和“健康”利益在个人信息处理中的地位持肯定态度。此外，《最高人民法院关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》第十二条规定“网络用户或者网络服务提供者利用网络公开自然人基因信息、病历资料、健康检查资料、犯罪记录、家庭住址、私人活动等个人隐私和其他个人信息，造成他人损害，被侵权人请求其承担侵权责任的，人民法院应予支持。但下列情形除外……（三）学校、科研机构等基于公共利益为学术研究或者统计的目的，经自然人书面同意，且公开的方式不足以识别特定自然人……”《信息安全技术个人信息安全规范》5.6中明确“个人信息控制者为学术研究机构，出于公共利益开展统计或学术研究所必要，且其对外提供学术研究或描述的结果时，对结果中所包含的个人信息进行去标识化处理的”，个人信息控制者收集、使用个人信息不必征得个人信息主体的授权同意。尽管《信息安全技术个人信息安全规范》系国家标准而非法律，但也在一定程度上凝聚了个人信息领域的行业共识，具有参考价值。故根据体系解释，可以将科学研究纳入公共利益的范畴当中。

再次，对“公共利益”进行目的解释。《个人信息保护法》第一条揭示了立法目的——“保护个人信息权益，规范个人信息处理活动，促进个人信息合理利用”。健康信息在被初次利用后，仍然富有巨大的潜在价值，需要二次利用以释放其潜在能量，充分激发健康数据要素活力，推动健康行业发展[13]。而过于严苛的目的限制会阻碍健康数据的流通利用。将科学研究目的解释为公共利益，有利于促进健康数据的流通利用，促进科学研究提质增效，促进健康产业发展，符合立法目的。

复次，对“公共利益”进行历史解释。从《民法典》的立法过程看，《民法典各分编（草案）》第八百一十六条规定，“实施收集、使用或者公开个人信息等行为，有下列情形之一的，行为人不承担民事责任：（一）在自然人同意的范围内实施的行为；（二）使用自然人自行公开的或者其他已合法公开的信息，但是使用该信息侵害该自然人重大利益或者自然人明确拒绝他人使用的除外；（三）为学术研究、课堂教学或者统计目的在合理范围内实施的行为;（四）为维护公序良俗而实施的必要行为；（五）法律、行政法规规定的其他适当实施情形。”《民法典人格权编（草案）》（二审稿）第八百一十六条删去了第三、四、五，统一为“为维护公共利益或者该自然人合法权益，合理实施的其他行为”。后来颁布的《民法典》采用了这一表达方式。从立法过程可以推知，立法者有意将“科学研究”纳入“公共利益”当中。

最后，对“公共利益”进行比较解释。域外许多国家都将科学研究作为个人信息处理的合法性基础。GDPR明确了基于科学目的之处理不受健康数据处理禁止规定之限制。美国《健康保险可携性和责任法案》规定，实体可以基于科学研究目的使用或披露现有数据库中受保护的健康信息1。德国《健康数据使用法》、意大利《隐私法》等法律中，也肯定了健康数据科学研究的正当性。将科学研究纳入个人信息语境下的公共利益，符合世界个人信息立法趋势。

综上所述，在现行法框架下，可以通过公共利益条款证成健康数据科学研究的合法性。

二、利用健康数据开展科学研究的具体规则

健康数据科学研究的开展，需要以具体的规则为依托。针对基于科学研究目的之健康数据处理，GDPR只是笼统地表明数据处理者须尊重数据权利保护的要义，为数据主体的权利和利益提供适当且明确的保护措施，并未详细阐述具体规则。下文将立足于我国现有的法律体系，并借鉴《数字服务法》（Digital service act）、《健康数据使用法案》（Gesundheitsdatennutzungsgesetz）等域外经验，构建健康数据科学研究的具体规则。

（一）研究主体须适格

《科学技术进步法》第八条规定，“科学技术研究开发机构、高等学校、企业事业单位和公民有权自主选择课题，探索未知科学领域，从事基础研究、前沿技术研究和社会公益性技术研究。”GDPR和我国《个人信息保护法》对基于科学研究目的之数据处理者也无特别限制。但这并不意味着对健康数据科学研究的主体无须设置任何要求。《数字服务法》第四十条规定，获取数据访问的研究人员须隶属于欧盟《数字单一市场版权指令》第2条中规定的研究组织，即以开展科学研究或相关教学活动为主要目标的大学、研究机构或其他实体2。这一条文表面上是对隶属性的规定，实质上则是对研究主体适格性的要求。一方面，只有组织机构（entity）才有资格获取数据访问；另一方面，相关组织机构须以科学研究为主要目标。诚然，自然人也可以从事科学研究，但我国人口数量庞大，对自然人的健康数据访问难以监管。数据来源者面临更大的信息泄露风险，造成权利义务失衡，使得健康数据的科学研究有泛化之虞。从我国国情出发，将以科学研究为目的对健康数据处理之主体限制在法人、非法人组织等组织机构更为适宜。

（二）根据商业程度区分付酬

为防止实际并不真正从事科学研究的组织机构，为适用科学研究这一合法性基础而广泛注册目的范围，让科学研究沦为投机取巧的工具，应当明确相关组织机构需以科学研究为主业或主要职能。健康数据科学研究的合法性通过公共利益得以证成，这就要求科学研究必须具备公共利益目的。这是否意味着要将商业目的完全排除在外？《数字服务法》规定研究人员要独立于商业利益3，即出于商业目的之科学研究人员不能获得平台数据的访问权限。这一规定旨在防止数据访问权异化为商业机构攫取相关数据以谋求商业利益的工具[14]。对于健康数据科学研究而言，公益目的与商业目的相互交织——健康数据科学研究活动在提升医疗服务水平、增进人民福祉的同时，可以为数据处理者带来巨大的商业利益。况且公益目的和商业目的之定义本就具有模糊性，公益目的和商业目的并非完全是此消彼长的对立关系，二者具有兼容性[15]。在科学研究的语境下，二者的边界更是难以明确划分。《数字服务法》主要针对网络中介服务提供商，且并未框定数据的范围。当将数据限定为健康数据、将场景限制为科学研究时，完全将商业目的排除在科学研究目的之外不具有可行性。

更为妥当的方式是，根据科学研究目的之商业化程度，构建不同的健康数据访问、利用规则。对于商业目的较弱的科学研究，相关主体可以直接对健康数据进行访问和利用。对于商业目的较强的科学研究，其主体同样可以对健康数据进行访问和利用，但需要向数据主体支付报酬。而目的商业化之强弱程度，或可参照商行为的标准加以认定——只有当科学研究构成商行为时，才能认定科学研究具有较强程度的商业性。所谓商行为，是指商主体以营利为目的实施的营业行为。营业性是商行为的核心要素，即商主体作为职业的、为营利目的而从事的具有连续性、经营性的活动[16]。即决定科学研究之商业目的强弱的，是研究主体是否长期持续从事科学研究，并将此作为谋取经济利益的主要手段。需要强调的是，虽然一些主体从事科学研究的直接目的并非营利，但如果科学研究对主业起到辅助作用，可以认定为相关科学研究构成附属商行为，同样具有较强程度的商业目的。例如，企业运用健康数据对保健品开展功效研究，并对相关科学研究及其研究结果义务宣传和讲解，以获取消费者信任，在客观上起到了广告、促进消费的作用。这种情形下，企业的科学研究行为同样构成商行为，不能基于科学研究目的获得健康数据的访问权限。

（三）健康数据协调者作为访问中介

健康数据科学研究需要依托健康数据登记和健康数据协调者制度加以实现。未来应建立专门的健康数据协调机构。德国在《健康数据使用法案》中规定，建立国家健康数据获取和协调中心（Datenzugangs und Koordinierungsstelle für Gesundheitsdaten），并将该中心作为健康数据存储机构和健康数据用户之间的中介，在健康数据连接请求中承担协调任务。《数字服务法》规定，研究人员需向数字服务协调人提出请求，提交材料并经过审核后，由数字服务协调人向在线平台或搜索引擎服务提供者发出数据访问申请，要求其在合理期限内向申请者提供数据访问[14]。我国的数据登记制度尚在构建当中，未来宜建立专门的健康数据协调机构，对健康数据的访问、利用加以协调。

科学研究主体向健康数据协调机构提交健康数据访问申请，健康数据协调机构对科学研究主体的资格、科研能力、数据保护能力等进行审查。为降低审查成本、提高审查效率，健康数据协调机构对科学研究主体的申请应采取形式审查原则——只要研究主体适格、研究目的明确合理、研究方案科学、拟采取的健康数据保护措施适当，就可以赋予研究主体健康数据的处理权限。这符合将科学研究作为健康数据处理合法性基础之初衷，即降低健康数据获取成本、促进健康数据流通利用。审查合格后，由健康数据协调机构向健康数据持有者提起数据开放要求，要求健康数据持有者在合理期限内向科学研究主体开放访问权限。《数字服务法》中的“经审核研究人员”（vetted researchers）并不是永久身份，研究人员的身份依附于特定的研究项目，需要根据个案动态判断。对于由研究主体自身持有的健康数据，研究主体须向健康数据协调机构提交申请即可直接开展相关科学研究，但是须通过公告等手段对研究项目进行披露，让数据主体在公开渠道或特定渠道可以了解。

三、利用健康数据开展科学研究的限制

健康数据的流通、利用必然会对数据主体的权益有所影响，故应对健康数据科学研究予以适当限制，以实现个人信息保护和发挥健康数据价值的平衡。在利用健康数据开展科学研究的过程中，应当遵循《个人信息保护法》中规定的合法、正当、必要和诚信原则，目的限制原则、最小范围原则，公开、透明原则等个人信息处理的一般原则，以及科学研究开展所需遵循的增进人类福祉、尊重生命权利、坚持公平公正、合理控制风险、保持公开透明等科技伦理原则。同时健康数据科学研究较之于一般的数据处理以及科学研究活动，又有其特殊性，如识别信息具有科研价值、研究过程具有“黑箱”性质、利益主体多元等。为此，在对健康数据开展科学研究的过程中，相关原则需要予以特殊化。

（一）最小数据原则

《个人信息保护法》第六条规定，收集、处理个人信息，应当限于实现处理目的的最小范围，采取对个人权益影响最小的方式。为了让健康数据科学研究对信息主体的权益影响最小化，研究主体应采取《个人信息保护法》第五十一条规定的相应保护措施。但是，对于健康数据科学研究而言，去标识化这一安全技术措施值得特别探讨，因为部分识别信息对科学研究具有重要价值。

1.采取主客观相结合的去标识化标准

去标识化技术是健康数据得以被访问和利用的重要技术支撑，在保护患者隐私的同时促进健康数据的流通利用。美国《健康保险流通与责任法案》（Health Insurance Portability and Accountability Act，HIPAA）中规定，研究者可以不经数据主体同意充分使用去标识化的健康数据。为保护数据主体的个人信息，原则上科学研究主体须对健康数据进行去标识化处理。然而健康数据的某些识别特征对于科学研究具有重要意义，完全去识别化会阻碍科学研究的进行。因此，可以对科学研究所必要的识别信息予以保留。要如何界定“必要的识别信息”，科学研究中对健康数据的去标识化要处理到何种程度？《信息安全技术——个人信息去标识化指南》（GB/T 37964-2019）列举了部分直接标识符和准标识符，并将个人信息标识度划分为4个等级，但对于不同场景中的去标识化程度并没有明确规定。HIPAA对健康数据的去标识化采取了两种标准——“专家决定标准”和“安全港标准”。“专家决定标准”是指，由具备专业统计技能者对数据集进行分析，并证明去标识化后的数据集重新识别的风险非常小。“安全港标准”列举了姓名、电话号码等18种识别符，当数据处理者把这18种标识符移除，则达到了去标识化标准4。完全的个案衡量成本过高，一刀切地划定须移除的标识符范围不符合科学研究多样性的需要。因此较为妥当的方式是将二者结合，划定原则上必须移除的标识符范围。对于理应移除但为科学研究所必须的标识符，则依研究主体的申请启动个案衡量，让专家结合标识符的敏感程度、标识符对科学研究的重要性、其他保护措施的保护强度等因素综合对标识符是否准予保留予以判定。

2.健康数据的处理限定在客观最小范围

“最小范围”主观性较强，需要通过客观标准加以量化。《深圳经济特区数据条例》第十一条从种类、范围、目的、数量、频率、期限几方面阐释了实现处理目的所必要的最小范围，可资借鉴。

首先，科学研究要受到数量限制。科学研究中可豁免同意的健康数据的种类和数量应当以相同或类似科学研究所需的一般标准为限。此外，数量限制还体现在对研究人员数量的限制。被授权单位应采用必要范围内最小数量的研究人员来开展相关研究。

其次，科学研究要受到时间限制。相关主体对健康数据的访问和利用时间应限制在最小范围内。德国《健康数据使用法案》将单个数据在研究中心的保存期限从30年改为100年。鉴于不同的科学研究所必需的期限不同，可效仿《民法典》第九章诉讼时效制度，规定普通访问时效、最长访问期间，以及健康数据访问的中止、中断制度。允许研究人员通过申请延期、告知患者等方式适当延长健康数据的访问、利用期限。

最后，科学研究要受到用途限制。对健康数据的用途限制应当结合目的限制和备案制度，采取形式审查原则。研究人员在开展科学研究的过程中，不得背离备案时申报的目的和用途。科学研究可能产生意外发现，如西地那非最初是作为心脏病药物进行研发的，但在研究过程中，研究人员发现西地那非对心脏病并无显著治疗效果，但可以改善男性勃起功能障碍。在健康数据科学研究过程中，即使新的研究方向符合目的相关等要求，研究人员仍应重新申请和备案。

（二）公开透明原则

鉴于健康数据科学研究对去标识化有所保留，数据主体面临更多的隐私泄露风险，因此公开透明原则对于健康数据科学研究有着至关重要的意义。《个人信息保护法》第七条规定，“处理个人信息应当遵循公开、透明原则，公开个人信息处理规则，明示处理的目的、方式和范围。”此外，公开透明原则也是所有科学研究开展时的必要遵循。《科技伦理审查办法（试行）》第三条规定，开展科技活动应保持公开透明，科技伦理审查应坚持透明原则，公开审查制度和审查程序。第十五条特别强调了涉及数据和算法的科技活动，数据的收集、存储、加工、使用等处理活动中，要坚持公平、公正、透明、可靠、可控等原则。然而传统的科学研究进展和结果是可观察的，而基于数据的科学研究则是一种基于逻辑和算法的盖然性预测[17]。健康数据科学研究具有显著的“黑箱”属性，给监管带来障碍。此外，信息不是中立的事实，而是人为建构的产物，研究人员可能会以最有利于自身的方式披露信息[18]。因此，对健康数据科学研究应当采取更高标准、更加全面的公开、透明要求，同时注重对预测性信息的披露。

1.披露主体为项目负责人

健康数据科学研究环节众多、参与主体众多，哪些主体负有披露义务？让凡对健康数据进行访问、研究者均需负有披露义务，无疑有矫枉过正之嫌。一方面，过度扩张公开主体的范围，会使得相关主体义务畸重，增加科学研究的成本，阻碍科学研究的进程。另一方面，披露需要熟知法律、伦理的相关要求，并非所有主体都具有合规披露能力。较为妥当的做法是，让科学研究项目负责人作为公开主体，不同等级的负责人层层上报，层层披露。《国务院办公厅关于优化学术环境的指导意见》中要求“逐步推广以项目负责人制为核心的科研组织管理模式”。科学研究通常围绕特定课题、项目或特定业务加以展开。项目负责人统筹科学研究的开展，对相关科学研究的领域、进度、细节较为了解，且对于参与研究的其他成员具有管理职责，具备公开的条件和能力。此外，项目负责人通常会予以公示，便于外界对科学研究的公开情况进行监督。

2.披露内容应当差异化

《个人信息保护法》第十七条规定了个人信息处理者在处理个人信息前，应当告知数据主体的事项，包括“个人信息处理者的名称或者姓名和联系方式；个人信息的处理目的、处理方式，处理的个人信息种类、保存期限”。第三十条规定“个人信息处理者处理敏感个人信息的，除本法第十七条第一款规定的事项外，还应当向个人告知处理敏感个人信息的必要性以及对个人权益的影响”。公示制度和告知制度的本质是一样的，旨在保障数据主体的知情权，因此健康数据科学研究开展前所需披露的内容可以类推适用第十七条之规定：包括科学研究人员的相关信息，科学研究的具体目的和开展方式，健康数据的种类和保存期限，以及相关科学研究开展的必要性和对数据主体权益的可能影响。在健康数据科学研究开展过程中，要对健康数据的处理情况、科学研究的进展、成果转化情况等进行披露。此外，还应注重预测性信息的披露。科学研究持续周期通常较长，短期内难以得出确定的结论，预测性信息对于把握科学研究走向、判断科学研究前景具有重要意义。健康数据科学研究应当采取差异化的披露方式。一方面，披露的事项、细节、数量等应当根据科学研究主体和研究方案的不同而有所差异。不同性质、类别的主体信息披露的依据和逻辑机理不同，健康数据的使用环境、使用目的、使用侧重点不同，对应的监管重点、披露重点、披露成本也不同。另一方面，不同类别的健康数据在科学研究过程中面临的隐私泄露、利益冲突、伦理敏感性等风险不同，披露的内容也应灵活调整。

3.强制披露和自愿披露结合

健康数据科学研究中的信息披露应采取强制披露和自愿披露两种方式，二者以“重大性标准”为界分——具有“重大性”的信息应当强制披露，不具有“重大性”的信息则可以自愿选择是否披露。重大性包括三个维度：重大利益、重大变化、重大影响。重大利益是指，在健康数据科学研究开展的过程中，与数据主体的重大利益或者国家利益、社会公共利益相关的信息。重大变化是指，在科学研究的方向、方案、方法等与先前产生巨大差异，或者因数据的汇集和重组导致数据得以呈现出的信息发生显著不同[19]。重大影响是指，影响科学研究这一合法性基础能否适用的基本要素，如研究主体、健康数据类型、研究目的等。不具有重大性的信息，研究主体可以自行决定是否披露。对于比较重大但尚不符合重大性标准的信息，应采取“不披露就解释”[20]的规则，即允许研究主体对相关内容选择性地进行披露，但必须在公开披露的文件中对不披露的原因加以解释，如具有保护商业秘密等正当事由，或者采取了风险防控、自我监督等替代性措施。对于不具有重大性的其他信息，在保留研究人员披露自由的基础上鼓励披露。

4.披露后果驶入“安全港”

针对预测性信息披露的“安全港规则”在证券领域已经较为成熟，发行人只要出于善意且满足特定基础条件，即使其披露的预测信息与最终事实不符，披露者也不必承担欺诈责任[21]。鉴于科学研究的不确定性，预测性信息披露在健康数据科学研究的信息披露中应占据重要地位。为激励研究人员在公开透明中开展科学研究，应当构建健康数据科学研究信息披露的安全港规则。对于有真实基础和科学方法为依托的、尽到了风险提示义务的、善意的不实预测性信息披露，研究人员可免除承担不实披露的相关责任。但安全港规则并不意味着对相关研究放任自流，对于驶入安全港内的健康数据科学研究行为，伦理委员会、政府监管部门仍然有权力、有义务对其进行监督管理，采取其他警示措施，以确保信息披露和安全港规则的有效性。

（三）风险收益平衡原则

健康数据科学研究的诸多规则都存在自由裁量空间，如必要识别特征的保留、披露范围的确定等，为避免自由裁量的无序与滥用，应当为自由裁量划定相应的尺度。传统的医学研究坚持以受试者权利为中心的原则。《赫尔辛基宣言》要求开展医学研究的研究人员保护受试者的生命、尊严、自我决定、隐私等权利，并特别强调了要“必须采取一切措施保护研究受试者的隐私和个人信息”，认为“受试者的福祉必须高于所有其他利益”。在传统的生物医学研究中，参与者的生命健康面临较大风险，参与者的权利受到倾斜保护。然而在健康数据科学研究中，参与者面临的主要研究风险发生转变，从生命健康转向个人信息。根据《涉及人的生物医学研究伦理审查办法》第十八条第二款、第二十条第三款之规定，科学研究使参与者可能遭受的风险程度与研究预期的受益，应当合乎比例。因此，在进行自由裁量时，应当以实现各主体间风险和收益的平衡为基本尺度。

1.数据主体面临的风险

数据体量大、传播快的特点决定了健康数据科学研究规则的设计必须是风险导向的。在进行利益衡量时，应将数据主体可能面临的风险而不是实际损害作为考量因素。根据导致风险的原因不同，可将科学研究的风险分为数据源性风险和设计源性风险[22]。

数据源性风险是指，因健康数据本身固有的敏感性，导致对健康数据进行科学研究时所产生的风险。健康数据科学研究可能让患者的隐私权、自主决定权、名誉权等人格权益有受损之虞。个人信息权的本质是对信息流动范围的控制，对信息使用的规范性期望和偏好[23]。患者并不钟情于自身健康数据的附加价值，更为在意的是这些数据能否有益于自身疾病的诊断和治疗、健康的管理和改善，以及健康数据的私密性。隐私权是健康数据科学研究场景下数据主体的核心利益[24]。健康数据的不当访问、流动会泄露患者的隐私，让患者在投保、就业、婚恋等方面遭受潜在歧视，甚至让患者因特定疾病而被污名化，导致名誉权受损。此外，科学研究过程中对健康数据的使用可能背离患者的意愿，使患者的自主决定权遭受损害。相关风险根据疾病的类型和特点、患者的个人情况、科学研究的方案、数据处理主体和处理方式等因素的不同而变化。如艾滋病、梅毒等性传播疾病，抑郁症、精神分裂症等精神疾病，肝炎、结核等传染性疾病在社会中存在污名化问题，数据泄露后患者要承受较之于其他疾病的更多非议。患者的个人情况同样会影响数据泄露给患者带来损害的严重程度，如已婚妇女和未成年少女怀孕信息的泄露，对二者的影响截然不同。

设计源性风险是指因科学研究的设计和开展方式所带来的风险。数据的汇集方式、处理方式、算法设计一定程度上蕴含了科研人员的价值观，不同的科学研究方案也会对数据主体权益产生不同影响。数据采集时，样本的全面性和多样性会对数据主体的权益造成影响。如在研究皮肤病变分类时，研究人员通常使用白人患者的皮肤病变样本图像来训练模型，而黑人患者的病变可能与白人患者具有不同的特征，导致相关科学研究给黑人患者带来不利影响[25]。对健康数据处理方式的不同，也会对数据主体的权益产生不同影响。匿名化数据必然比完整数据面临的隐私泄露风险低。不同的科学研究方法对健康数据的处理、分析深度不同，对数据主体的权益影响也有所差异。如解释性研究较之于描述性研究，对健康数据的处理程度较深，对数据主体权益的影响较大。在对科学研究风险进行评估时，要综合考虑不同的风险因素进行整体评估。

2.科学研究的潜在价值

科学研究价值的评判要从数据主体、研究主体以及社会三个维度进行。对数据主体而言，科学研究的价值直接体现为优化对数据主体的疾病诊治和健康管理方法，促进数据主体的健康。对研究主体而言，健康数据的运用或可提升科学研究质量和效率，促进科学研究成果产出和转化，提升研究主体的学术声誉，带来经济利润。对于社会而言，科学研究的价值体现更为广泛。党的十八大以来，党中央、国务院高度重视科技成果评价体系的改革。《国务院办公厅关于完善科技成果评价机制的指导意见》构建了“科学价值、技术价值、经济价值、社会价值、文化价值”的五元评价体系。“科学价值重点评价在新发现、新原理、新方法方面的独创性贡献。”健康数据科学研究对于揭示疾病生成机理、改良疾病诊断治疗方法、深化医学研究水准等方面具有重要意义。评价技术价值关键在于科学研究的成果转化情况。科学研究有助于将健康数据转化为健康产品，可以创新医药产品研发、促进医疗技术发展、提升医疗服务质量。经济价值重点评价健康数据科学研究可能给研究主体和健康产业带来的经济利益。社会价值重点评价健康数据科学研究在提升公共卫生治理水平、解决人民健康问题等方面的成效。文化价值重点评价健康数据科学研究在攻坚克难、求实创新、弘扬社会主义核心价值观等方面的影响。虽然相关研究能否顺利完成、研究能否顺利转化为科技成果、成果能产生多大效益是不确定的，但这并不意味着科学研究的价值在事前完全无法衡量。研究内容的重要性、研究的成熟度、研究设计的科学性、相关研究成果转化率，以及相关研究领域产品的市场环境、供求关系、价格等都可以作为衡量相关价值的参考因素。

四、结语

符合《个人信息保护法》第十三条规定的情形之一的，个人信息处理者方可处理个人信息。但科学研究与已有的合法性基础并非互斥关系，各合法性基础之间可能存在关联、重合和限制。那么，科学研究和其他合法性基础之间应保持何种关系？《个人信息保护法》第十三条第二款规定，“依照本法其他有关规定，处理个人信息应当取得个人同意，但是有前款第二项至第七项规定情形的，不需取得个人同意。”纵观第十三条第一款规定的合法性基础，根据确定相关合法性基础的正当性依据不同，可以分为两类——同意和其他的法定情形。同意作为个人信息处理合法性基础的主要依据在于数据主体的个人自决，旨在“保护个人信息权益”。而其他法定情形作为个人信息处理合法性基础的主要依据则是公共利益和法益权衡，旨在“促进个人信息合理利用”。

科学研究和同意该保持何种关系？将科学研究作为健康数据处理的合法性基础是法益权衡的结果，科学研究和同意的关系，本质上是对同意成本以及数据主体个人自决和他人利益、公共利益的权衡。《荷兰民法典》“医疗合同”部分第7.458条规定，只有在不能或者不宜取得同意的前提下，才可以基于科学研究目的利用医疗数据：其一，通过合理方式不能获得同意且患者的隐私不会因研究的进行而受到过度侵犯；其二，鉴于研究项目的性质和目的，不能合理地要求同意，且相关研究是用编码数据进行且不可溯源的。这两种情况都适用三项附加要求：研究必须服务于公众利益；没有相关数据研究就无法进行；患者没有明确反对其数据的流通。“不能取得同意”原则上让同意优先于科学研究，这无疑会极大增加科学研究的成本，阻碍健康数据的流通利用，背离了将科学研究作为合法性基础的初衷。较为妥当的做法是，只要数据主体没有明示反对，数据处理者就可以对健康数据进行研究。

科学研究和其他法定情形可能存在重合。如为履行医疗服务合同而对健康数据开展的科学研究、为应对突发公共卫生事件而开展科学研究、利用公开数据开展科学研究等。在上述情形中，科学研究和其他法定情形是特殊和一般的关系，应当坚持特别法优于一般法，优先适用科学研究作为合法性基础。

参考文献：

[1] 卢建平. 科学研究自由的法律评价──兼议“法律应否对科学研究设置禁区？”[J]. 浙江大学学报（人文社会科学版），2000（3）：17.

[2] 姜涛. 宪法上的科研自由与课题经费治理现代化的宪法法理[J]. 南京师大学报（社会科学版），2021（3）：6⁃8.

[3] GAWANDE A， GRZYBWSKI A， MCDOWOELL J A. Two hundred years of surgery[J]. The New England Journal of Medicine， 2012（5）： 367.

[4] 黄鼎成. 科学数据共享的理论基础与共享机制[J]. 中国基础科学，2003（2）：22.

[5] 郭创拓. 科研自主权的法理阐释与制度完善[J]. 政治与法律，2024（1）：116；

[6] 袁波. 必需数据反垄断法强制开放的理据与进路[J]. 东方法学，2023（3）：148.

[7] 哈贝马斯. 作为“意识形态”的技术和科学[M]. 李黎，等译. 上海：学林出版社，1999：45.

[8] 孙伟平，梅春英. 关于基因增强的价值反思[J]. 伦理学研究，2021（5）：113.

[9] 陈煜鹏. 健康权法律性质的二重性[J]. 社会科学家，2020（2）：136⁃140.

[10] 王理万. 健康权的国家塑造：以广播体操为例[J]. 人权，2023（5）：129.

[11] 满洪杰. 健康医疗大数据治理的健康权面向[J]. 求是学刊，2024（2）：110.

[12] 沈洪兵. 大数据时代的临床医学研究——机遇和挑战[J]. 南京医科大学学报（自然科学版），2020（3）：303⁃305.

[13]" 维克托·迈尔-舍恩伯格，肯尼斯·库克耶. 大数据时代：生活、工作与思维的大变革[M]. 盛杨燕，等译.杭州：浙江人民出版社，2013：135.

[14] 张飞虎. 科研人员数据访问权：欧盟网络平台内容治理的新工具——欧盟《数字服务法》第40条及其启示[J]. 德国研究，2023（6）：111⁃114.

[15] 高志宏. 公共利益的非营利性研究——以公共利益与商业利益的关系为视角[J]. 法治研究，2012（4）：76⁃78.

[16] 高在敏. 商法[M]. 北京：法律出版社，2016：86.

[17] 王欢，李雅琴. 个人医疗数据利用中知情同意伦理探讨[J].中国医学伦理学，2021（7）：833.

[18] RINGEL L. Unpacking the transparency-secrecy nexus： frontstage and backstage behave-iour in a political party[J]. Organization Studies， 2019， 40（5）： 705⁃723.

[19] BEBCHUK L， HIRST S. Index funds and the future of corporate governance： theory， evidence， and policy[J]. Columbia Law Review， 2019， 119（8）： 2033.

[20] 杨淦. 上市公司差异化信息披露的逻辑理路与制度展开[J]. 证券市场导报，2016（1）：7.

[21] 梁清华. 论我国私募信息披露制度的完善[J]. 中国法学，2014（5）：158.

[22] 商自申，封展旗，王忠谋. 试论涉及人的生物医学研究伦理审查中的风险与收益评估[J].中国医学伦理学，2007（3）：47⁃48.

[23] ROTHSTEIN M A. Ethical issues in big data health research： currents in contemporary bioethics[J]. Journal of Law Medicine amp; Ethics， 2015， 43（2）： 425⁃429.

[24] 满洪杰. 隐私保护与利益分享：健康数据医学研究的规制转向[J]. 中国政法大学学报，2023（3）：98.

[25] NORORI N， HU Q， AELLEN F M， et al. Addressing bias in big data and AI for health care： a call for open science[J]. Patterns （New York， N.Y.）， 2021， 2（10）： 1.

Rules on Processing of Health Data for Scientific Research Purposes

Yao Xuxin1， 2

（1. Institute of Health Law and Policy Research，" East China University of Political Science and Law，

Shanghai 200042，" China; 2. Law School， University of Antwerp，" Antwerp 2000， Belgium）

Abstract： Legal basis for the processing of health data fail to meet the needs of scientific research. Taking scientific research as a legal basis for the processing of health data is a requirement for states to promote the freedom of scientific research and the right to health. And it can be justified by an interpretation of \"public interest\". The subject of scientific research should be affiliated with a legal entity， unincorporated organization， administrative body， or other institution whose purpose includes scientific research. Access to health data should be facilitated through health data coordinating bodies. When processing health data for scientific research， different rules should apply depending on the level of commercialization of the research. In principle， health data should be de-identified， and identifiers relevant to scientific research may be retained upon request. The amount， duration， and utilization of health data for scientific research must be minimized. Principles of risk-return balance and transparency should be adhered to. Finally， scientific research on health data can only be carried out if the data subject has not explicitly objected. When scientific research intersects with other legal basis， scientific research should take precedence as a unique circumstance.

Keywords： health data; scientific research; basis of legitimacy; rules

基金项目：国家社会科学基金重大项目“国民卫生健康治理法治化研究”（20＆ZD187）；国家自然科学基金重大项目“医联网环境下的隐私数据保护与医源性风险决策”（72293583）

作者简介：姚旭鑫（1997—），女，山西太原人，博士研究生，研究方向：民法，卫生健康法，医疗数据。

1 Code of Federal Regulations§164.508.

2 Digital Service Act： Article 40 8（a）.

3 Digital Service Act： Article 40 8（b）.

4 Code of Federal Regulations§164.514.