医学科学数据共享与使用的伦理要求和管理规范(十)大数据产权认定解决方案的建议*
2021-04-03关健
关 健
(中国医学科学院北京协和医院&国家人口健康科学数据中心<临床医学>和肿瘤专题数据服务,北京 100730,gjpumch@126.com)
大数据开创了技术、生活、工作和思维的新模式,且对经济运行机制、社会生活方式和国家治理能力产生重要影响。大数据目前已广泛应用于医疗保健、移动通讯、交通管理、零售和支付等领域,极大提高了效率、精准和便利。同时作为科技资源和创新来源,促进科技发展。国家和企业在战略规划或计划中占领不同领域大数据高地。卫生健康领域是体现大数据特点及其科技作用最明显的领域之一。大数据不仅是医学科技重要的科技资源,更具有巨大的潜在经济价值,特别是大数据分析和人工智能为医学大数据应用开拓了产业前景,需要构建科学有效的机制促进其可持续应用和发展。
不断提高有价值大数据的应用,不断促进发挥大数据的应用价值和促进医学科技发展,在医学大数据的应用过程所形成法律关系中的各利益关系人之间需要具有合理分配权益的法律依据和客观衡量标准,这是医学大数据应用面临的大数据的共性问题和挑战。
数据产权形式及其归属是数据权益分配的依据,科学有效的产权界定体系才能保障数据贡献人的利益和提高共享积极性。数据共享中的权益分配是否合理对能否保障数据贡献人的权益、提高数据共享积极性具有决定性作用。医学大数据的建设需要长期积累。医学大数据应用中的权益分配是否合理,直接影响数据共享积极性。虽然,国际区域性规则和我国的法规或其他规定对数据共享应用过程中的一些个体权利、数据使用的原则、责任义务有一定的阐述,但主要是针对个人信息安全和个人隐私保护、数据安全、数据完整性和修改权等[1]。目前罕有对数据的产权,特别是对所有权的明确规定和经验。
自从大数据及其应用成为创新和经济战略发展点以来,大数据产权问题成为法律的学术前沿和争议热点之一。国内外学者至今无法达成共识,缺乏被公认的大数据产权认定原则、方式和体系。大数据的形式、内容、来源、种类、结构、信息量等诸多复杂性使大数据产权的认定方面遭遇前所未有的困惑和困难。大数据具有现有产权标的所没有的特征和多维性特点,传统的单一产权方式无法简单适用。大数据产权认定是法律需要探索解决的新问题。
本文将讨论大数据产权认定基础,并结合前述医学大数据的属性特征,提出其产权及其归属原则和相关问题解决方案的建议,为医学大数据的产权认定等提供思路和参考性方案。
1 大数据产权认定基础
产权是民事主体确定权益的依据。大数据具有了商品的属性和具备赋予产权的属性。这是大数据产权需要认定的原因(需求),也是其产权认定的基础。
商品的基本属性是价值和使用价值。使用价值是指商品能够满足人们某种需要的属性,价值是指凝结在商品中的无差别的人类劳动。基于大数据已形成了与传统知识—经验驱动的模式相并行的数据驱动的研究和服务模式。大数据成为科技创新的源泉。此外,大数据的精准服务、创新研发具有巨大的经济价值。
大数据能够带来经济价值和效用,具有了商品的属性,因此,大数据具有了权益分配的要求。进而,大数据通过共享应用(即交换)发挥价值,其交换过程之中的利益关系人之间形成民事法律关系。除法律规定以外,数据共享应用,特别是商业用途的实质是通过商品交换实现大数据价值和使用价值的过程。
产权是指财产所有权,即数据产权的所有权人享有依法对自己合法的财产享有占有、使用、收益和处分的权利。产权还指与财产所有权有关的财产权,即能与所有人发生分离的基础上产生的,非所有人在所有人财产上享有、占有、使用以及在一定程度上依法享有收益或处分的权利,包括基于产权数据产生的衍生的物权和知识产权。计算机、互联网和大数据时代为大数据积累和共享应用提供了技术基础,使数据具有产权属性。数字化存储、传送技术,互联网传送技术,以及计算机数据整合分析使数据得以再提取和应用使有价值数据,包括大数据具有市场经济条件下产权的属性,即产权的经济实体性、可分离性和产权流动的独立性。因此,需要法律明确确认数据产权及其归属、数据共享中利益相关人财产权相关的权利义务,使持有数据的经济实体通过数据产权的分离和流动,成就申请者获得大数据交换的使用价值的同时,获得大数据交换应用相应的财产权收益,完成商品交换的价值。产权权利人产生或保持获取数据共享收益的积极性,进而促进有价值数据的交换行为,促进有价值数据的可持续发挥作用。
2 大数据的产权认定原则
2.1 数据(产权)获取的合法性
产权是经济所有制关系的法律表现形式,是合法财产的所有权。依法获得数据产权是大数据产权认定的首要原则。非法采集的数据不能获得产权,收集者或持有人对数据无支配权和获益权。国家相关法律应该明确禁止违法手段收集和应用数据。未经允许收集数据,或通过服务限制服务等强行收集的数据都是违法的,无论是否为获得商业用途和经济利益,都不能获得数据产权及其相应的处理和支配等权利。
互联网服务和大数据时代下,个人信息已经成为获得网络服务被迫提供和强制收集的内容,平台获取大量公民个人信息可以利用大数据服务提供便利精准服务。但是,一些服务平台收集的信息明显超过服务必要范围。以智能平台交通和购物服务为例,基于数据的服务已经渗透公民日常生活。在登录银行、交通和购物等平台的过程中,被一些所谓验证等名目而索要的个人信息明显超出必要范围。这些超出必要范围收集的信息数据为违法收集。
依法收集是数据产权获取的前提条件,不是充分条件。数据产权标的或对象法定是依法获得数据产权的另一重要表现。例如,个人可识别信息不是数据产权的标的,依法收集的个人信息不能获取产权。必要范围内收集的个人可识别信息,仍仅限于这些平台在用户个人自身提供对应服务的核对功能,原则上不允许存储和用于其他目的,更不能享有这些信息和其服务相关数据的产权。
2020年6月1日实施的《中华人民共和国基本医疗卫生与健康促进法》第九十二条明确规定:“国家保护公民个人健康信息,确保公民个人健康信息安全。任何组织或者个人不得非法收集、使用、加工、传输公民个人健康信息,不得非法买卖、提供或者公开个人健康信息。”
目前,医学大数据重要来源数据的收集存储一般是在业务需求范围内依法收集的。如,实体机构的诊疗业务需求收集的健康医疗数据,按照法律法规要求上报收集的公共卫生数据,以及应申请基因测序产生的基因组数据。用于基因组及其标的研究的生物样本及其收集通过知情同意完成个人授权后收集储存。但是这些数据的产权认定中涉及个人可识别信息的问题。
2.2 承认个体对其个人数据的所有权
大数据产权认定应承认公民对其个人数据的所有权。以医学大数据为例,无论来源如何,个体参与者个人水平的数据都是大数据的最小组成单位。个人对其数据的所有权及其支配权利是数据共享应用履行知情同意的法律依据。如前所述,基于大数据的服务打破了原有个体与社会公益之间的传统平衡,使个体处于更加弱势的地位。在大数据应用中应该加强个人权益,包括其经济权益的保障。目前倡导的数据共享的初衷是促进不同来源数据依法再利用,即超出数据收集初次使用范围之外的再利用,其涉及的个人授权问题更为突出。目前国际上,允许去识别数据用于公益性科学研究。在数据的商业用途,包括商业研发,一般需要个体授权,如一些基于医学诊疗需求合法收集的数据进行数据驱动临床决策软件研发时需要履行知情同意。虽然盈利机构和部分学者的观点认为商业研发也是科学研究。欧洲联盟2018年实施修订后的《通用数据保护条例》中,也采纳了类似观点,规定临床诊疗数据可以不经授权应用于科学研究,包括商业用途。但该条例在实施后引起了众多反对。
2.3 医学大数据产权及其权益限制的伦理考虑
与一般“物”不同,大数据的产权界定关系到大数据应用的风险价值与个人权益之间,以及与社会公益之间的均衡关系,这一点在医学大数据尤为明显。医学大数据来源和应用与公民个人息息相关,其应用与国计民生的公民健康和遗传资源相关,其产权独具特点。产权界定需要考虑个体(包括机构)与社会公益的平衡问题;首先保障个体权益,如隐私问题,可识别个人信息不能成为产权标的。因此,大数据产权认定原则和权益分配体系、以及个人授权等除了从法律角度考虑产权一般性质和特点,需要考虑伦理因素,兼顾可行性和社会公益。
医学大数据的商品属性、商品价值体现在其与大数据分析、机器学习等形成的产品和服务,如疾病诊疗软件和产品等。医学大数据更具有科学价值,承诺精准医学与个性化预防诊疗,与人类的健康福祉密切相关。医学大数据产权及其应用的知识产权,不仅要考虑个人和机构获取财产权,还要考虑促进和保障全体公民和(或)一定社会群体的健康权。在促进医学大数据应用的科技研发和应用中不能损害个体权益。因此,医学大数据产权确立原则及其权益分配等需要在个体与社会公益的平衡,解决相互之间的交叉和矛盾关系。如,医学大数据的重要来源公共卫生和基因组学数据,因涉及社会公益和人类遗传资源,在相关产权认定时应该有所限制;诊疗方法根据专利权法的规定是不能授予专利权的,健康诊疗大数据因涉及社会公益,因此基于健康诊疗大数据的产品是否能够获得专利权需要具体问题具体分析。
医学大数据的商业用途应该符合伦理原则,企业代表通常倡导医学大数据免费提供其进行商业研发,但是闭口不谈提供数据的个人或机构的未来收益。公益性研究和商业用途(包括科技研发)的数据应用的原则应该有所不同。企业或机构在利用大数据进行商业研发时应该承诺其商业研发的成果,对于提供数据的个体参与者能够给予可期待的明确的合理的益处。如,优先、免费使用,或较大比例优惠价格应用软件、药物等。
此外,确定医学大数据适宜的产权保护体系,还需要注意少数群体的权益。如罕见疾病治疗研发机构的权益保障,以确保相关收益人群的疾病治疗平等权。这一点,可以参考欧洲体系承认特殊的特殊保护形式[2]。为促进对经济效益有限,但有利于治疗儿童或非常罕见的疾病(孤儿药)有用的特殊发明和应用的发展,对有价值的稀有数据的产权及其应用采取一定的特别权益优先考虑。
3 大数据产权解决方案建议
有关大数据产权保护实践,数据库保护法于2012年已在55个以上国家颁布,对版权法传统上不受保护的数据同时提供给编辑者和出版商(作为受让者)专有权保护[3]。在欧盟,对数据库内容的投资可以受到“数据库权利”的保护。例如,生物库包括以系统或系统方式组织的生物材料和相关数据的集合,或“系统生物学”(systems biology)项目中的数据库,可被视为受保护的数据库。在美国,数据库可以受到版权保护,前提是它们符合“汇编”的条件。笔者不赞成欧洲这种所谓的“数据库权利”,这种数据库可以根据数据实体、数据信息和数据工具等分别予以现行知识产权保护,且数据库权利对数据库参与的其他利益相关方,或者整合之前的数据库可能造成反向限制。
医学大数据的容量、速度、可变性等属性特征决定了大数据的资源优势。大数据应用的实质是不同主体、不同主题、不同角度和不同层次有价值信息的提取,决定了大数据产权的多维性。目前的知识产权制度中,单一的知识产权方式确实无法为大数据提供充分的保护和激励,但是所有权、各种不同的知识产权和特殊权利可以分别适用于大数据应用的各个方面[2]。解决大数据的产权方案是产权分解和协同保护,建立大数据产权的综合认定体系。
具体建议重点包括以下几个方面:
①个人数据所有权和整合数据所有权并行。承认对个人数据、整合数据的所有权,并确定其权利行使的条件和限制。应该对个人数据所有权、机构汇编或整合数据,包括大数据的所有权进行明确规定。通过法律法规提出个人数据所有权的处理方式和行使限制。提出汇编数据或整合数据,包括大数据的所有权获得的前提条件、所有权的处理权利和方式等,充分保护个人权益和体现贡献价值。无法律特别规定的情况下,个人数据所有权及其相关权利,通过严格的个人授权方式,有偿或无偿方式由个人自主决定。对于个人、机构持有的数据,提供数据使用的独占期,以及提供有偿数据转让和使用来实现数据的财产权。在所有权认定时还需要考虑数据的不同来源。以健康医疗数据为例,目前存在因来源不同而使其使用以及共享和责任也有所不同,甚至可能截然不同的潜在数据所有权:政府监管的临床和研究医疗数据(包括个人和人口数据);从社交媒体、应用程序、在线搜索和可穿戴设备收集的私人用户生成的健康数据。
② 数据所有权及其衍生产品知识产权并行。大数据资源本身无法获得知识产权,更适用所有权。但是其应用的成果即衍生产品更适用知识产权。目前对大数据存在一些误解。如,一些研究人员在其课题立项的申请中滥用大数据概念作为申请的亮点,其研究涉及的往往只是数千或上万个病例,甚至只是研究者个人收集的数百个病例。但这提示了大数据应用衍生知识产权的标的往往不是大数据本身[4]。
大数据与其他研究材料相似,大数据只是科技创新的材料或资源库,大数据的知识产权在于利用大数据提取有价值信息,进而形成有价值的产品,无论是数据库、数据集,还是基于规范统一结构的数据库、数据集形成的软件,都不是高容量、高速增长和不断变化的、结构不一的大数据本身。知识产权认定标的/对象是有价值数据提取应用形成的成果。基于对大数据有价值信息提取的成果形式、特点等提供不同的知识产权保护,把不同阶段、不同特征的成果适用不同知识产权,通过版权、软件著作权、专利权等相互协同保护相关权益。根据大数据及其有价值的信息提取形成的创新、产品特点确定适当知识产权或其他产权保护方式。数据持有人也可以根据数据所包含的价值信息通过商业秘密、技术秘密保护方案。
③ 明确大数据相关的知识产权获得的要求或条件。基于大数据经创造性劳动形成的作品、产品、方法等具有知识产权保护价值和知识产权认定元素,能形成知识产权。大数据与其他阶段性科学研究进展一样,丰富了知识产权的主题。但需要按照知识产权体系对这些新的产权主体提出相应的条件。如,生命科学技术的发展使基因及其表达产物、相关检测方法、应用创新产品等成为可专利主题,不同国家的专利审查体系对这些产品、方法等获得授权提出相应的要求。基于大数据及其分析应用等的知识产权获得,如专利权授权条件也需要随着技术的发展而不断地完善。
④ 医学大数据的产权权利限制和社会公益。医学大数据的公益性应用与产权获得不冲突,可以分别通过产权权利行使的限制、相应知识产权的保护期间,以及法律明确规定数据授权应用的例外情况,如应用的原则和条件等,来共同实现。不同来源医学大数据,健康医疗、公共卫生和基因组组学大数据的限制在法律规定上应具有不同的侧重和要求。医学大数据产权确认及其权利行使的特殊性,更多体现在法律规定的条件下的数据使用的例外情况,如公共卫生突发事件,以及满足一定条件的公益性科学研究使用得以获得个人授权的豁免,如疾病机制和诊疗方法的研究等。国际共识中对于医学数据非授权的使用基本上都是法定条件下对个人数据权利行使的限制等。
综上所述,大数据的产权及其归属的解决方案是产权分解和协同保护,基于现有产权和知识产权法律框架建立大数据产权的综合认定体系。重点是通过法律法规明确规定数据主体对其个人数据的所有权和机构等对其汇编或整合数据的所有权;通过细则为大数据的相应产权提出界定或授权条件。而且,医学大数据的产权认定和权利行使需要考虑伦理因素,通过产权权利限制在个人权益和社会公益之间进行平衡。这些原则和方案同样适用医学科学数据。
利益冲突:作者声明无利益冲突。