人类遗传资源数据共享管理研究及对中国的启示
2019-01-10李爱花李永洁崔春舜
杨 渊,秦 奕,池 慧,李爱花,李永洁,崔春舜,李 扬
中国医学科学院 北京协和医学院 医学信息研究所健康科技战略情报研究室,北京 100020
人类遗传资源是指含有人体基因组、基因及其产物的器官、组织、细胞、血液、制备物、DNA构建体等遗传材料及相关的信息资料[1],对推进生命科学研究和促进医药产业发展等具有重要意义。中国是人类遗传资源最丰富的国家,具有丰富的民族遗传资源、家系遗传资源和典型疾病遗传资源。近年来国外不法科研机构和企业对中国人类遗传资源的非法收集和攫取的行为屡禁不止,通过有计划有预谋的活动盗取中国基因数据的手段更加隐秘,已引起中国政府相关部门的高度重视。人类遗传资源涉及伦理学和生物安全等问题,中国应该在遵守国际相关公约的基础上,在有效保护人类遗传资源的同时,使得资源能够得到最大化的共享和利用,为人类攻克疑难杂症,提升健康水平做出应有的贡献。
国际人类遗传资源的数据共享管理现状
经济合作与发展组织关于人类遗传资源数据共享管理现状随着经济全球化和现代信息处理技术、传递技术的发展,科学研究呈现出分布化、实时化、大规模化的趋势。科学数据在科技创新中的战略地位不断得到提升。2004年,经济合作与发展组织(Organisation for Economic Co-operation and Development,OECD)在其发布的《推进科学研究数据共享/公开,促进科学、经济和社会发展》报告中重点提出以下两点原则:(1)由公共资金资助的研究数据是由公众研究兴趣产生,是一项公共资产;(2)由公共资金资助的研究数据应最大程度实现开放获取,数据共享不仅可以使研究者和普通民众受益,而且能给科学、经济和社会发展带来诸多福利[2]。2006年,OECD发布《OECD关于公共资金资助项目的研究数据获取原则和指南》[3],要求成员国将“开放性”、“灵活性”、“透明性”、“法律一致性”、“保护知识产权”、“正式性”、“专业性”、“协作性”、“保证质量”、“安全性”、“效率”、“多方评价”、“持续性”13条原则用于制定国家科学数据共享的法律和政策中,以指导各国公共领域的科学数据共享活动。
随着基因测序技术的兴起和快速进步,各国的科学研究产生了大量的基因测序数据,在此背景下,OECD于2006年底发布了《人类遗传资源研究数据库的建设和管理指南》[4],2009年发布了《OECD人类生物样本库和基因研究数据库建设指南》[5],2013年又修订了《关于保护隐私和个人数据跨境流动的准则》[6],这些指南提出了OECD对各国建设人类生物样本库和基因研究数据库中关于数据库管理、监管、数据保护、数据共享和知识产权保护等方面的指导原则。
代表国家人类遗传资源数据共享的管理现状
美国:《信息自由法》[7]和《版权法》[8]是美国数据共享政策的法律基础。《信息自由法》规定联邦政府应该公开的数据和信息,《版权法》规定“版权保护条款下的版权保护,不适用于美国政府的作品”,这两大基本法律明确了公众对政府信息具有自由获取的权利。美国白宫总统科技政策办公室早在1991年就发布了《全球变化研究数据管理政策声明》[9],首次将“完全与开放”的数据共享政策作为国家科学数据共享的基本国策。《联邦政府信息管理条例》、《美国联邦政府资助的科研项目数据采集和递交的办法和程序》、《联邦政府资助并委托非营利性机构科学研究所产生的数据管理条例》等政策进一步明确了各类科学数据生产者的权利与义务,协调科学数据共享过程中涉及的不同主体关系,加大了数据共享的深度。
国立卫生研究院(National Institute of Health,NIH)作为美国健康领域研究的国家代表,分别在2003[10]、2007[11]、2014年[12]发布及修订了基因组数据共享政策(Genomic Data Sharing,GDS),要求所有向NIH申请项目经费在50万美元以上的科研人员必须提交1份数据共享计划或者数据保密说明,并按规定共享科学数据。同时制定了《NIH数据共享政策和实施指南》、《数据共享常见问题问答》、《数据共享手册》以及非NIH机构的数据共享文档资料等若干指南,为解决共享活动中关于个人隐私、数据安全、知识产权等问题提供指导。在数据共享中涉及到的受试者隐私保护方面,美国还出台了相关的法律,如《健康保险携带和责任法案(Health Insurance Portability and Accountability ACT,HIPAA)》、《反基因歧视法》等,HIPPA明确提出了受保护的健康信息去识别的标准,受保护的健康信息去可识别后的使用和公开标准[13];反基因歧视法提出了不伤害原则、知情同意原则、维护个人遗传机密性等人类遗传资源管理和保护的原则,通过联邦立法建立了保护个人免受遗传信息歧视的统一标准,对个人遗传信息的披露和保密要求做出了明确规定[14]。
英国:英国国会出台的《人体组织法》和《人体组织条例》是英国对人体细胞、组织以及器官等人类遗传资源材料进行管理的主要法律依据,相应成立的人体组织管理局负责对不同情况下涉及人类遗传资源材料采集和使用的监督管理[15]。在OECD宣言的倡议下,英国的政府及公共资助机构、医学研究机构均制定了相应的数据政策,包括英国研究理事会(UK Research and Innovation,UKRI)《数据政策通用原则》、惠康基金会(Wellcome Trust,WT)《数据管理和共享政策》、医学研究理事会(Medical Research Council,MRC)《MRC数据共享政策》、生物技术与生物科学研究理事会(Biotechnology and Biological Sciences Research Council,BBSRC)《BBSRC数据共享政策》、英国癌症研究院(Institute of Cancer Research,ICR)《数据共享指南》等,这些政策和指南规定数据的可获取性是机构的职责范围,要求其资助研究所产出的科学数据应在不损害知识产权和隐私的情况下以尽可能少的限制及时开放共享,研究人员拥有优先权但并不是独家使用,数据管理活动贯穿整个项目周期,以及关于伦理及知情同意原则的相关要求[16]。
MRC和WT创建的英国生物样本库是英国最大的非营利生物数据资源库,其所收集的数据和样品严格限定在经过伦理和科学审查的研究中使用,有关批准、保密和数据安全等问题由《英国生物样本库伦理和监管框架》规范[17]。2012年英国提出“十万基因组计划”,2018年又升级为“百万基因组计划”,该计划自提出时即制定了全周期的数据管理政策,包括保密、访问、记录管理、数据安全等方面[18]。
日本:公共资金资助研究的人类基因组数据共享管理由日本科学技术振兴机构国家生物科学数据库中心(National Bioscience Database Center,NBDC)根据其制定的《人类来源数据共享指南》(以下简称《指南》)进行,《指南》规范了向NBDC提交数据时的要求和使用NBDC数据时的原则,提交的数据分为“开放数据”、“受控访问数据”、“未来公开数据”和“去识别之前的数据或无数据共享计划的数据”4类,在数据共享时归为“开放数据”和“受控访问数据”两大类进行管理。《NBDC人类数据安全指南》定义了安全使用受控访问数据进行科学研究应遵守的最低要求[19]。
日本DNA数据库中心(DNA Data Bank of Japan,DDBJ)隶属于日本国立遗传研究所,是日本的生物医学数据存储中心,2013年与NBDC合作建立日本基因型与表型档案数据库(Japanese Genotype-phenotype Archive,JGA),NBDC的《指南》同样适用于JGA数据的存储和共享使用,由人类数据访问委员会负责对数据使用申请进行审查,包括知情同意、隐私保护及是否符合《指南》的规范等。JGA对数据管理、存储和共享的方式由严格的协议控制。JGA只接受经过审查同意的去识别化的数据,数据共享使用时分为开放数据和受控访问数据两类:(1)所有人都可以使用开放数据;(2)只有拥有相关研究经验的研究人员(在大学、公共研究所或私营公司工作并有从事相关研究经验的人),才能申请作为首席研究员使用数据,并提供与计划使用数据相关的学术出版物及机构联系方式[20]。
国际人类遗传资源数据共享的管理要点
数据共享指南的要点
从国家利益和公共利益出发,应对数据需求:人类生物样本库和基因研究数据库(Human Biobanks and Genetic Research Databases,HBGRD)的建立、管理和监督,始终要遵循公开透明和问责制的原则,数据库治理结构的设计应确保受试者的权益,通过明确的监督机制确保HBGRD的治理、管理、运行、访问、使用和终止使用(停用)都符合法律要求和道德原则。
以确保数据的安全性为首要宗旨,采用低成本、平等的公有数据共享方式:OECD提出,HBGRD的建立、管理、治理和运行应该以阻止不适当或未经授权的访问或使用受试者的人体生物样本和个人数据及信息为宗旨,在人体生物样本和数据的收集、处理、存储、转换和销毁各环节中,都要以保护受试者的隐私及其标本和数据的机密性为首要原则,在收集人体生物样本或数据之前,必须向受试者提供关于其样本和数据如何得到保护的信息,在进行样本和数据的销毁处理时,也需首要遵循知情同意、隐私和保密的原则。
HBGRD应以不高于分发传播费用的成本平等地获取科学数据,形成简单、及时、用户友好的开放环境。不同国家间的共享机制要尊重各国法律体系和文化的不同。
通过制定明确的知识产权政策法规和执行规范,应对科学数据应用与共享过程中产生的风险和利益均衡问题:OECD明确提出,HBGRD建立的目的在于促进共享。鼓励研究人员申请获取并适当使用数据库中存贮的人体生物样本、数据和资料,并将进行研究而获得的科学利益能尽可能广泛地共享。要制定明确、正式化的政策法规促进对数据的获取,制定明确的知识产权政策和成果转化政策,规范对于使用存储资源产生的科技成果或成果转化事项。对科学数据应用与共享过程中必然产生的利益均衡问题,需要通过法律手段予以解决。
HBGRD的数据访问标准必须与受试者知情同意书中的内容保持一致,在审批访问请求时,申请者需要提供一个科学的、符合伦理标准的科学研究计划,并能够达到相应的隐私和保密标准,且只能访问被编码或匿名化的人体生物样本或数据(去识别化),不允许向第三方(如执法机构、保险公司等)提供用于非研究目的的人体生物样本或数据。在某些极为的特殊情况下,研究人员可以获得未被编码或匿名化的人体生物样本或数据。
代表国家对人类遗传资源数据共享的管理要点
在研究项目申请时即明确数据共享要求:NIH将遵守GDS政策成为项目申请批授或项目授予公告的一项特殊条款与条件。未能遵守资助协议的这一条款与条件可能启动强制执行程序,包括按照《联邦法规》扣发拨款和/或按其他判例酌情处理。英国不同研究机构颁布的数据共享政策和指南均要求在项目申请阶段同时提交数据共享计划并说明开放共享的细节,采取积极和协作的方式,确保及时制定和采用适当的数据标准,以支持高质量的研究和数据共享。在日本,由公共资金资助的项目产生的数据也要提交促进数据共享的计划书。共享计划书中的内容一般包括符合政策要求的共享方案,使用限制,可能需要的任何资源如提交数据的准备,相应的数据库建设等,由资助方对共享计划的遵守情况进行核查。
NIH一般要求在初始数据提交的6个月内,或者在首次接受发表的时间发布提交至NIH指定数据存储库的数据。英国要求的时间一般为研究成果在出版物上发表后的6个月内,最迟不晚于其主要成果在出版物上发表的时间。日本要求研究人员应及时发布数据,但可要求在发表研究成果、获取知识产权等权益后延迟发布数据。
通过政策法规和数据库加密技术保障受试者隐私和数据安全:根据美国健康与人类服务部(Health and Human Services,HHS)人体受试者保护规定及健康保险隐私及责任法案(Health Insurance Portability and Accountability Act,HIPAA)中的隐私规则,向NIH指定数据存储库提交的人类基因组数据要进行去识别处理,并取得数据库(如dbGap)的保密证书作为附加预防措施,防止任何可辨识个人身份的信息遭强制披露。数据提交到日本NBDC数据库时,所有经过审查的可接收数据将再次经过一轮去识别过程,将原始数据文件加密后归档于数据库中,并通过制定了《人类数据安全指南》用于指导数据使用者采取安全措施保障共享数据的安全。英国基因组计划为保护数据安全,对数据访问设有网络限制,可以免费提供给英国基因组学临床分析合作伙伴(Genomics England Clinical Interpretation Partnership,GeCIP)的成员,但所有的数据访问只能在英国基因组数据中心的“研究环境”下进行,“研究环境”中提供了分析工具和应用程序,但不允许下载任何测序或临床数据,也不允许向其中导入新增或拷贝出任何原始数据,所有文件的进出将通过一个名为“airlock”的系统。
数据共享前必先获得受试者的知情同意:尊重和保护研究受试者的利益是各国管理人类基因组数据的基本原则。NIH规定,数据或样本收集的知情同意情况是判断是否适合提交数据的依据,也是决定数据是否公开或受控级别的基础,因此要求知情同意书中必须包含关于未来研究性使用和数据共享方式的说明。英国生物样本库资源获取的首要原则就是符合受试者知情同意原则和《英国生物样本库伦理和监管框架》,机构伦理审查委员会、隐私保护委员会等根据知情同意材料判断数据的共享方式。日本NBDC在规定中明确指出,数据共享前需获得受试者关于要向数据库提交数据并用于分享的知情同意书并通过所属机构伦理审查委员会对相应内容的审核和批准。此外,各国的管理要求中更明确提出,将对数据提交和后续基于研究性目的数据共享与受试者知情同意书中的内容是否一致且符合相应的国家法规进行监管。
研究性使用共享数据要严格遵守访问条款并签署使用认证协议:各国对数据访问的管理基本都是采用无限制访问和受限数据访问的分级体系。访问受控级别数据的请求由数据访问委员会审查,根据数据访问申请书中拟开展的研究计划是否超出数据提交机构通过机构认证时设定的数据使用限制来判断是否批准申请。
研究人员获批从数据库下载受控访问数据后,还应与其所在的研究机构达成数据使用认证,并遵守用户行为准则,包括禁止识别个人身份,未经同意将编辑过的数据提供给任何第三方等。数据使用认证协议由申请数据使用的研究人员和其所在机构的科研主管共同签署,详细说明使用受控访问数据进行二次研究的条件。
中国人类遗传资源管理现状和问题
中国早在1998年就成立了中国人类遗传资源管理办公室,首次发布了《人类遗传资源管理暂行办法》(以下简称《暂行办法》)(国办发[1998]36号)[21],近年来相关的管理办法和条例在不断完善,包括2015年科技部发布的《人类遗传资源采集、收集、买卖、出口、出境审批行政许可事项服务指南》[22],2016年出台的《人类遗传资源管理条例(送审稿)》[23],2017年正式实施利用中国人类遗传资源开展国际合作临床试验的优化审批流程[24]。同时,积极推进中国人类遗传资源的基础设施建设,包括共享网络与信息化平台,研究相应的标准规范、质量控制体系等[25]。开展的人类遗传资源样本库建设项目包括科技部“生物安全关键技术研发”重点专项支持的青藏高原人类遗传资源样本库建设(2016年)、中国人类遗传资源样本库建设(2016年)和分布式人类遗传资源库建设与应用示范(2016年),科技部“十三五”重点研发计划精准医学专项支持的中国十万人基因组计划(2017年),教育部“科技基础资源数据平台建设计划”资助的中华民族群体遗传资源数据整合共享平台(2015年)。
目前中国在管理上还存在以下问题:(1)监管力度位阶不够,没有正式立法,资源非法盗取事件屡禁不止;(2)遗传资源获取和共享过程的知情同意和获益分享等方面的监管细则不够明确,受试者隐私保护存在安全隐患及应得利益被非法攫取;(3)对遗传资源的数据管理和共享使用还未出台与国际接轨的官方规范和指南,主要依赖国际生物信息数据库提供的服务,不利于规范的数据共享并引起资源的隐形流失等问题。
对中国人类遗传资源数据共享管理的启示
加快资源保护立法,运用法律手段解决资源共享过程中产生的问题近年来生物技术的发展,很大程度上得益于对遗传信息的获取、解读,但不法组织和机构对中国人类遗传资源的攫取和非法利用情况屡禁不止,因此需要尽快正式出台适应当前发展需求的《人类遗传资源管理条例》,通过法律手段解决科学数据应用与共享过程中必然产生的利益均衡问题、生物安全问题,加大对违法行为的处罚和约束,提升监管机构的监管效力。为中国的人类遗传资源提供切实有效的保护,减少造成生物安全风险的可能。
完善共享机制建设,推动中国人类遗传资源的有效、合法利用科学数据共享是全球科学研究必然的发展趋势,大数据时代,科技创新越来越依赖于科学数据综合分析,但科学数据管理在中国属于“短板中的短板”。2018年3月,国务院办公厅正式关于印发《科学数据管理办法》[26],为进一步加强和规范科学数据管理,推动科学数据开放共享,更好地服务于创新提出了明确的管理要求。
生命科学研究正在进入大数据、大平台、大发现时代,数据共享管理机制的缺乏在一定程度上迟滞了中国对资源的有效利用和在该领域的原始创新,也不利于对资源的管控和监管。目前迫切需要建立与国际接轨的资源采集、收集、保藏、研究使用、特别是国际合作中的数据共享的规范和标准,发挥中国人类遗传资源的优势,在生物医学研究的核心关键技术领域做好前期布局。
加强资源共享平台建设,为共享提供合法途径,为“健康中国”战略建设提供资源保障中国虽然是资源大国,但不是资源强国,只有将保护和开发利用有效结合起来,才能成为国家真正的战略资源。中国的资源和数据存储碎片化、管理分散、无安全保障和标准化质控,难以形成规模化资源和有效共享转化,因此需要统一布局,建立起类似美国NCBI、欧洲EBI、日本DDBJ这样具有规模,由国家统一管理,与国际接轨和国际认可的国家级资源战略保藏平台,摆脱中国科学家只能到他国数据库中上传数据的局面,为支持“健康中国”战略的科技创新提供资源保障。