遗传学家推动全球数据共享
2013-04-10李升伟编译
李升伟/编译
●一个两难悖论困惑着基因组医学界:尽管近乎人们都普遍认同医生和遗传学家之间应该交换更多的数据,但缘于隐私和安全考虑,或信息是一种有价值的商品,要完成其目标仍有一段不小的距离。
6月5日,一个由来自13个国家的69家机构组成的“全球同盟”组织宣称,将制定相关的标准和政策以推进对个人DNA序列和临床信息的共享。就具体工作方式,其创办者将效仿万维网联盟模式,后者于20世纪90年代建立了编程语言HTML标准,刺激了因特网网页的急剧增长。
该同盟成员之一的美国国立卫生研究院(NIH)院长弗朗西斯·柯林斯(Francis Collins)认为,目前还没有存储遗传学序列或评估其准确性的标准,“同盟步入了一种事实上还是空白的领域。”同盟为此希望解决那些妨碍研究人员共享数据的隐私和知情同意问题,包括计划创建一个由云计算平台和分析工具组成的网络来提供对共享数据的检索。
“毫无疑问,这项计划是物有所值的。”加州斯克利普斯转化医学研究所所长埃里克·托普尔(Eric Topol)如是说。迄今他还没有考虑加入同盟。但他补充说:“推倒围墙、走向共享,这意味着是需要技巧的。因为每个机构都想在其专有领域拥有自己的数据。”
这项努力得到了包括NIH、英国维尔康姆基金会桑格研究所、中国华大基因研究院等世界上最有影响力的序列数据拥有机构的支持。麻省坎布里奇市布罗德研究所的遗传学家大卫·阿特舒勒(David Altshuler),正领导着这个项目的8人组织委员会,他说:“这个项目比任何小组或机构都更大,让我们一起来勾画如何使其正确运行的方法。”
随着测序成本的下降,已测序的人类基因组的数目有望达到数百万个。但是,研究人员不能从中得到一个完整的图景,即各种基因是如何影响疾病的,除非那些数据与临床信息得到链接,并且不同的机构彼此可以共享这些数据。
通常,研究人员是不愿与他人分享这些来之不易的信息的。在有些场合,基于隐私方面的考虑,他们甚至还会动用法律手段来阻止这样的行为。然而,这同时也阻碍了科学家通过来自世界的数据以发现一些简单问题的答案,比如,一种特定的遗传学变异本与某种疾病有多频繁的关联性?
储存和数据共享技术标准的建立,将使基因组数据更加容易分享和分析。当然,同盟还希望克服一些法律障碍:匿名性如何处理、什么信息需要保密以及需要遵守的一些核心原则。即使它们的政策与其他不太中性化的方式而有所不同。
为了鼓励工具的研发及便于患者保持对他们的医疗和遗传学数据的控制与掌握,美国国立癌症研究所(NCI)所长哈罗德·瓦穆斯(Harold Varmus)建议,各机构应该对他们的数据进行标记,以便其只对特定的研究开放。他说,这一步“将是非常重要的。”
尽管一些大型的基因组医学研究机构加入了这个同盟,但还是有相当的机构没有参加,这或多或少地限制了外部人员对数据的获取。后者或是基于隐私和安全考虑有所顾忌,或同时也是因为信息是一种非常有价值的商品而有所保留。
柯林斯和瓦穆斯认为,将来NIH和NCI这样的机构可以引导更多的研究计划加入其中,措施是要求受资助的机构和科学家遵守同盟制定的政策。桑格研究所所长米歇尔·斯特拉顿(Michael Stratton)认为,这一计划的成功取决于各个机构能否放弃对各自数据的控制,以获取更加广阔世界的数据是值得的。“我们笃信这样的理念:为了人类的福祉,对于提炼最大数量的知识来说,共享数据将是最核心的。”