中国慢性病前瞻性研究的标准化生物银行建设
2014-02-16孙孪孪谭云龙李立明
郭 彧,孙孪孪,谭云龙,李立明
·述 评·
中国慢性病前瞻性研究的标准化生物银行建设
郭 彧,孙孪孪,谭云龙,李立明
慢性病已经成为威胁人类健康的主要杀手。随着组学时代的到来,大型人群为基础的生物银行将会为慢性病的预防和治疗开辟新的领域。标准化的生物银行将成为基因组学、蛋白组学及代谢组学等研究的重要资源,是将科研成果迅速转化为与人群健康相关的干预措施、政策策略的重要保证。本文就建立生物银行的目的和意义,国内外主要人群为基础的生物银行建立和管理情况进行简单综述,并以目前国内最大的中国慢性病前瞻性研究为例介绍该生物银行管理和运行情况,以期为同类研究提供参考。中国慢性病前瞻性研究于2004年起在中国10个省的10个地区开展,共包括51万余人,通过问卷、体检和生物样本的采集,以及发病和死亡监测等方式长期跟踪随访,建立中国人群的基础健康数据库,是目前世界上最大的涉及长期保存血液样本的前瞻性人群队列研究之一。
慢性病;生物银行;转化医学;队列研究;流行病学
世界卫生组织2011年报告显示,2008年全球由慢性病引起的死亡占到总死亡的63%,在中低收入国家,慢性病成为60岁以下人口的主要死因,严重影响了劳动力人口。与发达国家相比,发展中国家面临的慢性病挑战更为严峻,在我国2008年由慢性病引起的死亡人数占总死亡人数的83%[1],同时还存在着发病年龄前移的现象,寻找积极有效的慢性病防控措施成为了现阶段我国慢性病防制工作的重点。
目前,对于主要慢性病已经形成明确共识的重要危险因素包括吸烟、不合理膳食、少体力活动、过量饮酒等可变因素[2],但是对于遗传因素及遗传和环境交互作用对于慢性病的影响尚无一致性结论。已有研究多采用病例对照研究、病例系列研究和横断面研究,研究中较少完整收集调查对象的生物样本信息,因而研究的证据力度小[3-6]。人类基因组计划的完成、基因组学的发展,为人类认识慢性病的致病机制创造了新的条件和手段,为实现分子诊断、基因治疗的新方法提供了理论依据。因此,积极开展大规模前瞻性人群流行病学队列研究,建立人群为基础的生物银行(biobank),高效地收集和利用同时包括遗传和环境因素的大规模人群研究数据,对探讨影响慢性病致病和易感性的因素、有效地预防和控制慢性病具有极为重要的意义。
1 生物银行概念
生物银行,又称生物样本库,是指通过标准化的流程,收集并长期储存人体生物样本(例如血液和DNA)及样本采集对象生理、病理信息的资源库[7]。从流行病学的角度看,大多数的生物银行本质上是大样本的人群前瞻性队列研究,不同之处在于前者在收集传统流行病学危险因素的同时兼顾收集并长期保存调查对象的生物样本资料[8]。生物银行主要分为疾病资源库和人群样本库两大类。前者主要收集已经患有某种(或几种)疾病的人群中相关信息及生物样本,主要用于指导临床实践,例如美国国家级肿瘤样本库;后者主要是从一般人群中收集健康相关信息,主要用于指导人群健康及预防疾病,例如英国生物银行(UK Biobank)[9]。目前,包括我国在内的许多国家已经建立或者正在建立大规模的人群生物银行,开启了慢性病病因学研究的新天地。
2 国内外生物银行建设现状
20世纪末大型生物银行逐渐兴起于欧美国家(表1),冰岛于1998年最先提出生物银行计划,计划将全国27万名公民的健康记录建成卫生部门数据库,再与研究人群详细的家谱(genealogy)和遗传资料相结合,构成冰岛生物银行资料库系统——基因型、谱系及表型数据库。UK Biobank于2006—2010年在50万名年龄为40~69岁的人群中收集血液样本和与之相关的详细生活方式资料,追踪10~15年。除此之外,美国、加拿大、日本、瑞典、新加坡等国也都在积极推进生物银行项目。这些生物银行样本规模大小不等,但都是收集遗传、生活环境相关信息,以及患病情况。通过长期随访监测资料与生物样本资料的结合探索遗传和环境因素对于疾病的影响。与此同时,国际上已经成立相应的机构或组织对生物银行的建立和管理进行标准化,例如国际生物和环境资源协会、欧洲生物银行与分子生物资源研究中心,极大地促进了不同生物银行之间的交流和资源共享。
表1 目前国外主要大型人群为基础的生物银行
与此同时,我国也在推进生物银行的建设,在以医院疾病资源库为主的生物银行建设基础上,上海、广州、泰州、北京等地已经建立起人群为基础的生物银行(表2)。目前,由于缺乏统一的标准,不同的生物银行在建设过程中大多根据自身条件完成,在建设质量和管理水平上存在较大差别。为此,本文以目前国内最大的人群为基础的生物银行,同时也是世界上最先进的生物银行之一,即中国慢性病前瞻性研究(China Kadoorie Biobank,CKB)为例,介绍其生物样本的标准化管理流程,以期为同类研究提供参考。
表2 国内主要大型人群为基础的前瞻性生物银行
3 CKB的生物样本标准化管理流程
2004 年中国和英国合作启动了一项大型的CKB,项目旨在通过建立基于血液的基础健康数据库,从遗传、环境和生活方式等多个环节深入研究危害中国人群健康的各类重大慢性病(如脑卒中、冠心病、癌症、糖尿病、高血压等)的致病因素、发病机制及流行规律和趋势,为有效地制定慢性病预防和控制对策、开发新的治疗和干预手段提供科学依据。项目在中国10个省的10个地区(5个农村、5个城市)开展,共包括51万余人,持续时间15~20年,是一项多因素、多病种、多学科合作的大规模慢性病病因流行病学研究,也是目前世界上最大的涉及长期保存血液样本的前瞻性人群队列研究之一。
CKB项目自2004年1月1日正式启动,采取整群抽样的方法,以城市居委会和农村的村为单位,对选定调查点符合入选标准的35~74岁成年人进行一次全面的基线调查,全面了解队列人群的基本人口学特征、健康相关因素(例如生活方式、吸烟、饮酒情况等)及健康状况,以建立基础健康数据库。调查对象进入队列后,各个地区项目办通过国家的发病和死亡监测系统,以及各级医保系统对调查对象的健康状况进行长期追踪随访。每隔5年还在各调查点内随机抽取部分调查对象进行全面复查,以了解队列人群的生活方式、行为、饮食等因素的动态变化情况,并采集生物样本(例如血液、尿液)进行长期保存。基线调查于2004年6月开始,2008年7月结束,共入选513 211人,其中男性占41%、平均年龄52岁,血液采集率99.9%。基线调查完成后,项目随即于2008年8—10月开展了5%抽样的第1次重复调查,共抽取24 302人,完成调查20 144人,应答率为83%。项目计划于2013年7月—2014年7月开展5%抽样的第2次重复调查,共抽取35 000人,计划完成25 000人。
CKB项目生物银行信息的收集和保存总体来讲分为健康信息和生物样本信息,前者主要包括患病情况及健康行为信息,通过现场调查和长期随访监测获得;后者主要包括血液和尿液样本。将来随着研究的开展,还将会收集其他生物样本。生物样本的采集主要通过现场调查完成。
3.1 健康信息库
3.1.1 现场调查 截止到目前,共开展了3次现场调查。项目基线调查于2004年6月正式启动,2008年7月结束,在全国10个地区调查入选了35~74岁的51万余名对象。按照计划,2008年8—10月在10个点开展了第1次重复调查,调查了2万余名对象。目前,第2次重复调查已经于2013年7月启动,预计于2014年7月结束。
现场调查包括体检、问卷和生物样本采集。体检包括身高、腰围、臀围、体质指数、体脂百分比、血压、心率、肺功能、肺一氧化碳等。所有体检结果均在现场调查时由问卷人员输入计算机中。问卷共包括十大部分内容,涉及个人一般情况、饮茶、饮酒、吸烟、饮食、生活习惯、体力活动、职业和室内空气污染暴露史、疾病史及女性生育史等内容,均与主要慢性病的已知危险因素有关。采用电子问卷形式,所有问卷内容由调查员边询问边同步将结果直接录入计算机中。电子问卷除具有操作简便、数据采集完整性好(如可完全避免缺失值的出现)外,还可以做到对问卷调查表中的各项内容进行详细的逻辑错误检查,以及判断所输入的数值是否在可接受的界限范围内,从而能够对问卷的填写质量进行及时的评估和纠错,确保数据的质量。
随着科学研究的发展,结合项目已有研究成果,CKB第2次重复现场调查形式上虽然依旧包括问卷、体检和生物样本采集/检测,但是内容和检测项目上在不断丰富。问卷涉及问题面更宽,问题也更细致,体检项目新增加了6个项目(手握力、骨密度、踝部血压、颈动脉超声、心电图和脉搏波速度)。除血样外,还采集尿样,现场检测项目除随机血糖外,还增加了血脂检测和11项尿检测定。
为确保全国各个调查点的研究质量以及所收集资料的准确性和可比性,CKB项目采用统一的研究方案和操作手册,项目中所涉及的器械和材料均由国家项目办及牛津大学临床试验研究中心统一采购并集中调试,以减少系统偏差,确保研究结果的准确性、稳定性及可比性。
CKB项目全程实行计算机化管理,从项目的现场数据采集(如电子问卷表)到常规监测工作,从生物样本的登记、分装、储存、运输到物资设备、材料的供应和运输等各个环节,通过专业化开发的软件系统进行规范化管理。数据的传输由专人负责,现场采集的数据于采集当天上传到CKB北京的服务器中,实现了数据的同步和动态现场工作的质量控制。
此外,在项目基线调查过程中,根据课题设计要求,每个调查点随机抽取3%的研究人群进行复查,以确定所采集的原始调查资料的可靠性。
3.1.2 长期监测 做好长期随访监测工作,准确地了解研究队列人群中各类疾病的发病及死亡情况是CKB项目研究工作极为重要的内容之一。长期随访监测工作主要建立在各地行政部门现有的常规疾病死亡、发病报告体系、医保住院事件信息收集系统的基础上,与当地公安、民政以及各级医院和社区医疗服务中心等机构密切联系,对研究队列人群的人口学概况、死亡、主要慢性疾病发病、迁移和失访情况进行动态追踪观察。
项目从2004年调查对象进入队列开始,即开展随访监测工作。目前,CKB已经形成完善的监测网络系统,主要通过以下2个途径:一是常规监测,即政府部门(包括卫生、公安、民政、社会保障和计划生育等)常规工作中形成的数据库,从中筛选出CKB项目研究人群相关随访信息;二是定向监测,通过项目社区街道、居委会或乡镇、村的相关工作人员获取该调查点内项目人群的死亡、发病、迁移等有关随访信息。对于常规上报的死亡、发病、住院事件,项目相继开展了疾病诊断准确性调查、人群稳定性调查、未参保人员调查、死亡卡片准确性调查、死因不明调查、漏报调查等,保证了队列人群监测质量。截止到2013年11月底,队列人群共报告死亡22 100例,报告发病44 865例,收集住院信息52.5万人次。
目前,CKB队列人群中恶性肿瘤、脑卒中、缺血性心脏病、糖尿病等主要慢性病的病例已经积累到一定数量,针对项目人群的部分研究正在开展,部分生物样本的检测工作也逐渐开展,研究成果初步显现。随着长期随访和监测工作的进行,研究人群的健康相关信息及生物样本信息将会更加完善,这个不断丰富的数据库将会成为未来人类探索疾病病因、实现慢性病的早期预防和控制的宝贵资源。
3.2 生物银行 目前,CKB共保存项目研究人群约210万份血液相关样本,约10万份尿液样本,以及近30万份DNA样本。生物样本由CKB中国生物银行及英国牛津大学临床试验研究中心生物银行共同管理和保存,实现同一调查对象生物样本的异地异库管理,其中DNA样本全部由中方保存和管理。随着每5年1次随访调查及科学研究的开展,将会有更多的生物样本进入,更多的检测在这个大型生物银行中开展。
3.2.1 生物样本的现场采集 对于符合项目调查对象入选标准的当地居民,在同意签署《知情同意书》后,才可以进入到项目研究人群中。
生物样本的采集由10个地区项目办的工作人员完成,工作人员具有医学专业背景,在开展现场工作前需要经过国家项目办统一培训。在现场采集开始时,工作人员需要先对调查对象身份进行核对,同时核对采血管及采尿管上的条形码与调查对象知情同意书中的研究编码一致,确认无误后方可开始生物样本的采集工作。CKB不要求调查对象在采血前禁食,但是需要记录调查对象最后一次进食至采血时的时间间隔。使用乙二胺四乙酸处理的真空采血管进行静脉血收集,现场进行部分血糖和血脂指标(如高密度脂蛋白、低密度脂蛋白及三酰甘油等)的检测,结果记录在CKB计算机系统中,同时将检测结果反馈给调查对象。剩余血液暂时存放于现场0~4℃的冷藏箱(第2次重复调查改为冰箱)中,当天现场工作结束之后,所有血液样本全部运回到地区项目办实验室中进行离心、分装和暂时储存。
考虑到项目研究目的及现场实际情况,在第2次重复调查中要求调查对象现场提供中段尿样。使用无菌可封闭采尿杯和10 mL真空采尿管进行收集。使用调查对象采尿杯中的剩余尿液进行现场11项指标的检测(如白细胞、亚硝酸盐及尿胆原等),检测结果可以当场反馈给调查对象;采尿管中的尿液暂时存放于现场0~4℃的冰箱中,当天现场工作结束之后,所有尿液样本全部运回到地区项目办实验室中进行分装和暂时储存。
3.2.2 生物样本的离心分装 生物样本经调查点现场短暂储存后,于当天返回CKB项目地区实验室,地区实验室对样本的数量和状态进行确认和登记后,将接收的样本暂时存放于普通冰箱(4℃)中,并于样本采集24 h内完成分装和储存。
血液样本在低温离心机离心完成后,将血浆层和白细胞层分装在4个2mL冷冻管中(其中3管为血浆样本),即每个调查对象的血液样本对应4个冷冻管。分装完成后将真空管(血液和尿液)与对应的冷冻管信息扫描入CKB专用计算机系统,至此实现调查对象信息与生物样本信息的关联。分装完成的生物样本暂时储存在地区项目办实验室的低温冰箱(-40℃)中,在该过程中,同一个调查对象的生物样本不允许放置在同一个冰箱中。
3.2.3 生物样本的转运 地区项目办暂时储存由现场采集分装的生物样本,国家项目办根据当地的工作状况及样本采集数量发出样本转运请求,在-70℃条件下(干冰保存状态下)48 h内由专业生物样本运输公司将样本由地区项目办转运至北京生物银行。其中,血液和尿液样本各2管在到达北京生物银行进行短期保存后将被运往牛津大学临床试验研究中心的生物银行,实现异地异库储存,其余生物样本全部储存在北京生物银行。
4 北京生物银行核查接收样本
生物样本到达北京生物银行后,工作人员对样本进行核查和登记,将样本信息扫描入计算机管理系统。为防止样本的冻融,生物样本的扫描需要在-20℃操作平台上进行,登记完成后需要立即放入超低温冰箱(-80℃)。在北京生物银行储存中,同一调查对象基线和随访调查的生物样本须存放在不同的冰箱中,同一调查对象同一次调查的生物样本须存放在不同的冰箱中。2014年除白细胞、DNA样本外,其他样本将转入液氮罐中进行长期保存。
根据项目研究需要,目前已对项目研究人群中的15万人开展了DNA提取工作,DNA样本全部存储在北京生物银行,按照项目计划,最终将完成所有队列人群的DNA提取工作。
目前,北京生物银行存放有基线及每5年1次的随访研究的生物样本,共计约120万份生物样本,包括血浆、白细胞、尿液及30万份DNA样本。随着随访调查研究及基因提取工作的开展,在今后将会有更多的来自CKB人群的生物样本存储在生物银行中。
5 北京生物银行安全保障
保障生物样本处于安全状态是进行一切工作的前提条件。目前,北京生物银行由专人24 h值守,所有样本储存在-80℃超低温冰箱中,2014年起所有的血液样本将转入液氮罐中进行存储。研究样本的每一个生物样本的物理存储位置、使用过程及存储状态信息均通过CKB项目专用计算机系统实时记录,同时实现了生物样本信息与个体健康信息的连接。
5.1 生物样本的存储和使用安全保障 为保障样本的长期存储安全,CKB项目已建立了完善的生物银行安全管理体系。在生物银行建立之初即配备有备用发电机可提供专线供电,避免供电故障对样本安全造成的威胁。样本在存放过程中严格按照异地异库、同一个研究对象的样本分开存储原则,即同一次现场调查的样本分别存放在2个超低温存储装置中,基线调查的样本同重复调查的样本分别存放。此外,生物银行备用超低温冰箱可以容纳15%~20%的生物样本,平时备用冰箱同其他冰箱一起运行,可实现突发情况下的样本紧急转运。2014年,随着血液样本转入液氮罐,届时备用空间将进一步增大。
生物银行通过24 h不间断监控体系,实现对样本存储装置进行实时监控。当冻存设备发生故障时温度升到警戒值,系统会通过音乐、短信及电话的方式通知负责人。液氮罐启用后,除对液氮温度实时监控报警外,还将安装液氮液位监控和报警装置。这样能够在第一时间发现故障,尤其是在下班和节假日期间更为重要,便于及时采取措施,避免对样本造成损失。监控体系还将对生物银行室内温度和通风状况进行实时监控,保障工作人员的操作安全及存储设备的安全。为保障所有应急设备的安全运转,北京生物银行定期进行发电测试、报警测试及设备的维护等。
5.2 生物银行的信息安全 生物样本对应的个体信息是进行科学研究的重要组成部分,信息安全至关重要。在生物银行中工作人员现场收集的信息和数据通过项目专用软件安全处理后存储在项目专用服务器中,项目服务器装有独立的数据库,数据库有专人维护管理,并对可以访问数据库的人员进行安全权限分配,生物样本信息与个体信息分属不同权限的人员管理。此外,每个工作人员都有指定的用户名和密码口令。所有重要数据都进行加密,并对数据进行定期备份和异地备份。生物银行所有项目计算机均安装硬盘加密。所有项目计算机都装有正版杀毒软件、专用数据传输软件,在通过U盘、移动硬盘或其他移动设备进行邮件传输和数据传输时,需要对数据进行特殊加密,避免信息的泄露和数据的丢失。
同时,在进行生物样本的转运和使用过程中,只涉及样本的研究编码,不涉及任何样本对应的个人信息,因而操作者无法获知样本的个体信息,保证了生物样本传递过程中的信息安全。
6 问题和挑战
众所周知,在未来很长一段时间内,慢性病仍将是威胁人类健康的主要杀手,由其带来的疾病负担仍将继续加重[10],而中国人口众多,所面临的慢性病负担将更为严重。同时,在中国不同地区之间不同慢性病的发病率也存在着差异,同一地区人群中各类慢性病的发病率也随着年代的变化而改变。由于环境和遗传各种因素的差异,在探索慢性病病因和影响因素的研究中,来自西方发达国家的人群证据不一定适用于中国人群,中国慢性病的预防和控制工作更需要来自中国人群的证据。
而生物银行作为医学研究的重要资源,将成为转化医学研究的基石。CKB涉及中国10个地区51万余人,目前已经经过近10年的监测和随访,慢性病相关新发病例已经累计到一定数量,部分研究成果已经初步显现。接下来,随着人群健康相关信息的不断积累,各类疾病病例的逐渐累积,以及生物样本的检测,特别是基因测序工作的逐渐展开,CKB项目将成为慢性病研究的宝藏。通过探索已知和未知的环境危险因素、遗传相关信息及整合两者交互作用,CKB项目将会为探索各类慢性病的发病规律、致病因素及流行趋势提供强有力的证据,对制定慢性病预防和控制措施、进一步改善人民健康具有重要的意义,也将促进世界健康研究领域资源的共享,促进科学的发展。
本文通过对CKB项目标准化管理的介绍,以期促进国内生物银行建设、管理的交流和相互学习,为预防和控制慢性病、改善人群健康贡献力量。
[1]WHO.Noncommunicable diseases country profiles[M]. Geneva:World Health Organisation,2011.
[2]Tunstall-Pedoe H.Preventing Chronic Diseases:a vital investment.WHO Global Report[M].Geneva:World Health Organization,2005:200.
[3]Colhoun HM,McKeigue PM,Davey Smith G.Problems of reporting genetic associations with complex outcomes[J]. Lancet,2003,361(9360):865-872.
[4]Weiss KM,Terwilliger JD.Howmany diseases does it take to map a genewith SNPs?[J].NatGenet,2000,26(2):151-157.
[5]Risch NJ.Searching for genetic determinants in the new millennium[J].Nature,2000,405(6788):847-856.
[6]Garner C.Upward bias in odds ratio estimates from genome-wide association studies[J].Genetic Epidemiol,2007,31(4):288-295.
[7]Public Population Project in Genomics and Society.Biobank Lexicon[EB/OL].[2014-01-03].http://www.p3g.org/biobanklexicort/.
[8]Davey Smith G,Ebrahim S,Lewis S,et al.Genetic epidemiology and public health:hope,hype,and future prospects[J].Lancet,2005,366(9495):1484-1498.
[9]Elliott P,Peakman TC.The UK Biobank sample handling and storage protocol for the collection,processing and archiving of human blood and urine[J].Int J Epidemiol,2008,37(2):234-244.
[10]Mathers CD,Loncar D.Projections of globalmortality and burden of disease from 2002 to 2030[J].PLoS Med,2006,3(11):e442.
China Kadoorie Biobank:a resource of prospective study for chronic diseases
GUO Yu1,SUN Luanluan2,TAN Yunlong1,LILiming1,2
(1.Chinese Academy of Medical Sciences,Beijing 100730,China;2.Department of Epidemiology and Biostatistics,School of Public Health,Peking University Health Science Center,Beijing 100837,China)
Non-communicable diseases has become the leading cause formortality and permanent disability.In light of the"Omics"technology,large population-based biobanks will provide a new perspective in preventing and treating non-communicable diseases.Standardized biobanks will be the valuable resource for further advances in genomics,proteomics and metabonomics,and the foundation of translation medicine will provide powerful evidence for health policies.This review mainly aims to discuss purpose and significance on establishment of biobanks,demonstrating the management and operations of worldwide large biobanks and introduce the domestic largest population-based biobank-China Kadoorie Biobank.China Kadoorie Biobank is a large biosample-based prospective study of themain genetic and non-genetic causes of common chronic diseases in Chinese population since 2004,involving over 512 000men and women in 10 geographically defined regions of China.It is one of the largest prospective population-based biobanks throughout the world.It is aimed to build the Chinese population health database through 5-year resurvey and long-term monitoring ofmortality and morbidity.
Non-communicable diseases;Biobank;Translationalmedicine;Cohort study;Epidemiology
R36;R197.38
A
2095-3097(2014)06-0321-06
10.3969/j.issn.2095-3097.2014.06.001
2014-04-18 本文编辑:徐海琴)
英国Wellcome Trust(088158/Z/09/Z);中国国家科技支撑项目(2011BA109B01)
100730北京,中国医学科学院(郭 彧,谭云龙,李立明);100837北京,北京大学公共卫生学院流行病与卫生统计学系(孙孪孪,李立明)
李立明,E-mail:lmlee@pumc.edu.cn