四川医科大学附属医院新生儿科, 四川 泸州 646000
【关键词】出生队列研究; 大数据; 病因学
【中图分类号】R 195.4【文献标志码】A
收稿日期:( 2015-01-19
The new trends of birth cohort study in big data eraDONG Wenbin,LEI Xiaoping
Abstract【】Birth Cohort study followed-up subjects and collected the exposures, outcomes and confounders from pregnancy or after delivery. It could confirm the associations between the exposures and diseases by controlling the confounders and was one of the most important methods in etiology researches. According to the characteristics of the study, birth cohort studies could be divided into historical study, prospective study and ambispective study. The present article overviewed the existed birth cohort studies on the global scale and mainly described some typical birth cohort studies. Furthermore, for considering the current status of birth cohort study in China, we focused on the new trends of the clinical researches in the big data era and tried to provide new perspectives for the clinical etiology studies in our country.
【Key words】Birth cohort study; Big data; Etiology
成年期疾病的胎儿起源假说(developmental origins of health and disease, DOHaD)认为,遗传和环境因素对受精卵、胚胎胎儿发育、出生以后整个生命周期的生长发育、代谢和疾病均会产生影响[1]。我国医学研究存在重视微观实验研究而轻宏观流行病学研究的问题,因此对于转型期疾病谱的宏观变化缺乏较为全面的整体认识。随着大数据时代的来临,医学研究人员需要改变只重微观实验研究的思维和视野,引入大数据的概念进行宏观的临床研究。通过大规模、前瞻性的纵向队列研究,特别是出生队列研究(birth cohort),对足够大样本的人群进行从孕期甚至孕前开始的跟踪随访,从疾病发生前开始系统的、连续的收集生物样本和流行病学数据,揭示疾病发生、发展过程内在的规律。本文就全球范围内出生队列的研究历史及现状做一述评,为我国相关领域研究提供新的视角和思维,以促进大数据时代我国出现队列的研究。
2.1历史性出生队列研究(historical birth cohort study)就是以现有的人群为研究对象,回溯过去收集出生及以后的相关资料来探寻现有疾病的相关影响因素。研究性质上相当于从出生开始的前瞻性研究的随访,但实际做的是在现在调查过去的既成事实,这时暴露与结局均已成事实,是一种由“果”探“因”的研究方法[2]。
历史性出生队列研究具有节约成本的优点,可以确定所关注结局与暴露因素的联系,为前瞻性研究提供线索;但是由于受到研究方法的限制,其缺点也较明显:①对研究的暴露和混杂因素收集可能不完全。②不能获得历史观察期内的生物样本,如组织、血液等。③受信息来源限制,该研究不具有普遍开展可行性,如我国很难获取历史出生登记信息。上世纪80年代起,历史性队列研究率先在北欧等出生和保健登记信息系统完善的国家开展起来[3]。虽然历史性队列研究具有不可避免的缺陷,但是对探寻生命早期的环境及营养状况对成年期疾病的影响上产生了巨大的作用,并为前瞻性队列研究(prospective birth cohort study)的广泛开展提供了理论基础。
2.3双向性队列研究(ambispective cohort study)双向性队列研究指研究对象入组于出生后,研究工作回顾至出生时,按出生时暴露因素分组,然后从入组开始随访至发病或死亡。特点是根据历史档案确定暴露与否,根据将来的情况确定结局,故这种设计又叫混合性队列研究。该方法不但具有历史性队列研究的优点,还弥补了其不足。大多数历史性队列研究的研究者都在后期对研究对象进行了跟踪随访,故最后实际为双向性出生队列研究[3,30]。
出生队列研究最早可追溯到 1911~1948年英格兰赫特福德出生登记[8],到20世纪90年代,将这些信息录入计算机并与英国国家医疗健康登记中心的死因别信息相关联,发现低出生体重(low birth weight, LBW)死于心血管疾病风险增加[31]。此后以该登记信息为基础,分别随访1911~1930和1931~1939两个时段出生的人群并构建了两个出生队列,即赫特福德出生队列(Hertfordshire Cohort Study)[3]。在这两个队列基础上,发现LBW和婴儿期发育迟缓与成年期冠心病、2型糖尿病等慢性疾病的联系[31],并以此为基础提出了DoHaD假说[32]。DoHaD学术的提出以后,全球范围内的出生队列研究得以蓬勃发展。主要集中在发达美国等国家[33-35].
我国出生队列发展不仅相对发达国家晚,比巴西等发展中国家也明显落后。近年来我国较为成功的出生队列是中国安徽出生缺陷与儿童发育队列研究(China Anhui Birth Defects and Child Development Cohort Study,C-ABC),该研究通过建立大型孕产妇和新婚夫妇队列,动态观察主要出生缺陷发生情况,评价孕前和孕期环境因素暴露与出生缺陷发生的病因关联[46]。目前正在进行志愿者招募阶段的另一项大型出生队列研究为上海优生儿童队列(Shanghai Birth Cohort),该研究是世界卫生组织全球出生队列研究的一部分,计划在上海市10家医院开展以从孕前及孕早期妇女为对象的出生队列,对其孕前、孕早、中、晚期妇女及其分娩的儿童进行长期的随访,建立人群母子生物样品库,运用流行病学研究方法,探讨理化环境和社会环境对胎儿、儿童的影响,从而验证胎儿期和儿童期疾病的病因假设。此外,目前我国还有在 1993~1996年由北京大学主持开展开展“增补叶酸出生队列”、1997 年香港大学开展的97儿童(Children of 1997)出生队列[23]、2010 年广州市妇幼保健院开始开展的广州市出生队列研究(Born in Guangzhou Cohort Study)等少数几项前瞻性出生队列。
4.1大数据将促进队列研究间的更广泛合作目前虽然单一队列的研究规模也达到了10万样本量,但是在研究发病率低的疾病时仍需要更大的样本量。巨额的人力、财力及时间的耗费使得以单一出生队列来研究少见病病因不具有可行性。随着大数据时代的来临,数据分析能力及手段不断进步,相同背景的队列间合作已经成为研究的趋势。目前已有较为成功的国际出生队列合作典范,为巴西、危地马拉、印度、菲律宾和南非5国间开展的国际合作研究[36];21世纪国际胎儿和新生儿生长研究协作(the International Fetal and Newborn Growth Consortium for the 21st Century, INTERGROWTH-21st Project)是另一项由中国、巴西、肯尼亚、美国、英国、意大利和阿曼7国协作的、包括多种族的人群基础的出生队列。该研究采用统一的研究方案和孕期超声测量技术,着重关注孕早期到婴儿期的营养、生长等[37];欧盟内部也有数个成功的关注环境暴露因数与儿童疾病的出生队列合作案例[38-40]。在这种趋势下,为避免各自为阵造成的资源浪费,WHO倡议目前目前正在筹备及已经开始的出生队列研究采用相似的研究设计,构建WHO框架下的全球出生队列65。
