TARGET数据库的介绍及数据提取
2019-05-21吕敏田国祥郭晓娟李豹张军吕军
吕敏,田国祥,郭晓娟,李豹,张军,吕军,5
近年来随着医学水平的不断发展,儿童肿瘤整体预后已有大幅度的提升,但是儿童恶性肿瘤依然是儿童期死亡的主要原因。纵观人类遗传学的发展,不断有新兴技术被运用于疾病病因的研究中[1]。根据美国癌症协会(ACS)2015年发布的《全球癌症事实与数据(第三版)》以及全国肿瘤防治研究办公室、全国肿瘤登记中心发布的数据显示,2012年全球有16.33万儿童发生肿瘤,8万例儿童因肿瘤死亡;84.0%的肿瘤患儿居住在发展中国家[2]。TARGET(Therapeutically Applicable Research To Generate Effective Treatments)数据库是采用多组学方法来确定驱动儿童癌症发生和发展的分子变化。
TARGET数据库网址:https://ocg.cancer.gov/programs/target ,打开如图1所示,左侧标目为TARGET的全部内容,包括Overview、Research、Collaborators、Publications、Resources、Projects、Using TARGET Data及TARGET Publication Guidelines,点开每项即可查阅详细内容。
图1 TARGET页面
1 TARGET介绍
TARGET数据库针对儿童肿瘤,主要疾病项目包括ALL(Acute Lymphoblastic Leukemia),AML(Acute Myeloid Leukemia),KT(Kidney Tumors),MDLS(Model Systems),NBL(Neuroblastoma),OS(Osteosarcoma)。TARGET计划的目标是使用数据来指导有效,毒性较小的疗法的开发并通过测序和芯片技术对儿童癌症的基因组、转录组和表观遗传进行测定并且为每种癌症生成对应的特定的分子变化图谱并加以计算,进而验证其生物学功能,确定促进癌症生成的功能通路即是由某种基因的破坏改变而引起的,进一步从这些变化中对治疗靶点及其预后标志物进行识别,以达到更好的治疗目的。点击DATA ACCESS下拉菜单中的ACCESS TARGET DATA MATRIX选项,如图2所示即可进入TARGET DATA的页面。
图2 TARGET DATA界面
2 TARGET项目
TARGRT目前包括5个项目,内容分别是Acute lymphoblastic leukemia(ALL)、Acute myeloid l eukemia(AML)、Kidney Tumors(KT)、Neuroblastoma(NBL)以及Osteosarcoma(OS),并由NCI’s Office of Cancer Genomics和Cancer Therapy Evaluation Program管理。下面分别介绍TARGET五个项目内容,并以ALL(Acute Lymphoblastic Leukemia)为例介绍每个项目具体查看方法(图3)。
2.1 ALL项目ALL(Acute Lymphoblastic Leukemia)即急性淋巴细胞白血病,急性淋巴细胞性白血病是儿童白血病中的主要类型之一,占75%~80%,是儿童恶性肿瘤中发病率最高的疾病[3]。随着现代医疗技术手段的发展,急性淋巴细胞白血病患儿5年内无事件生存几率可达80%以上,但仍有20%左右的患儿出现复发,导致死亡[4]。ALL项目中阐明了全面的分子特征,因此通过对患者尤其是高危复发患者采用靶向药物针对性的治疗的方案,有以提高患者的治疗效果的可能,从而改善其预后和生存结果。
图3 ALL项目
有关ALL项目详细的介绍,可以选择该网页下方灰色的每一项条目,有更为具体的内容,打开之后内容如下图4~7所示,可详细阅读。TARGET每个项目都可用此同样方法进行查看。
图4 ALL项目内容
图5 ALL阶段项目
图6 ALL项目数据对象
图7 ALL数据集
2.2 AML项目AML(Acute Myeloid Leukemia)即急性髓性白血病,是一种源自骨髓中的未成熟白细胞,即成髓细胞的癌症,约25%的白血病儿童患有AML。儿童AML是发病率仅次于ALL的一种高度恶性、高度异质性的白血病,其发生和发展是一个涉及髓系细胞的多基因、多步骤失控的过程[5],在过去的几十年中,基于危险度分层的“个体化治疗”已使AML患儿的化疗诱导缓解率接近90%,而5年生存率也已逐渐上升到了55%~65%[6]。然而,治疗失败和复发仍然时有发生,高达1/3的复发率始终是影响AML患儿生存的主要危险因素[7,8]。
因此,如何早期诊断、精确分型、评估预后并及早预测复发,是目前儿童AML治疗的一大难题[9]。TARGET项目则为研究者提供全面的基因组鉴定,以用于发现研究对象癌症发生的基因及表观遗传的变化,进而为患儿提出更加有效的治疗方案。
2.3 KT项目KT(Kidney Tumors)即肾脏肿瘤。儿童肾脏肿瘤约占儿童癌症7%。绝大多数是肾母细胞瘤,但15~19岁青少年肾癌较为常见。医疗发达国家临床研究中,儿童肾母细胞瘤的总体存活率已达90%[10],是一种在儿童中可治愈的罕见癌症。但SIOP研究报道,1.6%~5.5%的患儿虽然临床和影像学提示为肾母细胞瘤,而术后病理并不支持[11]。因此希望通过TARGET计划项目的研究能够发现肿瘤致病的关键分子,尤其是复发患者,进而研究出更加有利于患者预后改善的治疗方案。
目前,Kidney Tumors项目已完成的有Wilms tumor(WT)、Clear cell sarcoma of the kidney(CCSK)和Rhabdoid tumors(RT)。
2.4 NBL项目NBL(Neuroblastoma)即神经母细胞瘤。神经母细胞(neuroblastoma,NB)瘤是儿童最常见的颅外实体肿瘤,年发病率为0.3/10万~5.5/10万,且发病率逐年上升,已成为严重影响影响儿童身心健康的重要疾病之一,NB占因肿瘤致死的儿童15%[12]。此外,目前的NBL大多治疗方案为强化化疗,会给存活儿童留下终生的副作用。Paulino等[13]报道对于中枢转移的NB患儿,化疗结合颅脑放疗能够有效缓解局部症状,但并不能改变预后[14]。因此,在TARGET计划的NBL项目包含全面的分子特征,通过在研究过程中发现准确的治疗靶点和预后标志物,以有效的改善患者的预后情况。
2.5 OS项目OS(Osteosarcoma)即骨肉瘤。骨肉瘤是最常见的骨原发性恶性肿瘤[15],研究表明其发病率随年龄发生变化,10岁以内患儿的年发病率为1.7/10万,而10~19岁间患者的年发病率则为8.2/10万[16]。在临床工作中,OS患者标准治疗方案改进后其生存结果是得到了有效的改善,但是依然没有达到理想的治疗和预后效果,而TARGET计划的OS项目精准的靶向疗法有可能会更大程度的提高患者的治疗和预后效果,促进研究者进行更加深入的研究,为患儿提供更有效和人性化的治疗方案。
3 TARGET数据的提取
TARGET数据库计划为选定的一组儿科癌症生成大规模基因组数据,并为研究界提供对这些数据的访问权限。 TARGET数据的目标是促进儿童癌症治疗靶标的发现,并促进将这些发现转化为临床应用,更好的为临床治疗提供依据。
3.1 TARGET数据类型TARGET数据类型包括哪些,主要如下:临床数据,转录组测序数据,拷贝数变异数据,甲基化数据,miRNA数据,基因表达谱芯片数据,全基因组测序数目,靶向测序数据。
3.2 TARGET数据提取方法选择DATA ACCESS下拉菜单中的ACCESS TARGET DATA MATRIX进入页面,选择Useing TARGET Data选项进入页面,如下图8所示。
图8 TARGET数据进入界面
进入页面后,是关于TARGET Data数据的详细介绍,包括TARGET Data的数据类型及如何使用数据等,详细介绍点击进入页面后可得,如下图9所示。
图9 TARGET数据介绍
数据信息的下载:点击首页右上角VIEW TARGET DATA MATRIX箭头所指选项栏,如下图10所示,点击进入页面。
点开后可看到TARGET DATA数据表格如下图,有蓝色、红色及黑色样字体,蓝色为可下载项,点击下载需要项目,如下图11~13所示,即可得到所需数据库:
4 讨论
近年来人类基因组计划的顺利实施及进展使人们逐渐认识到,应该把基因组作为一个整体来研究其结构、功能及其与环境的交互影响等[17]。TARGET大数据库针对儿童肿瘤,是由NCI’s Office of Cancer Genomics和Cancer Therapy Evaluation Program管理,具有一定的权威性,虽然包含的疾病种类较少,但是却具有更强的针对性。目前医学领域强调精准医学的概念和模式。总的来说,肿瘤大数据有三个特点:海量数据可以突破随机采样的限制、肿瘤大数据拥有更强的数据抗干扰性、肿瘤大数据可以让回顾性临床数据发挥更多的科研价值。这些特点都能让精准医学发挥更大的作用[17]。通过以上的介绍,可以了解到TARGET儿童肿瘤数据库在一定程度上帮助研究者进行更加深入的疾病的研究,进而得出更加精准的治疗方案。
图10 TARGET数据提取
图11 TARGET数据进入界面
图12 数据下载
图13 下载数据文件类型