APP下载

NK/T细胞淋巴瘤基因组中EBV DNA整合检测及分析*

2019-01-23王欣张旭东陈清江王冠男胡俊霞吴少璇马咪静尹美凤杨万秋董萌丁梦杰张明智朱利楠

中国肿瘤临床 2018年23期
关键词:信息学细胞系染色体

王欣 张旭东 陈清江 王冠男 胡俊霞 吴少璇 马咪静 尹美凤 杨万秋 董萌丁梦杰 张明智 朱利楠

NK/T细胞淋巴瘤(NK/T cell lymphoma,NKTCL)为一种高度侵袭性的非霍奇金淋巴瘤,其发病与EB病毒(Epstein-Barr virus,EBV)感染密切相关[1]。研究表明,约80%NKTCL患者血浆中可检测到EBV DNA[2-3]。EBV为一种在全球范围内广泛感染的疱疹病毒,主要有潜伏感染和裂解感染两种形式,其中以潜伏感染最为多见[4]。潜伏状态下,EBV在宿主细胞中仅编码部分病毒产物,如EBV核抗原(EBV-determined nuclear antigen,EBNA)、EBV潜伏膜蛋白(latent membrane protein,LMP)、EBV编码小RNA(EB-encoded small RNA,EBER)和终末蛋白(terminal protein,TP)。研究提示,上述蛋白及其相关通路是导致EBV相关肿瘤发生的主要机制[5]。然而,也有部分研究表明,EBV DNA在宿主基因组中的整合也有可能是其致瘤原因之一[6-9],其机制可能与病毒整合导致宿主基因组不稳定,从而引起基因表达异常有关。目前,关于EBV致瘤性的研究多来自B细胞或鼻咽上皮细胞,在NK/T细胞中的研究较少,因此EBV相关NKTCL的发病机制尚未明确。本研究通过对5例EBV(+)NK/T样本及4例EBV(-)NK/T样本进行全基因组测序及生物信息学分析,初步探究EBV DNA在NKTCL中的整合情况,为进一步研究EBV在NKTCL发生发展中的作用机制提供理论基础。

1 材料与方法

1.1 材料

1.1.1 样本 EBV(+)NKTCL细胞系SNK-6(样本ID:EB_NK_pS)和 YTS(样本 ID:EB_NK_pY)、EBV(+)鼻咽癌细胞系CNE1(样本ID:EB_C_pC)、1例EBV(+)鼻腔NKTCL组织(EBV+Tissue-NKTCL)(样本ID:EB_B_pR)、1例EBV(+)成人T/NK淋巴组织增殖性疾病(EBV+T/NK-LPD)(2级)组织(样本ID:EB_N_pZ)、EBV(-)NK细胞淋巴瘤细胞系NK92(样本 ID:EB_NK_n92)和 NKL(样本 ID:EB_NK_nL)、EBV(-)T细胞白血病/淋巴瘤细胞系Jurkat(样本ID:EB_T_nJ)和健康人EBV(-)外周血正常NK细胞(样本ID:EB_N_pF)共9例样本,均由郑州大学第一附属医院生物样本库提供。

1.1.2 试剂与仪器 DNA提取试剂盒购自美国Qiagen公司提供,TaqDNA聚合酶、dNTP和PCR引物购自上海生工生物工程公司,DNA marker购自北京康为世纪生物科技有限公司,EBER原位杂交检测试剂盒购自北京中杉金桥生物技术有限公司。PCR仪购自赛默飞世尔科技(中国)公司,凝胶成像仪购自上海伯乐生命医学产品有限公司,电热恒温培养箱(DNP-9052BS-m)购自上海新苗医疗器械制造有限公司,组织芯片机购自美国Beecher公司,TheraioBrite原位杂交仪购自美国StatSpin公司,石蜡切片机购自德国Leica公司,OLYMPUS BX51高级荧光显微镜购自日本Olympus公司。

1.2 方法

1.2.1 PCR法扩增EBV DNA和原位杂交法检测EBER表达 提取9例样本全基因组DNA,具体操作方法参考DNA提取试剂盒说明书进行。根据EBNA-3C特异性编码序列区设计引物5′-AGAAGGGGAGCGTGTGTTGT-3′进行PCR扩增,扩增片段为153 bp。按常规操作规程将模板DNA、引物、TaqDNA聚合酶、dNTP放入PCR仪中进行反应,经变性、退火、延伸共进行35个循环得到产物。对扩增产物进行2%琼脂糖凝胶电泳后取出凝胶,置于凝胶成像系统,拍照并保存图像。将常规石蜡包埋的EBV(+)鼻腔NKTCL组织(EBV+Tissue-NKTCL)和EBV(+)成人T/NK淋巴组织增殖性疾病(EBV+T/NK-LPD)(2级)组织制成4 μm石蜡切片,经56~60℃烤片2~16 h,具体操作方法参考EBER原位杂交试剂盒说明书进行。

1.2.2 全基因组测序及生物信息学分析 将9例样本送至北京诺禾致源生物信息科技有限公司进行DNA样本检测、文库构建、库检、Illumina Hiseq平台测序、基本生物信息学分析(测序原始数据、数据质量评估获取Clean Data、参考序列比对分析、SNV/Indel/CNV/SV)和高级生物信息学分析(突变位点筛选、显隐性模式筛选、基于家系研究、基因功能注释、新生突变、基因功能富集分析、蛋白互作网络分析)。具体方法均为Illumina测序和生物信息学分析常规流程。

1.2.3 全基因组序列比对、捕获并验证EBV DNA整合序列 对9例样本进行全基因组序列比对,使用BWA进行mapping,参考基因组为hg19。分析流程中,考虑到EBV的特性,将EBV的序列整合到参考基因组中进行序列比对。EBV整合信息捕获示意图(图1)。对每个样本构建EBV的fasta文件,与构建的EBV fasta库进行Blast比对,从而确认提取的序列是否是病毒序列。本研究从NCBI选取3个EBV genome序列来构建fasta库,3个EBV序列信息如下:1)Human herpesvirus 4 complete wild type genome(NC_007605);2)Epstein-Barr virus(EBV)genome,strain B95-8(V01555);3)HS4B958RAJ Epstein-Barr virus,artifactual joining of B95-8 complete genome and the sequences from Raji of the large deletion found in B95-8(M80517)。

图1 EBV整合信息捕获示意图

1.2.4 过滤EBV DNA整合序列并对其进行染色体分布的统计 使用CREST软件对bam文件进行softclip reads(一端比对到正常染色体,另一端比对到病毒序列的reads)提取,并抽取所有paired reads。对提取得到的paired reads进行过滤,步骤如下:1)去除部分未比对上的reads;2)去除部分比对到hs37d5的reads;3)去除 not primary alignment reads;4)去除未找到paired read的reads。对过滤后的reads进行染色体分布的统计。

1.2.5 对EBV DNA整合序列进行生物信息学分析及验证 根据reads数在染色体上的分布情况,提取每个样本bam文件中的EBV DNA高频整合区域,使用IGV查看染色体部分区域比对情况,并设计PCR引物(p23.1F:5′-TTGGGGCTTTAAGTGGAAC-3′,P23.1R:5′-TCAGA GGGGAGCCAGGAC-3′)扩增EBV DNA在样本基因组中的高频整合区域,扩增片段进行sanger测序并与EBV基因序列进行比对。

2 结果

2.1 样本EBV感染情况

经PCR法及EBER原位杂交法检测,5例EBV(+)样本均可检测出EBV DNA和EBER表达,4例EBV(-)样本则未能检出。PCR扩增结果(图2),EBER原位杂交结果(图3)。

图2 样本PCR扩增结果

2.2 全基因组生物信息学分析

经北京诺禾致源生物信息科技有限公司进行参考序列比对分析,9例样本的测序深度、覆盖深度、覆盖率和比对率均满足后续研究要求。测序深度(图4),覆盖深度和覆盖率(图5),比对率和覆盖度统计见表1。(本研究关注的为EBV DNA的整合信息,因此常规的SNP、INDEL、SV、CNV检测等全基因组的生物信息学分析在此未列出。)

图4 样本测序深度

图5 样本每个染色体的覆盖深度和覆盖率

2.3 EBV DNA整合序列的捕获及验证

经个体化EBV整合分析流程捕获softclip reads,比对样本EBV fasta文件与构建的EBV fasta库,结果显示提取的reads可以比对到构建的EBV fasta库,从而确认提取的序列是病毒序列。

2.4 EBV DNA整合序列的染色体分布统计

对过滤后的reads进行染色体分布的统计。结果表明,相较EBV(-)样本、EBV(+)鼻咽癌细胞系CNE1和EBV(+)T/NK淋巴组织增殖性疾病组织,EBV(+)NKTCL细胞系SNK、YTS和EBV(+)鼻腔NTKCL组织的EBV整合序列数目最多,2号染色体上的reads较其他染色体更多。统计结果见表2。

表1 比对率和覆盖度统计

表2 EBV DNA整合序列的染色体分布统计

2.5 EBV DNA整合序列的生物信息学分析及验证

根据reads数在染色体上的分布情况,提取每个样本bam文件中chr2:33140000-33149000区域,使用IGV进行展示。样本EB_B_pR、EB_NK_pS、EB_NK_pY bam文件2号染色体部分区域的IGV图(图6)。3个EB阳性样本在chr2:30234084-30234483400bp区域均存在大量的插入与删除。在IGV形象化展示中,每个颜色代表mapping质量值高低,其中灰白色背景表示比对越高,颜色越深,比对质量越低。每个颜色条代表1条read,每个read中会有1个cigar,将3个样本放在一起比对,可以观察到每个样本的区域大致相同。对样本EB_B_pR、EB_NK_pS、EB_NK_pY、EB_NK_n92、EB_NK_nL包含chr2:30234084-30234483 400 bp区域进行扩增,其中EBV(+)样本扩增730 bp条带,EBV(-)样本扩增711 bp条带,扩增片段进行sanger测序,发现EBV(+)NKTCL细胞系SNK、YTS和EBV(+)鼻腔NTKCL组织均存在chr2p23.1位点的插入缺失,且均为EBV基因组来源。sanger测序结果(图7),PCR扩增结果(图8)。

图6 样本EB_B_pR、EB_NK_pS、EB_NK_pY 2号染色体部分区域IGV图

图7 扩增片段部分区域sanger测序结果

图8 样本chr2:30234084-30234483 400 bp区域PCR扩增结果

3 讨论

NKTCL为非霍奇金淋巴瘤的一种独特亚型,84.8%NKTCL患者肿瘤组织中EBER阳性,亚洲人群中鼻型NKTCL的EBV阳性率几乎达到100%,提示EBV在NKTCL的发生发展中发挥重要作用[10]。Kim等[11]研究提示,血浆EBV DNA水平可为EBV感染提供直接证据,是监测NK细胞淋巴瘤疾病进展和评估预后的重要指标。Karaarslan等[12]研究表明,原位杂交法检测EBER表达为目前判断EBV感染的有效方法。本研究采用PCR法扩增EBV DNA和原位杂交法检测EBER表达,5例EBV(+)样本均可检测出EBV DNA和EBER表达,4例EBV(-)样本则未能检出,与上述报道相一致。

EBV属于人疱疹病毒γ亚科,是一种双链DNA病毒,流行病学显示多种恶性肿瘤与EBV感染有关,其中包括NKTCL[13]。目前,关于EBV致瘤性的研究多来自B细胞或鼻咽上皮细胞,虽然成熟NK/T细胞也是EBV正常的宿主细胞,但与B细胞或鼻咽上皮细胞相比,成熟NK/T细胞具有完全不同的生物学特点,与EBV相互作用机制也有根本性不同。因此,EBV相关NKTCL的发病机制尚未明确。多项研究表明,EBV编码病毒产物,激活相关通路从而促进肿瘤发生[5,14-16]。目前,已有关于致瘤性病毒DNA整合位点的研究报道,这些整合位点遍布在宿主细胞每条染色体上,多数表现为随机性,但有部分高频的整合位点。如Adey等[17]研究表明,宫颈癌Hela细胞系染色体8q24存在HPV DNA高频整合位点,此位点位于原癌基因MYC上游约500 kb。研究显示,Hela基因组中HPV整合片段可以激活原癌基因MYC的表达[18-19]。本研究共选取5例EBV(+)和4例EBV(-)NK/T样本进行全基因组测序和生物信息学分析,考虑到样本含量较少,获取的大量生物学信息多为复杂冗余信息。因此,本研究重点放在明确和验证EBV DNA在基因组中的整合上。为此,本研究经全基因组序列比对捕获EBV整合序列,发现相较EBV(-)样本、EBV(+)鼻咽癌细胞系CNE1和EBV(+)T/NK淋巴组织增殖性疾病组织,EBV(+)NKTCL细胞系SNK、YTS和EBV(+)鼻腔NTKCL组织的基因组中EBV整合序列最多,且3个样本在chr2:30234084-30234483 400 bp区域均存在大量的插入与删除,将3个样本放在一起进行IGV比对,观察到每个样本的区域大致相同。本研究推测,在EBV阳性样本chr2p23.1区域可能存在EBV DNA的整合位点,亟需进一步分析。因此,本研究对包含chr2:30234084-30234483 400 bp区域在内的片段进行扩增并sanger测序,发现EBV(+)NKTCL细胞系SNK、YTS和EBV(+)鼻腔NTKCL组织中均存在chr2p23.1位点的插入缺失,且均为EBV基因组序列来源。

综上所述,利用NCBI BLAST和USCS BLAT检索chr2p23.1区域可发现,在chr2:29192774-29921611区域存在间变性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)基因序列,2007年Soda等[20-21]发现ALK基因重排,并表明棘皮动物微管相关类蛋白(echinoderm microtubule-associated protein-like 4,EML4)与ALK的融合(EML4-ALK)为非小细胞肺癌的驱动基因。此外,在chr2:30231531-30260033区域存在枝芽心脏基因(limb-bud and heart,LBH)。有研究发现,LBH的过度表达可能与肝细胞癌的不良预后有关[22]。本研究在chr2p23.1区域也检索出XDH、YPEL5等基因序列和一些未知序列,提示EBV DNA在chr2p23.1区域的高频整合可能影响相关基因表达,从而促进NKTCL的发生发展。但仅依据生物信息学分析不能明确EBV DNA整合对宿主基因组功能的影响,本研究将在后续研究中针对这一区域的关键基因开展生物信息学分析和生物学功能研究。

猜你喜欢

信息学细胞系染色体
鸡NRF1基因启动子区生物信息学分析
生物信息学辅助研究乳腺癌转移相关lncRNA进展
头颈部鳞癌顺铂耐药细胞系的建立以及顺铂耐药与Notch1的关系
卵巢癌细胞多药耐药中miR-193a-3p 的表达及作用
PBL教学模式在结构生物信息学教学中的应用
多一条X染色体,寿命会更长
药用植物黄花蒿ATP合成酶电子克隆及生物信息学分析
为什么男性要有一条X染色体?
能忍的人寿命长
高等植物杂交染色体及其杂交基因表达的性状——三论高等植物染色体杂交