B细胞BCRCDR3受体库的高通量测序分析概况①
2011-02-12王小妹综述姚新生审校
王小妹 王 鹏 综述 姚新生 审校
(遵义医学院免疫学教研室贵州省免疫学研究生教育创新基地,遵义563003)
B细胞是介导机体体液免疫应答的主要细胞群,其识别、结合抗原主要依赖互补决定区(CDR),它决定着抗体的特异性,而互补决定区3(CDR3)比CDR1、CDR2更具多样性[1],通过观察机体 B细胞BCRCDR3受体库的多样性、重叠率的大小、CDR3区的基因/氨基酸组成特征、各亚家族的偏向取用等,可以观察生理及病理状态下机体免疫的相关情况。高通量测序能对一个物种的转录组和基因组进行全貌、细致的分析,目前在国外已开展并应用于B细胞BCRCDR3受体库测序。
1 B细胞BCRCDR3受体库概述
机体体液免疫应答主要由B细胞介导,其通过产生特异性抗体来应答抗原,对机体起重要保护作用。B细胞识别抗原主要依赖BCR,BCR是由两条重链(H)和两条轻链(κ或λ)组成的四聚体,其可变区和恒定区分别由不同染色体上的多个不连续基因片段重排所编码。人的κ链(2p11.2)和λ链(22q11.2)由“Vn-Jn-C”基因重排形成,H 链(14q32.33)由“Vn-Dn-Jn-Cn”基因重排形成,其可变区包含三个高变区,分别为 :CDR1、CDR2、CDR3,而决定 B 细胞识别抗原肽的关键部位是最具多样性的重链CDR3区,其由“IGHV(51个功能性基因片段)末端-IGHD(23个功能性基因片段)--IGHJ前端(6个功能性基因片段)”(http://www.imgt.org/IMGT-GENE-DB/GENElect?livret=0)基因重排及“V—D”和“D—J”连接时中间插入或剪接的核苷酸序列组成,类型转换和体细胞高频突变都能促成其多样性形成[2](单个人由于重链、轻链本身的多样性及重、轻链配对组合的多样性至少能形成1011种以上B细胞受体)[3]。由于其惊人的多样性,正常机体几乎能对所有侵入机体的异物产生应答[4]。每种克隆B细胞BCR有着特定CDR3序列组成,当抗原进入机体,就会引起其特异性B细胞克隆扩增并产生相应抗体对抗原应答。由于B细胞BCRCDR3区是B细胞识别抗原的主要部位,其长度及多样性都会影响它对抗原的识别与亲和力,故B细胞的特异性可以认为是基因重组和体细胞高频突变形成特异CDR3的结果,CDR3序列多变的特征为抗原的选择提供一个多样化的B细胞受体库。通过分析B细胞BCRCDR3受体库,能为监测和分析生理及病理状态下机体的免疫状况及B细胞的发生、发展机制提供新思路、新方法和手段。
2 B细胞BCRCDR3受体库的监测方法
B细胞BCRCDR3受体库相关研究方法众多,如聚合酶链反应(PCR)-单链构象多态性分析(SSCP)[5]是利用DNA或RNA单链构象具有多态性的特点,结合PCR技术进行基因检测的一种分析技术。利用聚丙烯酰胺电泳或毛细管电泳技术将PCR扩增片段按序列大小分离,出现单一条带考虑为含相应V基因家族的B细胞存在单克隆重排。但此方法存在操作繁琐,且只能对序列突变进行初步分析,不能观察到序列的具体碱基组成及突变点的问题。随着核酸末端标记技术的发展,用“免疫谱型分析技术(Immunespectratyping)”[6-8](或“免疫扫描(指纹)技术(Immunoscope))来研究CDR3序列得到较为广泛的应用,通过在上游或下游引物的5′端标记FAM等荧光素,利用测序胶扫描技术(GeneScan等软件)、毛细管电泳技术(PeakScan等软件)分析CDR3区的PCR扩增产物各V基因家族序列的长度和多、寡、单克隆偏向性,来判断所代表的相应T&B细胞的增生情况。这种基于分析CDR3区长度和多态性的技术自上世纪90年代初应用以来,推动了TCR&BCRCDR3受体库在多种生理和病理状态下的基础和应用研究。该方法能很好地观察到CDR3谱系漂移,结合测序还能观察到部分序列组成,但成本高、操作复杂。另外,基于对相应探针进行各种标记(同位素、荧光素等),用核酸杂交技术[9,10]分析相应V或J基因家族组成的CDR3序列的表达频率等方法在T&B细胞受体库研究中得到较广的应用。
上述方法均只能粗略地对序列多样性程度及高变区长度多态性分布或部分序列组成进行分析,所获数据局限且易出现偏差,要深入且动态地监测CDR3谱型,快速、全面观察个体B细胞BCR CDR3受体库序列的组成和特征,以及个体间的重叠率,研究其与疾病或与疾病活动情况的关联;对比分析同一疾病患者B细胞BCR CDR3受体库;比较患有某疾病的个体与正常个体B细胞BCR CDR3受体库的差异等问题,尚待进一步在基因水平对B细胞受体库进行深入研究。
随着分子生物学的发展和人类基因组计划的顺利实施,基因诊断已逐渐进入临床实验室,成为临床检验的常规项目,其中DNA测序是基因诊断的金标准。DNA测序技术自发明以来一直在推动分子生物学发展方面起着至关重要的作用,它从根本上改变了人们研究所有生命蓝图的方式,并且推动了基因组学及其分支乃至其他密切相关学科的创立与发展,如生物信息学,系统信息学,基因组学及合成生物学等。DNA测序技术的进展使生命研究的基本元素发生了转变,从单一、局部的基因或基因片段转变成整个基因组,要大批量、准确的检测序列组成变化需应用近年发展起来的高通量测序技术。
高通量测序技术又称“下一代测序技术”或“深度测序”或“第二代测序技术”,是对传统测序的一次革命性改变,一次能对几十万到几百万DNA分子进行序列测定,使得对一个物种的转录组和基因组进行全貌、细致的分析成为可能。高通量测序中三种代表性的第二代测序技术为Roche 454、Illumina Genome Analyzer、ABI SOLiD sequencer,罗氏公司的454测序仪(Roche GS FLX sequencer,http://www.454.com)是世界上第一个可以提供超高通量基因组和长片段DNA测序的商业化系统设备。该系统采用一种基于焦磷酸测序原理而建立起来的高通量基因组测序技术,通过纳米技术、微流体技术和微阵列技术的结合,拼接超高通量的DNA片段得到完整的基因组。其每个反应可以得到100万个以上序列读长,序列平均读长可达450 bp,每天可以产出1亿个以上碱基数据;同时,Roche于2010年推出了精巧型高通量基因组测序仪“Roche GSJunior”,平均每次运行可获10万个400 bp左右的序列,有很大的推广应用价值;Illumina公司的Solexa基因组分析仪(Illumina Genome Analyzer,http://www.illumina.com.cn,将“合成测序”化学法与“DNA簇技术”相结合),于2010年推出的HiSeq 2000系统,它每天的测序通量高达25 Gb,单个读长达到100 bp;ABI的SOLiD测序仪(ABISOLiD sequencer,http://www.appliedbiosystems.com.cn/,基于序列连接的化学法),在2010年推出的SOLiD 5500xl每天的测序通量高达30 Gb,单个读长为75 bp。这些测序方法能大大缩短测序的时间,使得对一个物种的基因组进行细致、全貌的分析成为可能。最适合CDR3受体库分析的是Roche 454高通量测序技术,因为其测序读长为450 bp左右,而目前CDR3受体库的制备,最优化和简便的是在V区设计上游引物,在C区设计下游引物,扩增CDR3受体库的PCR产物在400 bp左右,用Roche 454高通量测序仪单向测序便能完整的测出PCR产物的全长,并直接的进行分析。而Illumina Genome-Analyzer、ABI SOLiD sequencer因读长有限,需要对CDR3受体库的制备进行多次的优化;同时,测序时需进行双向测序和数据对接。
高通量测序是一种高效、准确、灵敏度高、自动化的基因测序方法,它主要是应用特异性引物扩增目标序列,将扩增产物电泳,对目的区有条带者进行测序。不同于常规引物,如在B细胞BCR CDR3受体库的监测中,以cDNA为模板,再根据基因特点,将IGHV分为六个家族,并设计六条上游引物(包括90%以上V区基因);依据IgM、IgG、IgA序列设计三条下游引物,并根据个体的不同加上不同“标签”(由10个特异性碱基序列组成),此即特异性引物。每个个体的PCR扩增产物序列都带有特异性标记,经电泳、胶回收、纯化后,所有样本产物就能作为一个样本进行反应测序。分析结果时可根据特异性标记区分样本。高通量测序简化了样本准备步骤(测序前仅需把样本进行PCR扩增),缩小了反应体系,节约了试剂,现在国外已将其初步应用于T、B细胞序列分析[2-4,11-15]。
3 B细胞BCR CDR3受体库的分析
3.1 生理状态下B细胞BCRCDR3受体库的分析每个个体的BCR CDR3受体库中存在一定数量、多样性的CDR3序列,那么不同个体该库的大小、多样性会一致吗?并且,由于遗传基因和所处环境差异,每个个体都存在独特性B细胞BCRCDR3序列,那么独特性B细胞BCR CDR3受体库在个体间的分布是怎样的呢?个体间的CDR3受体库的重叠率是怎样的呢?受体库的大小和多样性会随年龄变化吗?这些问题都仍待解决。同时,对一些分化来源存在争议的B细胞亚群也可以通过分析它们的BCR CDR3序列用以鉴定,如Wu等[2]通过Roche 454高通量测序技术检测B细胞受体库,分析了转换后记忆B细胞和IgM记忆B细胞的关系。对于IgM记忆B细胞的来源一直有争议,主要有三种假设:首先,有研究者认为其是胸腺依赖性抗原刺激产生的生发中心中还未经历类型转换的记忆细胞,因为有报道称高频突变先于类型转换,且这两个过程是可以分开的;另有研究者认为其可能是来自胸腺非依赖性抗原刺激产生的生发中心形成的,因为IgM记忆B细胞在机体应答胸腺非依赖性抗原中发挥重要作用;还有研究者认为该记忆B细胞不需要抗原刺激即存在,因为在胎儿中即发现有该种细胞存在。通过分析发现,这两种细胞受体库有较大差异,IgM记忆细胞比转换后记忆B细胞IGHV1取用率下降而高取用了IGHV3,序列中带负电及脂肪族氨基酸含量较少,故认为IgM记忆B细胞和转换后记忆B细胞来源不尽相同,IgM记忆B细胞可能来源众多。另有研究应用Roche 454高通量测序分析四种不同家族的14条斑马鱼的抗体库(IgM和IgZ)[15]。斑马鱼是进化过程中具有最早可识别的适应性免疫系统的物种,并且与人的基本组成类似,它也取用重组活化基因(RAG)和V、D、J重组以产生抗体,但斑马鱼免疫系统仅含约300 000个能产生抗体的B细胞,比人类要简单5个数量级。每条鱼检测到28 000~112 000条有效序列(分辨出V、D、J的取用,正确率达98%),斑马鱼的VDJ库理论上为975种(39V*5D*5J),则在每条被研究的斑马鱼中,VDJ库的覆盖率达50%~86%。并且每个个体的VDJ库及抗体重链的多样性分布相似,不同个体有相同IgH链取用趋势,甚至有两个个体共同取用245种序列,有5个个体共同取用2种序列;同一家族部分个体间VDJ取用具高相关性。Boyd等[4]通过454高通量测序对12个人的B细胞受体库分析,检测到108210条IgH重组序列并确定了它们的基因型。已报告功能性IGHV基因及其等位基因的多样性为45~60种,由于基因杂合的多样性水平,研究者发现了之前未报告过的 14种 IGHV多态性,并且 IGHD3-16、IGHJ6基因的多态性也被发现;还确证了IGHV3-33*05、IGHV3-66*02和 IGHV4-31*01等9种基因是存在的,并质疑 IGHJ3*01、IGHJ4*01、IGHJ5*01和IGHJ6*01等位基因是否报告错误,与其它报告一致[16]。而Glanville等[3]采用454高通量测序对654个样本的B细胞受体库进行分析,发现重链CDR3区长度为1~31个氨基酸,服从正态分布,在其大部分位点,每种氨基酸都有分布;CDR1和CDR2都具有一定的多样性,这种多样性主要来自种系基因多态性和高频突变,并且重、轻链的随机配对也能产生部分多样性(48H*53L=2544)。另外,有研究发现机体T细胞TCR CDR3序列V、D、J各家族的取用有非随机现象[17],那么在B细胞受体库中各家族的取用是否随机呢?现在B细胞BCR CDR3受体库数据尚不完善,随技术改革,通过进一步分析,将识别低频出现在群体中的等位基因,观察到不常见的重组序列,或能观察到更多基因多态性与疾病的关联。
疫苗接种是目前预防疾病的最好方法之一,已开发了多种类型疫苗,如基因工程疫苗、亚单位疫苗、合成肽疫苗等,广泛应用于预防乙肝、狂犬病、白喉等疾病。但接种后效果的检测目前仅停留在蛋白水平,对于在基因水平动态监测和分析抗体的发生与发展仍待进一步探索。B细胞受体对抗原应答主要依赖其CDR3区识别抗原表面分子,一种表面分子能与所有B细胞受体的CDR3区结合的几率非常低,最后与该表面分子具最适亲和力的B细胞会产生活化与应答[18,19]。如通过动态观察B细胞BCR CDR3受体库可在基因水平观测机体针对某疫苗的免疫应答情况,并能对其主要受体序列进行分析,还能为某些仍缺乏良好免疫效果疫苗的疾病开发新型疫苗提供新思路。单克隆抗体现广泛用于检验医学诊断试剂盒、肿瘤的导向治疗和放射免疫显像技术等方面,但传统的方法如单细胞 PCR扩增V区[20,21]、用 EB病毒或逆转录病毒调节基因转录[22]、分析和扫描重组抗体库[23],都依赖复杂而精确度不高的扫描技术。Reddy等[13]通过454高通量测序分析免疫后鼠的B细胞受体库,挑出频率较高的重链和轻链序列,将其自动化基因合成并连接到细菌等载体上,从而无需扫描即能生产单克隆抗体。
3.2 B细胞BCRCDR3受体库分析与疾病的预测、诊断和预后 B细胞是机体免疫应答的主要细胞群,当某些对机体具重要免疫保护效应的BCR CDR3序列缺失时会引起机体易患某些疾病。如有研究者发现一无明显症状的贫血患者体内染色体有六种IGHD基因缺失,这就影响了B细胞受体的多样性表达,进而影响了机体的免疫功能[4]。是否是由于这种缺失引起了无症状贫血仍待进一步探索,但为研究贫血的发病机制提供了新思路,并可推测通过大范围对B细胞受体基因进行分析,或发现某些基因位点与疾病存在关联,研究还发现在某些恶性疾病症状出现之前,检测机体B细胞BCR CDR3受体库能发现其序列具单、寡克隆现象,能为疾病的预防和早期诊断提供重要信息[11];并且通过克隆情况可对机体肿瘤同源性进行分析:对一淋巴瘤患者的B细胞BCR CDR3受体库分析发现存在两群非同源的B细胞克隆,后经复杂的形态学和免疫组化等实验证实该患者确实患有两种不同淋巴瘤。在自身免疫性疾病的应用研究中Klarenbeek等[24]在最近的一次国际会议上,报告了用高通量测序T&B细胞CDR3受体库在类风湿性关节炎的发病机制和诊疗上的研究价值和意义。随研究的深入,将会发现更多基因多态性与疾病的关联;并且,更深入的对B细胞BCRCDR3受体库进行分析在观察某些疾病治疗效果方面也将成为很好的指标。如通过分析造血干细胞移植前后BCR CDR3受体库的大小及多样性变化,能深入、准确的监测机体免疫重建状况;某些B细胞发生、发展存在障碍的个体用药治疗时,通过动态监测其BCR CDR3受体库,可观察该药物的疗效;某些疾病治疗后仍有微小残留病灶但无明显表征,用常规方法不容易检出,但可通过分析 BCR CDR3受体库观察到单、寡克隆扩增。Boyd等[11]将454高通量测序技术应用到恶性疾病的评估、监测疾病残存病灶、不同年龄健康个体克隆多样性分析等方面。如对治疗后慢性淋巴细胞白血病患者B细胞受体库用454高通量测序和克隆特异性实时PCR两种方法进行监测,以观察是否存有微小残余病灶,结果显示两种方法具有良好一致性;文中提出用454高通量测序仅需不到0.1 ml的血样足以用于观察机体多样性克隆情况,并指出通过该种测序能清晰地监测到B细胞受体库中VDJ优先重组情况,如在该次研究中即发现D2-2与J6、D3-22与J3、D3-3与J6等有优先配对现象;文中还强调某些克隆比例增多,可能是机体对抗原的应答反应,也可能是细胞恶化的前期标志;在分析某些淋巴瘤(尤其是经历了高频突变的毛囊瘤)的B细胞受体库时要注意引物的设计,以防影响结果。故监测B细胞BCR CDR3受体库的分析方法不失为应用于临床筛查、诊断疾病及观察其治疗疗效并应用于指导个性化治疗等方面的简便、灵敏、准确的好方法。
4 小结
综上所述,B细胞BCR CDR3受体库随着其监测技术的进步,容量和准确度都在不断提升、完善。分析机体B细胞BCR CDR3受体库的应用前景广阔,贯穿生理和病理相关研究,为当前某些无法解决的问题提供了新思路。如B细胞发生、发展机制的深入研究;某些疾病(如系统性红斑狼疮)的发病机制及早期监测与诊断的探讨等。随DNA测序技术的发展,Roche 454技术为B细胞BCR CDR3受体库的分析应用与研究建立了良好的技术平台。相信随着研究的深入,分析B细胞BCR CDR3受体库的作用会日益凸显,或将应用于临床疾病筛查、诊断、治疗、药物疗效观察等方面。
1 陈慰峰主编.医学免疫学[M].北京:人民卫生出版社,2004:36-36.
2 Wu Y C,Kipling D,Leong H S et al.High-throughput immunoglobulin repertoire analysisdistinguishesbetween human IgMmemory and switched memory B-cell populations[J].Blood,2010;116(7):1070-1078.
3 Glanville J,Zhai W,Berka J et al.Precise determination of the diversity of a combinatorial antibody library gives insight into the human immunoglobulin repertoire[J].Proc Natl Acad Sci,2009;106(48):20216-20221.
4 Boyd S D,Gaëta B A,Jackson K J et al.Individual variation in the germline Ig gene repertoire inferred from variable region gene rearrangements[J].J Immunol,2010;184(12):6986-6992.
5 Gokmen E,Raaphorst FM,Boldt DH et al.Ig heavy chain third complementarity determining regions(H CDR3s)after stem cell transplantation do not resemble the developing human fetal H CDR3s in size distribution and Ig gene utilization[J].Blood,1998;92(8):2802-2814.
6 姚新生,马 骊,温 茜 et al.监测TCRCDR3漂移的免疫扫描谱型分析技术的建立与鉴定[J].中华微生物学和免疫学杂志,2006;26(06):571-573.
7 Yin L,Kou Z C,RodriguezC et al.Antiretroviral therapy restores diversity in the T-cell receptor Vbeta repertoireof CD4 T-cell subpopulations among human immunodeficiency virus type 1-infected children and adolescents[J].Clin Vaccine Immunol,2009;16(9):1293-1301.
8 Weller S,Mamani-Matsuda M,Picard C et al.Somatic diversification in the absence of antigen-driven responses isthehallmark of the IgM+IgD+CD27+B cell repertoire in infants[J].JExp Med,2008;205(6):1331-1342.
9 Näsman-Björk I,Lundkvist I.Oligoclonal dominance of immunoglobulin VH3 rearrangementsfollowing allogeneic bonemarrow transplantation[J].Bone Marrow Transplant,1998;21(12):1223-1230.
10 Wang X,Jia S,Meyer L et al.Quantitative measurement of pathogenspecific human memory T cell repertoire diversity using a CDR3 betaspecific microarray[J].BMCGenomics,2007;8:329-329.
11 Boyd S D,Marshall E L,Merker J D et al.Measurement and clinical monitoring of human lymphocyte clonality by massively parallel VDJpyrosequencing[J].Sci Transl Med,2009;1(12):12-23.
12 Ge X,Mazor Y,Hunicke-Smith SP et al.Rapid construction and characterization of synthetic antibody libraries without DNA amplification[J].Biotechnol Bioeng,2010;106(3):347-357.
13 Reddy ST,Ge X,Miklos A E et al.Monoclonal antibodies isolated without screening by analyzing the variable-gene repertoire of plasma cells[J].Nat Biotechnol,2010;28(9):965-969.
14 Wang C,Sanders CM,Yang Q et al.High throughput sequencing reveals a complex pattern of dynamic interrelationships among human T cell subsets[J].Proc Natl Acad Sci USA,2010;107(4):1518-1523.
15 Weinstein JA,Jiang N,White RA 3rd et al.High-throughput sequencing of the zebrafish antibody repertoire[J].Science,2009;324(5928):807-810.
16 Lee C E H,Jackson K J L,Sewell W A et al.Collins.Use of IGHJ and IGHD gene mutations in analysis of immunoglobulin sequences for the prognosis of chronic lymphocytic leukemia[J].Leuk Res,2007;31:1247-1252.
17 Robins H S,Srivastava S K,Campregher PV et al.Overlap and effective size of the human CD8+T cell receptor repertoire[J].Sci Transl Med,2010;2(47):47-64.
18 Cobaugh CW,Almagro JC,Pogson M et al.Synthetic antibody libraries focused towards peptide ligands[J].JMol Biol,2008;378(3):622-633.
19 Fellouse F A,Esaki K,Birtalan S et al.High throughput generation of synthetic antibodies from highly functional minimalist phage-displayed libraries[J].JMol Biol,2007;373(4):924-940.
20 Wrammert J,Smith K,Miller J et al.Rapid cloning of high-affinity human monoclonal antibodies against influenza virus[J].Nature,2008;453:667-671.
21 Meijer P J,Andersen P S,Haahr Hansen M et al.Isolation of human antibody repertoires with preservation of the natural heavy and light chain pairing[J].JMol Biol,2006;358:764-772.
22 Kwakkenbos M J,Diehl SA,Yasuda E et al.Generation of stable monoclonal antibody-producing B cell receptor-positive humanmemory B cells by genetic programming[J].Nat Med,2010;16:123-128.
23 Mazor Y,Van Blarcom T,Mabry R et al.Isolation of engineered,fulllength antibodies from libraries expressed in Escherichia coli[J].Nat.Biotechnol,2007;25:563-565.
24 Klarenbeek P L,Doorenspleet M E,van Schaik B D C et al.Complete T and B cell receptor repertoire analysis in rheumatoid arthritis using high throughput sequencing[J].Ann Rheum Dis,2010;69:33-34.