APP下载

淞江鲈肝脏组织cDNA文库的构建与部分EST测序

2015-11-19刘庆全罗武松秦志浩王金秋

复旦学报(自然科学版) 2015年6期
关键词:文库菌落克隆

许 耀,刘庆全,罗武松,秦志浩,王金秋

(1.复旦大学 遗传工程国家重点实验室,上海 200438;2.上海四鳃鲈水产科技发展有限公司,上海 200438)

淞江鲈(Trachidermus fasciatus Heckel),隶属鮋形目(Scorpaeniformes),杜父鱼科(Cottidae),淞江鲈属(Trachidermus)[1].历史上,该物种曾广泛分布于中国的东南沿海及朝鲜半岛、日本一带;近年来,随着人类工业活动的破坏,其野生种群数量骤减.据王金秋等所作调查,现今中国境内仅有辽宁鸭绿江流域、山东青龙河流域和长江口-杭州湾一带尚有三个相互独立的野生种群存在[2],为加强保护,我国政府已将其列为国家二级保护动物[3].为从本质上把握淞江鲈生命现象的内在规律,更科学地对其加以保护和利用,近年来,对该物种遗传背景的研究日益增多,陆续有一些功能基因被克隆出来,并进行了表达情况分析或功能研究[4-10],其线粒体全基因组也已经测序完成[11].然而,由于相关研究起步较晚,基础还很薄弱,迄今为止在NCBI的Genbank中只收录了13个淞江鲈基因,不到270条该物种核苷酸序列.相关资料的严重匮乏,制约了相关研究的深入.

以组织细胞中的mRNA 为模板,逆转录合成双链cDNA,将各cDNA 分别插入载体形成重组子,再将重组子导入宿主细胞进行克隆扩增,这些重组子内所含cDNA 片段的集合,即为cDNA 文库.利用文库载体上克隆位点两侧的序列作为通用引物,对从cDNA 文库中随机选出的克隆进行5’端或3’端的一次性单向测序,获得一段约长300~500bp的序列,即为表达序列标签(Expressed Sequence Tag,EST).当下,构建cDNA 文库并进行大规模EST 测序已成为发现新基因和研究基因表达的重要方法,多种重要经济鱼类如鲤鱼(Cyprinus carpio)[12]、草鱼(Ctenopharyngodn idellus)[13]、石斑鱼(Epinephelus coioides)[14]、文昌鱼(Branchiostoma belcheri)[15]等的多种不同组织均已建立起cDNA 文库,并通过EST测序获得了大量有研究和开发价值的新基因,而淞江鲈的相关研究还未见报道.

本文用人工养殖条件下的成鱼构建淞江鲈肝脏组织cDNA 文库,通过测序首次获得了该物种的批量EST 序列并提交dbEST 数据库,且从中筛选出了一批淞江鲈基因,为进一步的研究奠定了基础.

1 材料与方法

1.1 材料

1.1.1 材料来源

人工养殖雌性淞江鲈(Trachidermus fasciatus Heckel)成鱼一条,采自复旦大学淞江鲈项目组松江养殖示范基地.

1.1.2 主要试剂及仪器

TRIzol试剂购自Invitrogen公司;构建cDNA 文库所用SMART cDNA Library Construction Kit和Advantage 2Polymerase Mix购自Clontech公司;纯化PCR 产物所用QIAquick PCR Purification Kit购自Qiagen公司;SfiⅠ酶为NEB 公司出品;分子量标记DL2000 Marker为TaKaRa公司出品;Sanprep柱式质粒DNA 小量抽提试剂盒为生工生物工程(上海)公司产品;测序用BigDye Terminator V3.1Cycle Sequencing Kit为ABI公司产品.PCR 仪为Bio-rad MyCycler;电泳仪和凝胶成像仪为Tanon HE-120和2500;紫外分光光度计为Thermo Nanodrop2000;DNA 测序仪为ABI 3730xl DNA Analyzer.

1.2 方法

1.2.1 总RNA 的提取及cDNA 文库的构建

活体解剖淞江鲈,取出其肝脏,切取约0.2g组织,置于液氮中充分研磨.按照TRIzol试剂使用说明书提取总RNA.取2μL 总RNA,用紫外分光光度计测定OD260/OD280和OD260/OD230值;另取5μL 总RNA 上样于1%琼脂糖凝胶,120V 电泳15min,用凝胶成像仪检测,剩余总RNA 样品置于-80℃冰箱保存备用.取2μL总RNA为模板,按照SMART cDNA Library Construction Kit说明书进行操作,先在逆转录酶作用下合成cDNA第一链,再用LD-PCR合成cDNA 第二链并扩增cDNA.取5μL双链DNA 进行1%琼脂糖凝胶电泳检测,剩余双链DNA 先后经蛋白酶K 消化、SfiⅠ酶切及SPIN-400柱纯化滤去较小cDNA片段后,用T4DNA连接酶连接到同样经SfiⅠ酶切处理的pUC19改良载体上,获得重组质粒.将重组质粒与大肠杆菌E.coli DH5α感受态细胞混合,42℃热激90s完成转化,即得质粒cDNA文库.

1.2.2 cDNA 文库的鉴定

(1)库容的测定 导入重组质粒的大肠杆菌在不含抗生素的LB液体培养基中复苏培养45min后,取菌液的1/1 000涂布到含氨苄青霉素(Amp)和IPTG/X-gal的LB 固体培养基上,37℃过夜培养,待菌落长出后,数出菌落个数,即可计算出文库的库容.

(2)重组率的测定 在上述平板中,分别数出蓝色和白色菌落的数目,其中白色菌落为重组成功者,可由此计算出文库重组率.

(3)插入片段的长度分析 在上述平板中,用灭菌牙签随机挑取24个菌落,接种到含Amp的LB液体培养基中培养,并用通用引物M13R(5’-CAGGAAACAGCTATGACC-3’)和M13F(5’-TGTAAAAC GACGGCCAGT-3’)进行菌液PCR,1%琼脂糖凝胶电泳检测各组PCR 产物.

1.2.3 EST 测序

取更多的文库菌液液体培养,涂布含Amp的LB固体培养基,37℃过夜培养后,随机挑取2200个克隆,按照BigDye Terminator V3.1Cycle Sequencing Kit的说明书,对文库插入片段进行5’端单向测序,所得序列用NCBI的VecScreen软件剔除载体序列、接头序列后,提交NCBI的dbEST数据库,获取序列号.

1.2.4 对EST 序列的初步分析

用CAP3软件对原始EST 序列进行拼接,拼接所得结果与公共数据库KOG、KEGG 和GO 等进行BLAST 比对,取相似度>30%且e<1×10-5的注释,进行基因功能分类.

2 结果与分析

2.1 总RNA的提取及检测

抽提共获得200μL淞江鲈肝脏组织总RNA,经紫外分光光度计测定,其浓度为0.46μg/μL,因而可以计算出所得总RNA 为91μg,而其OD260/OD280和OD260/OD230均为2.10.

琼脂糖凝胶电泳检测结果如图1(a)所示,在加样孔位于图片上方的看图模式下,上面一条带为28S RNA,下面一条带为18SRNA,其中28SRNA 条带的亮度约为18SRNA 条带亮度的2倍,2条带均清晰可辨,说明无降解,而5SRNA 条带不明显.综上所述,所得总RNA 质量合格,可以用于后续实验.

2.2 双链DNA的合成

将LD-PCR 所得的双链DNA 进行琼脂糖凝胶电泳检测(图1(b)),可见合成的cDNA最短的在250bp左右,最长的则超过2 000bp.值得一提的是,由于淞江鲈肝脏组织这一样品自身的原因,双链DNA 在1 000bp附近有一条极亮的条带,说明在该位置可能有些基因丰度极高,可能导致测序时产生冗余.

2.3 文库的鉴定

图1 淞江鲈肝脏组织总RNA 和cDNA 的电泳检测Fig.1 Analysis of roughskin sculpin hepatic total RNA and cDNA by agarose gel-electrophresis

2.3.1 库容和重组率的测定

经37℃过夜培养,在含Amp和IPTG/Xgal的LB固体培养基上共长出1 498个菌落,据此计算出文库的库容约为1.5×106个独立克隆.在这1 498 个菌落中,有1 416 个为白色,剩下82个为蓝色.根据蓝白斑筛选的α-互补原理,白色菌落为重组成功者,故重组率为1 416/1 498=94.5%.

2.3.2 插入片段的长度分析

从平板上长出的1 416个阳性克隆中,随机挑取24个进行液体培养,菌液PCR 扩增插入片段的电泳图谱如图2所示.由图可知,插入片段长度在500~2 000bp之间,平均插入片段长度约为1 100bp.

图2 24个阳性克隆的菌液PCR 产物电泳检测Fig.2 Analysis of bacteria liquid PCR of 24positive clones by agarose gel-electrophresis

2.4 EST测序

随机挑取2 200个阳性克隆进行5’端单向测序后,剔除载体序列、接头序列和短于100bp的序列后,共得到2 002 条高质量EST 序列,提交NCBI的dbEST 数据库,获得登录号JZ774993~JZ775545、JZ820916~JZ822364.

2.5 对EST序列的初步分析

从2002条EST 序列中共筛选出471个基因,对其进行了KOG 功能分类预测、KEGG 注释和GO 功能分类注释.

2.5.1 KOG 功能分类预测

对各基因所编码的蛋白序列进行KOG 功能分类预测,共有216个蛋白被注释上21种KOG 分类.注释上样本基因最多的3个KOG 分别为“总体功能仅为预测(General function prediction only)”(29个蛋白),“翻译后修饰,蛋白折叠,分子伴侣(Posttranslational modification,protein turnover,chaperones)”(24个蛋白)和“翻译,核糖体结构与生物合成(Translation,ribosomal structure and biogenesis)”(22个蛋白).

2.5.2 KEGG 注释

共有186个基因注释上175个KO,139个基因注释上195个代谢通路(pathway).注释上蛋白最多的3个通路分别是KO04610“补体和凝结级联反应(Complement and coagulation cascades)”(20个基因),KO03010“核糖体(Ribosome)”(18 个基因)和KO05010“阿尔茨海默症(Alzheimer’s disease)”(9 个基因).

2.5.3 GO 功能分类注释

有312个蛋白被注释上GO 分类.如图3所示,样本基因的功能在“生物过程(Biological process)”功能分类中主要集中于“细胞过程(Cellular process)”和“代谢过程(Metabolic process)”;在“细胞成分(Cellular component)”主要集中于“细胞(Cell)”和“细胞成分(Cell part)”;在“分子功能(Molecular function)”分类中主要聚集于“结合(binding)”和“催化功能(catalytic function)”.

图3 Level 2水平GO 注释上的基因分布Fig.3 GO classification under Level 2

3 讨论

3.1 cDNA文库的质量

cDNA 文库的质量直接影响着文库的使用价值,而对文库质量的评价,一般从文库的代表性和插入片段序列完整性两个方面着手[16].

文库的代表性,是指文库中所包含的重组cDNA 分子反映来源细胞中mRNA 种类的完整性.库容是衡量文库代表性的重要指标,其定义为构建的原始cDNA 文库中所包含的独立重组子克隆数,一般认为,原始文库的库容量大于106数量级即可说明其代表性较好[16-18].本文所建的cDNA 文库经测定,库容达到1.5×106,且重组率达到94.5%,说明代表性较好,可以用于后续的研究工作.

插入片段序列完整性,则是指插入片段能否尽可能多地反映所代表基因的信息,为此,应尽可能提高插入片段的全长比例.目前,已经建立起Oligo-capping 法[19]、CAPture 法[20]、SMART 法[21]、CAPtrapper法[22]等多种构建全长cDNA 文库的方法,本文所用的SMART 法即为其中一种广泛采用的经典方法,由Clontech公司创建[23-24].一般认为,插入片段序列较为完整的cDNA 文库,其平均插入片段长度应在1 000bp以上,而实际测定表明,本文所建文库的平均插入片段长度达到1 100bp左右,再次证明文库质量较高,可以用于后续研究.

3.2 EST测序及对未来工作的展望

EST 测序既可以从5’端进行,也可以从3’端进行,但一般情况下,由于mRNA 的3’端有一个poly(A)结构,在该结构附近又有特异性的非编码区,因此如果从这一端开始测序,所能获得的编码区序列信息将较少;相对而言,5’端附近所含的非编码区较少,包含的有效信息量更大,适合于寻找新基因或研究基因的差异表达[25-26].

尽管EST 测序用以寻找新基因已经成为一种成熟且常用的研究手段,但在淞江鲈的遗传研究中,相关工作还是一片空白.在本文之前,NCBI的dbEST 数据库中尚无1条淞江鲈EST 序列被收录,因而本文的研究填补了相关领域的一个重要空白.

肝脏的主要功能是蛋白质合成与机体防御.本文通过对淞江鲈肝脏组织cDNA 文库中的部分基因进行功能分类,发现在注释上蛋白最多的3个KOG 分类中有2个是关于蛋白质合成的,KO03010“核糖体(Ribosome)”通路在KEGG 注释中高居第二,这些均与肝脏的蛋白质合成功能相一致;此外,在KEGG 注释中还发现,肝脏中与KO04610“补体和凝结级联反应(Complement and coagulation cascades)”和KO05010“阿尔茨海默症(Alzheimer’s disease)”通路相关的基因数量较多,这也印证了肝脏在机体防御中的重要作用.

在今后,可以利用本文所构建的文库,测定出更多的EST 序列,并通过生物信息学手段,筛选出更多具有研究和利用价值的新基因,所以本文的研究工作也为今后的相关工作奠定了基础.

[1]王金秋.松江鲈的生态学和繁殖生物学的研究进展[J].水生生物学报,1999,23(6):730-734.

[2]王金秋,成 功.淞江鲈在中国地理分布的历史变迁及其原因[J].生态学报,2010,30(24):6845-6853.

[3]中华人民共和国林业部、农业部.国家重点保护野生动物名录[EB/OL].[2014-01-05].http:∥www.forestry.gov.cn/portal/bhxh/s/709/content-85157.html.

[4]LIU Y,YU S,CHAI Y,et al.Transferrin gene expression in response to LPS challenge and heavy metal exposure in roughskin sculpin(Trachidermus fasciatus)[J].Fish & Shellfish Immunology,2012,32(1):223-229.

[5]LIU Y,YU S,CHAI Y,et al.Lipopolysaccharide-induced gene expression of interleukin-1receptor kinase 4 and interleukin-1βin roughskin sculpin(Trachidermus fasciatus)[J].Fish &Shellfish Immunology,2012,33(4):690-698.

[6]CHAI Y,YU S,ZHU Q.The molecular cloning and characteristics of a fibrinogen-related protein(TfFREP1)gene from roughskin sculpin(Trachidermus fasciatus)[J].Fish &Shellfish Immunology,2012,33(3):614-618.

[7]刘庆全,罗武松,郑映荷,等.淞江鲈HSP70基因cDNA 部分序列克隆及其组织表达差异[J].复旦学报(自然科学版),2013,52(4):146-152.

[8]卢祥云,张 营,王星果,等.淞江鲈肌肉生长抑制素基因克隆和序列特征分析[J].动物学研究,2010,31(4):387-394.

[9]邵 芳,费晓燕,卢祥云,等.松江鲈Myostain基因内含子和线粒体D-loop DNA 序列分析[J].常熟理工学院学报(自然科学),2011,25(2):64-68.

[10]薛茂云,胡承俊,张 营,等.松江鲈β-肌动蛋白基因全长cDNA 的克隆和序列分析[J].安徽农业科学,2010,38(32):18229-18232.

[11]ZENG Z,LIU Z Z,PAN L D,et al.Complete mitochondrial genome of the endangered roughskin sculpin Trachidermus fasciatus(Scorpaeniformes Cottidae)[J].Mitochondrial DNA,2012,23(6):435-437.

[12]陈文波,刘黎黎,李文笙,等.鲤鱼肝胰脏cDNA 文库的表达序列标签分析及Lb-Fabp mRNA 的特征[J].水生生物学报,2009,33(3):376-384.

[13]张学俊,屈 刚,朱文漓,等.草鱼肠道cDNA 文库构建及部分ESTs分析[J].水生生物学报,2007,31(2):251-258.

[14]张 勇,张为民,李 欣,等.石斑鱼卵巢cDNA 文库构建及脂肪酸结合蛋白克隆[J].中山大学学报(自然科学版),2003,42(2):66-69.

[15]方永强,中庆祥,翁幼竹,等.文昌鱼头部cDNA 文库的构建[J].台湾海峡,2003,22(2):131-135.

[16]申明霞,刘 涛,杜 丽,等.海南坡鹿外周血白细胞cDNA 文库的构建[J].生物技术,2008,18(2):5-8.

[17]晏慧君,黄兴奇,程在全.cDNA 文库构建策略及其分析研究紧张[J].云南农业大学学报,2006,21(2):1-6.

[18]CLARE L,CARBON J.A colony bank containing synthetic ColE1,hybrid plasmids representative of the entire E.coli genome[J].Cell,1976,9(1):91-95.

[19]MARUYAMA K,SUGANO S.Oligo-capping:A simple method to replace the capstructure of eukaryotic mRNAs with oligoribonucleotides[J].Gene,1994,138(1/2):171-174.

[20]EDERY I,CHU L L,SONENBERYG N.An efficient strategy to isolate full-length cDNAs based on an mRNA cap retention procedure(CAPture)[J].Molecular Cell Biology,1995,15(6):3363-3371.

[21]SPIRIN K S,LJUBIMOV A V,CASTELLON R,et al.Analysis of gene expression in human bullous keratopathy corneas containing limiting amounts of RNA[J].Investigative Ophthalmology &Visual Science,1999,40(13):3108-3115.

[22]CARNINCI P,KVAM C,KITAMURA A,et al.High efficiency full-length cDNA cloning by biotinylated CAP-trapper[J].Genomics,1996,37(3):327-336.

[23]毛新国,景蕊莲,孔秀英,等.几种全长cDNA 文库构建方法比较[J].遗传学,2006,28(7),865-873.

[24]朱利军,长孙东亭,罗素兰.全长cDNA 文库构建方法及应用研究[J].海南大学学报(自然科学版),2009,27(2):185-190.

[25]ADAMS M D,KELLEY J M,GOCAYNE J D.,et al.Complementary DNA sequencing expressed sequence tags and the human genome project[J].Science,1991,252(5013):1651-1656.

[26]EPPLE P,APEL K,BOHLMANN H.ESTs reveal a multigene family for plant defensins inArabidopsis thaliana[J].FEBS Letters,1997,400(2):168-172.

猜你喜欢

文库菌落克隆
克隆狼
不同emm基因型化脓性链球菌的菌落形态
专家文库
浙江:诞生首批体细胞克隆猪
优秀传统文化启蒙文库
关于推荐《当代诗坛百家文库》入选诗家的启事
专家文库
抗BP5-KLH多克隆抗体的制备及鉴定
食品微生物检验中菌落总数测定的注意事项
SPC在压缩干粮菌落总数监测过程中的应用