APP下载

雌、雄弓背青鳉(Oryzias curvinotus) 肝脏转录组比较分析*

2020-10-14董忠典黎学友郭昱嵩王中铎

海洋与湖沼 2020年5期
关键词:文库测序肝脏

董忠典 黎学友 廖 健 张 宁 郭昱嵩 王中铎

(广东海洋大学水产学院 南海水产经济动物增养殖重点实验室 湛江 524088)

肝脏是脊椎动物最重要的器官之一, 在物质能量代谢、激素合成及免疫反应等生理过程中具有重要意义(van der Oostet al, 2003; Tomet al, 2004; Laiet al, 2015; Zhanget al, 2017)。在鱼类中, 雌性肝脏还是卵黄蛋白原(vitellogenins,vtgs)、透明带蛋白前体(choriogenins,chgs)、雌激素受体(estrogen receptor,er)和细胞色素P450(cytochrome P450s,cyp450s)等基因的主要表达器官, 这些基因对环境中雌激素物质较为敏感, 当水体环境中存在雌激素类物质时, 可以诱导雄鱼肝脏表达这些基因(Leeet al, 2002; Chenet al, 2008; Laiet al, 2015)。

弓背青鳉(Oryzias curvinotus)是一种广泛分布于我国南海沿岸水域的小型鱼类, 为红树林水域的常见物种(Hayakawaet al, 2015; Wanget al, 2017)。弓背青鳉具有体型小、生长快、性成熟时间短和胚胎发育透明的特点, 可以用于实验室饲养繁殖; 其对盐度有较强的适应能力, 具备开发成海洋环境毒理及盐度适应研究新模式种的潜力(Hayakawaet al, 2015)。同时, 弓背青鳉的性染色体为XX/XY 型, 具有性别标记, 是研究海洋鱼类性别决定和分化机制的潜在模型(Matsudaet al, 2003; 董忠典等, 2018)。同属的日本青鳉(Oryziaslatipes)和海水青鳉(Oryziasmelastigma)已被广泛应用于淡水和海水环境检测研究(Metcalfeet al, 2000; Chenet al, 2008; Honget al, 2015; Conget al, 2017; Abdel-moneimet al, 2018)。然而, 缺乏基因组和转录组信息, 在很大程度上限制了弓背青鳉资源的开发和利用。本研究采用RNA-Seq 技术分别对雌、雄弓背青鳉肝脏进行了转录组测序、基因功能注释和表达谱分析, 以期为弓背青鳉基因资源的开发提供基础数据。

1 材料与方法

1.1 弓背青鳉的采集及总肝脏RNA 提取

本研究所用性成熟弓背青鳉(平均体长29.25mm, 平均体质量0.27g)采集自湛江雷州半岛近岸的高桥国家级红树林保护区(21°36′24"N, 109°47′8"E), 实验室 暂 养 30d, 温 度 25±1°C, 盐 度 15, 光 暗 周 期14h:10h。解剖通过性腺类型确定弓背青鳉生理性别, 雌雄各 3 尾取肝脏分别进行总 RNA 提取, 使用DNase I(宝生物, 大连)去除基因组污染。使用1%琼脂糖凝胶电泳分析RNA 完整性, Nanodrop 检测RNA的纯度(OD260/OD280比值), Qubit 检测总RNA 浓度, RNA 满足进行下一步的文库构建的要求。对3 尾雌性肝脏总RNA, 分别取等量(1.0μg)混合为一个RNA样品池(FL), 用同样的方法获得雄性肝脏RNA 样品池(ML), 对FL 和ML 各取1.5μg 总RNA, 分别进行cDNA 文库构建和转录组测序。

1.2 文库构建及测序

使用带Oligo(dT)的磁珠富集真核生物mRNA, 加入fragmentation buffer 将mRNA 打断成短片段, 以mRNA 为模板, 用六碱基随机引物合成第一链cDNA, 然后加入缓冲液、dNTPs 和DNA 聚合酶和RNase H合成第二链cDNA, 再用AMPure XP beads 纯化双链cDNA。纯化的双链cDNA 先进行末端修复、加A 尾并连接测序接头, 再用 AMPure XP beads 选择150—200bp 片段。随后进行PCR 扩增, 并用AMPure XP beads 纯化PCR 产物, 得到最终的文库。文库构建完成后, 用Qubit2.0 进行初步定量并稀释至1.5ng/μL, 用 Agilent 2100 确认文库插入片段大小, 最后用Q-PCR 方法对文库的有效浓度进行准确定量(文库有效浓度>2nmol/L), 以保证文库质量。库检合格后, 进行Illumina HiSeq 测序, cDNA 文库的制备和测序由诺禾致源生物信息科技有限公司(天津)完成。

1.3 转录组测序质量控制和组装

为了保证转录组分析质量, 对原始测序数据(raw reads)过滤, 去除带接头的reads、N(N 表示无法确定碱基信息)的比例大于0.1%的reads、低质量(质量值Qphred<=20 的碱基数占整个reads 的50%以上)的reads, 得到高质量测序数据(clean reads)。采用Trinity软件对clean reads 进行拼接(Grabherret al, 2011)。

1.4 基因功能注释

为获得全面的基因功能信息, 使用7 大数据库对Trinity 拼接获得的unigenes 进行功能注释。使用在线BLAST 程序对unigenes 在Nr (http://www.ncbi.nlm. nih.gov)期望值e-value < e-5、Nt (http://www.ncbi.nlm. nih.gov) e-value < e-5、Swiss-Prot (http://www.expasy. ch/sprot) e-value < e-5、KOG (http://www.ncbi.nlm.nih. gov) e-value < e-3、KO (https://www.kegg.jp/kegg/ko. html) e-value < e-10和GO (http://www.geneontology. org/) e-value < e-6进行比对注释。通过HMMER3.0 (e-value < 0.01)程序对unigenes 在Pfam 数据库中进行蛋白家族注释(Eddy, 2011)。

1.5 基因表达水平和差异分析

将Trinity 拼接得到的转录组作为参考序列, 通过RSEM 对每个样本的基因表达水平进行估计: 将Clean data 比对到组装好的参考序列上, 根据比对结果得到每个基因的Readcount 数目, 采用TMM 对read count 数据进行标准化处理, 再用DEGseq 进行差异分析, 筛选阈值为qvalue <0.005 且|log2(foldchange)|>1 (Wanget al, 2010)。

1.6 差异基因GO 和KEGG 富集分析

使用R 软件中的GOseq 对弓背青鳉雌雄肝脏转录组差异基因进行显著性富集分析(Younget al, 2010)。使用KOBAS 软件检测差异基因在KEGG 通路中富集情况(Maoet al, 2005)。

1.7 实时荧光定量PCR(RT-qPCR)验证

利用RT-qPCR 技术, 弓背青鳉雌雄肝脏转录组中选择 12 个基因进行定量验证(引物见表 1)。RT-qPCR 反应体系15μL, 包含7.5μL 2×Power Green qPCR Mix (东盛生物, 广州), 0.6μL 上下游引物(10μmol/L), 1.5μL cDNA, 4.8μL ddH2O。每个样品技术重复3 次, 反应置于Roche LightCycler 96(罗氏, 瑞士)上运行。反应程序如下: 95°C 3min; 95°C 15s, 60°C 15s, 72°C 30s (采集荧光), 40 个循环; 熔解曲线分析检测PCR 产物的特异性。gapdh和adp作为内参基因, 使用SPSS17.0 采用2-ΔΔCt方法对目的基因表达水平进行统计(Livaket al, 2001)。

表1 本研究所用引物及序列 Tab.1 The sequences of primers used in this study

续表

1.8 微卫星标记(SSR)检测

采 用 MISA (http://pgrc.ipk-gatersleben.de/misa/ misa.html)对弓背青鳉肝脏转录组拼接获得的unigenes进行微卫星标记(SSR)检测, 设置各重复单元类型的最少重复次数为: 1—10、2—6、3—5、4—5、5—5、6—5。以1—10 为例, 该设置表示单核苷酸重复类型至少重复10 次才被算为微卫星。

2 结果

2.1 测序结果与组装

本研究分别构建了雌、雄弓背青鳉肝脏cDNA 文库, 并进行了转录组测序。测序结果经过质控后, 分别获得80095044 和87043984 条Clean reads。经Trinity 组装, 共得到49912 个unigenes, 其中N50 长度为2394bp, 其中长度大于1000bp 的unigenes 共计25423 个(图1)。

图1 unigenes 序列长度分布图 Fig.1 The distribution of sequence length of the unigenes

2.2 转录组注释

通过BLAST 比对, 分别在NR、NT、SwissProt、PFAM、KOG 数据库中注释到32651、47988、19005、25587 和19005 个unigenes。与NR 数据库比对发现有32649 个unigenes 与390 个物种基因序列高度同源, 其中77.6%(25349 个)的unigenes 和日本青鳉基因序列同源, 其次有 3.6%的 unigenes 和深裂眶锯雀鲷(Stegastes partitus)同源(图2)。为进一步了解弓背青鳉雌、雄肝脏表达基因集的功能, 将拼接的unigenes在GO 和KO 数据库中进行了比对分析。25630 个unigenes 被归类到GO 三个大类(生物学过程、分子功能和细胞成分)55 个功能分类中(图3)。生物学过程包 括25 个功能分类, 参与“细胞过程”(15094)和“代谢过程”(12821)的基因最多; 细胞成分包含20 个功能分类,“细胞”(8419)和“细胞部分”(8419)基因最多; 分子功能包含10 个功能分类, “结合”(16155)和“催化活性”(10114)基因最多。对基因做KO 注释后, 可根据它们参与的KEGG 代谢通路进行分类。共有18887个unigenes 在KO 数据库中获得注释, 富集到232 个KEGG 信号通路中, 其中“PI3K-Akt”信号通路含有最多(657)的 unigenes, 其次是“内吞”(615)、“斑黏连”(521)和“肌动蛋白骨架”的调节通路(508)。

图2 弓背青鳉unigenes 同源物种分布 Fig.2 Distribution of homologous species of O. curvinotus unigenes

2.3 差异基因表达及富集分析

通过DEGseq 对弓背青鳉雌、雄肝脏转录组基因进行差异表达分析(差异基因筛选条件为: qvalue < 0.005 & |log2(foldchange)| > 1), 结果如图4 所示, 有207 个unigenes 在雌鱼肝脏中上调, 364 个unigenes 在雄鱼肝脏上调。对差异基因(DEGs)进行GO 和KEGG 富集分析, GO 富集结果显示雌性肝脏高表达基因主要 参与蛋白质合成过程, 雄性高表达基因主要参与免疫及氧化还原反应(图5)。KEGG 分析结果显示DEGs 富集到244 个KEGG 通路中, 涉及核糖体、PPAR 信号通路、卵巢类固醇激素生成、类固醇生物合成、不饱和脂肪酸合成和内质网蛋白质加工等通路(图6)。

2.4 RT-qPCR 验证

本研究选择了在雌、雄弓背青鳉肝脏RNA-Seq分析中的12 个差异表达基因, 通过RT-qPCR 技术对RNA-Seq 结果进行验证。所选的验证基因包括环腺苷三磷酸依赖的转录因子camp, 内质网基因endoplasmin, UDP-葡萄糖醛酸转移酶基因utp, 磺基转移酶家族2B 基因sult2b及部分检测环境雌激素物质的标记基因如卵黄蛋白原基因vtg1、vtg2、vtglike, 透明带蛋白前体基因chgl、chgh、chghm, 细胞色素P450 基因p4502k1、p45027c。结果表明所选基因的表达模式与RNA-Seq 分析相一致, 说明RNA-Seq 分析结果可信(见图7)。

图6 弓背青鳉雌雄肝脏差异基因KEGG 富集 Fig.6 KEGG assignment of differentially expressed genes of O. curvinotus

图7 RT-qPCR 检测RNA-Seq 结果 Fig.7 Validation of RNA-Seq data using RT-qPCR

2.5 简单重复序列SSR 分析

利用MISA 软件对弓背青鳉进行SSR 标记鉴定, 用于遗传多样性研究。有18326 条unigenes 序列含有SSR 标记, 共计28195 个, 其中6373 条unigenes 包含一个以上的SSR。各种类型的SSR 标记出现的频率不同(表2), 单核苷酸重复SSR 出现的频率最高, 占总SSR 的73.17%, 其次是三核苷酸重复SSR, 占总SSR 的19%。另外, 不同重复序列的相对丰度差异很大。A/T 在单核苷酸SSR 中最常见, 在双核苷酸SSR中, AG/CT 最为常见。AGG/CCT 和AAAC/GTTT 是三、四核苷酸SSR 中最常见的元件。

3 讨论

3.1 弓背青转录组测序分析

为了阐明弓背青鳉肝脏表达基因的功能和涉及的生物学过程, 本研究分别构建了性成熟雌、雄弓背青鳉肝脏 cDNA 文库, 并在 Illumina 平台进行了RNA-Seq 测序, 分别获得了80095044 和87043984 条Clean reads。N50 长度是评价RNA-Seq 组装质量的重要参数, 本研究弓背青鳉肝脏转录组N50长度为2394bp, 高于多个已发表的水生动物肝脏转录组, 包括海水青鳉(2162bp) (Laiet al, 2015), 七鳃鳗(lampetra japonica)(1447bp) (李 庆 伟 等, 2018), 脂 鲤(Pterygoplichthys anisitsi) (1571bp) (Parenteet al, 2017), 低 于 海 鲈(Dicentrarchus labrax) (3257bp) (Magnanouet al, 2014)。对NR 数据库比对, 发现有77.64% (32649 条unigenes 中的25349 个)的可比对序列与日本青鳉基因同源(图2), 可能是因为弓背青鳉和日本青鳉均属于青鳉属, 亲缘关系密切(Wanget al, 2017)。

表2 弓背青鳉肝脏转录组SSR 类型及数量 Tab.2 SSR summary from the O. curvinotus liver transcriptome

肝脏在鱼类生长和物质能量代谢中起着重要的作用。在弓背青鳉肝脏转录组中, “细胞过程”、“细胞”和“结合”分别在GO 三大功能类别中富集(图3)。这与其他水生动物的肝脏RNA-Seq 结果类似, 说明属于这几类功能的基因在物种间保守(Magnanouet al, 2014; Chenet al, 2016; 张燕萍等, 2018)。KEGG 的注释结果表明, 弓背青鳉肝脏转录组中unigenes 主要参与了信号转导(3130)、内分泌系统(1536)及免疫系统(1491)的生物学过程。结果可能提示了肝脏在弓背青鳉生命过程中的主要功能, 为了解肝脏的功能演变奠定了基础。

3.2 弓背青 免疫相关基因

肝脏是鱼类的重要免疫器官, 通过KEGG 分析, 从弓背青鳉肝脏转录组中筛选出了多个可能参与免疫相关防御途径的unigenes(表3): 373 个unigenes 参与了血小板活化, 272 个unigenes 参与了白细胞跨内皮迁移, 245 个unigenes 参与了T 细胞受体信号通路, 136 个unigenes 参与了补体和凝血级联, 188 个unigenes 参与了自然杀伤细胞介导的细胞毒性, 163 个unigenes 参与了Toll-样受体信号通路等过程。在七鳃鳗的肝脏转录组中也有相似的结果(李庆伟等, 2018)。

表3 弓背青鳉肝脏转录组中参与免疫反应相关KEGG 通路的unigenes Tab.3 KEGG pathways with immune-related genes enrichment in the liver transcriptomes of O. curvinotus

血小板上具有toll 样受体, 在机体的先天免疫应答中起着关键作用。当病原菌与血小板结合时, 血小板活化同时分泌抗菌肽, 引起机体免疫反应(Coxet al, 2011)。白细胞跨内皮迁移在先天性和适应性免疫系统应答中起重要作用(Muller, 2011)。当机体受损时, 就会发生炎症反应, 它涉及血液中预先形成的可溶性元素迅速而短暂地运送到受伤部位, 随后是较长时间的白细胞运送, 经内皮细胞迁移可能是炎症反应的不可逆点(Jimenezet al, 2010; Muller, 2011)。补体和凝集通路在机体固有免疫防御中具有重要意义(Bajicet al, 2016), 在 小 瓜 虫 感 染 的 大 黄 鱼(Larimichthys crocea)早期免疫中发挥重要作用; 另外, 补体和凝集通路在鳗弧菌感染后半滑舌鳎的免疫反应中也发挥了重要作用(Zhanget al, 2015; Yinet al, 2016)。综上, 我们推测弓背青鳉的肝脏可能在抵御病原体入侵的免疫防御中发挥重要作用。

3.3 环境内分泌干扰物的生物标志物

鱼类肝脏常被用作检测环境中雌激素物质的靶器官, 通常用于检测环境雌激素物质的标记基因在雌鱼肝脏中大量表达, 如chgs、vtg、cyp450s和er(Bucheliet al, 1995; Arukweet al, 2001; Leeet al, 2002; Chenet al, 2008)等。Chgs基因编码放射带蛋白(ZPs)的前体, ZPs 占据了鱼卵壳的大部分, 由ZP-1、2和ZP-3 两个主要亚基群组成(Hamazakiet al,1989; Murataet al, 1991)。在性成熟雌鱼中, 雌激素诱导Chgs 在肝脏中合成, 随血液流动整合到放射带中。当雄鱼被环境雌激素物质刺激时, 肝脏也产生Chgs。在日本青鳉中, 双酚A、壬基酚和乙炔雌二醇均可以诱导Chgl 和Chgh 的表达, 表达量的增加与雌激素剂量呈正相关(Leeet al, 2002)。Chen 等(2008)研究表明海水青鳉chgl和chgh基因对环境雌激素物质也有相似的响应。卵黄蛋白原是硬骨鱼类卵黄蛋白前体, 虽然Vtgs 在成熟的雌性体内自然存在, 而在雄性体内则不存在, 但雌性激素或环境雌激素分泌物可以诱导雄性产生Vtgs。因此, 雄性肝脏中的vtgs 转录产物, 可用于指示检测对象过去或当前暴露于雌激素或具有雌激素效应的环境干扰物。本研究在弓背青鳉肝脏转录产物中发现了多种环境雌激素的生物标志物, 这些基因在性成熟雌性肝脏中的表达水平明显高于雄性肝脏, 可用于将弓背青鳉开发成广盐性环境监测模式物种。

3.4 SSR 标记

SSRs 是一种重要的分子标记, 可作为群体遗传学研究的资源。本研究, 从18326 个unigenes 中共获得28195 个SSRs。在已鉴定的SSRs 中, 单核苷酸重复基序最为丰富, 重复核苷酸较多的SSRs 较少(表2), 这与斑石鲷(Oplegnathus punctatus)(Duet al, 2017)、花蟹(Charybdis feriatus)(Zhanget al, 2017)及多鳞鱚(Sillago sihama)(Tianet al, 2019)的SSRs 分析相一致。本研究获得的弓背青鳉SSR 标记, 为遗传多样性研究提供了数据, 也有助于进一步绘制弓背青鳉遗传连锁图谱和开发弓背青鳉遗传资源。

4 结论

本研究首次获得了弓背青鳉雌雄肝脏转录组。共获得49912 个unigenes, 48391 个unigenes 被定位到主要数据库, 丰富了弓背青鳉的功能基因资源。通过功能分析推测肝脏可能在 弓背青 鳉抵御病原体入侵的免疫防御中发挥作用, 同时鉴定到了多个环境雌激素生物标志基因(vtgs,chgs,er,cyp450等), 为将其开发成环境监测物种提供了基础。此外, 从18326 个含有SSR 序列的unigenes 中获得了28195 个SSR, 为弓背青鳉遗传多样性的研究提供数据。

猜你喜欢

文库测序肝脏
用生命保卫中央文库的陈为人
七种行为伤肝脏
肝脏里的胆管癌
专家文库
外显子组测序助力产前诊断胎儿骨骼发育不良
优秀传统文化启蒙文库
关于推荐《当代诗坛百家文库》入选诗家的启事
加州鲈肝脏养护
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展