基于家蚕转录组测序的SSR序列分析
2022-03-01王晖王敬高妍夏杨帆马宝俊谷苗张乘云薛翠翠谢岩
王晖 王敬 高妍夏 杨帆 马宝俊 谷苗 张乘云 薛翠翠 谢岩
摘要:本研究对家蚕中肠、脂肪体进行转录组测序,分析SSR位点的分布规律和特征。结果表明,从17915个Unigene中共检测到1339个SSR位点,分布在960个Unigene中。SSR位点的基序长度以1bp为主,随着基序长度的增加,SSR位点数量逐渐减少,SSR位点间的距离和平均长度逐渐增加。家蚕SSR单核苷酸基序类型以A/T为主,占总基序数量的53.10%。SSR位点重复次数主要集中在5~12次,占总SSR位点数的87.60%,其中单核苷酸重复10次的SSR位点最多,共有368个。家蚕转录组SSR基序长度分布范围为10~688bp,高度多态性SSR位点(长度≥ 20bp)有253个,占比18.89%。960个Unigene中分别有125、122个在GO、KEGG数据库中得到功能注释,主要包括蛋白结合、DNA结合、剪接体、代谢途径等通路。随机选择20对EST-SSR引物进行验证,发现19条引物扩增成功。
关键词:家蚕;转录组测序;简单重复序列(SSR);特征分析
中图分类号:S881.2+6文献标识号:A文章编号:1001-4942(2022)01-0014-07
家蚕作为目前唯一被人类完全驯化的无脊椎动物,具有生长周期短、经济效益好等优点。中国家蚕养殖历史悠久,古代中国的家蚕通过丝绸之路传播,逐渐演化出许多地方品系,之后传播到欧洲、东亚、南亚等国家,并形成当地特有品种[1]。目前国内常见的家蚕品系可分为中系、日系等,中系家蚕品种主要有菁松、新松、苏春、浙蕾甲等,日系家蚕品种主要有皓月、东肥、白云、玉种等[2]。此外,还有一些特色地方品种,如孝丰17号、安吉7号、余杭11等;一部分由引进的日系品种改良选育而成的新品种,如苏7、苏10、蘇14等[3]。由于家蚕品系、品种、杂交种众多,根据形态特征已难以进行准确的种间鉴定。
分子标记是能反映生物基因组差异的特异性的DNA片段,由于具有位点数量多、多态性高、检测技术简单快捷等优点,已广泛应用于动植物品种选育、物种亲缘关系鉴定、基因定位等领域[4]。目前已报道的分子标记主要有RFLP(限制性内切酶片段长度多态性)、RAPD(随机扩增多态性DNA)、SSR(简单重复序列)等。SSR为目前最常用的分子标记,基于基因组或转录组序列信息开发,可分为基因组SSR标记和表达序列标签SSR(EST-SSR)标记。EST-SSR标记在团头鲂[5]、文蛤[6]、蚂蟥[7]、红腹锦鸡[8]、绵羊[9]等物种的种群遗传结构分析、遗传多样性分析、QTL定位方面已有报道。基于不同的家蚕品种,AFLP[10]、RAPD[11]、SSR[12]分子标记均表现出较好的鉴别力。随着高通量测序技术的进步和成本的降低,从转录组测序数据中可以挖掘出更多的SSR分子标记。
本研究选择代表性家蚕品种,获得家蚕重要的消化(中肠)、免疫器官(脂肪体)的转录组数据,对转录组数据库中的SSR位点进行筛选和分析,研究其分布规律,并通过设计引物,初步验证SSR标记的有效性,以期为家蚕品种鉴定提供有效的分子标记工具。
1 材料与方法
1.1 试验材料
2019年6月将家蚕品种‘东肥‘彩3‘彩4‘菁松×皓月幼虫饲养于温度(25±2)℃、湿度60% ~70%和自然光周期的环境中。7月份解剖‘东肥与‘彩4蚕体(5龄最后一天、预蛹期、排净粪便),分离得到中肠、脂肪体组织,迅速投入液氮中,保存于-80℃,送北京诺禾致源科技股份有限公司进行转录组测序。
1.2 试验方法
1.2.1 SSR位点分析 采用MISA程序(1.0版,http://pgrc.ipkgatersleben.de/misa/misa.html)检测基因的SSR位点,参数设置默认,1、2、3、4、5、6个unitsize的最少重复次数分别为10、6、5、5、5、5,统计不同SSR类型在转录本(Unigene)中的分布规律。
1.2.2 PCR扩增 使用动物组织/细胞基因组DNA提取试剂盒(北京索莱宝科技有限公司,D1700)提取4种家蚕蚕体的DNA,NanoDrop2000检测DNA浓度和纯度,1.5%琼脂糖凝胶电泳检测DNA的完整性,-20℃保存备用。选择与家蚕抗氧化途径相关的、含有SSR位点的重要基因,采用Primer3设计引物。PCR反应体系:DNA0.2μL,引物F、R(10μmol/L)各0.8μL,2×ReactionMix10μL,Taq酶0.4μL,ddH2O8.2μL。扩增程序:94℃ 3min;94℃ 30s,55℃ 30s,72℃1min,35个循环;72℃ 10min。反应结束后,采用2.5%琼脂糖凝胶电泳进行检测。
1.3 数据分析
采用MicrosoftExcel2010软件进行数据统计分析,OriginPro2021b软件作图。
2 结果与分析
2.1 家蚕SSR位点数量与分布
从家蚕的脂肪体和中肠共检测到1339个SSR位点,分布于960个Unigene,平均每个Unigene含有1.39个SSR位点;192个Unigene含有1个以上SSR位点,SSR发生频率和出现频率分别为5.35%、7.47%;每10kb长度序列包含1.53个SSR位点(表1)。SSR位点的基序长度以1bp为主;基序长度为1、3bp时,SSR位点总长度较大;随着基序长度继续增加,SSR位点数量大幅减少,位点间的平均距离和平均长度总体呈增加趋势(表2)。
2.2 家蚕转录组SSR位点基序类型
家蚕SSR位点基序类型共有66种,从单核苷酸至六核苷酸均含有多种基序类型。单核苷酸基序类型以A/T为主,占总基序数量的53.10%,C/G基序出现频率很低;二核苷酸基序类型有8种,以AC/GT为主;三核苷酸基序类型有20种,以CCG/CGG为主;四核苷酸、五核苷酸、六核苷酸基序类型分别有12、8、14种,分别以AAAT/ATTT、ACAGG/CCTGT、ACCGAG/CGGTCT为主要类型(图1)。
2.3 家蚕转录组SSR位点基序长度分布特征
家蚕转录组SSR位点的重复次数与基序类型相关,单核苷酸的重复次数主要范围为10~17次,二核苷酸的重复次数主要范围为6~10次,三核苷酸的重复次数主要范围为5~7次,四核苷酸、五核苷酸、六核苷酸的重复次数以5次为主。SSR位点的重复数主要集中在5~12次,占总SSR位点数的87.60%,其中单核苷酸重复10次的SSR位点最多,共有368个;其次为三核苷酸重复5次,有245个(图2)。
家蚕转录组SSR位点基序长度分布范围为10~688bp,低度多态性的SSR位点(长度范围10~11bp)有469个;中度多态性的SSR位点(长度范围12~19bp)有617个;高度多态性SSR位点(长度≥ 20bp)有253个,占比18.89%(图3)。
2.4 含有SSR位点的Unigene的GO、KEGG功能注释
960个Unigene中分别有125、122个在GO、KEGG数据库中得到功能注释。GO注釋结果中,分别有47、12、11个Unigene注释到蛋白结合、DNA结合、核酸结合通路(图4A);KEGG注释结果中,分别有11、10、7、7个Unigene注释到剪接体、代谢途径、内吞作用、核糖体生物合成通路(图4B)。
2.5 SSR引物的有效性与多态性分析
随机选择含有不同长度SSR位点的Unigene设计20对引物(表3),以4个家蚕品种进行检验,发现19条引物在至少1个家蚕品种中扩增出条带,7条引物在4个家蚕品种中均扩增出条带(图5),说明引物扩增性较好。
3 讨论与结论
家蚕作为鳞翅目昆虫的模式生物,在基础研究、应用研究中发挥着重要作用。人工的不断选育、驯化使家蚕品种多样、性状特异,是昆虫中遗传资源保存最为丰富的物种之一。前人研究已经证实,微卫星DNA在昆虫的基因组中广泛存在。
通过高通量测序获得的Unigene和SSR位点数量表现出种间特异性。本研究以家蚕中肠、脂肪体转录组数据共组装得到17915条Unigene,其中960个Unigene上共检测到1339个SSR位点。意大利蜜蜂幼虫肠道转录组测序共获得12115条Unigene,其中2149条Unigene上分布6312个SSR位点[13]。麦红吸浆虫唾腺转录组数据只组装得到1047条Unigene,检索到141个SSR位点[14]。SSR位点基序类型重复次数的多少与软件种类、软件设置、物种、样品类型有关。常用的SSR位点检测软件有MISA、MSATCOMMANDER等。本研究中使用MISA软件检测家蚕SSR位点,检测条件设置从单核苷酸至六核苷酸,单核苷酸的重复次数最多。当MISA软件设置只检测二核苷酸至六核苷酸时,意大利蜜蜂幼虫肠道转录组中二核苷酸SSR位点重复次数最多[13]。即使设置条件一致,软件、物种不同,重复次数最多的SSR位点基序类型也不相同,MSATCOMMANDER软件检测桔小实蝇转录组测序数据,发现三核苷酸SSR位点重复次数最多[15]。
许多昆虫转录组SSR位点研究表明,单核苷酸重复是占比最高的重复类型。通常来说,A/T既是单核苷酸重复中的优势类型,也是所有重复类型的优势类型,但所占比例因物种不同而不同。家蚕中肠、脂肪体SSR位点基序A/T类型占总基序数量的53.10%;梨小食心虫幼虫中肠转录组中A/T出现频率可达79.82%[16];在窄足真蚋中则高达86.93%[17];麦红吸浆虫唾腺转录组数据中A/T只占31.21%[14]。本研究发现家蚕中肠、脂肪体中三核苷酸重复是仅次于单核苷酸重复的类型,占比27.56%,这可能与三核苷酸更容易留在编码区并且不会引起编码框移码有关[18]。
在双翅目昆虫中,AC/GT是二核苷酸优势重复类型[17]。鳞翅目中的粘虫[19]、小菜蛾、烟草天蛾、棉铃虫[20]的二核苷酸优势重复类型也是AC/GT,与本研究结果一致;印度谷螟[21]、帝王蝶、菜粉蝶[19]则是AT/AT。说明,鳞翅目昆虫的二核苷酸优势重复类型与物种相关,没有表现出明显的分类学层面特征。
虽然转录组测序技术开发的SSR多态性通常低于基因组SSR,但其成本更低、技术成熟,更容易开发大量可用的SSR分子标记。本研究随机选择了20对引物,对4种家蚕进行了种间检测与验证,初步证实这些引物扩增性较好,为下一步大规模开发SSR分子标记奠定了基础。