二代测序技术和叶绿体基因组在菊花系统学分类和遗传资源研究中的应用综述

2021-09-12夏涵涵雷雪柔黄臻齐陈雪燕杜一鸣周厚高

江苏农业科学 2021年13期

夏涵涵雷雪柔黄臻齐陈雪燕杜一鸣周厚高

摘要：快速发展的简化基因组测序技术，适用于非模式植物的测序，成本较低、测序性能强，目前被大量应用于园艺植物鉴定和基因组辅助育种。而具有母系遗传特征的叶绿体基因组，具有多拷贝、结构保守等优点。将叶绿体基因组与二代测序技术结合应用，将成为植物遗传资源研究的有效手段。本文综述了二代测序技术和叶绿体基因组在包括菊花在内的园艺植物种质资源研究中的应用，以期为菊花分类和遗传资源研究提供理论基础。

关键词：简化基因组测序;叶绿体基因组;菊花系统学分类;基因组辅助育种;二代测序技术;遗传资源

中图分类号： S682.1+10.1 文献标志码： A 文章编号：1002-1302（2021）13-0025-04

菊花（Chrysanthemum×morifolium Ramat.），别称鞠、黄花和秋菊，是菊科多年生草本植物。菊花作为我国的传统花卉，同时又是世界上四大切花之首，品种繁多，有着3 000余年的栽培史[1]。在唐朝，中国菊花传到日本，日本人将其与野菊进行杂交;明末清初时期，菊花又经荷兰商人引种至欧洲栽培，形成花色、花型各异的品种[1]。菊花具有极高的药用和经济价值，用途多样。药菊如滁菊被研发成了滁菊蜜、滁菊口含片等，还可利用其黄酮和挥发油等制作新产品[2]。又因其品种丰富，被许多艺术家用于雕塑、插花等艺术作品的制作。如今菊花在世界各地广泛栽培，栽培技术和条件的提高，更是让菊花的栽培和应用具有更广的前景[3]。

1 菊花分类研究进展

1.1 传统分类阶段

菊花起源于中国，关于菊花最早的记载在《周礼》中，此外，周朝至春秋时期均有关于菊花的记载，在秦朝时甚至曾出现菊花销售市场[4]。菊花具有极高的药用价值，古人最早是以食用、药用的目的来栽培菊花的，在我国关于菊花最早的分类在《本草经》中，将其分为真菊和苦薏[5-6]。晋朝陶渊明独爱菊，创作了许多赞美菊花的诗句，菊花被当作观赏植物开始广泛栽培。宋朝是栽培菊花的盛期，随着栽培技术的提高，出现了各种不同花色的菊花，人们开始以花色来对菊花进行分类[5]，宋朝各菊谱记载的品种也越来越多。明清时期还是按照宋朝的方法利用花色来对菊花进行分类[5]。但是，由于古代技术的缺乏和局限，并未能对菊花进行很详细的记载和研究，菊花品种也没有被科学系统地分类，仅记载了一些类别。

1.2 形态学系统分类整理阶段

我国第1次对菊花进行系统分类的是南京农业大学李鸿渐教授，他经研究整理后发现我国拥有 3 000 多个菊花品种[7]。形态学系统分类整理阶段对菊花品种进行分类的依据主要是花形、花色、瓣型等，各学者提出了不同的分类方案。汤忠皓提出将菊花分为22区、2花型、7瓣型和30个花型的四级方案[8]，张树林提出将菊花品种归为2系、3瓣型、25花型的三级分类方案[9]。李鸿渐教授等发布了与全国菊花品种分类研讨会相似的分类方案，将大菊品种分为5类、42型[10]。

1.3 现代综合分类阶段

现代的菊花分类依据除了形态学性状之外，还有细胞学及分子生物学等性状，可以对菊花进行更深入、更细致的分类学研究。傅玉兰对寒菊新品种进行花粉形态研究，证实菊花外部形态特征与花粉形态的遗传变异具有一定的相关性[11]。陈发棣等对几种中国野生菊进行减数分裂研究发现，野菊为异源四倍体[12]。分子标记技术在菊花种质资源研究中的应用为菊花的起源、菊属植物种间的亲缘关系、菊花品种的遗传多样性研究及菊花的品种分类和鉴定提供了丰富可靠的参考数据。不同的分子标记技术[如随机扩增多态性DNA标记（RAPD）、扩增片段长度多态性（AFLP）和简单重复序列间区（ISSR）等]对菊花品种分类均起到了重要作用，如戴思兰等曾用RAPD技术对菊花起源进行研究发现，野菊、毛华菊与栽培菊花的亲缘关系最接近[13]。许多研究提出，瓣型在菊花起源中是一个重要的性状，并可作为菊花分类的一个等级[14]。此外，这些标记技术不仅可以将菊花的原始栽培品种区分开来，还可以区分从一个品种中衍生出来的突变体，这就为今后菊花品种鉴定和培育工作提供了技术支持。

1.4 存在的问题

前人虽然已经在中国菊花品种形态分类和鉴定方面做了大量工作[15-16]，但是对于品种数量众多的菊花来说，制定全面系统的分类鉴定方案非常困难，在品种分类和遗传资源研究方面都存在很大的不足和局限。一是由于菊花品种间差异较小、遗传复杂及高度的自交不育性，加大了菊花研究的难度。二是菊花品种收集和保存难度大，菊花品种繁多，易杂交产生新的变异，缺乏直接有利的生物分子信息[17]。三是菊花分类体系和鉴定手段不完善，目前主要仍以形态特征作为分类依据，受自然环境的影响较大。寻找稳定的遗传标记、有效地鉴定菊花品种是今后菊花品种资源研究的重要课题，应重视分子生物学方向的研究，用不同的分子标记技术进行菊花品种研究。

2 叶绿体基因研究进展

叶绿体是部分藻类及高等植物特有的、具有双层膜结构的半自主性细胞器，其最重要功能就是通过光合作用合成重要氨基酸类物质并产生能量，是植物体重要的能量转换器[18]。叶绿体基因组即叶绿体DNA（cpDNA），包含叶绿体中所有的DNA。自Shinozaki等成功获取烟草（Nicotiana tabacum）的叶绿体基因组全序列以来，越来越多的植物叶绿体基因组序列被测定[19]。叶绿体基因组库中含有同一个种的不同亚种叶绿体基因组序列，反映了它们之间存在进化差异[20]。由于叶绿体基因组具有比较保守的环状结构、独立的基因组及属于母系遗传，使得叶绿体转化技术成为研究植物进化研究的有效手段。

2.1 叶绿体基因组结构

叶绿体基因组序列的基因组大小、结构、种类的保守性都很强，绝大部分叶绿体DNA为双链闭合环状分子，极少数是线状，如伞藻（Acetabularia）和玉米（Zea mays）。叶绿体基因组的大小一般为 120～160 kb，也存在同一物种大小差异过大的情况，如绿藻的叶绿体DNA的差异很大，小的如某种寄生性绿藻（Simulium jonesii）的DNA大小只有 37 kb，而大的如伞藻的DNA大小则达2 000 kb[21]。cpDNA有4个基本组成部分，虽然不同植物的叶绿体DNA长度各不相同，但大部分植物叶绿体中均有1段大致为10～24 kb且呈反向重复的DNA序列（IRA、IRB）。除此以外，IRA和IRB之间发生重组形成了小单拷贝序列（small single copy region，简称SSC），剩下的部分就是大单拷贝序列（large single copy region，简称LSC）。IRA、IRB大小和方向的不同是造成cpDNA差異的主要原因，如被子植物豌豆（Pisum sativum）甚至已经失去IR区间，而纤细裸藻（Euglena gracilis）含有3段方向相同的重复DNA序列，紫红紫菜（Porphyra purpurea）的IR序列同向重复[20]。叶绿体基因组编码的基因可大致分为3类，分别是光合系统基因（psaA、psaB、psaC、petA、petB、atpA等）、遗传系统基因（rrn5、trnH、rpl2等）、生物合成基因（matK、cemA等）。

2.2 叶绿体基因组在园艺作物研究中的应用

随着基因组学的发展，叶绿体基因组凭其自身特点和优势已经成为基因组测序的首要选择，在植物的系统发育分析中有巨大优势。如段义忠等通过叶绿体基因组对比分析沙冬青（Ammopiptanthus mongolicus）和小沙冬青（A. nanus）在蝶形花科中的系统进化发育[22]。杨嘉鹏等对3种石豆兰属药用植物叶绿体基因组进行组装注释，为系统发育分析和物种鉴定提供了理论依据[23]。趙惠恩对菊花的cpDNA基因序列中的trnT-trnL、trnL-trnF序列进行研究，发现毛华菊（C. vestitum）和栽培菊花的序列差异较大，而栽培菊花和甘菊（C. lavandulifolium）的序列完全相同，由此可见，栽培菊花的母系祖先种可能是甘菊，并非毛华菊[24]。李世茂采用叶绿体基因间隔序列对比分析法探讨研究栽培菊和野生近源种的系统学，为栽培菊的起源提供了理论依据[25]。刘锡娟等在试验中通过用菊花Rubisco小亚基的启动子驱动，在基因的5′端加叶绿体定位信号肽，构建了植物表达载体并进行其他转基因方面的试验，获得转5-烯醇式丙酮酰莽草酸-3-磷酸合酶（EPSPS）基因抗草甘膦烟草和棉花[26]。何熠将菊属、亚菊属叶绿体DNA测序组装后，分别进行结构分析，发现菊属、亚菊属不同物种之间的差异很小[27]。通过基因组大小比对，发现它们的叶绿体基因组长度十分相似，都在151 000 bp左右，表明该物种全含有相同的一套编码基因。

3 基因组测序技术方法

3.1 二代测序技术

1977年Sanger等发明的双脱氧链终止法（即第1代DNA测序技术）是获得植物全基因组最传统的DNA测序技术[28]。Sanger测序法的测序程序是根据DNA复制和RNA反转录的原理来设计的。人们利用该技术第1次获得了拟南芥的全基因序列[29]。基于Sanger测序发展起来的二代测序技术（next generation sequencing，简称NGS）目前已被广泛应用于观赏植物分子标记、图谱构建等[30-31]。二代测序技术主要有Illumina公司的Solexa Genome Analyzer测序平台、454测序技术、寡聚物连接检测（SOLiD）测序技术、完整基因DNA测序方法（complete genomics）测序方法、半导体测序技术等5种测序技术。虽然Sanger测序法能够高准确性地完成大量测序工作，但其存在成本高、速度慢、通量低等不足，而二代测序技术则是一种低成本、高通量的测序技术，1次可对成千上百万条DNA分子同时进行快速测序，故NGS逐渐取代Sanger测序法而被广泛应用。如北美云杉（Picea sitchensis）的叶绿体基因组序列就是通过此方法获得的[32]，胡志刚利用454测序技术结合标签法获得了菊科药用植物的叶绿体基因组全序列[33]。随着二代测序的运用，发展出来的简化基因组测序应用更加广泛，它是通过选择一种限制性内切酶进行酶切，然后进行文库片段大小选择，使用一定大小的酶切片段所对应的序列作为整个基因组序列的部分代表来降低基因组的复杂性。对群体中不同基因型的个体采用相同的内切酶进行酶切，回收相同大小范围的酶切片段建立文库，然后进行高通量测序。对于有参考基因组序列的物种，可进行测序片段的比对;而对于没有参考序列的物种，则先组装序列然后进行序列比对。通过简化基因组测序和分析，可以准确发现单核苷酸多态位点（single nucleotide polymorphism，简称SNP）。王柏柯等利用简化基因组测序对 60个特定番茄样本进行测序和分析，共获得8个与目标基因相关的候选区域，对番茄雄性不育基因进行初步定位，为雄性不育基因的克隆功能提供理论基础[34]。张珊珊等对从24个天然的云南蓝果树样本进行基因测序中获得6 309 个有效SNP位点进行遗传分析，得出了现存植株之间亲缘关系较远的结论，认为该品种的种质资源具有很大的保存价值和研究价值[35]。由于全基因组测序对于像菊花这样大基因组的物种仍然很困难，而其他的一些遗传简化方法具有很高的偏差和限制[36]，因此对于很多非模式的物种，简化基因组测序技术仍然是一种经济且有效的途径来产生高密度的SNP，可以用来对园艺作物进行鉴定和分类，完成基因组辅助育种。周春玲通过AFLP技术对菊属12个分类群体进行分析，结果表明，滁菊、毫菊2个品种可归并为1个品种，且与毛华菊、野菊、甘菊的亲缘关系较近[37]。洪亚辉等利用RAPD技术对5种菊花变异种后代进行遗传差异分析，从中发现6种引物的多态差异性明显，结果表明，变异菊花在DNA水平上具多态差异性[38]。叶松选用99种菊花对其进行高通量测序分析，得到简单重复序列（simple sequence repeat，简称SSR）片段 32 863 条，随机筛选的100对SSR引物中有16对SSR引物具有多态性，且扩增条带清晰[39]，为分子标记辅助育种在菊花的研究上提供了有效的理论依据。

4 展望

菊花的起源和系统学的研究已经持续了很多年，但由于菊花品种繁多、品种差异较小和技术、历史的局限性，并未能很好地解释菊花分类及系统关系，存在较大的分歧。虽然前人已经有进行深入到DNA序列方向的研究，但目前有关于菊花叶绿体基因组序列的研究仍比较缺乏。叶绿体的基因属于母性遗传，具有独立的遗传系统。与核基因组相比，其结构和基因组成非常保守，具有多拷贝、进化速率适中、在分子水平上具有明显差异等优点[40]。利用cpDNA对菊花品种的系统进化研究具有很大的潜力，近年来测定叶绿体基因组序列也成为了系统进化和物种分类强力有效的手段。但群体间存在杂交现象，而cpDNA属单亲遗传，故其无法解释全部的系统发育现象，也无法揭示完整的进化过程。

随着科技的发展，NGS凭借其测序性能强、周期短、无需参考基因组等优点，一跃成为探究植物全基因组序列、遗传多样性的有效技术。因此，结合简化基因组测序技术，可获取更多的遗传信息和不同水平的区分特征，叶绿体基因组和简化基因组测序技术可更广泛地运用在园艺作物鉴定和分类上，辅助分子育种，对园艺作物进行种质创新和品种改良具有重要意义。

参考文献：

[1]薛守纪. 菊花栽培[M]. 北京：中国林业出版社，2004：3-4.

[2]王世福，龚建国，王诏. 滁菊产业化发展综述[J]. 安徽农学通报，2012，18（17）：10，69-70.

[3]铁铮. 菊花起源之争[N]. 北京日报，2013-10-09（20）.

[4]刘春迎，王莲英. 菊花品种的数量分类研究（Ⅰ）[J]. 北京林业大学学报，1995，17（2）：79-87.

[5]孙文松. 菊花品种起源及形态学分类研究[J]. 黑龙江农业科学，2013（9）：58-60.

[6]牟禮忠. 霜寒时节话菊花[J]. 广西林业，2004（1）：75.

[7]李鸿渐，邵健文. 中国菊花品种资源的调查收集与分类[J]. 南京农业大学学报，1990，13（1）：30-36.

[8]汤忠皓. 中国菊花品种分类的探讨[J]. 园艺学报，1963，2（4）：441-418.

[9]张树林. 菊花品种分类的研究[J]. 园艺学报，1965，4（1）：35-46.

[10]李鸿渐. 中国菊花[M]. 南京：江苏科学技术出版社，1993.

[11]傅玉兰. 根据花粉形态探讨寒菊新品种的遗传特性[C]//中国风景园林学会，北京市园林局，中国菊花研究会.中国菊花研究论文集（1997—2001）. 2001：4.

[12]陈发棣，陈佩度，李鸿渐.几种中国野生菊的染色体组分析及亲缘关系初步研究[J]. 园艺学报，1996（01）：67-72.

[13]戴思兰，陈俊愉，李文彬. 菊花起源的RAPD分析[J]. 植物学报，1998，40（11）：1053-1059.

[14]吴在生，李海龙，刘建辉，等. 65个菊花栽培品种遗传多样性的AFLP分析[J]. 南京林业大学学报（自然科学版），2007，31（5）：67-70.

[15]白新祥. 菊花花色形成的表型分析[D]. 北京：北京林业大学，2007.

[16]雒新艳. 大菊品种资源遗传多样性研究[D]. 北京：北京林业大学，2009.

[17]张莉俊，戴思兰. 菊花种质资源研究进展[J]. 植物学报，2009，44（5）：526-535.

[18]Ahlert D，Ruf S，Bock R. Plastid protein synthesis is required for plant development in tobacco[J]. PNAS，2003，100（26）：15730-15735.

[19]Shinozaki K，Ohme M，Tanaka M，et al. The complete nucleotide sequence of the tobacco chloroplast genome：its gene organization and expression[J]. The Embo Journal，1986，5（9）：2043-2049.

[20]邢少辰，Liu C J . 叶绿体基因组研究进展[J]. 生物化学与生物物理进展，2008，35（1）：21-28.

[21]Maier R M，Schmitz-Liuneweber C. Plastid genomes[M]//Daniell H，Chase C D. Molecular biology and biotechnology of the plant organelles：chloroplasts and mitochondria. Netherlands：Springer Netherlands，2004：115-150.

[22]段义忠，张凯. 沙冬青属植物叶绿体基因组对比和系统发育分析[J]. 西北植物学报，2020（8）：1323-1332.

[23]杨嘉鹏，朱紫乐，范雅娟，等. 三种石豆兰属药用植物的叶绿体基因组比较分析及物种鉴定研究[J]. 药学学报，2020，55（11）：2736-2745.

[24]赵惠恩. 菊属基因库的建立与菊花起源的研究及多功能地被菊育种[D]. 北京：北京林业大学，2000.

[25]李世茂. 基于叶绿体DNA基因间隔序列的菊花与近缘种亲缘关系研究[D]. 武汉：华中农业大学，2010.

[26]刘锡娟，刘昱辉，王志兴，等. 转5-烯醇式丙酮酰莽草酸-3-磷酸合酶（EPSPS）基因抗草甘膦烟草和棉花的获得[J]. 农业生物技术学报，2007，15（6）：958-963.

[27]何熠. 基于二代测序技术对SNP检测软件的比较研究[D]. 石河子：石河子大学，2019.

[28]Sanger F，Nicklen S，Coulson A R. DNA sequencing with chain-terminating inhibitors[J]. Biotechnology，1977，24（12）：104-108.

[29]Arabidopsis Genome Initiative. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana[J]. Nature，2000，408（6814）：796-815.

[30]熊燕，张金柱，董婕，等. 简化基因组测序技术在观赏植物中的应用研究进展[J]. 园艺学报，2020，47（6）：1194-1202.

[31]赵娜，苗艳梅，赵敏. 未知植物病毒分子生物学检测方法的研究现状[J]. 江苏农业学报，2019，35（1）：224-228.

[32]白雪菲. 基于混合样品高通量测序数据的植物叶绿体基因组拼接和分析[D]. 杭州：浙江大学，2013.

[33]胡志刚. 菊科药用植物DNA条形码及叶绿体基因组研究[D]. 武汉：湖北中医药大学，2012.

[34]王柏柯，李宁，唐亚萍，等. 基于简化基因组测序技术的番茄雄性不育基因定位[J]. 西北农林科技大学学报（自然科学版），2017，45（6）：177-184.

[35]张珊珊，康洪梅，杨文忠. 基于简化基因组技术的云南蓝果树群体遗传分析[J]. 植物研究，2019，39（6）：899-907.

[36]Catchen J M，Hohenlohe P A，Bernatchez L，et al. Unbroken：RADseq remains a powerful tool for understanding the genetics of adaptation in natural populations[J]. Molecular Ecology Resources，2017，17（3）：362-365.

[37]周春玲，戴思兰. 菊属部分植物的AFLP分析[J]. 北京林业大学学报，2002（增刊1）：72-76.

[38]洪亚辉，朱兆海，张学文，等. 运用RAPD分析菊花辐射变异后代遗传差异[J]. 湖南农业大学学报（自然科学版），2003，29（6）：462-467.

[39]叶松. 菊花表型性状与SSR、SCoT分子标记的关联分析[D]. 郑州：河南大学，2017.

[40]田欣，李德铢. DNA序列在植物系统学研究中的应用[J]. 云南植物研究，2002，24（2）：170-184.

江苏农业科学

2021年13期

二代测序技术和叶绿体基因组在菊花系统学分类和遗传资源研究中的应用综述

杂志排行

江苏农业科学的其它文章