浙茄类型茄子品种DNA指纹图谱构建
2019-11-29魏庆镇王五宏胡天华胡海娇汪精磊包崇来
魏庆镇,王五宏,胡天华,胡海娇,汪精磊,包崇来
(浙江省农业科学研究院 蔬菜研究所,浙江 杭州 310021)
茄子(SolanommelongenaL.,2n=24)是茄科(Solanaceae)茄属(Solanum)的一种蔬菜作物,具有重要的农业经济价值和保健作用[1]。茄子具有十分丰富的生物多样性和广泛的地理分布,在生长习性、抗病抗逆、果实形状和颜色上存在较大变异[1-3]。据联合国粮食及农业组织(FAO)统计,2017年全世界茄子产量为5 230.9万t,而中国的产量达到3 290.8万t,占全世界产量的62.9%,我国已成为茄子世界第一生产国和主要出口国。茄子栽培种因区域消费习惯的不同,差异较大,但是相同区域内茄子品种却非常相近[4-5];浙江省主要栽培紫红线茄,茄子紫红色,细长,一般30 cm左右,横径2.5~3.5 cm,近年来涌现出一系列浙茄品种,如浙茄1号、浙茄3号、浙茄8号、杭丰、杭茄2010等[6-9],浙茄系列品种形态学性状非常相似,从性状上统计鉴定有一定难度,而且形态学性状容易受环境影响,在种子市场上同名异物及同物异名的情况经常发生,给育种单位和育种人员造成重要的经济损失。因此,对不同的品种进行快速准确地鉴定,不仅可以辨别品种的真假,同时对解决产权纠纷具有重要意义。
DNA指纹图谱技术已广泛应用于作物的品种资源多样性和纯度鉴定研究中[10-13]。1986年,Jeffreys发明了DNA指纹图谱技术(DNA-fingerprinting),成为品种和品系鉴别的重要方法,且具有高效、准确等优点。近几十年,随着分子生物学的发展,分子标记技术成为鉴定品种的重要手段,用于DNA指纹图谱的标记类型也在不断更新,从传统的限制性片段长度多态性(restriction fragment length polymorphism,RFLP)、随机扩增多态性(random amplified polymorphic DNA,RAPD)、扩增片段长度多态性(amplified fragment length polymorphism,AFLP)标记,发展到简单重复序列标记(simple sequence repeat,SSR),最新应用较多的是单核苷酸多态性标记(single nucleotide polymorphism,SNP)。SSR标记已在许多作物指纹图谱构建中得到应用,宋海斌等[14]利用SSR引物对不同甜瓜品种组合进行了指纹图谱构建;董志刚等[15]利用15对SSR引物区分了16份葡萄品种与亲本。此外,SSR标记也在猕猴桃、柑橘、玉米等作物上得到应用[16-18]。传统标记具有多态性低,对变异反应较敏感等缺点,SNP标记作为第三代分子标记,具有数量多、分布广泛、二态性、很容易进行高通量检测的优点。目前,SNP标记是国际植物新品种权保护联盟分子测试指南中构建DNA指纹数据库的推荐标记之一[8],王大莉[19]通过对功能基因SNP进行分析,构建了22个香菇栽培种的SNP指纹图谱;张昆鹏[20]利用SSR标记和SNP标记分别构建了油菜品种的指纹图谱并做了比较,发现SNP标记的结果更可靠;李志远等[11]开发筛选获得甘蓝50个核心SNP标记,并利用这些标记构建了甘蓝主要品种的指纹图谱,SNP标记已经在指纹图谱构建中凸显出越来越重要的地位。竞争性等位基因特异性PCR(kompetitive allele specific PCR,KASP)是一种新型高通量SNP分型方法,该方法成本低、准确度高,更具SNP位点适用性,已经在水稻、小麦、大豆等作物中得到广泛应用[21-23]。
目前,茄子还未见开发标记并用于构建指纹图谱的报道,本研究利用北京农林科学院前期开发的48个核心SNP标记,利用KASP技术对46份茄子材料进行基因分型,根据标记分型结果、多态性信息含量筛选获得34个核心SNP标记,并用于浙茄系列品种的指纹图谱构建,为浙茄品种真实性、特异性鉴定提供重要依据,为品种保护提供了重要的方法。
1 材料与方法
1.1 材料
试验材料是浙江省农业科学院茄子研究室收集,包含3份野生自交系材料,37份自交系材料,6份杂种F1。各材料于2018年11月播种,穴盘育苗后,移栽到小号营养钵中,于2019年4月定植于浙江省农业科学院乔司实验基地大棚温室,株距20 cm,行距80 cm。利用所有材料对48个SNP标记进行分型,筛选核心标记后,对品种进行指纹图谱构建。
1.2 DNA提取
取茄子幼嫩叶片直接放入2.0 mL离心管中,用液氮速冻,然后利用DNAsecure试剂盒提取DNA,提取的DNA用1%琼脂糖凝胶电泳检测,条带明亮单一无污染,利用Nanodrop2100检测D260/D280,在1.8~2.0(DNA样品没有蛋白污染);D260/D230在1.8~2.0(DNA样品盐离子浓度低);270 nm没有明显的光吸收(DNA样品没有酚污染)。根据英国LGC公司的KASP检测技术和基因组大小换算出DNA用量为每样品10~20 ng,稀释DNA浓度成为10~20 ng·μL-1备用。
1.3 KASP标记开发
1.3.1 引物的合成和引物预混液的配制
SNP标记由北京市农林科学院蔬菜研究中心提供,标记是利用茄子参考基因组数据开发,经过筛选后获得的48个核心标记。SNP引物由北京生工生物工程有限公司合成,每组引物中的引物A1的序列的5′端加上接头序列:GAAGGTGACCAAGTTCATGCT,引物A2的序列的5′端加上接头序列:GAAGGTCGGAGTCAACGGATT,引物C的序列不用改变。分别将各组SNP引物中的引物链均稀释成10 μmol·L-1,并按照体积比为12∶12∶30(引物A1∶引物A2∶引物C)的比例混匀,分别得到引物预混液。
1.3.2 基因分型
利用KASP技术对46份茄子进行SNP基因分型,SNP基因分型过程按照LGC公司提供的KASP技术实验流程进行,试验涉及的试剂、耗材和仪器均由LGC公司提供,整个实验步骤和试剂用法用量均按照LGC公司的操作指南KASP user guideand manual(www.lgcgenomics.com)进行。具体步骤如下:首先利用K-pette分液工作站将稀释好的待测DNA模板(4~10 ng·μL-1)1.5 μL和空白对照(no template control,NTC)分别加入反应板孔中,60 ℃烘干30 min(干燥箱,LGC公司),DNA变成干粉备用。然后在Kraken操作系统下利用Meridian加样工作站分别向每个反应孔中加入1×Master mix与引物混合液,Mix分装完毕立即将微孔板依次放在Kube热封仪和Fusion激光封膜仪上封膜,利用Hydrocyler进行高通量水浴PCR扩增。
PCR反应在高通量水浴系统Hydrocycler中进行,具体程序为94 ℃预变性,15 min;94 ℃,20 s(变性),61 ℃-55 ℃,1 min(复性和延伸:以touch down 程序扩增10个循环,每循环降低0.6 ℃);94 ℃,20 s(变性),55 ℃,60 s继续扩增26个循环。扩增结束后,利用BMG PHERAstar仪器检测荧光信号并查看分型情况。若分型不充分,则继续扩增,每3个循环查看分型情况,直至分型完全,从Kraken软件中导出实验结果。
1.4 数据处理
根据分型结果,利用Excel 2010计算每个标记的等位基因频率,并计算各标记的多态性信息含量,计算公式为PIC=1-∑fi2,其中fi为i位点基因频率。根据SNP标记的二态性特点,将分型数据转化为二元编码数据,其中按照茄子品种名称顺序,首次出现的纯合基因型记为(1 0),杂合基因型记为(1 1),另一种纯合基因型记为(0 1),构建6个浙茄品种的指纹图谱。
2 结果与分析
2.1 SNP标记的基因分型
在所有标记基因分型结果中,将所有46种茄子全部成功分型的标记有9个,有11个标记在45种茄子材料中成功分型,图1为SNP分型结果示意图。但有部分标记分型结果较差,例如标记SmSNP007在8个材料上未成功分型,其次是标记SmSNP031,有6个材料未成功分型,有9个标记在超过3个材料上未成功分型;有6个标记SmSNP021、SmSNP024、SmSNP168、SmSNP186、SmSNP201、SmSNP217均不能在3个野生材料上获得明确的分型结果,标记SmSNP045、SmSNP089、SmSNP091、SmSNP112、SmSNP173均只能成功分型1个野生材料,推测这些标记对野生材料的分型的概率比较小,不能应用于野生茄子材料的基因分型。
每个圆点代表一份测试材料;a.标记SmSNP011分型:红色圆点,A∶A;绿色圆点,A∶T;蓝色圆点,T∶T。b.标记SmSNP196分型:红色圆点,C∶C;绿色圆点,C∶T;蓝色圆点,T∶T;粉色圆点,未成功分型。Each dot represented a test material. a. SmSNP011 genotyping: red dots, A∶A; Green dots, A∶T; Blue dots, T∶T; b. SmSNP196 genotyping: Red dots, C∶C; Green dots, C∶T; Blue dots, T∶T; Pink dots, the ungenotyped.图1 SNP标记分型示意图Fig.1 Genotying graph of the SNP marker
2.2 SNP标记的多态性及杂合比例
多态性信息含量(PIC)是衡量标记质量的重要指标。48个标记在46份材料中PIC值最小为0.139,最高为0.500,其中小于0.35的有5个标记,有30个标记PIC值为0.45~0.50,占到所有标记的62.5%,没有标记的PIC值为0.30~0.35(图2)。根据将PIC值的分布,将小于0.35的标记剔除,PIC值大于0.35的标记用于后续指纹图谱的构建。
根据标记分型结果,我们计算了杂合基因型的比例,其中,杂合基因型比例小于5%的有3个标记,大部分标记的杂合基因型的比例为10%~15%,其中标记SmSNP045杂合位点比例高达72%,只有G∶A和G∶G两种基因型,杂合位点比例较高,不利于后续指纹图谱的构建,我们将此标记剔除。
2.3 核心SNP标记筛选
根据标记在46份材料上的基因分型结果和PIC值,挑选基因分型数据缺失少于3个,PIC值大于0.35的SNP标记作为核心标记,用于后续6份浙茄材料指纹图谱构建的核心标记,因为茄子参考基因组是scaffold版本,并不能明确标记在染色体上的位置,所以并不能根据标记的位置分布来筛选标记。综上,一共剔除了14个SNP标记,剩余34个标记用于后续指纹图谱构建(表1)。
图2 SNP标记多态性信息含量分布情况Fig.2 Distribution of polymorphism information of SNP markers
图3 三十四个标记在46种茄子中的杂合基因型比例Fig.3 Heterozygous genotype ratio of 46 eggplant varieties based on 34 SNPs
2.4 茄子材料的聚类分析
根据34个标记的分型结果,利用NTSYS软件对46份茄子材料进行聚类分析(图4)。结果表明,编号1、2、3的野生茄子聚类到一起,其中2和3更为相似;编号43(浙茄8号)和编号44(杭丰1号)更为接近,与编号29聚类为1个分支;编号27和编号45(杭茄2010)以及编号19更为接近,整体上这6个茄子与编号25更为接近;编号42(浙茄3号)和编号46(浙茄10号)相近,它们与编号41(引茄1号)以及编号26归为一个分支,这与我们浙茄系列品种的亲本来源及品种特性相一致,;同时,浙茄类型6个品种均在一个大的亚类内,同属一个类型。
图4 四十六个茄子品种的SNP聚类分析图Fig.4 Clustering analysis dendrogram based on SNP for 46 eggplant varieties
表1 四十六个SNP标记信息
Table1The information of 46 SNP markers
标记名称序列信息多态性信杂合位点比例未分型数目MarkernameSequence息含量PIC valueHeterozygousgenotype ratioNumber ofungenotypedSmSNP001TCATTGTACTAGCCG[A/T]ATTATTGAAGTTCT0.474 0.273 2SmSNP002CAACACATTAGTAAC[C/T]GGAATAACATTCAT0.491 0.261 0SmSNP003TTTCCCAATGCTATA[A/G]ATGATTTTTCAATC0.369 0.133 1SmSNP004TGATAGTGAGCAAAC[C/A]AGGGTGTTGTTGAC0.464 0.156 1SmSNP005AGGATTAAATGTTGG[C/T]CATGCGAACTCATT0.466 0.217 0SmSNP006CACACAATTGGAAGA[A/G]CAACATGTGAATCA0.485 0.217 0SmSNP007TTGTGAATTAGATTT[T/C]TTATTGATTTACTA0.487 0.243 8SmSNP011ATTATTTGGAGGAAC[T/A]AATGAGGAGAATGG0.491 0.130 0SmSNP012TGTATTGACTATTCT[T/A]ATCTGTTCTGCAGC0.496 0.261 0SmSNP013CAGTGGATTAATGGT[C/G]TGCTTAAAATCAGT0.429 0.267 1SmSNP016TGCCGCGATACCTCT[G/A]CATTTTTACTTTTG0.499 0.130 0SmSNP021TTGCAACTTGTAACT[A/G]TATGATTGAAGCAT0.369 0.209 3SmSNP024TGACTCTAAAGAATT[T/C]ATTAAAAGTTATCC0.363 0.143 4SmSNP027ATCAAGTAACCTGTC[G/A]TTCTTCTCGTTCAG0.415 0.109 0SmSNP030TACAATGAAACAATG[G/T]GAATAGACAAGAAA0.499 0.209 3SmSNP031CTCACAAAATTTCAA[C/T]CCAATTACATTATT0.139 0.100 6SmSNP035TCTGACTAGCGACTA[G/A]TATCATATCCAGAC0.438 0.162 1SmSNP038AGAGATTGAGAGAAC[G/T]CTTCAATCTGCGTT0.425 0.205 2SmSNP042ACTAAATGCAGAGGG[C/T]AAATTAGAGAAGAA0.498 0.222 1SmSNP045GTTTGCATTTGGATT[A/G]ATTTGGAGAATGTT0.461 0.721 3SmSNP055AATCAAGACTCAATC[C/T]CGACCACTTTCTTT0.416 0.136 2SmSNP062CAAATCGCCATAGAC[G/A]ATAACAGGAGCATT0.358 0.156 1SmSNP078TGCGTTGATGAATAA[C/T]GAGTAAGAGATTTT0.473 0.116 3SmSNP089AGTTAATTTATACAT[A/G]TATCCTAGATATAA0.499 0.256 3SmSNP091GCATTCAAGATGACA[T/C]CTAAATAAAATAAA0.500 0.159 2SmSNP094AATTAGGTGGAGAAA[A/G]GAGGACCATACAAT0.483 0.116 3SmSNP097ACCAACAGAAGGTGA[A/G]AATAATCAGTGGAT0.500 0.214 4SmSNP105ACAATCACATACTAC[T/C]ACCTCTCAAAGTCC0.500 0.093 2SmSNP107TGTCAAGTGACACTA[T/C]TTTGTCGAAAAAAA0.449 0.182 2SmSNP112TGTAAGTGGATCCGA[C/T]AAATTATCCTTTGA0.497 0.146 5SmSNP114AATAATGGGTTCGCT[T/C]GTTCAAAATCCCAG0.500 0.119 4SmSNP119ATCAGAGGCGGCAAG[C/T]ATAGCCACTGTTGC0.494 0.152 0SmSNP128TGGGTGCCACTTATT[T/C]CAACATTCTTTGAA0.198 0.044 1SmSNP135GCCATGGCTTCCGGT[G/A]TGTCGTCTGCTGCC0.463 0.045 2SmSNP140GTTTTGAGCCTTCTG[G/T]TTATAGAACATTTA0.442 0.068 2SmSNP142TTGGAGCAGTTCAGC[G/A]CCAAAGTTATGCTT0.500 0.089 1SmSNP146CGAGCCATGTGATTT[G/A]TCTCTGTGATGACC0.247 0.067 1SmSNP151TTATTATTCTAGCTA[T/A]GGAAGGTTTAAATC0.463 0.091 2SmSNP161ACCAGCATGATAAAG[C/T]AAAACCAAATCTAA0.298 0.091 2SmSNP168CCTCGCGGTGCTGTG[A/G]AATCTTCCAGAGAC0.476 0.195 4SmSNP173CTCAAAGTGAATGTC[T/C]TAGCATTACATATT0.487 0.140 3SmSNP186TCATATTCGCACTTA[C/T]ATTAGGATTATCAA0.404 0.122 5SmSNP196GCAAAAAGTTAGTCA[T/C]CAGTAACATGGCAA0.480 0.267 1SmSNP201TTGATTACAAGAAAT[C/T]TATATGATGCACTA0.476 0.098 5SmSNP205TTATTCAACTTGTTC[G/A]TATAGTTCTACTCC0.396 0.152 0SmSNP206AGAAGATAAGATGCA[C/T]ACAATTCATGTCTA0.278 0.022 1SmSNP216AGTTTTAGAAAAAAA[C/A]ATGTTCTTCAGGTT0.494 0.114 2SmSNP217AGCGAAATCTATATA[C/A]AGGAACTGAACAGT0.499 0.163 3
带阴影标记的是筛选后剔除的标记。
The shaded markers were those markers removed after screening.
2.5 主要品种指纹图谱构建
利用最终筛选的34个SNP位点用以构建主要茄子品种的指纹图谱,将6个茄子品种SNP分型转化为二元编码数据,得到浙茄品种的指纹图谱。34个标记中,有13个标记在6种茄子品种基因分型一致,占到38.2%,有7个标记在6种茄子品种只有两种基因分型,14个标记均出现了3种基因分型,各品种间差异位点数均≥ 2,因此,利用该 DNA 指纹图谱可对6个茄子品种进行快速有效区分(表2)。
表2 六个浙茄类型茄子的指纹图谱
Table2SNP-DNA Finger-printing database of 6 eggplant varieties from Zhejiang Province
品种VarietySmSNP001SmSNP002SmSNP003SmSNP004SmSNP005SmSNP006SmSNP011SmSNP012SmSNP013SmSNP016SmSNP021SmSNP027SmSNP030SmSNP035SmSNP038SmSNP042SmSNP055引茄1号1 01 11 11 11 11 11 01 11 01 01 11 01 01 01 11 01 1Yinqie No.1浙茄3号1 11 01 11 11 01 11 01 11 01 01 11 01 01 01 11 11 1Zheqie No.3浙茄8号1 00 11 11 10 11 01 01 01 01 01 01 00 11 11 00 11 0Zheqie No.8杭丰1号1 00 11 11 11 11 11 11 01 01 01 01 01 10 11 01 11 0Hangfeng No.1杭茄20101 00 11 11 11 00 11 00 11 01 01 01 01 00 11 00 11 0Hangqie 2010浙茄10号1 01 11 11 11 00 11 00 11 01 01 11 01 00 11 11 11 1Zheqie No.10品种VarietySmSNP062SmSNP078SmSNP089SmSNP091SmSNP094SmSNP105SmSNP107SmSNP119SmSNP135SmSNP140SmSNP142SmSNP151SmSNP173SmSNP196SmSNP205SmSNP216SmSNP217引茄1号1 01 01 11 11 11 11 11 01 01 01 01 01 11 01 01 01 1Yinqie No.1浙茄3号1 01 01 11 01 01 11 01 01 01 01 01 01 01 11 11 01 1Zheqie No.3浙茄8号1 01 01 01 10 11 11 11 01 01 01 01 00 11 11 11 01 0Zheqie No.8杭丰1号1 01 01 00 10 11 11 11 01 01 01 01 00 11 11 11 01 1Hangfeng No.1杭茄20101 01 00 10 11 01 11 01 01 01 01 01 00 10 10 11 00 1Hangqie 2010浙茄10号1 01 01 11 11 01 11 01 01 01 01 11 01 11 11 11 00 1zheqie No.10
3 结论与讨论
虽然不同地域茄子品种差异很大,但是同一地区的茄子品种很难从形态学性状方面准确区分;浙茄系列品种均属于红茄线茄类型,在长度、横径、颜色方面差异很小,再加上茄子品种在销售过程中经常会出现同物异名的现象,使得品种鉴定保护成为重要的一环。
SSR标记已在多种作物指纹图谱构建中得到应用,但是随着标记检测成本的降低,SNP标记逐步用于指纹图谱的构建中。目前,相对于SSR标记,高通量大样本的SNP标记检测已显现出优势;李志远等[11]利用开发的2.54×106个SNP标记,成功筛选出50个核心SNP标记,构建了59个甘蓝品种的指纹图谱;顾炳朝等[13]采用芯片技术开发SNP,构建了镇油6号的指纹图谱,并发现SNP标记指纹图谱所含差异位点信息较多,比SSR标记图谱更好,同时,研究发现SNP标记构建的指纹图谱具有数量多、分布广泛、高通量的优点[24]。目前,SNP检测及分型的方法有很多种,例如基于凝胶电泳检测的等位基因特异性PCR[25]、酶切扩增多态性序列法[26]、DNA芯片技术[27]和KASP技术[28]等。张昆鹏等[20]利用DNA 芯片技术检测SNP,构建了油菜的指纹图谱;Tian等[29]利用DNA芯片技术构建了玉米的指纹图谱构;赵勇等[23]采用测序法、酶切扩增多态性序列法和KASP法对大豆Dt1基因的4个SNP进行分型,发现KASP法是大豆快速、高效的SNP分型方法。相对于其他SNP检测方法,KASP 技术具有灵活、经济、准确的特点,优势明显,被广泛应用于各个领域。今后随着品种数量的增多、品种指纹图谱数据库的进一步丰富,高通量的SNP检测技术在新育成品种的真实性、特异性鉴定方面将具有非常广阔的应用前景。
本研究利用了北京农林科学院开发的48个核心SNP标记,利用KASP技术,经过46份茄子材料的再次筛选,最终获得34个高质量SNP标记,并利用这些核心标记构建了浙茄类型6个品种的指纹图谱,通过指纹图谱有效地区分6个品种类型的茄子,对浙茄类型的品种鉴定保护起到了积极作用,有助于茄子种子市场的监管监督。浙茄类型品种丰富,远不止6个品种,从长远考虑应当对不同类型的茄子品种材料和育种亲本进行重测序,结合参考基因组数据,开发大量SNP标记,然后结合分型结果、PIC值、在染色体上的分布等情况筛选更多的核心标记用于指纹图谱的构建。同时,由于全国范围内各省市茄子的差异,应当搜集更多的不同类型茄子资源材料、品种、育种亲本等,开发更多核心SNP标记且通用于不同类型的茄子,构建更加全面的茄子指纹图谱,以此来快速鉴别鉴定茄子品种,提高种子市场规范。
致谢:感谢北京市农林科学院蔬菜研究中心在SNP标记开发和分型方面提供的帮助,感谢李志远博士在指纹图谱构建方面提供的帮助。