APP下载

基于SNP分子标记的甘草产地鉴别研究△

2022-03-16郑司浩尚兴朴邓庭伟曾燕王继永

中国现代中药 2022年2期
关键词:碱基产地甘草

郑司浩,尚兴朴,邓庭伟,曾燕,王继永

中国中药有限公司,北京 102600

甘草为豆科甘草属常用大宗中药材,《中华人民共和国药典》2020 年版规定甘草为甘草Glycyrrhiza uralensisFisch.、胀果甘草G.inflataBat.或光果甘草G.glabraL.的干燥根和根茎,味甘,性平,归心、肺、脾、胃经,具有补脾益气、调和诸药等功能,多用于治疗脾胃虚弱、倦怠乏力等[1]。现代药理研究表明,甘草及其提取物具有抗氧化、抗炎、抗溃疡、解毒抗癌、抗肝纤维化等药理作用[2]。植物甘草为甘草药材的主要来源,分布在内蒙古自治区、新疆维吾尔自治区、甘肃省、宁夏回族自治区等地,东北地区也有少量分布。

甘草在中医临床中使用量较大,历来有“十方九草”之说。同时,其也是药食同源品种之一,广泛用于食品、保健食品及化妆品。自20 世纪60—70年代开始,甘草被大规模栽培,据不完全统计,全国甘草栽培面积约50 万亩(1 亩≈666.67 m2),年使用量近6 万t[3]。研究表明,不同产地甘草不仅外观性状特征存在一定差异,甘草酸、甘草苷、总黄酮及总皂苷含量也存在显著差异[4-5]。因此,不同产地甘草药效成分与药理作用存在差异。受市场因素及产业机械化程度不同影响,不同产地甘草种子、种苗、药材及饮片价格差异较大,存在相互掺杂、异地调种等情况。传统鉴别方法对于种内鉴别研究较少,多借助性状鉴别等主观经验,很难复制与产业化推广。单核苷酸多态性(single nucleotide polymorphism,SNP)指发生在染色体基因组水平上单个核苷酸变异引起的DNA 序列多态性。本研究通过对不同产地甘草进行基因组重测序,参考甘草全基因组序列,分析比较不同产地基因组序列差异,获得各主产区特有的SNP 位点信息,作为鉴别不同产地甘草的依据,为规范甘草产业、促进市场健康发展提供参考。

1 材料

1.1 样品

由中国中药有限公司自建甘草种质资源圃采集内蒙古自治区、新疆维吾尔自治区、甘肃省等甘草主产区野生种质资源叶片样本共24 份,经国药种业有限公司李进瞳副研究员鉴定为甘草Glycyrrhiza uralensisFisch.,标本存放于中国中药有限公司,样品信息见表1。

1.2 仪器

MGISEQ-2000RS型高通量测序仪(深圳华大智造科技股份有限公司);1-14 型离心机(德国Sartorius公司);NanoDrop One型超微量分光光度计(美国Thermo公司)。

1.3 试药

FCL PE150MGISEQ-2000RS 高通量测序试剂套装(批号:1000012555,深圳华大智造科技股份有限公司);异丙醇(批号:20190605)、无水乙醇(批号:20190507)均购自国药集团化学试剂有限公司。

2 方法

2.1 总DNA提取

采用改良十六烷基三甲基溴化铵(mCTAB)法对甘草叶片材料DNA 进行提取,具体步骤如下:1)取新鲜植物叶片100 mg 放入2.0 mL 离心管,加入少量石英砂和磁珠1 颗,浸入液氮中冻存约1 min,置研磨机中打磨至细小的粉末状;2)在研磨好的材料中加入buffer A[0.1 mol·L-1Tris-HCl(pH 8.0)、5 mmol·L-1乙二胺四乙酸(EDTA)、0.25mol·L-1NaCl、1%聚乙烯吡咯烷酮-40(PVP-40)]溶液1.5 mL,反复颠倒离心管使溶液与材料粉末均质混匀,冰浴10 min,其间将沉淀下的粉末重新均质混合几次。10 000×g离心2 min 后,弃掉上清液;3)重复步骤2)1 次,在沉淀中加入预热的2% CTAB[0.1 mol·L-1Tris-HCl(pH 8.0)、1.4 mol·L-1NaCl、25 mmol·L-1EDTA、2%CTAB;0.2%β-巯基乙醇;1% PVP-40]溶液800 μL,将沉淀均质悬浮于溶液后置于65 ℃水浴锅中保存1.5~2.0 h,其间颠倒均质溶液若干次;4)10 000×g室温离心2 min 后,将上清液小心倒入新的2.0 mL 离心管中,加入等体积CI[三氯甲烷-异戊醇(24∶1)]溶液,在颠倒摇床上混合10 min;5)10 000×g离心2 min 后,以移液枪小心吸取上层水相至新2.0 mL 离心管中,加入等体积CI 溶液,颠倒摇床上混合10 min;6)10 000×g离心2 min 后,以移液枪小心吸取上层水相至新的1.5 mL 离心管中,加入0.6 倍体积的冰冷异丙醇,颠倒混合后置于-20 ℃冰箱保存1 h 以上;7)取出冰箱中的离心管,10 000×g离心2 min,弃去上清液,倒置于干燥纸上,加入100 mg·L-1核糖核酸酶(RNase)溶液100 μL,37 ℃保存0.5 h;8)在离心管中依次加入ddH2O 150 μL、5 mol·L-1NaCl 溶液50 μL 和无水乙醇700 μL,充分混合后10 000×g离心2 min,弃去上清液;9)加入70%乙醇600 μL,弹底混合后10 000×g离心2 min,,弃去上清液,重复1 次;10)真空干燥去掉乙醇,加Tris-EDTA 缓冲液100 μL 溶解DNA,根据NanoDrop One 测定要求将样品DNA 浓度并稀释至50 ng·µL-1备用。

2.2 样本建库测序

检测合格的DNA 样品随机打断成300~400 bp的片段,采用华大基因试剂盒进行建库。库检合格后,根据文库的有效浓度和实际产出需求进行BGI-SEQ高通量测序,获得DNA测序原始数据。

2.3 测序数据质控

测序得到的原始reads包含接头序列,低质量和包含N的reads。使用SOAPnuke 1.5.6对原始reads进行过滤以保证信息分析质量。过滤参数:-n 0.02-l20-q 0.4。

2.4 样本序列比对

以甘草在http://ngs-data-archive.psc.riken.jp/Gur-genome/download.pl 中的基因组作为参考序列,利用BWA 软件进行序列比对,比对参数为mem-t 8-M-R。比对获得的.bam 文件利用Samtools软件进行排序,并用picard 移除聚合酶链式反应(PCR)引起的重复reads。

2.5 SNP检测与鉴定

得到.bam 文件后,利用GATK 软件获得个体的SNP基因型,进一步对SNP进行过滤,保留QUAL>100&&FS<10&&MQ>40的SNP。通过比较不同产地样本的SNP 基因型,找到各主产区稳定的SNP 鉴别位点信息,结合SNP 位点在基因组的位置,根据其前后150~200 bp 的碱基序列设计引物,利用经典的SANGER 测序对不同产地样品的SNP 位点碱基进行验证与确认。在产地鉴别时,建议待检样品与产地鉴别SNP位点满足95%以上的比对标准。

3 结果与分析

3.1 内蒙古杭锦旗产甘草SNP鉴别位点信息

通过对甘草不同产地样品的重测序数据进行分析比对,找到可稳定鉴别内蒙古杭锦旗产甘草的20 个SNP 位点信息,同时结合SNP 位点前后序列设计引物,通过SANGER 测序的方式,验证与确认SNP 位点准确性,信息见表2。SNP 周边序列是指该SNP 位点前5 bp 起始共计10 bp 的碱基序列。

通过提取鉴别内蒙古杭锦旗产地甘草SNP 位点周边300~500 bp 碱基序列设计引物,通过SANGER测序方式进行测序验证,第一次设计引物扩增成功率为90%(扩增不成功的加长序列长度重新设计引物直到扩增成功),SNP 位点碱基均正确。基于表2中SNP 位点信息,将待检测样本按照2 项下方法进行实验,最终得到待检样品SNP 基因型。相同染色体位置处的SNP位点信息与表2进行比对,如有19~20 个SNP 位点信息与表2 中所列的位点信息相同,则可判定该待检样品为内蒙古杭锦旗产甘草。

表2 内蒙古杭锦旗产甘草鉴别SNP位点信息

3.2 新疆产甘草SNP鉴别位点信息

通过对甘草不同产地样品的重测序数据进行分析比对,找到可稳定鉴别新疆产甘草的40 个SNP 位点信息,结合SNP 位点前后序列设计引物,通过SANGER 测序的方式,验证与确认SNP 位点准确性,信息见表3。

通过提取鉴别新疆产地甘草SNP 位点周边300~500 bp 碱基序列设计引物,通过SANGER 测序方式进行测序验证,第一次设计引物扩增成功率为95%(扩增不成功的加长序列长度重新设计引物直到扩增成功),SNP 位点碱基均正确。基于表3 中SNP 位点信息,将待检测样本按2 项下方法进行实验,最终得到待检样品SNP 基因型。将相同染色体位置处SNP 位点信息与表3 进行比对,如有19~20个SNP基因与表3中SEQID No.1~No.20相同,同时有19~20个SNP基因与表3中SEQID No.21~No.40 不同,则可判定该待检样品为新疆产甘草。

表3 新疆产甘草鉴别SNP位点信息

3.3 甘肃产甘草SNP鉴别位点信息

通过对甘草不同产地样品的重测序数据进行分析比对,找到可稳定鉴别甘肃产甘草的40 个SNP位点信息,结合SNP 位点前后序列设计引物,通过SANGER 测序的方式,验证与确认SNP 位点准确性,信息见表4。

通过提取鉴别甘肃产地甘草SNP 位点周边300~500 bp 碱基序列设计引物,通过SANGER 测序方式进行测序验证,第一次设计引物扩增成功率为90%(扩增不成功的加长序列长度重新设计引物直到扩增成功),SNP 位点碱基均正确。基于表4 的SNP 位点信息,将待检测样本按2 项下方法进行实验,最终得到待检样品SNP 基因型。相同染色体位置处的SNP位点信息与表4进行比对,如有19~20个SNP基因与表4 中SEQID No.1~No.20 相同,同时有19~20个SNP 基因与表4 中SEQID No.21~No.40 不同,则可判定该待检样品为甘肃产甘草。

表4 甘肃产甘草鉴别SNP位点信息

4 讨论

药材甘草在中医处方中用药频次较高,又是药食同源的中药大品种,随着甘草在食品、化妆品及保健食品等产品中使用量逐渐增多,其需求量将会不断增加。当前,甘草是甘草药材的主要植物来源,新疆、内蒙古、甘肃等地是其主要产区。不同产区的甘草种子、种苗及药材存在较为明显的价格差异,特别是甘草种子。由于新疆面积广阔、利于机械化作业,该地区甘草种子价格普遍比内蒙古、甘肃等地低近50%。巨大的经济利益驱使商贩进行异地调种、产地掺杂,严重影响甘草药材的质量稳定和产业健康有序发展。

中药材产地鉴别一直是中药产业技术难点和痛点。有经验的药农与中药材种植户多依靠主观经验加以判断。随着分子生物学的加速发展,其在居群及生态型鉴别方面的研究技术和方法可在中药材产地鉴别中加以探索和应用。SNP 分子标记是第三代分子标记技术的代表,以基因组序列为基础,具有通量大、多态性丰富、分析速度快、易建立标准化操作等特点[6]。SNP分子标记技术在中药物种鉴别中已有广泛应用[7-11],在同一药材不同产地或居群的鉴别方面也有部分研究[12-13]。本研究以甘草全基因组序列为参考,通过对不同主产地甘草的测序数据进行分析比较,挖掘新疆、甘肃和内蒙古杭锦旗产地甘草的SNP 鉴别位点信息,可用于鉴别甘草的产地来源,为甘草药材质量稳定和产业健康有序发展提供科学依据。研究结果表明,鉴别新疆与甘肃产地的SNP 位点组合各含有40 个碱基,鉴别内蒙古杭锦旗产地甘草的SNP位点为20个碱基。从SNP碱基分布来看,以碱基A 和T 为主,占比高达74%。运用基因组重测序方法,分析样本的各SNP位点碱基信息,并与产地鉴别SNP 位点信息进行比较,可初步判断该样本的产地来源。同时,也可通过根据鉴别各产

地的SNP位点所在序列设计的引物进行扩增与测序,通过测序结果比较SNP 位点对产地来源进行判断。但是,目前该方法工作量较大、成本较高,后续研究工作重点应加大样本验证数量及减少SNP 位点数量,降低技术成本、扩大技术推广利用范围。

中药材产地鉴别技术的研究和产业化应用是当前中药产业亟待解决的难题。中药资源丰富,野生资源和各种栽培类型分布相对分散,给中药产地鉴别带来巨大的挑战。传统的性状鉴别受个人主观判断影响,无法产业化推广和应用。基于基因序列和基因组的鉴别技术具有通量高、鉴别准确及稳定性强等优点,对于传统鉴别方法是较好的补充,可应用于中药产地鉴别。但是,由于药用植物基因组学基础研究起步较晚、研究和检测费用相对较高,分子标记技术的应用还存在一定限制性。随着测序成本不断下降及相关技术、设备的迭代更新,分子标记技术在中药产地鉴别中的应用将越来越普遍,并逐渐形成可产业化推广的鉴别技术,为中药产业的监督、监管及健康发展提供技术支撑。

猜你喜欢

碱基产地甘草
炙甘草汤,适用于哪些病症
推动产地农产品追溯进入下游流通消费环节
基因“字母表”扩充后的生命
A Network Pharmacology Study on the Effects of Ma Xing Shi Gan Decoction on Influenza
Systematic Pharmacological Strategies to Explore the Regulatory Mechanism of Ma Xing Shi Gan Decoction on COVID-19
创建新型糖基化酶碱基编辑器
印尼燕窝产地探秘
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
警惕“洗产地”暗礁