APP下载

ATR-FTIR技术在小麦籽粒识别上的探索

2021-08-11曾玉婷王炳锐赵林姝张文英刘录祥徐延浩

核农学报 2021年7期
关键词:马氏株系突变体

曾玉婷 李 博 王 容 王炳锐 赵林姝 张文英 刘录祥 徐延浩,*

(1 长江大学农学院涝渍灾害与湿地农业湖北省重点实验室,湖北 荆州 434025;2 华中农业大学植物科学技术学院,湖北 武汉 430070;3 中国农业科学院作物科学研究所,北京 100081)

小麦(TriticumaestivumL.)是中国第三大粮食作物,其产量及品质的持续发展为保障国内粮食安全做出了贡献[1]。近年,人们对高抗性淀粉[2]、纤维[3]、花青素[4]、籽粒锌元素[5]等特异品质小麦材料需求越来越强烈。诱变育种技术是种质资源创新,新基因挖掘和新品种(系)选育的一个重要途径[6]。目前,诱变技术已经在高抗性淀粉、籽粒高锌元素含量等特异小麦材料创制上显示出了重要作用[7]。但诱变突变体产生概率仅为10-6~10-9[8],因此,突变体筛选是制约诱变技术应用的关键[9],亟需开发快速、准确又有效的突变体筛选技术。

鉴别突变体的方法包括形态学鉴定、离体筛选方法、分子筛选等[6]。形态学方法简便、直观、成本低,但很难筛选籽粒品质性状突变体[10]。应用离体培养与诱变技术结合的方法可以筛选具有非生物胁迫耐受性突变体[11]。结合Tilling(定向诱导基因组局部突变技术)分子筛选技术可以鉴定突变群体中含有目标基因的个体[11],但该方法成本高,筛选工作量大。随着高通量表型技术的发展,结合高通量表型技术可以快速获取植物型信息,可用于表型突变体的筛选[12]。小麦籽粒品质性状的测定,如蛋白质,一般采用化学法,需要样品量较多且一般都需要破坏样品。随着微量酶标仪、全自动直链淀粉分析仪等微量、高通量品质测定仪器的改进与应用,品质突变体的筛选有了较大进展,但这些方法需要对样品进行复杂的前处理[13-14]。近些年,近红外光谱技术广泛应用于小麦籽粒蛋白质含量测定[15-16],该方法具有无损、快速的特点,但是该技术谱带宽,重叠严重,通常用于OH、NH、CH等基团的定量分析;而且近红外光谱测定需要的样品量较多,只适用于高世代株系的品质性状筛选。

衰减全反射傅里叶变换红外光谱(attenuated total reflection-fourier translation infrared spectroscopy,ATR-FTIR)是一种分子振动光谱技术。ATR-FTIR通过样品的反射信号获得样品表层有机成分的结构信息,具有无需样品前处理、测试速度快、检验成本低、对样品形状及含水量无特殊要求等优点[17-18]。与近红外相比,ATR-FTIR技术需要的样品量少。应用ATR-FTIR技术可以实现绘画颜料中蛋白质种类的“不分离即分析”[19],并且可以对葡萄籽的多糖、木质素、脂质、果胶等物质的主要基团进行定性分析,并鉴定不同产地的葡萄籽[20]。目前,用于ATR-FTIR定性分析的算法主要有主成分分析(principal component analysis,PCA)、判别分析(discriminant analysis,DA)[21]、Bootstrap法[22]、支持向量机(support vector machine,SVM)[23]。DA是基于马氏距离法的“有监督的模式识别法”,马氏距离表示光谱数据之间的协方差距离。DA法首先计算训练集样品每个分类的平均马氏距离,然后计算验证集样品离各个类中心的马氏距离,通过比较两者距离判断样品的类别。

本研究旨在应用ATR-FTIR技术,探索建立小麦籽粒ATR-FTIR识别模型的最佳预处理方法,并应用新采集光谱和新品系分别进行外部验证,检验小麦籽粒ATR-FTIR识别模型的准确性,在此基础上,应用建立的最佳识别模型对小麦籽粒性状突变体进行识别,拓宽小麦籽粒性状突变体筛选途径,同时为ATR-FTIR技术在小麦突变体育种中的应用提供线索。

1 材料与方法

1.1 试验材料

用于籽粒品种(系)识别的小麦由扬州大学许如根教授惠赠,来源于中国小麦微核心种质库,突变体亲本YUW-1-207由长江大学农学院选育。突变体群体是由YUW-1-207经50 Gy7Li离子束处理并获得(由中国农业科学院作物科学研究所/国家农作物航天诱变技术改良中心进行辐射处理)。2017年秋季,将供试的91个小麦品种(系)材料(表1)、突变体及其对照株系在长江大学试验基地点播成行,行长1.3 m,行距25 cm,每行16粒。田间管理按照常规。2018年从田间随机选择576行M5突变体与235行对照用于后续研究。试验材料采用单穗挂牌的方法,每个株行选择6个单穗,成熟后手工剪穗,并手工脱取穗中部饱满、无病害、霉变的籽粒(每穗6粒)。

1.2 小麦籽粒ATR-FTIR光谱采集

收获的小麦籽粒烘干保存待用,测试平衡籽粒水分(13.0%)。采用NICOLET is5红外光谱仪(美国Thermo Fisher Scientific公司)采集小麦籽粒的ATR-FTIR光谱,该仪器配有ATR附件。测量前,先用酒精棉擦拭ATR附件样品台,将小麦籽粒置于ATR晶体表面(腹股沟朝下),扫描范围4 000~525 cm-1,光谱分辨率4 cm-1,扫描次数16次。通过空气背景扫描自动扣除背景环境中CO2和H2O的影响。利用OMNIC 8.2软件收集ATR-FTIR光谱数据。每颗小麦籽粒采集5次光谱数据,取5次光谱的平均光谱作为测定光谱。用于小麦籽粒识别的91个小麦品种(系),每个品种(系)采集20颗籽粒(4粒/穗,5穗);突变体株系及对照每个材料采集10颗籽粒(2粒/穗,5穗)。

1.3 小麦籽粒ATR-FTIR光谱数据预处理及识别模型的建立

使用TQ Analyst 9软件对小麦籽粒ATR-FTIR光谱进行预处理和构建模型,7种预处理方法分别为多元散射校正(multiplicative scatter correction, MSC),MSC+Norris平滑(norris derivative filter, ND),MSC+ Savitzky-Golay平滑(SG),MSC+ND+一阶导数(first derivative, FD)(MSC+ND+FD),MSC+ND+二阶导数(second derivative, SD)(MSC+ND+SD)和MSC+SG+FD,MSC+SG+SD。MSC用来消除由于样品大小不一致及分布不均产生的散射对光谱的影响;ND和SG平滑处理为了消除光谱信号中的随机噪声,提高样本信号的信噪比;FD和SD处理后,可以消除基线和背景的干扰。以品种(系)识别错误数作为评价小麦籽粒ATR-FTIR识别模型优劣的标准,并以此筛选预处理方式。

将小麦籽粒ATR-FTIR光谱数据导入TQ Analyst 9软件,每个小麦品种(系)的光谱数据按照训练集和验证集7∶3划分。首先计算训练集中每个品种(系)内光谱数据的平均马氏距离,再计算验证集每个光谱数据到每个品种(系)内中心的马氏距离。根据未知光谱数据到某已知品种(系)中心的马氏距离判定未知光谱的品种(系),未知光谱数据到某品种(系)的马氏距离越小,则未知光谱数据与该品种(系)匹配程度越高[24]。

1.4 小麦籽粒ATR-FTIR识别模型的外部验证

首先对最佳小麦籽粒ATR-FTIR识别模型进行新采集光谱验证。从小麦籽粒ATR-FTIR识别模型的71个品种(系)中,随机选择15个品种(系)作为外部验证的品种(系)(表2),每个品种(系)重新采集10个光谱数据作为待验证数据。

进一步对最佳小麦籽粒ATR-FTIR识别模型进行新品种(系)的验证。选择未参与小麦籽粒ATR-FTIR识别模型的20个小麦品种(系)(表1),每个品种(系)测定10个光谱数据,共计200个光谱数据作为待建模数据。按照小麦籽粒ATR-FTIR识别模型筛选到的最佳预处理方式建立外部验证模型,并结合模型的二维分类图效果、品种(系)识别错误数来判断识别模型的优劣。

表1 小麦籽粒ATR-FTIR识别建模及验证材料名称和来源

1.5 小麦籽粒ATR-FTIR识别模型的应用

将突变体及对照株系的ATR-FTIR光谱数据导入小麦籽粒ATR-FTIR识别模型,突变体和对照株系的光谱数据分别按照7∶3的比例分为训练集和验证集,分别计算突变体和对照株系训练集中的平均马氏距离,再分别计算验证集光谱数据到突变体和对照株系中心的马氏距离。根据突变体和对照株系训练集中的平均马氏距离、验证集光谱数据到突变体和对照中心的马氏距离对突变体光谱数据重新聚类,以此获得潜在的籽粒性状突变体株系。并用验证集光谱数据到突变体和对照株系中心的马氏距离绘制小麦籽粒性状突变体识别二维聚类图,直观反映聚类结果。

2 结果与分析

2.1 小麦籽粒的ATR-FTIR光谱分析

通过ATR-FTIR对不同小麦品种(系)籽粒进行ATR-FTIR光谱采集。结果表明,小麦籽粒具有明显的ATR-FTIR光谱特征吸收峰(图1)。蛋白质的主要吸收峰为1 642 cm-1的酰胺Ⅰ(C=O拉伸),1 540 cm-1的酰胺Ⅱ(C-N拉伸,N-H弯曲)和1 239 cm-1的酰胺Ⅲ(C-N和N-H拉伸);碳水化合物的主要吸收峰包括1 745 cm-1的C=O伸缩振动;脂质的主要吸收峰包含2 872 cm-1的CH3对称拉伸;此外木质素的吸收峰为1 514 cm-1,淀粉的吸收峰为1 150 cm-1、1 124 cm-1[25]。由于光谱3 648 cm-1附近吸收峰推测为羟基O-H的伸缩振动,因此该波段范围内受水的干扰较大;Pearson相关系数分析表明,1 000~525 cm-1波段内的不同品种(系)光谱数据间的相关性系数高达0.91,无法提供有效的品种(系)识别信息。故本研究选择3 600~1 000 cm-1波段范围进行后续分析。

图1 小麦籽粒ATR-FTIR光谱图

2.2 小麦籽粒ATR-FTIR光谱数据预处理及识别模型的建立

应用原始光谱建立的小麦籽粒ATR-FTIR识别模型,共有3个品种(系)判别错误;相比原始光谱的小麦籽粒ATR-FTIR识别模型,经过MSC+SG、MSC+ND+FD、MSC+SG+SD、MSC+SG+FD和MSC+ND+SD预处理后的模型,其判别错误的品种(系)数目分别为5、5、13、21和24个品种(系);而应用MSC+ND预处理后能够更好地实现小麦品种(系)的识别,判别错误的品种(系)为0。光谱的导数变换虽然可以消除基线漂移,强化谱带特征、避免谱带重叠,但本试验将光谱FD和SD变换后,品种(系)判别错误数反而增加,这可能是由于导数变换后信噪比降低,因此光谱中的噪声被扩大。综上,用于小麦籽粒ATR-FTIR识别模型的光谱数据选用MSC+ND进行预处理更佳,其判别错误的品种(系)为0,能够全部识别71个品种(系)。

小麦籽粒ATR-FTIR识别模型的光谱数据选用MSC+ND进行预处理,71个小麦品种(系)内的平均马氏距离分布在0.014 3~2.110 9范围内;所有品种(系)内最小马氏距离分布在0.001 1~1.566 4之间,最大马氏距离分布在0.083 4~6.085 1范围内(表2)。71个小麦品种(系)间的平均马氏距离分布在3.816 8~9.806 1范围内,最小马氏距离分布在0.812 4~6.176 0范围内,最大马氏距离分布范围为9.575 1~12.469 2(表2)。白火麦(NO.44)品系内的最大马氏距离最大为6.085 1,其余70个品种(系)与白火麦间的最小马氏距离为5.105 8。抗锈10号(NO.28)品系内的最大马氏距离最小为0.083 4,其余70个品种(系)与该品种(系)间的最小马氏距离为0.812 4。比较71个品种(系)的马氏距离发现,各个品种(系)内的最大马氏距离均小于品种(系)间的最小马氏距离。品种(系)内的平均马氏距离也都远小于各个品种(系)间的平均马氏距离(表2)。

表2 小麦品种(系)识别模型马氏距离

表2(续)

2.3 小麦籽粒ATR-FTIR识别模型的外部验证

新采集光谱验证结果显示,京红5号、农大183等15个品种(系)的所有光谱数据均能被检测正确,每个品种(系)的10个光谱数据到光谱数据实际品种(系)的马氏距离均小于实际品种(系)内的最大马氏距离,新采集外部验证结果与小麦籽粒ATR-FTIR识别模型结果一致。

采用红皮小麦等20个未参与建模的小麦品种(系)(表1)进一步进行新品系的外部验证。结果表明,20个小麦品种(系)内的平均马氏距离分布范围为0.471 1~1.642 0,最大马氏距离分布范围为0.742 1~5.465 1,最小马氏距离分布范围为0.233 7~0.888 0;20个小麦品种(系)间的平均马氏距离分布范围为3.023 5~6.132 4,最大马氏距离分布范围为4.890 5~8.112 2,最小马氏距离分布范围为1.038 2~5.667 9(表2)。长治6406(A14)品种(系)内最大马氏距离最大5.465 1,其余19个品种(系)到该品种(系)之间的最小马氏距离为5.667 9;红皮小麦(A1)品种(系)内的最大马氏距离最小为0.742 1,其余19个品种(系)到该品种(系)的最小马氏距离为1.657 2(表2)。20个小麦品种(系)内的最大马氏距离均小于品种(系)间的最小马氏距离,该结论与71个小麦籽粒ATR-FTIR识别模型一致。同时发现,品种(系)内的平均马氏距离远小于各个品种(系)间的平均马氏距离(图2-A),选择红皮小麦(A1)和白蒲(A20)作为参考,绘制20个品种(系)到2个品种(系)的二维分类图,该检测分类图效果佳,能够直观地区分出20个品种(系)(图2-B)。综合新采集光谱和新小麦品种(系)两种外部验证结果,应用MSC+ND预处理后建立的小麦籽粒ATR-FTIR识别模型最佳。

表3 小麦籽粒ATR-FTIR识别模型新采集光谱外部验证马氏距离

图2 小麦籽粒ATR-FTIR识别模型新品种(系)外部验证平均马氏距离(A)及其分类图(B)

2.4 小麦籽粒性状突变体识别

应用本研究构建的小麦籽粒ATR-FTIR识别模型计算训练集中对照内和突变体内株系的平均马氏距离、计算验证集中的各个光谱数据到对照和突变体株系中心的马氏距离。训练集中对照株系内的平均马氏距离为0.603 3,突变体株系内的平均马氏距离为0.820 5;验证集中对照株系光谱数据到对照株系中心的马氏距离分布在0.209 6~3.601 1之间;突变体株系光谱数据到对照株系中心的马氏距离分布在0.226 6~13.581 0之间。有4个突变体株系的光谱数据到对照株系中心的马氏距离远大于对照株系内的平均马氏距离(0.603 3);并且这4个突变体株系到对照中心的马氏距离也远大于验证集中对照株系的最大马氏距离(3.601 1),这4个突变体株系光谱数据到对照中心的马氏距离分别为13.737 2、9.523 9、7.622 1、8.483 3(图3)。本研究预测这4个突变体为潜在的籽粒性状突变体株系(突变率为0.69%)。

图3 突变体鉴别模型分类图

3 讨论

探究小麦籽粒性状突变体快速、准确、简便、有效的鉴别方法可以提高小麦籽粒品质筛选突变体的效率,进而提高诱变育种的效率,加快特异品质小麦的改良进程。前人研究结果表明,不同预处理方法对光谱模型的建立有一定的影响[26]。第五鹏瑶等[27]采用9组数据,通过一阶导数、二阶导数、中心化、多元散射校正(multiplicative scatter correction,MSC)等10种预处理方法的120种组合探讨了预处理的必要性及预处理方法的选择,结果显示,对于多数数据,采用合适的预处理方法可以提高建模效果。本研究结果表明,适合的预处理方式是提高模型分辨率的关键,不适合的预处理方法可能降低建模效果。

ATR-FTIR技术作为一种快速分析技术在物质定性鉴别分类已有大量报道[28-30]。Cozzolino等[31]用ATR-MIR对大麦完整种子样品中脂肪酸和总脂含量进行定量分析。魏霞等[32]比较了ATR-FTIR和NIR(近红外)光谱技术测定大麦籽粒抗性淀粉含量,而鲜见利用ATR-FTIR进行作物品种(系)识别和突变体鉴别的研究。

中远红外与近红外光谱相比,振动产生的吸收带较稀疏,易于解析吸收峰。近些年,王纯阳等[15]、张乐等[33]尝试应用近红外采集单粒种子的光谱,但由于单粒种子体积小,近红外采集的光谱信噪比相对较低;而配备有ATR附件的中远红外仪可精确、无损地检测单粒种子的红外光谱,且采集的光谱吸收带稀疏,吸收峰易解析,信噪比高。因此,ATR-FTIR技术比NIR技术在籽粒性状突变体的鉴别上更具有发展前景。本研究通过建立判别分析模型,有效实现了通过小麦籽粒ATR-FTIR光谱对已知小麦籽粒品种(系)进行识别和区分,并应用两种外部验证鉴定模型准确性,两种外部验证结果显示该品种(系)识别模型效果佳,各个品种(系)无交差,能完全识别71个品种(系),并利用该模型预测了4个突变体株系,这为籽粒突变体筛选开辟了新途径。

张纪元等[34]通过进行十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(sodium dodecyl sulfate polyacrylamide gel electrophoresis, SDS-PAGE)鉴定筛选获得小麦突变体的概率为4.65%,陈洋等[35]报道的小麦表型突变率为7.38%。本研究采用ATR-FTIR技术鉴别出的小麦籽粒性状突变率为0.69%。这可能是本研究仅对籽粒的部分性状进行了相关鉴定,且ATR-FTIR技术识别的物质种类有限,从而造成突变率较低。本研究发现品种(系)内籽粒光谱的差异小于品种(系)间,基于此可将同一品种(系)识别为一个内群。同时,本研究还比较了突变体和对照籽粒的光谱差异,区分出突变体籽粒光谱的微小差异。但是,本研究对于筛选到的突变体株系属于何种品质突变尚不明确,后续工作中还需收集更多的突变体光谱数据,增加不同品种(系)的突变体以及更多品种(系)的籽粒光谱数据,提高鉴别模型的准确性,并将化学分析法与模型结合,进行突变性状的定量分析,从而丰富ATR-FTIR技术在小麦籽粒突变体鉴定上的应用。

4 结论

本研究利用小麦籽粒ATR-FTIR光谱,采用判别分析方法建立了小麦籽粒品种(系)鉴别模型,并应用该方法开展小麦籽粒性状突变体鉴定,为小麦籽粒性状突变体筛选提供了快速、无损的方法。但该模型的通用性还需要更广泛数据的验证。

猜你喜欢

马氏株系突变体
水稻胚胎和胚乳双缺陷突变体eed1的表型与遗传分析
盐胁迫对水稻耐盐突变体sst芽苗期生长的影响
应用MAS技术改良水稻特异种质大粒溪香的稻瘟病抗性
水稻细长秆突变体sr10的鉴定与基因定位
华中农业大学番茄团队揭示番茄果实颜色形成的新机制
转录因子OsNAC2对逆境下水稻产量性状的影响
大叶蒲公英耐盐性变异株系的培育
大麦黄矮病毒的生物信息学分析
《封神演义》中马氏形象的另类解读
露马脚