不同产地稻花香水稻代谢产物差异分析
2022-01-19冯玉超杨宏志盛亚男王长远
冯玉超,杨宏志,2,安 宇,2,张 舒,盛亚男,王长远,2,
(1.黑龙江八一农垦大学食品学院, 黑龙江大庆 163319;2.国家杂粮工程技术研究中心, 黑龙江大庆163319)
水稻是我国主要的粮食作物,它含有丰富的营养成分和人体必需的微量元素,可满足机体健康需求[1-2]。不同的地理位置以及环境因素使得水稻品种多样、类型丰富,同时其质量品质也存在显著差异。生活水平的不断提高使得人们更加注重稻米风味及营养品质,地理标志稻米产品质优味美,虽价格较高,但供不应求。故稻米市场中频繁出现交易行为不规范的情况,违法者利用这些品牌严重损害市场秩序与原产地产品的价值,使消费者权益得不到保障,面对众多食品安全及市场问题,产地识别或溯源成为解决该问题的有效手段。
目前,应用于实际生活的溯源手段为数据编码记录技术,技术门槛不高,易于在产业中推行,但因其相关信息均可被人为更改或操纵,故仍需挖掘更真实、有效的溯源方法及手段。近年,国内外也开展了大量关于水稻产地溯源方面的研究,如采用稳定同位素技术[3-4]、近红外光谱技术[5]、矿物元素分析技术[6-7]、有机组分指纹图谱技术[8]、拉曼光谱技术[9-10]、顶空固相微萃取-气质联用技术[11-12]等进行溯源,这些方式与大米产地的气候、土壤、温度等相关的同位素组成、矿物元素含量、化学成分组成及风味特征物质等相关,而近年更关注水稻本身特性的代谢组学溯源方法逐渐成为研究热点[13-16]。产地环境对水稻的生长具有重要的影响,不同产地生长的水稻其代谢也会存在差异,最终代谢通路的终端物质则会将这些差异体现出来,水稻的代谢物就是代谢过程的终端物质。王玲[17]发现水稻种子在不同生长环境、不同传代以及转入外来基因的情况下,其代谢产物都会发生不同程度的改变,且与基因修饰的影响相比较,不同生长环境对水稻代谢物带来的影响更大。程建华等[18]对海南和武汉的转Bt基因大米进行了代谢组学研究,发现转Bt基因大米与其亲本大米中甘油和鼠李糖两种代谢物的含量存在显著性差异,产地对大米间代谢组学的差异影响要显著强于外源基因。
对水稻代谢物进行研究,可以从一个新的角度,直观地分析不同产地水稻的差异,从而为水稻及农产品的产地鉴别以及溯源提供新的研究方向。本研究基于GC-MS的代谢组学平台,以稻花香品种水稻为研究对象,通过两产地稻花香水稻在代谢物水平的差异分析, 对不同产地间水稻的品质以及代谢差异机制进行分析,为水稻产地区分及农产品溯源提供理论支撑。
1 材料与方法
1.1 材料与仪器
稻花香水稻 采自黑龙江省宁安(NA)和五常(WC)两个地理标志稻米保护区,五常地区样品采集点分布于9个农场,宁安地区样品采集点分布于7个农场,每个保护区共采集20个糙米样品(后文图中的NA代表宁安地区样本,WC代表五常地区样本),两产地稻花香水稻施肥、浇灌水源以及耕作方式具有统一性。在大田收割前于保护范围内依据代表性采样原则,采用五点采样法进行随机采集,每个地块随机设置5个重复点,从每个位置收集1~2 kg的稻穗。将收集的稻谷样品清洗干净并风干至水分含量为14%~15%,在稻穗顶部相同的位置将稻谷脱粒,然后装入尼龙网眼袋中,实验前将样品混合均匀,水稻样品采集自2019年;吡啶(≥99.9%色谱纯)、甲醇(色谱纯) 阿拉丁试剂有限公司;2-氯苯丙氨酸(纯度98.5%)、甲氧基胺盐酸盐(纯度98%)、N,O-双(三甲基硅)三氟乙酰胺(含三甲基氯硅烷)99%BSTFA+1%TMCS 均购自麦克林试剂有限公司。
7890A/5975C GC-MS 美国Agilent公司;色谱柱HP-5ms(30 m×0.25 mm×0.25 μm) Agilent J& W Scientific公司。
1.2 实验方法
1.2.1 样品制备 样品处理方法和色谱方法参照程建华等[18]和ZHOU 等[19]的方法并略有修改。水稻种子液氮研磨后称取50 mg粉末于2 mL的EP管中,加入800 μL甲醇涡旋混匀30 s,而后置于4 ℃离心机中,12000 r/min 离心15 min,之后吸取200 μL上清液转入进样小瓶中氮气吹干。衍生化:取30 μL甲氧氨盐酸吡啶溶液至浓缩后的样品中,涡旋混匀至完全溶解,置于37 ℃恒温箱90 min,取出后加入30 μL BSTFA,置于70 ℃烘箱60 min,取出后待检测。衍生化处理后24 h内分析所有样品。
1.2.2 GC-MS检测 分析平台:Agilent 7890A/5975C GC-MS。用自动进样器进样1 μL。色谱柱为30 m的HP-5ms,色谱柱的内径为0.25 mm,膜厚为0.25 μm。采取不分流进样,进样温度为280 ℃,界面设置为250 ℃,离子源调节为230 ℃,四极杆温度调节至150 ℃。使用氦气(纯度>99.999%)作为载气,固定流速为2 mL/min。温度设定为:80 ℃下等温加热2 min,然后以10 ℃/min将温度升至320 ℃,最后维持320 ℃加热6 min。在注入下一个样品之前系统在80 ℃温度下平衡6 min。使用全扫描模式,扫描范围为50~550 m/z。
1.2.3 数据分析 GC-MS代谢组学数据分析由上海百趣生物医学科技有限公司进行。在R软件平台下使用XCMS软件包提取GC-MS数据并进行预处理,然后将已编辑的数据矩阵导入SIMCA软件(V14.1, Sartorius Stedim Data Analytics AB, Umea,Sweden),进行主成分分析( PCA) 和正交偏最小二乘-判别分析( OPLS-DA)等多元统计分析,之后根据学生t检验(student’st-test)的P值(P-value)小于0.05,同时OPLS-DA模型第一主成分的变量投影重要度(variable importance in the projection, VIP)大于1,进行差异性代谢产物的筛选。
根据保留时间和质荷比(m/z),在Fiehn代谢组数据库中进行代谢物及差异代谢物的定性。对单个峰基于四分位数距对偏离值进行过滤以去除噪音,只保留单组空值不多于50%或所有组中空值不多于50%的峰面积数据,其次对原始数据中的缺失值进行模拟,数值模拟方法为最小值二分之一法进行填补,最后进行数据标准化处理,利用每个样本的总离子流进行归一化,可为代谢物进行定量。
对筛选出的差异代谢物进行KEGG[20]注释,检索出差异代谢物映射的所有通路,然后通过对差异代谢物所在通路的综合分析(包括富集分析和拓扑分析),对通路进行进一步的筛选,找到与代谢物差异相关性最高的关键通路。
2 结果与分析
2.1 离子流色谱图
通过对GC-MS原始数据的处理,五常地区稻花香样本共检测出291个峰,宁安地区稻花香样本共检测出318个峰,两产地稻花香的离子流色谱图如图1和图2所示,两个产地间的稻花香样本的总离子流色谱图大体相近,但存在一定的差异性,色谱峰基线平稳。
2.2 代谢物定性结果分析
代谢物通过Fiehn数据库进行定性,相似度越接近1000越准确,但是组学中代谢产物多数为中间代谢产物,并不是所有物质均有标准品可依据,故存在部分代谢产物相似度不是特别高的情况。两产地共鉴定到127个代谢物,五常地区鉴定出99个代谢物,宁安地区鉴定出104个代谢物(标注见图1和图2),两产地稻花香水稻同时拥有的代谢物有76个,两产地相比较,五常地区独有的代谢物有23个,宁安地区独有的代谢物有28个。代谢物定性结果如表1所示,序号1~76为共有代谢物,序号77~99为五常地区稻花香水稻独有的代谢物,序号100~127为宁安地区稻花香水稻独有代谢物。
图1 五常稻花香典型样本总离子流色谱图Fig.1 Total ion chromatogram of typical samples in the WC
图2 宁安稻花香典型样本总离子流色谱图Fig.2 Total ion chromatogram of typical samples in the NA
由表1可知,从宁安和五常产地的大米中鉴定出的代谢物包括脂肪酸及其衍生物,氨基酸及其衍生物,糖类及其衍生物,固醇类和其他物质,其他类包括胺、醛、烷烃、腺苷、有机酸、无机盐、酮、烯烃、嘌呤等。从数量上看,五常产地的稻花香样品中,各种物质的比例为脂肪酸及其衍生物占22.22%,糖及其衍生物占27.27%,氨基酸及其衍生物占7.07%,醇及其衍生物占10.10%,酚类占7.07%,类固醇及其衍生物占2.02%,其他类占24.24%。宁安产地的稻花香样品中,各种物质的比例为脂肪酸及其衍生物占19.23%,糖及其衍生物占31.73%,氨基酸及其衍生物占7.69%,醇及其衍生物占10.58%。酚类占4.81%,类固醇及其衍生物占2.88%,其他类占23.08%。对比可知,五常产地的稻花香水稻中脂肪酸及其衍生物、酚类物质以及其他类物质在数量上所占的比例要高于宁安地区。宁安产地的稻花香水稻中糖类及其衍生物、氨基酸及其衍生物和固醇类物质在数量上所占的比例要高于五常地区。研究表明,氨基酸除了用于蛋白质的合成外,还是次生代谢产物(如激素和植物防御相关物质)的前体,氨基酸的合成直接或间接影响植物生长发育的各个方面[21]。糖的代谢和运输分布影响糖类进入储库细胞以及糖在储库细胞中的储存,从而影响植物材料的质量。稻米中的脂类物质(甘油脂类、游离脂肪酸、固醇类等)含量很少,但在水稻生长发育期间的代谢变化对其生长适应性有重要影响,对植物细胞骨架重塑、生长发育、逆境胁迫、激素响应、衰老过程等具有显著的生理效应[22-24]。脂类作为稻米的重要组分,不仅具有丰富且独特的营养价值[25],而且对稻米品质尤其是蒸煮食味品质也具有较大影响[26-27],优质水稻品种中脂类物质含量通常要高于非优质的水稻品种。根据两个产地的稻花香样品中代谢产物的情况,发现同一品种的稻米在不同产地生长其代谢物数量和比例是不同的,说明产地对稻米代谢产物的种类具有较大影响,不同产地的稻米具有不同的代谢物组成。
表1 代谢产物定性结果Table 1 Qualitative results of metabolites
续表 1
续表 1
2.3 主成分分析(PCA)
主成分分析(principal component analysis, PCA)是将一组观测的可能相关变量,通过正交变换转换为线性不相关变量(即主成分)的统计方法,可以揭示数据的内部结构,有效地利用少量的主成分使得数据的维度降低。图3为两产地稻花香样品的PCA得分图,本次分析中R2X=0.515,Q2=0.182,第一主成分贡献度为36.4%,第二主成分贡献度为29.7%。由图3可以看出,除个别异常样本外,基本处于95%置信区间(Hotelling’s T-squared ellipse)内,两产地的稻花香样本并没有区分开,存在重叠的现象,可能是由于相同品种,代谢物种类相近的原因造成的,PCA是从整体上反映样本的情况,所以区分不明显,但同样可以看出两产地的样本均存在明显的聚集区。
图3 NA组与WC组的PCA模型的得分散点图Fig.3 Score scatter plot of PCA model for group NA vs WC
2.4 正交偏最小二乘法判别分析(OPLS-DA)及置换检验
使用PCA模型进行分析,因相关变量的影响,差异变量会分散到更多的主成分上,无法进行更好的可视化和后续分析。所以下面采用正交偏最小二乘法-判别分析(orthogonal projections to latent structures-discriminant analysis, OPLS-DA)的统计方法对结果进行分析。通过OPLS-DA分析,可以过滤掉代谢物中与分类变量不相关的正交变量,并对非正交变量和正交变量分别进行分析,从而获取更加可靠的代谢物组间差异与实验组的相关程度信息。图4为两产地稻花香OPLS-DA得分图。
图4 NA组与WC组的OPLS-DA模型的得分散点图Fig.4 Score scatter plot of OPLS-DA model for group NA vs WC
从OPLS-DA得分图的结果可以看出,两组样本区分比较明显,样本基本处于95%置信区间内。本次分析共得到两个主成分,第一主成分贡献度为29.8%,第二主成分贡献度为21.3%。R2X=0.449,R2Y=0.649,Q2=0.531,R2X与R2Y数值相差不多,且Q2值大于0.5,说明OPLS-DA模型的预测性较好,不存在过拟合现象。由图4可知,五常地区稻花香样本主要分布在左侧的置信区间内,而宁安地区稻花香样本分布在右侧的置信区间内,样本点间没有重叠,区分效果较好。同时可以发现每个产地的20个样本点之间存在较大的距离,相对较分散。这可能与采样地点不同有关,为了体现产地的区别,所以水稻样本的采集覆盖整个地理保护区域,而不局限于一个采样点,使研究结果具有普遍性。由OPLS-DA结果可以看出,产地对水稻的代谢具有显著的影响。
置换检验通过随机改变分类变量Y的排列顺序,多次(次数n=200)建立对应的OPLS-DA模型以获取随机模型的R2Y和Q2值,在避免检验模型的过拟合以及评估模型的统计显著性上有重要作用。OPLS-DA模型的置换检验结果如图5所示。图中横坐标表示置换检验的置换保留度(与原模型Y变量顺序一致的比例,置换保留度等于1处的点即为原模型的R2Y和Q2值),纵坐标表示R2Y或Q2的取值,绿色圆点表示置换检验得到的R2Y值,蓝色方点表示置换检验得到的Q2值,两条虚线分别表示R2Y和Q2的回归线。原模型R2Y比较接近1,说明建立的模型比较符合样本数据的真实情况;原模型Q2大于0.5,说明如果有新样本加入模型,会得到较为近似的分布情况,总的来说原模型可以较好地解释两组样本之间的差异。置换检验随机模型的Q2值均小于原模型的Q2值;Q2的回归线与纵轴的截距小于零;同时随着置换保留度逐渐降低,置换的Y变量比例增大,随机模型的Q2逐渐下降。说明原模型具有良好的稳健性,不存在过拟合现象,即OPLSDA得分图结果准确。
图5 NA与WC组的OPLS-DA模型的置换检验Fig.5 Permutation test of OPLS-DA model for group NA vs WC
2.5 差异代谢物的筛选
采用OPLS-DA模型的VIP(variable importance in the projection)值(阈值≥1),并结合学生氏t检验(student’st-test)的P值(阈值<0.05)来筛选差异代谢物。在Fiehn数据库中通过保留时间等条件与库中物质进行匹配,从而进行物质差异性代谢物的定性,宁安地区对五常地区筛选的差异代谢物定性结果如表2所示。
宁安产地和五常产地的稻花香样品中共筛选出22个差异代谢物。差异代谢物为两产地水稻共同拥有的代谢物,但是含量上存在显著差异。大部分差异代谢物是脂肪酸和脂肪酸衍生物,以及少量糖、有机酸、多元醇和其他物质。在含量上,由表2可知,宁安产地稻花香样品中有9个差异代谢物的含量均低于五常地区,这些物质多为酚、醛、醇类物质。宁安地区稻花香水稻中有13个代谢物的含量高于五常地区,这些物质多数为脂肪酸及脂肪酸的衍生物,倍性变化在1.34~1.81倍之间。研究表明,温度对水稻中脂肪酸的含量有较大的影响[28]。宁安地区属于温带大陆性季风气候,五常属于中温带大陆性季风气候,宁安独特的玄武岩“石板地”使地温、水温都要略高于五常地区,水稻成熟度更高,所以导致宁安稻花香中脂肪酸的含量要高于五常地区。与2.2中得到的结果综合分析,可以发现数量上,宁安地区的水稻其脂肪酸等脂类物质在全部代谢物中所占的比例要少于五常地区。但是在含量上,宁安地区脂类物质要显著高于五常地区,酚类物质在数量和含量上均是宁安地区低于五常地区,醇类物质在数量上两产地占比相近,含量上宁安地区要低于五常地区。综上所述,产地对稻米代谢物中影响最大的物质为脂肪酸及其衍生物。
表2 差异代谢物定性结果Table 2 Differential metabolite qualitative results
2.6 差异代谢物的层次聚类分析
对差异代谢物的定量值计算欧式距离矩阵(Euclidean distance matrix),以完全连锁方法对差异代谢物进行聚类分析,并以热力图进行展示,结果如图6所示。
图6 中横坐标代表不同实验分组,左侧为五常地区稻花香样本,右侧为宁安地区样本;纵坐标代表该组对比的差异代谢物,不同位置的色块代表对应位置代谢物的相对表达量,红色代表高表达量,蓝色代表低表达量。图6可以分成上下两个区域,图右侧的前9个代谢物为上半部分,下方13个差异代谢物为下半部分。在上半部分中可以看出五常地区的样本中9个代谢物的表达量明显高于宁安地区样本代谢物的表达量,这9个代谢物分别为甜菜碱β-环氧丙烷、未知物217、2-脱氧赤藓糖醇、亚油酸、苄醇、2-氨基苯酚、苯酚、水杨醛、皮糖醇3,多数为酚类、醛类以及多元醇类物质。在下半部分中由颜色区域可知,宁安地区的除上述9个代谢物外的13个差异代谢物的表达量要明显高于五常地区,这13个差异代谢物多数为脂肪酸以及脂肪酸的衍生物。从聚类分析的颜色变异程度上可以看出,产地不同,脂肪酸类物质含量差异更显著。
图6 NA与WC组的层次聚类分析热图Fig.6 Heatmap of hierarchical clustering analysis for group NA vs WC
2.7 差异代谢物的代谢通路分析
生物体中的复杂代谢反应及其调控并不单独进行,往往由不同基因和蛋白质形成复杂的通路和网络,它们的相互影响和相互调控最终导致代谢组发生系统性的改变。通过京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG) Pathway数 据 库http://www.kegg.jp/kegg/pathway.html,共检索到差异代谢物参与的19个水稻的代谢通路,分别为不饱和脂肪酸的生物合成(ReFSEQ),水稻的代谢途径(ReFSEQ),脂肪酸生物合成,水稻角质、丝氨酸和蜡生物合成(ReFSEQ),枸橼酸循环(TCA循环),水稻脂肪酸延伸,脂肪酸降解,水稻氧化磷酸化,精氨酸生物合成,丙氨酸、天冬氨酸和谷氨酸代谢,酪氨酸代谢,苯丙氨酸代谢,亚油酸代谢,丙酮酸代谢,丁酸代谢,烟酰胺和烟酰胺代谢,次生代谢物的生物合成,碳代谢,脂肪酸代谢。KEGG注释分析仅找到所有差异代谢物参与的通路,为了找到与产地影响密切相关的通路,需要对差异代谢物进行进一步的代谢通路分析。通过对差异代谢物所在通路的综合分析(包括富集分析和拓扑分析),可以对通路进行进一步的筛选,找到与代谢物差异相关性最高的关键通路。首先,通过差异代谢物对KEGG、PubChem等权威代谢物数据库进行映射,映射出3个物质,亚油酸、棕榈酸以及富马酸,且均为精确匹配。在取得差异代谢物的匹配信息后,对对应物种Oryza sativa japonica (Japanese rice) 的通路数据库进行搜索和代谢通路分析,代谢通路分析如表3所示。
由表3可知,共找到8条与代谢物差异相关性最高的关键通路,包含两大类代谢即脂肪酸代谢和氨基酸代谢,而这8条通路中的差异代谢物分别为亚油酸、棕榈酸以及富马酸,其中富马酸参与的代谢通路有4条,棕榈酸参与的有3条,可见这两种差异代谢物是处于多条通路的交集处,对通路影响较大。
表3 差异代谢物的代谢途径Table 3 Metabolic pathways of the differential metabolites
代谢通路分析的结果以气泡图进行展示,如图7所示。气泡图中每一个气泡代表一个代谢通路,气泡所在横坐标和气泡大小表示该通路在拓扑分析中的影响因子大小,越大影响因子越大;气泡所在纵坐标和气泡颜色表示富集分析的P值(取负自然对数,即-lnP-value),颜色越深P值越小,富集程度越明显。由图7可知,亚油酸代谢处的气泡颜色最深,而且最大,可见亚油酸对两产地稻花香水稻之间差异的影响最大,其次是棕榈酸和富马酸。亚油酸、棕榈酸和富马酸是稻米脂肪酸的主要组成成分,亚油酸和富马酸属于不饱和脂肪酸,而棕榈酸属于饱和脂肪酸。脂肪酸是水稻品质的关键决定因子[29],稻米中脂类含量与稻米品质呈显著正相关[30],亚油酸在水稻脂肪中含量较高,可提高蒸煮时的食味品质,富马酸不仅可以提升蒸煮时的水稻香味,还起到酸度调节剂的作用,也可以提高水稻的食味品质,而棕榈酸是一种高级的饱和脂肪酸,对稻米的色泽、口感等也具有显著地影响,尤其是色泽,但棕榈酸含量与稻米色泽以及食味品质呈负相关。
图7 NA与WC组的代谢通路分析气泡图Fig.7 Pathway analysis for group NA vs WC
由结果可知,产地对影响稻米品质的代谢物含量具有明显影响,说明产地对稻米品质具有一定的影响。还有研究表明,棕榈酸、亚油酸的含量与生长环境的温度有关,宁安和五常两个地区中环境温度也不相同,由代谢通路结果可知,五常与宁安两个产地的稻花香水稻在代谢中最大的差异体现在脂肪酸代谢过程,则说明不同产地间水稻代谢差异机制可能主要在于脂肪酸类物质的代谢。
3 结论
基于GC-MS代谢组学技术对不同产地水稻代谢产物与代谢差异机制进行研究具有可行性。研究结果表明产地对稻花香水稻代谢物的数量和含量均具有影响,且代谢物种类与含量的差异可能与稻米品质相关。产地不同,对水稻中脂类物质的影响最为显著,且不同产地间水稻代谢差异机制主要在于脂肪酸类物质的代谢。亚油酸,棕榈酸和富马酸是产地影响的脂肪酸代谢中的三种关键代谢物。产地对稻米的代谢具有明显的影响。