黑龙江省不同产地水稻的GC-MS代谢物差异分析
2019-01-28冯玉超王长远富天昕张丽媛
冯玉超,王长远,2,,李 雪,富天昕,张丽媛,2
(1.黑龙江八一农垦大学食品学院,黑龙江 大庆 163319;2.黑龙江省农产品加工与质量安全重点实验室,黑龙江 大庆 163319)
代谢组学是一门通过对生物体特定组织或细胞内代谢物组成成分进行鉴定和定量分析,从代谢角度揭示生物体的生物学功能,并最终诠释生命现象的学科[1-3]。近几十年,代谢组学发展迅速,广泛应用于各个领域,成为探究物质内在机理的有力手段,植物体内的代谢物种类多样化,目前植物代谢组学是代谢组学中最重要的一个研究方向[4]。植物代谢组学的研究主要集中在代谢指纹或代谢物指纹图谱方面,主要用于探索植物表型和基因型的关系,进一步挖掘植物代谢途径[5],以及受刺激后植物自身的免疫应答[6],除此之外还可用于生长环境对植物代谢物产生的影响进行探索[7-10]。代谢组学逐渐成为农产品产地鉴别的一种分析平台。Nicholson等[10]对不同地区生产的拟南芥进行代谢组学研究,发现生长环境的不同会使拟南芥的氨基酸、糖等均产生差异。最具代表性的是Fiehn等[11]研究的工作,利用气相色谱-质谱(gas chromatography-mass spectrometry,GC-MS)联用技术通过对不同表型拟南芥中433 种代谢产物进行分析,并对这些植物的表型进行分类,检测出4 种对分类有重要贡献的代谢物质。Giansante等[12]利用GC分析意大利4 个不同地区橄榄油中脂肪酸组成和含量,结果表明不同产地的橄榄油中棕榈酸、亚油酸等含量存在显著差异,并对不同地区橄榄油进行鉴别。GC-MS分离效率高,而且具有较为完善的数据库,适用于复杂的生物混合物代谢指纹分析,至今仍是代谢组学研究中主要的分析平台之一[13]。
水稻(Oryza sativa L.)是主要的粮食作物,近几年成为植物代谢组学研究的热点[14-19],水稻的品质除受遗传基因控制外,环境因素的影响也很显著,黑龙江省是全国地理标志品牌大米最多的省份,其中建三江地区位于三江平原腹地,以盛产绿色优质水稻闻名,有“东方第一稻”和“中国绿色米都”之誉,所产水稻品质佳,口感好,说明产地环境对水稻的生长具有重要影响。水稻中代谢产物不仅可以全面反映水稻种子的整体代谢状态[20-21],且代谢物的种类和含量对大米品质有着重要影响。
本实验利用GC-MS代谢组学技术对来源于建三江地区的水稻与黑龙江其他3 个水稻产区的水稻种子进行代谢物比较分析,探究产地对水稻代谢物的影响,及代谢物对水稻品质的影响,从代谢物差异上为水稻的产地区分提供理论基础。
1 材料与方法
1.1 材料与试剂
水稻采自黑龙江省建三江地区(JSJ)、查哈阳农场(CHY)、五常地区(WC)和响水地区(XS)4 个地理标志大米保护区,在保护区范围内依据代表性采样原则,采用棋盘式采样法进行主栽品种随机采集,每个采样点按照不同方位采集1~2 kg稻穗,每个产区选取30 个水稻样品。采集的样品均为粳稻,所选水稻品种主要为龙粳26、龙粳29、龙粳31、龙粳39、龙粳40、龙粳46、绥粳4、松粳9、空育131、五优4号以及稻花香和龙粳43品种。采集年份为2015年。每个产区水稻样本编号分别为JSJ1~JSJ30、CHY1~CHY30、XS1~XS30、WC1~WC30,水稻样本共分为2 组,1组为建三江地区样本,1组为黑龙江省其他3 个产区样本。
吡啶(纯度≥99.9%)、甲醇(均为色谱纯) 阿拉丁试剂有限公司;甲氧基胺盐酸盐(纯度98%)、N,O-双(三甲基硅)三氟乙酰胺(N,O-bis (trimethylsilyl)trifluoroacetamide,BSTFA)(含1%三甲基氯硅烷)麦克林试剂有限公司。
1.2 仪器与设备
7 8 9 0 A/5 9 7 5 C G C-M S、色谱柱H P-5 m s(30 m×0.25 mm,0.25 μm) 美国Agilent公司;DHG-9123A型电热恒温鼓风干燥箱 上海精宏实验设备有限公司;FC2K砻谷机 日本大竹制作所;恒温箱上海森信实验仪器有限公司;TGL-16B台式离心机 上海安亭科学仪器厂。
1.3 方法
1.3.1 样品制备
样品的制备参照周佳等[22]的方法并加以改进,采集样品后对其进行自然风干处理,脱粒,砻谷后,选择饱满,无虫害、干瘪、变色的水稻种子-80 ℃低温保存。实验时用研钵进行液氮研磨后称取粉末50 mg,加入800 μL甲醇涡旋混匀30 s,而后置于4 ℃离心机中,12 000 r/min离心15 min,吸取200 μL上清液,转入进样小瓶中氮气吹干。
衍生化:取30 μL甲氧氨盐酸吡啶溶液至浓缩后的样品中,涡旋混匀至完全溶解,置于37 ℃恒温箱90 min,取出后加入30 μL的BSTFA,置于70 ℃烘箱60 min,取出后待检测。每个样品进行3 个生物学重复测定。
1.3.2 GC-MS条件
GC条件:色谱柱:Agilent J&W Scientific HP-5ms(30 m×0.25 mm,0.25 μm);升温程序:初始温度80 ℃,维持2 min,以10 ℃/min升温至320 ℃,并维持6 min;高纯氦气(纯度大于99.999%)作为载气,不分流进样,进样量1.0 µL。
MS条件:进样口温度280 ℃,电子电离源温度230 ℃,四极杆温度150 ℃。采用全扫描模式,检测范围m/z 50~550。
1.3.3 建三江地区与其他产区水稻代谢组学差异分析
主成分分析(principal component analysis,PCA):使用SIMCA软件(V13.0)和R语言ropls包,对数据进行对数转换加中心化格式化处理,然后进行自动建模分析,有效地利用少量的主成分使得数据的维度降低。
偏最小二乘法-判别分析(partial least squaresdiscriminate analysis,PLS-DA):使用SIMCA软件(V13.0)对数据进行对数转换加UV格式化处理,首先对第1主成分进行PLS-DA建模分析,模型的质量用交叉验证进行检验;然后用交叉验证后得到的R2Y(模型对分类变量Y的可解释性)和Q2(模型的可预测性)对模型有效性进行评判。
凝聚层次聚类分析:通过R(v3.3.2)中pheatmap程序包对数据集进行数据缩放,同时对样本和代谢物进行双向聚类。热图表现的是一个数据矩阵,通过使用颜色梯度使数据间的差异实现可视化,通过数据缩放,保留较大差异,同时也能突显较小差异。不同颜色的区域代表不同的聚类分组信息。
1.3.4 差异代谢物通路分析
采用MetPA数据库分析2 组差异代谢物的相关代谢通路,采用超几何检验数据分析算法,采用Relativebetweeness Centrality pathway拓扑结构。
1.4 数据分析
数据利用R(v3.3.2)软件的XCMS程序包进行特征峰提取及预处理,得到包括m/z和保留时间及峰面积等信息的数据矩阵,导出数据至Excel进行编辑。代谢物的定性:根据保留时间及m/z在NIST库和Wiley Registry代谢组数据库中查找与其匹配的物质。使用SIMCA软件进行多元统计分析,为使不同量级的数据能够进行比较,对数据进行总峰面积归一化处理。GC-MS代谢组学数据由苏州帕诺米克公司进行分析。
2 结果与分析
2.1 GC-MS分析结果
所有水稻样品中共检测到173 个峰,根据NIST商业数据库和Wiley Registry代谢组数据库以及标准品进行代谢物的注释,最终解析出44 个代谢物。典型样品的总离子流色谱图如图1所示,可以看出总离子流色谱图基线平稳,峰分离效果较好,仪器稳定,从而提高了仪器分析和数据结果的可靠性。
根据GC-MS检测结果可知,建三江地区水稻精确定性29 个化合物,黑龙江省其他3 个产地注释得到44 个化合物,其中含有初生代谢物23 种,次生代谢物21 种。从定性结果可知,水稻代谢物主要是氨基酸、糖类、有机酸和脂肪酸等,这一结果符合水稻营养物质类型。
图1 典型样品的总离子流色谱图Fig.1 Total ion chromatograms of a typical sample
表1 各产地水稻组分相对含量Table1 Metabolite composition of rice seeds from different producing areas%
由表1可知,建三江地区水稻与本省其他地区的水稻组分相比,氨基酸、脂肪酸、核苷酸、有机酸以及其他所占比例高出其他3 个地区1%~2%,糖类和多元醇所占比例则分别低于4%和3%。其中氨基酸、脂肪酸以及糖类对水稻品质具有一定的影响。建三江是我国“最早迎接太阳的垦区”,地处世界闻名的三大黑土带,属寒温带湿润季风气候区,其雨量、热量、日照时数特征是水稻的最佳生长区带[23],可能是这些产地环境的差异,造成建三江地区水稻代谢物组成的不同。
2.2 建三江地区与其他地区的水稻代谢组学差异分析
2.2.1 PCA
由图2可知,PCA得分图模型具有2 个主成分,累计R2X=0.615,Q2=0.538,Q2>0.5,说明模型拟合度较好。PCA[24-25]能从总体上反映各组样本之间的总体代谢差异和样本之间的变异度大小。建三江地区与其他地区的样本除个别异常样本外均处于置信区间内,且建三江组样本与其他产地样本区分比较明显,2 组样本均有明显的样本聚集区,也均存在离散的样本。对于建三江地区样本,离散样本可能是由于样本品种间差异造成的,况且水稻基础组分有相同物质,故发生重叠,不好区分;对于其他3 个地区样本,作为整体与建三江地区进行比较,产地不同,其生长环境就不同,对水稻的代谢物就会产生不同的影响,故存在差异样本。
图 2 JSJ与CHYWCXS两组样本的PCA得分图Fig.2 PCA score plots for two samples of JSJ and CHY + WC + XS
2.2.2 PLS-DA
图 3 JSJ与CHYWCXS两组样本的PLS-DA得分图Fig.3 PLS-DA score plots for JSJ and CHY + WC + XS
PCA结果表明,建三江地区与其他地区的水稻之间具有代谢差异。为获得导致这种显著差异的代谢物信息,进一步采用监督性的多维统计方法即PLS-DA[26]法对两组样本进行分析。图3为PLS-DA得分图,模型具有2 个主成分,R2X=0.652,R2Y=0.634,Q2=0.52,说明此PLS-DA模型解释能力较好,预测数据能力较强。由图3可知,样本整体基本处于置信区间内,相比于PCA得分图,两组样本间基本不重叠,2 组样本内重叠现象也减少,分离效果更好。对于其他地区样本,重叠样本较多,可能是因为虽然水稻代谢物的含量受到环境等因素的影响,但是水稻代谢物的种类大体相同,即使品种和产地之间存在一定差异,使得水稻样本代谢物也存在差异,但这些样本的代谢物组成或者浓度相近,也会出现样本点的接近或重叠的情况。
2.2.3 总体代谢物层次聚类分析
图4为本实验整体代谢物相对定量值层次聚类图,将代谢物相对定量值进行归一化转换并进行聚类,红色表示高表达代谢物,蓝色表示低表达代谢物,其中,列代表所有样本,行代表全部代谢物。由图4可看出,通过鉴定出的全部代谢物进行聚类,高低表达交互在一起,并未形成明确的高、低表达区域。而由图上部的条带颜色可以看出,建三江地区的样本被分成很多部分,与其他产地样本有代谢相似的部分。而且整体来讲,左右两大部分间距离也较远,并不能直接看出建三江地区水稻样本与其他产地水稻样本的区别。
图4 总体代谢物层次聚类热图Fig.4 Hierarchical cluster heatmap of metabolites
2.3 差异性代谢产物分析
2.3.1 差异性代谢产物的挖掘及鉴定
采用PLS-DA模型的主成分1的变量投影重要度(variable importance in the projection,VIP)大于1并结合t检验的P值(阈值≤0.05)寻找差异性表达代谢物。
由表2可知,建三江地区和其他3 个地区对比筛选出的差异代谢物共23 个,其中包括糖、脂肪酸、氨基酸、有机酸、多元醇以及少量其他次生代谢物,可以看出这些组分均是构成水稻营养成分的物质,同时也正是这些组分含量的差异,最终导致不同水稻的品质差异。这23 个差异代谢物中,建三江组相对于其他地区组差异代谢物含量高的仅有一个即α-D-甲基呋喃果糖苷,且含量增加27.66 倍。建三江地区其他22 种水稻代谢物含量均低于其他地区,降低28%~64%,可见组别间差异代谢物在含量上差异巨大,不同产地对水稻代谢物的含量具有重要影响,王玲[27]对武汉和海南的TP309水稻样本进行代谢物研究,发现生长环境不同且产地跨度很大的水稻种子其代谢物存在明显差异。程建华等[28]对武汉和海南的转Bt基因水稻进行研究,发现不同产地对水稻代谢物的影响很大,且这种差异还大于基因修饰对代谢物的影响。本实验的结果与上述报道结果一致,但区别在于本实验研究的水稻样本均在同一省份范围内,地理跨度较小,但整体实验效果较好,说明产地对水稻代谢物的影响比较显著,且不同品种的水稻种子具有相同的产地特征,同时也说明水稻代谢产物携带其产地信息,差异代谢物还可以作为产地间区分的依据。
图5 应用差异代谢物层次聚类分析热图Fig.5 Hierarchical clustering heatmap of differential metabolites
表2 建三江地区相对于其他3 个产地的差异代谢物Table2 Differential metabolites in rice seeds from Jiansanjiang area compared to those from three other producing areas
2.3.2 差异代谢物聚类分析
由图5可知,本实验整体代谢物相对定量值层次聚类图颜色区分明显,左侧为低表达区,右侧为高表达区,两部分区域代谢物含量差异很大。建三江地区的所有样品位于左侧蓝色区域的中后部分,而黑龙江省其他3 个主产区的水稻样本则集中在右侧和蓝色区域前面部分,聚类效果显著。在蓝色区域的建三江地区的样本中还可以明显看到,高表达的“红色条带”,其对应的为α-D-甲基呋喃果糖苷,这些现象与表2结果相吻合,同时也说明同色区域中的异色部分是区分两组样本的重要指标。
2.3.3 差异代谢物通路分析
图6 代谢通路影响因子图Fig.6 Factors affecting metabolic pathways
采用MetPA数据库在假阳性矫正后P值为1的条件下,分析组间差异代谢物的相关代谢通路,通过代谢通路浓缩和拓扑分析,识别出可能的受生物扰动的代谢通路,图6为代谢通路影响因子图,图中每一个点代表检索到一条代谢通路,图中共10 个点,即在KEGG[29]中查询到了10 个代谢通路,其中5 个属于氨基酸代谢途径,且既有合成途径也有分解途径,分别为酪氨酸代谢,精氨酸和脯氨酸代谢,丙氨酸、天冬氨酸和谷氨酸代谢,缬氨酸、亮氨酸和异亮氨酸降解,缬氨酸、亮氨酸和异亮氨酸生物合成,除此之外,还有半乳糖代谢、嘧啶代谢、柠檬酸循环以及脂肪酸合成和氨酰生物合成。
涉及到这些代谢通路的差异代谢物有富马酸、脯氨酸、异亮氨酸、硬脂酸、9-(Z)-十八碳烯酸、十四酸、棉子糖和胸苷共8 个,其中富马酸、脯氨酸、异亮氨酸这3 种差异代谢物参与到不少于两条的代谢通路中,说明这些物质是处于复杂的网络代谢通路的节点上,是连接各通路的枢纽[30]。在所有检索到的代谢通路中,氨基酸代谢途径占得比重非常大,氨基酸含量与蛋白质含量密切相关,稻米的营养价值也体现在蛋白质与氨基酸含量上,异亮氨酸是必需氨基酸之一,是水稻营养价值的一个重要体现,脯氨酸等氨基酸类代谢物还能够充当植物的渗透因子抵御干旱、盐胁迫所带来的生存压力[31-32],可见氨基酸不仅可以提供营养,还可以作为调节因子帮助水稻适应环境。富马酸对于水稻的风味有调节作用,棉子糖是一种功能性低聚糖,脂肪酸是提供能量的物质,其饱和水平还可以改变植物对寒冷条件的抗性[33],可见这些差异代谢物都从不同的方面影响水稻的品质。氨基酸代谢途径所占比重最大,在产地对水稻品质的影响中,氨基酸代谢可作为深入研究的方向。
3 结 论
基于GC-MS技术对黑龙江省建三江地区与其他地区的水稻种子进行代谢组学研究,检测出173个峰,共定性出44 种化合物,筛选出建三江地区与黑龙江省其他水稻产区的差异代谢物23 个,其中建三江地区所产水稻中α-D-甲基呋喃果糖苷的含量是其他3 个地区样本的27.66 倍,而其他22 种水稻代谢物含量均低于其他地区,降低28%~64%,可见差异代谢物含量具有显著差异,证实产地对水稻代谢物具有显著影响,水稻的代谢产物携带其产地信息,通过代谢物差异对水稻产地进行区分具有可行性。实验结果说明,同省份、跨度距离极近的不同产地水稻在代谢产物上存在差异,主要是含量上的差异。同时,也说明本方法对水稻种子中代谢物成分的分离和鉴定是可行的。代谢通路分析说明氨基酸代谢途径对研究产地对水稻品质的影响具有指导意义,说明产地的差异对水稻机体的多种终端代谢途径造成了非常明显的影响,这为研究水稻种子代谢产物的动态变化规律提供参考。