基于小型便携式质谱和多元统计分析的木材种类鉴别方法研究
2023-02-26尚宇瀚孟宪双白桦马强
尚宇瀚 孟宪双 白桦 马强
(中国检验检疫科学研究院,北京 100176)
随着国民经济的持续快速发展,人民生活水平和住房条件不断提高,家具消费需求呈逐年增长趋势。名贵木材制品如高值木家具凭借其优良的质地和精湛的工艺,备受消费者青睐,在当前耐用消费品市场中占有重要地位。然而,在经济利益驱使下,在高值木家具市场中不时出现以假充真、以次充好等欺诈行为,不仅侵犯了消费者合法权益,而且扰乱了行业秩序。因此,高值木家具市场对快速准确鉴别的需求日益增长。
目前,较为常用的木材种类鉴别方法为感官检验结合光学显微镜观察[1],这类方法对木材取样与处理要求较高,过程繁琐,并且高度依赖检测人员个人经验,主观性较强。为解决上述问题,研究人员结合木材切面微观构造图像与计算机图像识别技术建立木材种类识别方法,获得了较为理想的识别率[2-5]。然而,这些方法仍需木材切片取样,所获样品信息较为有限。自20 世纪50 年代起,包括应力波法、震动法、超声波法和计算机断层扫描法等无损检测方法开始用于木材的鉴定[6],这些方法无需破坏性采样,可准确获取木材密度、力学性能和内部结构等信息,在无损检测木材表面或内部缺陷、结构材腐朽情况以及评价木制品开裂与老化等方面优势明显,但无法获得木材的化学成分组成信息。相比之下,红外光谱[7-9]、核磁共振波谱[10]或色谱-质谱联用[11-13]等技术在分析不同木材样品的化学组成方面具有突出优势。由于不同种属、不同生长阶段和不同地理来源的木材样品通常具有特征性的化学组成,上述鉴别方法可以达到较理想的鉴别效果,但大多需要经过复杂的样品制备与耗时的色谱分离过程,并且有机溶剂用量较大,越来越难以满足日益提升的木材种类快速鉴别的需求。
相较于传统检测技术,直接质谱分析具有无需样品制备或仅需简单处理、操作简便、检测效率高和绿色环保等优势。近年来,Espinoza 研究组[14-15]和殷亚方研究组[16-17]将实时直接分析(Direct analysis in real time,DART)与四极杆-静电场轨道阱高分辨质谱(Quadrupole-Orbitrap high-resolution mass spectrometry,Q-Orbitrap HRMS)相结合,通过加热的亚稳态氦气或氩气对样品表面直接进行解吸附电离,并经高分辨质谱检测和多元统计分析,开发了木材种类快速鉴别方法。上述方法对样品形貌无严格要求,在木材表面普适性好,但仍需将样品送至实验室,依赖台式大型仪器设备,难以实现现场快速检测。小型便携式质谱(Miniature mass spectrometry,Mini MS)[18]小巧轻便,并且对工作环境要求不高,在现场快速检测中展现出巨大的应用潜力,但尚未见其在木材种类鉴别中的研究报道。
本研究分别采用纳升电喷雾-小型便携式质谱(nanoESI-Mini MS)、纳升电喷雾-静电场轨道阱高分辨质谱(nanoESI-HRMS)和超高效液相色谱-静电场轨道阱高分辨质谱(UHPLC-HRMS),经样品制备、质谱分析及多元统计分析后,建立了正交偏最小二乘判别分析(Orthogonal partial least squares-discriminant analysis,OPLS-DA)模型。其中,nanoESI-Mini MS 方法的Y变量累积解释率(R2Y,0.961)略低于nanoESI-HRMS 方法(0.994)和UHPLC-HRMS 方法(0.983),预测相关性(Q2)均大于0.79,并且模型不过拟合,说明模型的解释性和可预测性较强,均能较好区分黄檀属与紫檀属木材样品。本研究提出的小型便携式质谱结合多元统计分析可用于木材种类鉴别,有望在高值木家具真伪鉴别方面发挥重要作用。
1 实验部分
1.1 仪器与试剂
Miniβ小型便携式质谱仪,配有不连续大气压接口和线性离子阱质量分析器(北京清谱科技有限公司);Q Exactive 静电场轨道阱高分辨质谱仪(美国Thermo Scientific 公司);UltiMate 3000 超高效液相色谱仪(美国Thermo Scientific 公司);Milli-Q 超纯水机(美国Millipore 公司);KQ-600 型超声波清洗器(江苏省昆山市超声仪器有限公司);AB204-S 电子天平(美国METTLER TOLEDO 公司);P-1000 型微电极拉制仪(美国Sutter 公司)。
豆科(Fabaceae)木材样品(黄檀属9 种、紫檀属6 种,经国家木材与木制品性能质量检验检测中心鉴定),具体信息见电子版文后支持信息表S1。甲醇(质谱级,美国Fisher 公司);甲酸(质谱级,美国Sigma公司);硼硅酸盐玻璃毛细管(美国World Precision Instruments 公司);0.45 μm 尼龙微孔滤膜(美国Pall公司)。实验用水为超纯水(18.2 MΩ·cm)。
1.2 实验方法
1.2.1 喷雾毛细管的制备
将硼硅酸盐玻璃毛细管水平固定于微电极拉制仪的拉力臂上,加热并拉伸毛细管中间部分,直至玻璃融化并被拉断,得到两个前端尖锐的喷雾毛细管。采用定量移液器向喷雾毛细管中注入样品溶液,将铂丝电极插入毛细管中施加电压,可在毛细管尖端形成电喷雾,供质谱仪检测。
1.2.2 样品前处理
nanoESI-Mini MS 和nanoESI-HRMS 分析 用刀片刮取少量木材样品置于2 mL 聚乙烯离心管中,加入100 μL 甲醇,振摇1 min,用移液器移取10 μL 提取液并注入至喷雾毛细管中。每种木材样品平行取样3 次。
UHPLC-HRMS 分析 称取0.5 g(精确到0.001 g)木材样品,置于25 mL 具塞比色管中,加入10 mL 甲醇,在室温下超声提取30 min。待冷却至室温,将提取液转移至15 mL 具塞聚四氟乙烯塑料离心管中,8000 r/min 离心5 min。取1 mL 上清液,采用0.45 μm 尼龙微孔滤膜过滤后,转移至2 mL 进样瓶中。每种木材样品平行取样3 次。
1.2.3 nanoESI-Mini MS和nanoESI-HRMS分析条件
nanoESI-Mini MS 正离子模式,喷雾电压2.0 kV,扫描范围m/z80~1200,碰撞诱导解离振幅2.7。nanoESI-HRMS 正离子模式,喷雾电压2.0 kV,离子传输管温度320 ℃,扫描范围m/z80~1200,归一化碰撞能量57,质谱数据采集时间窗口40 ms,选取时间窗口内所有质谱数据叠加作为样品的质谱指纹图谱,质谱扫描模式为一级质谱全扫描–数据依赖的二级质谱扫描。
1.2.4 UHPLC-HRMS分析条件
色谱柱:Waters ACQUITY BEH Phenyl(100 mm × 2.1 mm,1.7 μm);流动相A 为0.1%甲酸溶液,B 为甲醇;梯度洗脱(0~2 min,5% B;2~5 min,5%~35% B;5~7 min,35% B;7~7.1 min,35%~65% B;7.1~10 min,65%B;10~10.1 min,65%~95% B;10.1~13 min,95% B;13~13.1 min,95%~5%B;13.1~15 min,5%B);流速0.3 mL/min;进样量2.0 μL;柱温35 ℃;正离子模式,喷雾电压3.5 kV,离子透镜电压50 V,离子传输管温度320 ℃,辅助气温度320 ℃,鞘气和辅助气流速(N2)分别为40 和10 arb。质谱扫描模式为一级质谱全扫描-数据依赖的二级质谱扫描,扫描范围m/z80~1200。
1.2.5 数据处理与多元统计分析
采用Python 3.10.4 环境下编译的脚本对所得质谱数据进行信号强度归一化、寻找峰值、质量数对齐与空值填充。其中,质量数对齐通过以下步骤完成:(1)以质量数作为窗口中心,质量容忍度最小值的1/2 作为窗口宽度,建立一系列m/z窗口并构成列表;(2)将质谱数据中各质量数与m/z窗口范围比较,将落入窗口的m/z及对应信号强度写入列表,当同时存在多个信号强度时,保留其中最大值;(3)合并所有样品的m/z列表,移除其中全部为空值的列,形成输出矩阵。具体实验设置为:以小型便携式质谱的全扫描质谱图进行OPLS-DA 分析,窗口中心列表设为首项80、尾项1201 和公差为1 的等差数列,窗口宽度为±0.5,质量数精确到小数点后1 位数字;以静电场轨道阱高分辨质谱的全扫描质谱图进行OPLSDA 分析,窗口中心列表为首项80.00、尾项1200.01 和公差为0.01 的等差数列,窗口宽度为±0.005,质量数精确到小数点后3 位数字。
采用SIMCA 14.1 软件(瑞典Umetrics 公司)对处理后的木材样品质谱数据进行主成分分析(Principal component analysis,PCA)与OPLS-DA 分析。在进行分析之前,对原始数据进行帕累托缩放处理(以标准偏差的平方根作为缩放因子)以实现数据标准化。
2 结果与讨论
2.1 采用PCA模型检验木材样品质谱数据
采用不同质量分辨率的质谱仪采集15 种豆科木材样品质谱数据,所得nanoESI-MiniMS 谱图见图1A。黄檀属与紫檀属木材样品谱图之间存在差异性m/z,可以采用多元统计分析方法进行分类。以刀状黑黄檀为例,对nanoESI-Mini MS、nanoESI-HRMS 和UHPLC-HRMS 所得谱图进行比较,如图1B 所示,3 种质谱图之间特征m/z大部分可以互相吻合,但对应离子信号强度存在差别。
图1 15 种豆科木材样品的纳升电喷雾-小型便携式质谱(nanoESI-Mini MS)谱图(A)与刀状黑黄檀样品的nanoESI-Mini MS、nanoESI-高分辨质谱(HRMS)和超高效液相色谱(UHPLC)-HRMS 谱图(B)Fig.1 Mass spectra of (A) 15 kinds of Fabaceae wood samples obtained by nanoelectrospray-miniature mass spectrometry (nanoESI-Mini MS) and (B) Dalbergia cultrate obtained by nanoESI-Mini MS,nanoESI-high resolution mass spectrometry (HRMS),and Ultra high performance liquid chromatography (UHPLC)-HRMS,respectively
基于木材样品质谱数据分别建立PCA 模型,用于推测基于相同数据建立的OPLS-DA 模型的可靠性。由表1 可见,建立的3 种PCA 模型中,只有模型ⅠA 的累积解释率R2X(cum)大于0.4(0.614),表明此模型可靠。预测相关性方面,基于HRMS 数据的两种模型(ⅡA 和ⅢA)的Q2(cum)均低于0.1,表明其预测能力不理想。考虑到3 种模型所用的质谱数据来自相同的样品,可认为模型ⅡA 和ⅢA 的累积解释率与预测能力较低是由于质谱数据中噪声(包括质谱背景信号、溶剂背景等导致的噪声以及质量分辨率升高带来的冗余维度等)较大导致的。
表1 3种方法质谱数据拟合的主成分分析(PCA)模型比较Table 1 Comparison of the fitted principal component analysis (PCA) models for MS data fitting by three methods
图2 为基于不同来源质谱数据的PCA 模型得分散点图,图中横、纵坐标分别代表第一和第二主成分得分值。可以看出,黄檀属或紫檀属木材样品的数据点分布相对集中,其分布区域在模型ⅠA(图2A)与ⅡA(图2B)图中有较大程度重叠,而在模型ⅢA(图2C)图中重叠程度较低。值得注意的是,模型ⅢA对第二主成分的累积解释率R2X[2]仅为0.0967,解释不充分,得分散点图中属于黄檀属或紫檀属的数据点群质心距离过近,分类效果不够理想。此外,模型ⅠA 图中有数个离群点位于Hotteling′sT2=95%椭圆外,表明此数据组中存在强异常值。当数据组中存在较多噪音时,PCA 模型的组间分离度将随之降低,进而导致相应的OPLS-DA 模型在统计学上不可靠(过拟合)。在这种情况下,尽管OPLS-DA 模型仍可用于揭示组间分离情况,但所得结果须经过严格的交叉验证,才能确保其有效性[19]。
图2 PCA 模型得分散点图(绿-黄檀属;蓝-紫檀属):(A)nanoESI-Mini MS;(B)nanoESI-HRMS;(C)UHPLC-HRMSFig.2 Score scatter plots of PCA models(Green-Dalbergia spp.,Blue-Pterocarpus spp.):(A)nanoESI-Mini MS;(B) nanoESI-HRMS;(C) UHPLC-HRMS
2.2 采用OPLS-DA模型鉴别木材样品效果比较
分别采用基于不同来源质谱数据拟合的OPLS-DA 模型对15 种木材样品进行分类,并比较离子化方式和质谱仪质量分辨率等因素对鉴别结果的影响,相关OPLS-DA 模型解释率数据列于表2。对于OPLSDA 模型,R2X(cum)代表其所能解释的X预测性与正交性变异之和。在模型建立过程中,被选为X自变量的m/z数据量庞大,将导致模型中预测性变异(与Y相关的X变异)以及正交性变异(与Y不相关的X变异)数值均偏低,噪声偏高。本研究中,nanoESI-Mini MS 和nanoESI-HRMS 质谱数据的OPLS-DA 模型(ⅠB 和ⅡB)的R2X(cum)分别为0.313 和0.339。考虑到在质谱数据处理过程中,Mini MS 质量数因有效数字位数较少,其X变量数少于HRMS 数据,噪声相对较低,可以认为在R2X(cum)相近的情况下,模型ⅠB 质量更好。相比之下,模型ⅢB 受超高效液相色谱溶剂背景与精确质量数有效数字共同影响,噪声更高,R2X(cum)仅为0.258,解释能力逊于另外两种模型。R2Y(cum)代表模型所解释的Y的总变化量,本研究中3 种模型的R2Y(cum)分别为0.961、0.994 和0.983,对Y变量的解释均较充分,分类效果较好。Q2(cum)代表模型预测的良好程度,由表2 可见,nanoESI-HRMS 和UHPLC-HRMS 质谱数据的OPLS-DA 模型(ⅡB 和ⅢB)的Q2(cum)均大于0.950,表明其预测能力良好。模型IB 的Q2(cum)值虽然相对较低(0.799),但大于0.5,表明此模型仍具有较好的预测能力,可以满足不同属木材样品鉴别要求。
表2 3种方法的质谱数据拟合的正交偏最小二乘判别分析(OPLS-DA)模型比较Table 2 Comparison of the fitted orthogonal partial least squares-discriminant analysis (OPLS-DA) models based on MS data from three methods
图3 展示了不同来源质谱数据拟合的OPLS-DA 模型的得分散点图与对应的置换检验结果。由得分散点图(图3A~3C)可见,3 种模型均可实现对不同属木材样品数据点的良好区分。同时,为了识别离群值,对不同来源质谱数据进行Hotteling′sT2检测。结果表明,在模型ⅠB 和ⅡB 中未发现离群值,而在模型ⅢB 中存在中等离群值(P5 和P6)。通过置换分析对3 种OPLS-DA 模型的可靠性进行评估(图3D~3F),所有置换后的R2均小于或接近0.6,Q2均小于0,并且所有R2与Q2均小于右侧原始值,表明3 种模型的拟合均有效,不存在过拟合情况。图4 展示了3 种OPLS-DA 模型的S-plot 图,图中X轴与Y轴分别代表变量与OPLS-DA 模型预测成分的协方差载荷(p[1])及相关系数(p(corr)[1]),红色高亮代表VIP 值大于1 的变量。相关系数绝对值大于0.05 的变量通常被认为对分类具有统计意义,考虑到本研究的各组数据中变量较多,选取协方差绝对值大于0.1 的变量作为黄檀属和紫檀属木材样品的差异性质量数。结果表明,在不同来源数据拟合的OPLS-DA 模型中,对分类贡献较大的质量数不尽相同,但m/z255(255.09、255.10 和255.11)和m/z285(285.08 和285.11)在所有模型中均为重要变量。
图3 OPLS-DA 模型的得分散点图与置换检验结果(绿-黄檀属;蓝-紫檀属):(A、D)nanoESI-Mini MS;(B、E)nanoESI-HRMS;(C、F)UHPLC-HRMSFig.3 Score scatter plots and permutation test results of OPLS-DA models (Green-Dalbergia spp.,Blue-Pterocarpus spp.): (A,D) nanoESI-Mini MS;(B,E) nanoESI-HRMS;(C,F) UHPLC-HRMS
图4 OPLS-DA 模型的S-plot 图(红色圆圈代表VIP>1 的变量):(A)nanoESI-Mini MS;(B)nanoESIHRMS;(C)UHPLC-HRMSFig.4 S-plots of OPLS-DA models(Red circles represent variables with VIP values >1):(A)nanoESI-Mini MS;(B) nanoESI-HRMS;(C) UHPLC-HRMS
2.3 采用OPLS-DA模型区分黄檀属木材样品生物学种类
基于木材样品质谱数据,进一步拟合OPLS-DA 模型,并对黄檀属9 种木材样品生物学种类进行区分。如图5 所示,在nanoESI-Mini MS 和nanoESI-HRMS 质谱数据的OPLS-DA 模型的得分散点图(图5A和5B)中,代表黄檀属不同种木材样品的数据点各自成簇,nanoESI-HRMS 模型的簇间分离度略优于nanoESI-Mini MS 模型。在UHPLC-HRMS 质谱数据的OPLS-DA 模型中,属于刀状黑黄檀(D1~D3)与卢氏黑黄檀(D10~D12)的簇相互重叠,分离效果不理想。通过置换分析对3 种OPLS-DA 模型的可靠性进行了评估,由图5D~5F 可见,所有R2与Q2均小于右侧原始值,表明3 种模型不存在过拟合。此结果表明,在对同属少量木材样品进行种类区分时,nanoESI-Mini MS 和nanoESI-HRMS 的OPLS-DA 模型表现优于UHPLC-HRMS 模型。
图5 黄檀属样品OPLS-DA 模型的得分散点图与置换检验结果:(A、D)nanoESI-Mini MS;(B、E)nanoESI-HRMS;(C、F)UHPLC-HRMSFig.5 Score scatter plots and permutation test results of OPLS-DA models for classification of Dalbergia spp.:(A,D) nanoESI-Mini MS;(B,E) nanoESI-HRMS;(C,F) UHPLC-HRMS
2.4 木材样品中特定化合物二级质谱图比较
参考文献[20-21]的方法,选取刀状黑黄檀(Dalbergia cultrata)样品中黄檀素(Dalbergin)作为目标化合物进行二级质谱分析,结果如图6 所示。由全扫描质谱图(图6A 和6B)可见,难以通过精确质量数确定对应化合物的元素组成。然而,当选取m/z269.0(269.08070)进行二级质谱分析时,HRMS 与MiniMS 质谱图可以相互印证(图6C)。其中,碎片离子m/z254 来自黄檀素分子7-甲氧基脱甲基产生的[M+H–CH3]+,m/z238 为7-甲氧基脱落产生的[M+H–CH3O]+,m/z225 为己内酯环脱羧产生的[M+H–CO2]+,m/z212为己内酯环碎裂产生的[M+H–C2HO2]+,m/z192 为4-苯基脱落产生的[M+H–C6H5]+,而m/z181 则来自黄檀素分子同时发生7-甲氧基脱落与己内酯环碎裂。上述结果表明,二级质谱产生的碎片离子与母离子结构相关性较好,具有二级质谱分析功能的小型便携式质谱也可实现对木材样品中特定化合物的结构分析。
图6 对刀状黑黄檀样品中黄檀素的一级质谱全扫描和二级质谱分析:(A)采用nanoESI-Mini MS 和nanoESI-HRMS 采集全扫描谱图;(B)图6A 中m/z 250~270 局部放大质谱图;(C)m/z 269 的二级质谱分析Fig.6 Full-scan MS and MS/MS analysis of dalbergin in Dalbergiacultrata sample:(A)Full-scan MS spectrum obtained by nanoESI-Mini MS and nanoESI-HRMS;(B) Partial enlargement of full-scan MS spectrum at m/z 250–270 in Fig.6A;(C) MS/MS analysis of m/z 269
3 结论
通过小型便携式质谱结合多元统计分析实现了黄檀属与紫檀属共15 种木材样品的高效鉴别,并在模型质量、差异性因子和鉴别效果等方面与高分辨质谱所采集数据进行了比较。结果表明,尽管纳升电喷雾直接质谱分析方法与色谱-质谱方法相比缺少色谱分离维度,并且小型便携式质谱的质量分辨率低于高分辨质谱,但基于纳升电喷雾-小型便携式质谱数据建立的多元统计分析方法仍可满足木材样品的鉴别需求,具有良好的应用前景。
支持信息
Supporting information
表S1 15 种豆科木材样品种属信息与数据编号Table S1 Species information and data numbers of 15 kinds of Fabaceae wood samples