顶空气相色谱中药分类
2017-03-18王炫凯山东省枣庄市实验中学山东枣庄277000
王炫凯(山东省枣庄市实验中学,山东 枣庄 277000)
顶空气相色谱中药分类
王炫凯(山东省枣庄市实验中学,山东 枣庄 277000)
对中药的顶空气相色谱进行了奇异值分解与主成分分析。以前两个主成分为新的坐标,对青皮,藿香,当归进行分类,效果明显从而以顶空气相色谱为基础建立了中药的指纹图谱。
主成分分析;奇异值分解;青皮;藿香;当归;中药;指纹图谱;顶空气相
1 顶空气相色谱
1.1 顶空分析技术原理
1.1.1 顶空分析技术
顶空分析技术经常用于气相色谱分析,是气相色谱分析中的一种处理手段,也就是气体萃取技术。如果样品中存在痕量的高挥发性的物质,也可以进行定性定量地分析测定。又因为高挥发性的物质的气相组分含量较大,因此气体是最适合的溶剂,常用气体萃取的方法来提高被测物的浓度。
1.1.2 顶空分析技术的分类
顶空分析法通常可分为三类:静态顶空分析,动态顶空分析和顶空-固相微萃取。[1]他们分别有这这样的有点:静态顶空分析操作简单,便于进样与测量。动态顶空分析由于自动化发展较多,便于大批量地测量。顶空-固相微萃取的萃取回收率高,测量的灵敏度也高。
1.1.3 静态顶空分析
由于在封闭的容器中,由于样品的蒸汽压,使得样品的固相和气相在容器中达到平衡。抽取容器上方中的气体,便可以直接对样品气体进行分析与测试。这就是静态顶空分析。
静态顶空分析可分为三类模式:顶空直接注入模式,平衡压力提取采样模式和压力恒定体积采样模式。我们专注于顶空直接注入模式,因为成本较低使用较多的是顶空直接注入模式。顶空直接注射系统通常在气体取样针的外侧具有温度控制装置,而且还配备有气密的取样针。
静态顶空分析气体直接注射可以分为两个步骤:首先,将液体样品或固体样品置于封闭的玻璃小瓶中,并且超过一半的气体空间留在小瓶中的样品上方。相平衡在恒温下实现。然后使用气密注射器将样品瓶中的顶部空间气体直接注入色谱仪的入口,用于色谱分离和测定。这种静态顶空分析方法具有广泛的适用性,易于清洁。它适用于具有高挥发物含量的样品,如香料,苯,香料,烟草和樟脑。静态顶空分析的主要缺点是必须注入大体积的气体,不然会使得挥发性物质的色谱峰的初始扩展将影响色谱分离,造成干扰。
1.2 顶空色谱分析的样品要求
如果要进行顶空气相色谱分析,那么样品必须具有这些要求。样品是有挥发性的固体或者液体,如果蒸汽压较低,无法达到萃取要求的话,可以选择别的萃取方式。样品有一定的热稳定性,否则加热萃取时,会造成干扰,影响实验,甚至损坏仪器。
1.3 顶空气相萃取的过程
在顶空分析技术中,分析物首先从液相或者固相扩散到气相中。然后将分析的组分从气相转移到固定相。这种改进避免了在某些样品基质中具有高分子量和非挥发性物质的萃取固定相的污染。萃取时,分析物的扩散过程是萃取的决速步骤。因为固定相的萃取的速率一般远远地超过了分析物的扩散的速率。使得挥发性组分具有比半挥发性组分快得多的提取速率。事实上,对于挥发性组分,顶空萃取的平衡时间远小于在相同混合条件下的直接萃取平衡的平衡时间。
2 模式识别
化学模式识别技术分为非监督方法和监督方法2类。利用计算机的分类算法,根据信息中包含的化学成分的材料,从而能很好地对指纹进行分类。以下介绍两种常用的监督模式识别方法。
2.1 主成分分析
PCA算法的原理是将原来的变量进行线性组合,综合各个变量,得到几个新变量,用新变量来表示数据。如果取前两个新变量,那么就可以用一个二维图图像表示出原来的数据,起到了降维的作用,也易于数据的可视化表示。常见的降维算法有特征值分解和奇异值分解,特征值分解要求原数据是方阵,而奇异值分解则无要求。
2.2 聚类分析
聚类分析的原理很简单。首先定义样本数据之间的距离。常见的距离定义有马氏距离,曼哈顿距离,欧式距离等。根据各个样本之间的距离远近来进行聚类。如距离大于1则分为A类,距离小于1则分为B类。因此可以调整聚类的距离值,来控制具体聚类的类别数目,距离越短,同类样本之间的距离就越接近,类别数目就越多。距离越大,同类样本之间的距离越大,类别数目就越少。
3 指纹图谱
2000年后,中药指纹图谱的研究得到了空前的发展。聚类分析、主成分分析、人工神经网络技术等现代数据处理的算法快速发展。很多指纹信息可以完全整合,正确的表达,真实,生动地反映了中医药质量的差异。各种色谱图,光谱,光谱手段应用于建立中医指纹,中药成分分析技术成为有用的信息提取手段。
指纹是指可标记的化学特性的对象适当的处理后,提前共有信息的色谱或光谱图,采用一定的分析方法。生动地说,中药指纹是中药的身份证,中药的主要化学信息可以反映在指纹,指纹作出的中药图谱可以用来对中药分类。
4 常见中药的分类
以青皮、藿香、当归为例,对中药建立指纹图谱分类。
4.1 中药的色谱流出时间图
为了更好表示每个样本的气相色谱图,在基线依次加了1000000,色谱图如图1。
图1 中药色谱图
4.2 数据自标准化
数据自标准化有很多方式,第一种方法是先求出每组数据的标准偏差和平均值,每个数据值依次除以标准偏差,使得每组数据的离散程度相同,标准偏差都为1。每个数据再减去平均值,使得每组数据中性化,都以0为中心分布。第二种方式是取每列数据的区间长度与数据最小值,每个数据减去数据最小值后除以区间长度,使得数据在[0,1]之间分布。
第一种方法无法处理对于离散程度较大数据。第二种方法没有中心化,参考点不同,但是可以处理离散程度较大的数据。
4.3 相关系数矩阵
相关系数是两组数据的协方差除以两组数据各自标准差的乘积。可以反映两组数据之间的线性相关性,以此为判据,可做粗略的分类。计算数据的相关系数矩阵得表1:
表1 相关系数矩阵
可以看出同类的相关系数很高都大于0.65。
4.4 主成分分析与奇异值分解
4.4.1 奇异值分解
为了进行合理的分类算法,可以选取特征的流出时间作为依据来对中药进行分类。但是如此做存在缺陷,目前只有三种中药,即最少只要三个特征向量就可以进行分类。对于样本较少的情况下可以这么做,但是没有普遍性,因为也许有了第四种中药,仅凭这三个特征向量是不能分类的。而且即使多选择至11个特征向量,也无法合理分类,因为可知N种中药至少需要N个特征向量。因此可以对所有流出时间进行分析找出所有的特征向量,而不是有限的N个向量,这样可以保证分类的准确性,不会轻易地把从未测量过的未知样错误地分如已知类别中。
4.4.2 主成分分析
常见的主成分分解对样本的数据矩阵要求是非奇异方阵,而本实验八个样本,5706个数据点,为8×5706的矩阵,且秩为三。因此只能进行奇异值分解。分解样本矩阵,选取奇异值从小到大排序,选取前两个奇异值所对应的特征向量作为主成分在旧空间中的坐标变化的新基。
4.4.3 分类图
标准化后的原数据在用新基表示的线性空间内,可变为如下数据,见表2:
表2
5 顶空气相指纹图谱分类分析流程总结
第一步数据中心化标准化,使得数据离散程度相同,并且都以0为中心分布,便于公平的分类。
第二步主成分分解或奇异值分解,找到这个矩阵最大的几个特征值或奇异值所对于的特征向量,好表示这个矩阵。
第三步,以这些特征向量为新的坐标轴,画出原数据在新坐标下的坐标。
第四步,根据坐标的邻近程度分类。
[1]王昊阳,郭寅龙,张正行,安登魁.顶空-气相色谱法进展[J].分析测试技术与仪器,2003,(03):129-135.