穿山甲色谱指纹谱的建立及其在基源鉴别和质量等级区分方面的应用
2020-11-02乔亚丽沈爱金郭志谋刘艳芳陈相银梁鑫淼
乔亚丽, 刘 喆, 沈爱金, 郭志谋, 刘艳芳, 陈相银, 徐 青, 梁鑫淼
(1. 中国科学院大连化学物理研究所, 中国科学院分离分析化学重点实验室, 辽宁 大连 116023; 2. 中国科学院大学, 北京 100049; 3. 北京三和药业有限公司, 北京 100049)
穿山甲(中药名)为鳞鲤科动物穿山甲的鳞甲,具有活血消症、通经下乳、消肿排脓的功效,用于治疗乳汁不通、痈肿疮毒、风湿痹痛等症[1],现代医学研究发现穿山甲对恶性肿瘤有一定程度的治疗效果[2,3]。穿山甲的传统动物基源仅限于中华穿山甲(Manispentadactyla)(也称穿山甲)。中华穿山甲为国家一级保护动物,野生数量极少,人工饲养技术尚不成熟,致使穿山甲药用资源匮乏,市场价格大幅增长[4]。为此,多种其他穿山甲属物种的穿山甲大量充斥市场,包括马来穿山甲、印度穿山甲、树穿山甲和南非穿山甲[5,6],严重影响了穿山甲临床用药的科学性和准确性,因此,明确穿山甲的动物基源非常必要。另外,在实际生产中,会根据经验对穿山甲进行等级分类,但其量化的分类标准一直空缺,且尚未见到相关研究。
穿山甲主要成分为角蛋白,同时含有硬脂酸、胆固醇等脂溶性成分和Si、Al等微量元素[7,8]。刘逊等[9]同时运用性状鉴别分析、基于胆固醇的薄层色谱分析以及以环二肽为特征指标的质谱分析,对不同基源穿山甲炮制品进行鉴别。谭永梅等[10]以薄层色谱法对比分析了穿山甲中的氨基酸成分。刘潇潇等[11]采用液相色谱-质谱联用,分析不同基源穿山甲中的特征肽段。其中,性状鉴别在针对非典型甲片或是破碎甲片时,种间分辨能力有限;薄层色谱分辨率低,而质谱成本高难以普及。另外,胆固醇或是过度分解的氨基酸并不能代表穿山甲专属特征,而少量的肽段也不足以反映穿山甲的整体轮廓。部分学者提出利用特异性DNA条码追踪鉴定穿山甲基源[12,13],但其繁杂的DNA提取及分析过程并不适合作为中药质量监测的常规手段。中药指纹图谱能够全面综合地反映中药化学组成的整体轮廓,体现中药多成分协同作用的基本特性,已成为中药来源和品质研究的重要手段[14,15]。在具体应用时,相似度评价是最基本和最简单的反映指纹谱相关性的数据分析方法。但在进行小类别分析时,基于统计学理论的判别分析有更高的数据处理能力,已广泛应用于天然产物的分类鉴别[16-19]。
本文同时收集了不同等级的中华穿山甲及多种其他基源的穿山甲,拟通过建立穿山甲的色谱指纹谱,结合相似度评价和判别分析,探讨其在等级及基源鉴别方面的可行性,为提高其临床用药科学性和准确性提供新的思路。
1 实验部分
1.1 试剂、仪器与材料
Waters Alliance高效液相色谱仪(2695梯度泵,2998二极管阵列检测器,自动进样器,柱恒温系统,Empower色谱工作站)。苯丙氨酸、酪氨酸和色氨酸标准品均为分析标准品(≥98%),来自上海源叶生物科技有限公司。
乙腈(色谱纯,Meryer),三氟乙酸(色谱纯,Sigma-Aldrich),实验用水为Milli-Q纯水系统生成;其余试剂均为分析纯。
本研究共收集了不同等级的中华穿山甲24批,其他种属穿山甲4批,甲片具体信息见表1,所有甲片均来自北京三和药业。
表 1 甲片批号、基源及等级
1.2 供试液的制备
取穿山甲,捣碎打粉过3号筛。精密称取甲片粉末2 g,置于125 mL具塞锥形瓶中,加入1 mol/L HCl 30 mL, 100 ℃条件下加热回流1 h,放冷,加入1 mol/L HCl补足减失的重量,摇匀,取上清液过0.45 μm孔径的聚醚砜滤膜,续滤液即为供试品溶液。
1.3 色谱条件
色谱柱为Waters Symmetry 300 C18(150 mm×4.6 mm, 5 μm,沃特世科技(上海)有限公司),流动相A为0.1%(v/v)三氟乙酸/水,流动相B为0.1%(v/v)三氟乙酸/乙腈,流速为1 mL/min,柱温为30 ℃,洗脱梯度:0~50 min, 0~30%B; 50~51 min, 30%B~90%B; 51~60 min, 90%B。紫外检测波长为280 nm。进样量为10 μL。
1.4 数据分析
1.4.1相似度评价
相似度评价是指纹谱分析的基本手段,其中余弦相似度是常用相似度之一,具体计算见式(1)[20]:
(1)
其中,A为样本指纹谱峰面积构成的向量,S为对照指纹谱各峰面积构成的向量。余弦相似度反映的是样品化学成分与对照指纹图谱化学成分在分布比例上的相似程度,其特点是峰面积越大峰计算权重越大,易对小峰造成掩蔽作用,更适用于大类别样品的区分。
为了消除大峰对小峰的掩蔽作用,可先对样本进行归一化处理,再进行相似度计算,所得相似度为比率定性相似度[15],此方法更适用于小类别样品的区分,具体计算见式(2)[15]:
(2)
其中Ai为样本指纹谱峰面积构成的向量的第i个分量,n为样本峰个数,Si为对照指纹谱峰面积构成的向量的第i个分量。
考虑到穿山甲的等级区分相比于种属鉴别属于小类别区分,小峰的差异同样重要,本文统一采用比率定性相似度作为评价标准。
1.4.2判别分析
判别分析又称“分辨法”,是在分类确定的条件下,根据研究对象的特征值判别其类型归属问题的一种多变量统计分析方法,通过参数调整及模型训练,可使样品判错率达到最小。支持向量机(support vector machine, SVM)是一种常用判别分析模型,其利用支持向量对样本进行学习并处理未知样品,实现经验风险和置信范围的最小化,有良好的统计规律和泛化能力,数学表述见式(3)和(4)[21]。
(3)
(4)
yj(wTxj+b)=1
(5)
对于非线性、高维度数据,核函数引入的支持向量机可以很大程度上克服“维数灾难”的问题,具有独特的优势[22]。其中,sigmoid感知核为一种常用核函数,其数学表达式见式(6)[21]:
(6)
其中,x为样本峰面积构成的数据矩阵。
本文中使用python 3.7作为编程语言,借用scikit-learn 0.22.1编写以sigmoid为核函数的核支持向量机模型,正则化参数设为10,使用十折交叉验证对模型进行验证并可视化预测结果。
2 结果与讨论
2.1 方法优化
2.1.1提取条件的考察
穿山甲的主要成分为角蛋白,高温、高酸条件下蛋白质容易发生水解,产生质量不一的肽段,本文分别对穿山甲的提取溶剂、提取方式和提取时间进行考察。分别以水、0.2 mol/L HCl、0.5 mol/L HCl、1 mol/L HCl为提取剂,加热回流1 h,前3种条件下的提取效果基本一致,当HCl浓度达到1 mol/L时,提取效果明显改善,可以获取更多的指纹信息(见图1a)。提取方式考察结果表明,超声提取到的物质明显减少(见图1b),因此采用加热回流提取法。当提取时间缩短为0.5 h时,提取效果下降(见图1c)。
图 1 不同(a)提取溶剂、(b)提取方式、(c)提取时间下的穿山甲色谱图Fig. 1 Chromatograms of Squama Manis under different (a) extraction solvent, (b) extraction mode, and (c) extraction time Column: Symmetry 300 C18 (150 mm×4.6 mm, 5 μm). Mobile phase A: 0.1% (v/v) trifluoroacetic acid (TFA) in water, mobile phase B: 0.1% (v/v) TFA in acetonitrile. Gradient elution: 0-40 min, 0-50%B; 40-60 min, 50%B-95%B.
2.1.2色谱条件的考察
为了获得最佳的分离体系和分离条件,我们分别对色谱柱、流动相体系、检测波长和流动相梯度条件进行了考察。
首先考察Unitrary C4 300 (150 mm×4.6 mm, 5 μm,华谱科仪(北京)科技有限公司)、Symmetry 300 C4 (150 mm×4.6 mm, 5 μm,沃特世科技(上海)有限公司)和Symmetry 300 C18 3种类型色谱柱对穿山甲供试液的分离能力,结果表明,穿山甲供试液在Symmetry 300 C18色谱柱上具有更好的选择性和色谱峰形(见图2)。
图 2 不同色谱柱上的穿山甲色谱图Fig. 2 Chromatograms of Squama Manis on different columns Mobile phase A: 0.1% (v/v) TFA in water; mobile phase B: 0.1% (v/v) TFA in acetonitrile. Gradient condition: 0-40 min, 0-50%B; 40-60 min, 50%B-95%B.
在Symmetry 300 C18色谱柱上考察不同的流动相体系,包括三氟乙酸-乙腈-水、磷酸二氢钠/高氯酸钠(pH 4)-乙腈-水、磷酸二氢钠/高氯酸钠(pH 6)-乙腈-水,结果表明三氟乙酸-乙腈-水体系下的分离效果最佳。
对比230、254、280、300 nm下的色谱图,结果表明280 nm波长下色谱峰响应普遍更高,故选其为检测波长。
为了进一步改善分离效果,对流动相梯度进行了考察,不同梯度下的色谱分离结果见图3。综合考虑主要色谱峰(6~30 min)的分辨率、分离度和保留时间,条件c为最佳梯度条件。
图 3 不同梯度条件下的穿山甲色谱图Fig. 3 Chromatograms of Squama Manis under different gradient conditions Column: Symmetry 300 C18. Mobile phase A: 0.1% (v/v) TFA in water, mobile phase B: 0.1% (v/v) TFA in acetonitrile. a. 0-40 min, 0-50%B; 40-60 min, 50%B-95%B. b. 0-50 min, 0-40%B; 50-51 min, 40%B-90%B; 51-60 min, 90%B. c. 0-50 min, 0-30%B; 50-51 min, 30%B-90%B; 51-60 min, 90%B.
2.2 对照指纹谱的建立
取12批中华穿山甲一等品,制备其供试液,按照1.3节色谱条件进行分析,采集指纹谱(见图4a)。对所有色谱图进行统一积分,将其CDF格式数据文件导入到“中药色谱指纹谱相似度系统”(2004A版),采用平均数法,时间窗设置为0.1,经多点校正和全峰自动匹配生成对照指纹谱(见图4c)。综合各一等品指纹谱出峰情况,选取出峰时间一致性较高、分离度较好的17个峰为共有峰。以共有峰的绝对面积为原始数据,计算各指纹谱与对照指纹谱间的相似度(公式(2)),如表2所示,一等品样品指纹谱与对照指纹谱的相似度均大于0.98,表明该指纹谱稳定可靠,可用于后续质量评价。
图 4 (a)12批一等品、(b)12批统货穿山甲的色谱指纹谱和(c)对照指纹图谱Fig. 4 (a,b ) Chromatographic fingerprints of the 24 batches of Squama Manis (a. First-class samples, b. General samples) and (c) the reference fingerprint Peaks 1-17: common peaks.
表 2 穿山甲样品指纹谱与对照指纹谱之间的相似度
以S106批次甲片色谱图的5号色谱峰(见图4)为例考察方法的系统适应性,由图4可得到该色谱峰的塔板数大于6 000,拖尾因子为1.02,与4号峰的分离度为1.51,表明该方法的系统适应性很好。
2.4 方法学验证
处理批号为S106的穿山甲,按照1.3节色谱条件对其进行分析,系统考察方法的精密度、日内日间重复性和样品稳定性,以5号峰(见图4c)为参照峰,计算所有共有峰的相对峰面积和相对保留时间的RSD值。
精密度试验中,供试品溶液连续进样6针,各共有峰相对保留时间的RSD为0.02%~0.08%,相对峰面积的RSD为0.57%~2.99%。
重复性试验包括日间重复性和日内重复性,首先平行处理6份S106批次穿山甲用于评价日内重复性,各共有峰相对保留时间的RSD为0.05%~0.12%,相对峰面积的RSD为0.46%~4.10%;连续3天,每天平行处理6份S106批次穿山甲评价日间重复性,各共有峰相对保留时间的RSD为0.05%~0.45%,相对峰面积的RSD为2.45%~4.98%。
分别于供试液制备后0、2、4、8、12和24 h将其注入液相色谱仪进行分析检测,各共有峰相对保留时间的RSD为0.23%~0.80%,相对峰面积的RSD为0.44%~4.32%,表明样品供试液在24 h内稳定性良好。
以上结果表明该方法稳定,符合指纹谱要求。
2.5 相似度评价
2.5.1不同基源穿山甲相似度评价
为了考察穿山甲指纹图谱对基源鉴定的适用性,对4种其他基源穿山甲处理并分析。将上述甲片的指纹谱与中华穿山甲对照指纹谱导入到相似度系统,指纹谱对比图见图5,其中南非穿山甲(c)和马来穿山甲(d)与中华穿山甲(e)均有很高的相似度,主观判断很难鉴别其基源。利用指纹谱系统中导出的共有峰数据,计算马来穿山甲、南非穿山甲、树穿山甲、印度穿山甲指纹谱与中华穿山甲对照指纹谱的相似度(公式(2)),相似度结果依次为0.776、0.676、0.641、0.349,相似程度均较低。因此,通过相似度评价,可以快速区分中华穿山甲与其他种属穿山甲。
图 5 不同种属穿山甲甲片的色谱指纹谱Fig. 5 Chromatographic fingerprints of scales from different species of Manis a. Manis tricuspis; b. Manis crassicaudata; c. Manis temminckii; d. Manis javanica; e. Manis pentadactyla.
2.5.2不同等级中华穿山甲相似度评价
为了考察穿山甲指纹图谱对等级鉴定的适用性,取12批中华穿山甲统货,按照实验方法对其进行处理并分析,指纹谱见图4b。按照公式(2),以共有峰的绝对面积为原始数据,计算12批统货的指纹谱与对照谱之间的相似度,结果见表2。就整体水平而言,一等品的平均相似度为0.994, RSD值为0.23%;统货平均相似度为0.988, RSD值为1.31%,一等品整体品质优于统货。对于单独个体,不同等级之间相似度存在严重的交叉现象,相似度评价难以对穿山甲质量等级作出判断。相似度评价对小类别区分的局限性在文献中多有提及,对此需要采用数据处理能力更强的方法对数据做进一步的分析。
2.6 判别分析
以12批一等品甲片和12批统货甲片的共有峰绝对面积为原始数据,质量等级为甲片标签,建立sigmoid核函数支持向量机判别模型。由十折交叉验证对模型进行训练并验证,模型的无偏差预测正确率高达为95.83%,其可视化结果见图6。由于该模型通过多维空间内的超平面对甲片进行分类,在二维平面上不能看到明显的分类界限,判别结果通过不同颜色的小球表示。其中,A、B批次甲片的模型分类结果与其甲片标签完全一致,只有S批次的S104、ST05甲片的模型预测结果与其标签不同。上述批次偏向性提示我们,模型的出错率很可能来源于人为因素造成的标签错误,而非模型自身。总之,该模型的分类能力明显高于相似度评价,其判别结果与实际等级分类高度一致,在穿山甲等级分类方面可行性很高。
图 6 基于色谱指纹谱的穿山甲等级判别结果Fig. 6 Discriminant classification of Squama Manis based on chromatographic fingerprints
3 结论
中药指纹谱是中药质量评价的重要手段,可以准确反映中药化学成分的分布比例及含量高低。中药指纹谱的数据分析方法可以分为两类,其一为相似度评价,该方法是指纹谱评价的基本手段,常用于大类别区分;其二为基于统计学分析的化学计量学分析,该方法对非线性、高维度的复杂数据有更高的分析能力,常用于小类别区分。在基源鉴别时,其他基源穿山甲与中华穿山甲的相似度均不高于0.776,根据相似度结果可快速、有效鉴别中华穿山甲的基源。在等级区分时,鉴于数据的复杂性,相似度评价只能在样品的整体水平上体现其趋势,不能对个体样品做出正确判断;判别分析则是先根据现有分类标准建立数学模型,再将其用于未知样品的分类,出错率大大降低。经十折交叉验证,判别模型的无偏差准确率可高达95.83%,说明该模型用于穿山甲等级区分具有很高的可行性。综上,本研究建立了穿山甲的色谱指纹谱并确认了其在基源鉴别和等级区分应用上的可行性,为提高穿山甲临床用药的科学性和准确性提供新思路。