基于支持向量机模型的中药挥发油化学成分类型与皮肤细胞毒性关联性研究
2020-10-14杨文国乔兆颖戴沭宁张沁晶朱学敏姚俊宏陈军
杨文国,乔兆颖,戴沭宁,张沁晶,朱学敏,姚俊宏,陈军
基于支持向量机模型的中药挥发油化学成分类型与皮肤细胞毒性关联性研究
杨文国1,乔兆颖2,戴沭宁2,张沁晶2,朱学敏3,姚俊宏3,陈军3,4
1.南京中医药大学人工智能与信息技术学院,江苏 南京 210023;2.南京中医药大学卫生经济管理学院,江苏 南京 210023;3.南京中医药大学药学院,江苏 南京 210023;4.南京中医药大学江苏省中药资源产业化过程协同创新中心,江苏 南京 210023
探寻中药挥发油的化学成分类型与皮肤细胞毒性之间的关联性,并建立皮肤细胞毒性预测模型。应用位于活性表皮的人角质形成细胞HaCaT评价皮肤毒性,并通过气相色谱-质谱分析得到挥发油的化学成分分类。运用非参数统计和支持向联机选取特征变量并建立预测模型。不同毒性程度中药挥发油的单萜化合物、单萜氧化物、倍半萜氧化物和单萜与芳香族复合结构与中药挥发油皮肤细胞毒性存在显著关联(<0.05)。基于上述4种化学成分进行特征构造,利用支持向量机建立的皮肤细胞毒性预测模型具有良好的预测性能。支持向量机模型可用于阐明中药挥发油化学成分类型与皮肤细胞的关联性。
中药挥发油;皮肤细胞毒性;非参数统计;支持向量机
经皮给药是中药除口服外的常用给药途径,具有给药方便、血药浓度平稳、避免首过效应和胃肠道不良反应、可随时中止用药等诸多优势。但由于皮肤角质层的屏障作用,经皮给药生物利用度偏低,严重限制了药效的发挥。透皮吸收促进剂(penetration enhancers,PE)是目前最常用的解决这一问题的制剂学手段[1],而中药挥发油是常用的一大类PE[2],具有促渗作用好、毒性低、药效协同的特点。
除促渗作用外,PE皮肤毒性是决定其应用前景的主要因素。与常规的化学合成PE相比,皮肤毒性相对较低是中药挥发油的主要优势。前期研究表明,中药挥发油的皮肤细胞毒性远低于以氮酮为代表的化学合成PE[3]。因此,本研究选择经典的、位于活性表皮层的人角质形成细胞HaCaT作为模型,考察33种辛味中药挥发油的皮肤细胞毒性,并借助数据挖掘和数学建模手段分析中药挥发油化学成分类型与皮肤细胞毒性的关联性。
1 仪器、试药与细胞
调温电热器(南通市通州申通电热器厂),挥发油提取器,WAY-2S型阿贝折光仪(上海精密科学仪器有限公司),BAS-124S型电子天平(德国赛多利斯科学仪器有限公司),INCO108型CO2培养箱(德国Memmert公司),XD-202型倒置显微镜(南京江南永新光学有限公司),SW-CJ-IF型超净工作台(苏州安泰空气技术有限公司),Spectramax M5型多功能酶标仪(美国Molecular Devices公司),96孔细胞培养板(康宁公司),DW-86L338型-80 ℃冰箱(海尔生物医疗),血细胞计数板(上海求精生化试剂仪器有限公司),EPED-10TF型实验室超纯水器(南京易普易达科技发展有限公司)。
中药饮片干姜、高良姜、小茴香、蛇床子、广藿香、莪术、荜澄茄、羌活、细辛、草果、香附、川芎、荆芥、石菖蒲、丁香、当归、花椒、吴茱萸(批号分别为20150301、20140701、150401、150601、20141201、20140701、20150416、20150506、20150801、20150412、20141201、20140801、20150618、150601、20141201、20150308、150106、150212),安徽铜陵中药饮片有限公司;陈皮、檀香、青皮、没药、豆蔻、辛夷、乌药、草果(批号分别为170101、160927、161216、161209、161109、161206、161130、161016),苏州市天灵中药饮片有限公司;枫香脂(批号170119),南京海源中药饮片有限公司;肉桂(批号150121),亳州市永刚饮片有限公司;藁本(批号161018012),江西济世堂药业有限公司;香薷(批号111126006),北京仟草中药饮片有限公司;紫苏叶(批号151201),东营百佳益中药饮片有限公司。松节油(批号20140924),永华化学科技(江苏)有限公司;薄荷油(批号150326),黄山天目薄荷药业有限公司。胎牛血清(浙江天杭生物科技有限公司,批号150624),0.25%胰蛋白酶-EDTA消化液(上海立菲生物技术有限公司,批号1828698),青霉素-链霉素溶液(碧云天生物技术有限公司,批号C0222),MTT细胞毒性试剂盒(上海生工生物工程有限公司,批号150614),二甲基亚砜(DMSO,江苏凯基生物股份有限公司,批号130815),无水硫酸钠(南京化学试剂有限公司,批号150302367D),超纯水(实验室自制),其他试剂均为分析纯。
人永生化角质形成细胞HaCaT,购自江苏凯基生物股份有限公司,以DMEM(高糖)培养基(含10%胎牛血清、100 U/mL青霉素-链霉素溶液)培养于37 ℃、5%CO2培养箱。
2 方法与结果
2.1 挥发油制备及气相色谱-质谱分析
除松节油和薄荷油外,采用水蒸气蒸馏法提取其余31种中药挥发油[3-4]。
2.2 挥发油对HaCaT细胞毒性评价
取对数生长期的HaCaT细胞,制成单个细胞悬液,调整细胞浓度,以7×103个/孔接种于96孔培养板,37 ℃、5%CO2培养过夜,分别加入不同浓度挥发油溶液,每个浓度设5个复孔。以不加PE溶液的细胞悬液作为阴性对照组,并以不含细胞的培养基作为空白组调零。处理24 h后,每孔加入含0.5 mg/mL MTT的不含胎牛血清培养基120 µL,培养4 h,吸弃上清,每孔加DMSO 150 µL,摇床10 min摇匀,于酶标仪570 nm波长处测定吸光度,计算存活率和IC50。存活率(%)=(A挥发油组-A空白组)÷(A阴性对照组-A空白组)×100%。根据IC50将挥发油毒性分为小、中、大3类,结果见表1。
2.3 挥发油化学成分毒性非参数统计
以Y代表毒性,X1~X12依次代表单萜化合物、单萜氧化物、倍半萜化合物、倍半萜氧化物、二萜及其氧化物、脂肪族及脂肪酸类成分、芳香族成分、单萜与芳香族复合结构、倍半萜与芳香族复合结构、单萜氧化物与芳香族复合结构、苯酞类成分和其他。利用SPSS22.0统计软件对X1~X12进行分析,根据偏态系数发现数据均呈右偏分布。单样本Kolmogorov- Smirnov拟合优度检验适合在分布未知和样本量比较小的条件下分析样本分布与正态分布间是否存在显著差异,从而判定变量是否服从正态分布。检验结果显示,值均小于0.05,可知X1~X12均不服从正态分布。由于样本数据均不服从正态分布且根据毒性分类后每类样品数据较少,故采用非参数统计的Kruskal-Wallis检验进行分析,结果表明单萜化合物、单萜氧化物、倍半萜氧化物、单萜与芳香族复合结构的含量与挥发油的毒性强度具有关联性,见表2。
表1 33种中药挥发油的皮肤细胞毒性
中药IC50/(µg/mL)毒性主要化学成分 荆芥304.27小单萜氧化物90.95%、单萜化合物3.74%、脂肪族及脂肪酸类成分3.36% 花椒333.69小单萜化合物30.44%、单萜氧化物51.18%、脂肪族及脂肪酸类成分15.98% 小茴香332.78小芳香族成分91.89%、单萜化合物5.34%、单萜氧化物1.55% 豆蔻123.10小单萜氧化物74%、单萜化合物18.85%、倍半萜化合物3.96% 细辛161.80小芳香族成分48.68%、单萜与芳香族复合结构26.71%、单萜化合物17.02%、单萜氧化物7.73% 丁香192.25小芳香族成分97.67%、倍半萜化合物1.79% 藁本138.10小芳香族成分90.53%、单萜化合物4.61%、单萜氧化物3.16% 薄荷油97.01小单萜氧化物75.76%、单萜化合物4.61%、脂肪族及脂肪酸类成分0.3% 石菖蒲65.42中芳香族成分59.36%、倍半萜氧化物23.74%、倍半萜与芳香族复合结构3.58% 陈皮49.74中单萜化合物96.78%、倍半萜化合物1.88% 草果68.75中单萜氧化物52.07%、脂肪族及脂肪酸类成分14.81%、芳香族成分11.36%、单萜化合物7.32% 荜澄茄69.89中单萜化合物51.43%、单萜氧化物33.63、倍半萜氧化物4.07% 枫香脂39.77中单萜氧化物46.36%、倍半萜化合物23.47%、单萜化合物18.77% 香薷50.58中芳香族成分41.74%、单萜氧化物17.66%、倍半萜化合物15.46%、单萜氧化物与芳香族复合结构13.93% 青皮37.74中单萜化合物62.38%、倍半萜化合物14.59%、单萜与芳香族化合结构13.34% 莪术39.63中倍半萜氧化物71.34%、芳香族成分10.07%、倍半萜化合物6.65% 辛夷31.66中单萜氧化物34.04%、倍半萜化合物27.67%、单萜化合物22.29% 吴茱萸49.22中单萜化合物71.99%、单萜氧化物9.9%、倍半萜化合物7.28%、倍半萜氧化物4.88% 川芎30.21中苯酞类成分48.4%、芳香族成分13.79%、单萜氧化物11.99%、倍半萜化合物10.19%、单萜化合物7.57% 没药28.13中倍半萜化合物36.14%、单萜化合物15.25%、芳香族成分12.54%、倍半萜氧化物8.87% 当归34.44中苯酞类成分83.86%、单萜化合物7.55%、芳香族成分2.54%、倍半萜化合物1.45% 松节油32.55中单萜化合物58.37%、单萜氧化物36.46%、单萜与芳香族复合结构3.81% 高良姜42.75中单萜氧化物60.88%、倍半萜化合物18.73%、单萜化合物9.63% 蛇床子29.92中单萜化合物84.45%、单萜氧化物9.86%、倍半萜化合物1.42% 乌药22.29中芳香族成分45.9%、倍半萜化合物24.98%、倍半萜氧化物6.89%、单萜化合物6.68% 羌活24.64中单萜化合物85.03%、单萜与芳香族复合结构6.45%、单萜氧化物4.37% 檀香16.57大倍半萜氧化物84.46%、芳香族成分4.02% 紫苏叶23.26大芳香族成分86.54%、倍半萜化合物7.13%、倍半萜氧化物4.51% 广藿香14.15大倍半萜氧化物55.84%、倍半萜化合物41.9% 干姜19.72大倍半萜化合物59.76%、倍半萜与芳香族复合结构8.97%、单萜化合物14.07% 香附14.40大倍半萜氧化物50.59%、倍半萜化合物31.81%、芳香族成分7.53% 白芷11.32大脂肪族及脂肪酸类成分64.59%、倍半萜化合物23.96%、倍半萜氧化物5.12% 肉桂12.47大芳香族成分63.39%、倍半萜化合物33.75%
2.4 利用支持向量机进行毒性强度预测
支持向量机(support vector machine,SVM)是一种针对小样本问题而提出的机器学习方法,可以在样本有限的情况下获得最优解。SVM利用非线性变换将原始变量映射到高维特征空间,在其中构造线性分类函数,既保证了模型具有良好的泛化能力,又解决了“维数灾难”的问题,可用来解决分类、模式识别、回归、拟合等问题。本研究采用Libsvm工具箱,调用相关的SVM模式识别与回归机软件包,进行相应的回归与预测。根据非参数检验得知,不同毒性的挥发油中X1、X2、X4、X8含量显著不同。利用SVM算法,根据X1、X2、X4、X8含量对挥发油的毒性强度(大、中、小)进行预测,建立中药挥发油分类模型,并对性能进行评价。以随机产生29个样本为训练集,4个样本为测试集,创建并训练SVM模型,采用RBF核函数。首先利用交叉验证方法寻找最佳的参数c(惩罚因子)和参数g(RBF核函数中的方差),然后利用最佳参数对模型进行训练。MATLAB训练结果见图1。
结果显示测试集的准确率为100%,表明可通过SVM算法,根据中药挥发油的单萜化合物、单萜氧化物、倍半萜氧化物、单萜与芳香族化合结构的含量,对挥发油的毒性类别(小、中、大)进行预测,预测准确程度良好,具有现实操作性。
表2 不同类型挥发油化学成分毒性Kruskal-Wallis检验结果
变量化学成分类型毒性强度*秩平均值P值 X1单萜化合物118.75 219.610.026 3 8.29 X2单萜氧化物123.50 216.920.023 3 9.79 X3倍半萜化合物110.50 219.110.092 319.00 X4倍半萜氧化物1 7.38 218.940.003 323.00 X5二萜及其氧化物116.00 216.890.459 318.43 X6脂肪族及脂肪酸类成分116.25 215.920.509 320.64 X7芳香族成分116.06 216.690.837 318.86 X8单萜与芳香族复合结构119.00 218.720.046 310.29 X9倍半萜与芳香族复合结构113.50 217.280.160 320.29 X10单萜氧化物与芳香族复合结构117.13 217.720.536 315.00 X11苯酞类成分117.13 217.720.651 315.00 X12其他115.00 216.830.247 319.71
注:*1、2、3分别表示挥发油毒性小、中、大
图1 测试集SVM函数结果对比
2.5 利用支持向量回归机进行回归预测
实际中需要对中药挥发油的毒性进行更加精确的预测,故采用支持向量回归机方法对毒性的具体数值进行预测。模型采用RBF核函数,然后利用交叉验证方法寻找最佳的参数c和参数g,并利用最佳参数训练模型。为避免偶然性,将33个样本分为10组,其中7组样本容量为3,另3组样本容量为4,每组轮流做测试集,进行10次测试,结果见表3。训练集R2平均值为0.715,MSE平均值为0.095,拟合程度良好。预测集R2平均值为0.727,MSE平均值为0.099,预测性能良好。因此,利用SVM算法对中药挥发油的毒性进行回归预测是可行且效果优秀的,模型仍有改进空间,但总体模型与真实值已高度接近。
表3 支持向量回归机测试结果
序号训练集 测试集 R2MSE R2MSE 10.7270.089 0.6030.201 20.6940.103 0.8750.102 30.6640.113 0.7400.095 40.6180.124 0.5740.105 50.6640.118 0.5820.113 60.6530.127 0.9080.014 70.6880.108 0.6720.071 80.6590.124 0.7120.177 90.9020.029 0.7320.084 100.9270.014 0.8730.032 平均值0.7150.095 0.7270.099
3 讨论
对经皮给药而言,大部分药物因不易透过皮肤而导致生物利用度过低甚至无法发挥药效。应用PE是目前解决这一问题的最主要手段,而中药挥发油为常用PE。中药挥发油总数约有300种,目前作为PE应用的仅34种[5]。如何从中药挥发油中遴选安全有效的PE是目前研究的难点。
除透皮吸收促进效果外,安全性是决定PE应用的另一主要因素,皮肤细胞毒性评价是预测PE安全性的一个重要因素。中药挥发油类成分以萜类成分为主,根据文献[6]可分为12类。本研究在皮肤细胞毒性评价的基础上,应用数学模型,深入探讨中药挥发油皮肤细胞毒性与其物质基础即成分类型之间的相关性,结果发现单萜化合物、单萜氧化物、倍半萜氧化物等成分类型与皮肤细胞毒性的相关性最高,初步阐明了中药挥发油毒性作用的物质基础,对于开发高效低毒的中药挥发油PE具有重要意义。
[1] 杨华生,朱庆文,梁秉文.药用辅料在中药经皮给药制剂中的应用[J].中医外治,2007,16(3):3-5.
[2] 陈军,刘培,蒋秋冬,等.中药挥发油作为透皮吸收促进剂的现状与展望[J].中草药,2014,45(24):3651-3655.
[3] 杨文国,姚俊宏,陈军,等.33种辛味中药挥发油皮肤细胞毒性与药性特征的关联性研究[J].南京中医药大学学报,2017,33(6):597-602.
[4] 蒋秋冬,杨文国,蔡皓,等.透皮促渗中药挥发油的化学成分与中药药性关联性研究[J].中国中药杂志,2016,41(13):2500-2505.
[5] 杨文国,陈军,刘培,等.基于数据挖掘方法研究挥发油透皮促渗作用与中药药性间的关联性[J].中国中药杂志,2015,40(23):4609-4615.
[6] 覃洁萍,刘进,陈玉萍,等.解表类中药挥发性成分与药性的相关性研究[J].计算机与应用化学,2013,30(1):85-88.
Study on Correlation Between Chemical Components and Cytotoxicity of TCM Essential Oils Based on SVM
YANG Wenguo1, QIAO Zhaoying2, DAI Shuning2, ZHANG Qinjing2, ZHU Xuemin3, YAO Junhong3, CHEN Jun3,4
To explore the correlation between chemical components and skin cytotoxicity of TCM essential oils; To establish a skin prediction model.The cytotoxicity was evaluated by HaCaT cells located in the active epidermis. The chemical components of TCM essential oils was investigated by GC-MS analysis. The non-parametric statistics was used for feature selection and support vector machine (SVM) was used to establish the prediction model.Monoterpenes, oxygenated monoterpenes, oxygenated sesquiterpene and the combined structure of monoterpene and aromatic had significant correlation with the cytotoxicity (<0.05). Based on the above four chemical components for feature construction, the established skin cytotoxicity prediction model using SVM had good prediction performance. Conclusion SVM can be used to clarify the correlation between chemical components and cytotoxicity of TCM essential oils.
TCM essential oils; skin cytotoxicity; non-parametric statistics; support vector machine
R285.5;R2-05
A
1005-5304(2020)09-0121-05
10.3969/j.issn.1005-5304.201812016
江苏省中药资源产业化过程协同创新中心重点项目(ZDXMHT-1-15);江苏省中医药局科研专项(ZX2016D1);江苏省大学生创新训练计划重点项目(201810315027Z);江苏省高校优势学科建设工程(2014年);南京中医药大学中药学优势学科专项培育基金(2017年)
陈军,E-mail:chenjun75@163.com
(2018-12-02)
(2019-01-28;编辑:陈静)