APP下载

马钱子致大鼠体内毒性的研究*
——“装袋”算法和16S rRNA基因测序技术在毒理学研究中的应用

2024-02-26王曦烨宝乐尔姜明洋李丹白梅荣

生物化学与生物物理进展 2024年2期
关键词:马钱子装袋组学

王曦烨 宝乐尔 姜明洋 李丹 白梅荣

(1)内蒙古民族大学化学与材料学院,通辽 028000;2)内蒙古民族大学,天然产物化学及功能分子合成重点实验室,通辽 028000;3)内蒙古自治区药品检查中心,呼和浩特 010000;4)内蒙古民族大学计算机科学与技术学院,通辽 028000;5)内蒙古民族大学蒙医药研发工程教育部重点实验室,通辽 028000)

毒理学是研究外源性因素对生物系统有害影响的学科。毒理学主要研究化学物质对生物体的毒性反应、严重程度、频率和毒性机制,并对毒性效应进行定性和定量评估。毒理学研究的主要目的是预测毒物对人体和生态环境的危害,为确定安全阈值和采取预防措施提供科学依据[1]。马钱子(Strychnos nux-vomicaL.,SN)是一种传统的中药材,是马钱的干燥成熟种子。马钱子经过加工后用作药物,能够疏通络脉、散结,从而减轻肿胀和疼痛。马钱子具有广泛的药理活性,如抗肿瘤、抗炎和镇痛等,但由于含有马钱子碱、士的宁和其他类型生物碱,马钱子具有靶器官毒性,主要包括肝毒性和肾毒性,这严重限制了马钱子的临床应用[2-3]。因此,有必要全面深入了解马钱子的体内致毒机制。遗憾的是,对马钱子毒性引起的内源性代谢变化知之甚少。马钱子的毒性反应主要与其含有的马钱子碱、士的宁等活性成分有关。

目前,高级化学计量学方法已广泛应用于化学研究中[4-6]。代谢组学是一个以化学计量学为基础的重要研究领域。代谢组学是继基因组学和蛋白质组学之后的一门新兴学科,是系统生物学的重要组成部分。近年来,代谢组学迅速发展并渗透到许多领域,如疾病诊断、药物研发、毒理学、环境科学,以及与人类健康保健密切相关的其他领域。代谢组学研究涉及在一定时间收集细胞中的所有代谢产物。代谢产物反映细胞环境,与细胞的营养状态、药物的影响、环境污染物和其他外部因素密切相关[7-9]。装袋算法是一种基于机器学习的群体学习算法。与传统的代谢组学分类算法相比,装袋算法更适合于对具有小样本量、高维度和稀疏特征的数据进行分类[10]。临床上将30个样本以下称为小样本,而30个以上称为大样本。代谢组学动物实验一般包含3个基本组(即正常组、模型组、给药组,每组8个样本,共24个样本),属于小样本范畴。由于数据的样本量较少且变量极多(几千维甚至上万维),导致数据难以直接进行分析。装袋算法在处理小样本量、高维度数据过程中不损失原始数据信息、准确率高且结果能够得到有效验证[11]。因此,该算法近年来在毒理学研究中得到了广泛应用。毒性目标生物分子相互作用的特异性导致许多毒性数据集的特征非常不平衡,这是基于结构活性关系的化学分类结果不佳的直接原因。Idakwo等[12]使用随机森林作为分类器,以装袋算法作为集成策略,并将随机森林与合成少数类过采样技术(SMOTEENN)学习方法相结合,应用于对高度不平衡的Tox21数据集进行分类。结果表明,该学习方法可以显著改善不平衡的化学毒性分类结果,为了调节毒理学中预测不同营养水平下各种试验物种的急性毒性,Singh等[13]开发了多个物种定量构效关系的数学模型,并且这些基于集成学习方法的分类和回归模型使用装袋算法作为内置算法。结果表明,该模型对于物种的完整数据集具有较高的分类精度(97.82%)。此外,该模型对不同营养水平的不同试验物种具有良好的预测能力,可用于预测新化学品的毒性。目前,将装袋算法融入到代谢组学中以解决生物化学及毒理学方面的问题鲜见报道。Wang等[14]将装袋算法融入代谢组学分析中对蒙药忠伦-5治疗类风湿关节炎数据集进行分类,处理来自健康对照组、模型组及给药组的数据。结果表明,在不同组成的训练样本和测试样本集中应用装袋算法均得到较高的分类准确率,但该研究未对后续的生物标记物筛选及代谢通路的验证做进一步的说明。如果将装袋算法应用于组学数据的分类和计算,不仅可以进一步挖掘毒物的生物学信息,显著提高数据分类的准确率,而且对于药物代谢组学研究方法的扩展和大数据研究的深化都具有重要意义。

人体肠道中寄生着大约10万亿个细菌,它们可以影响人体体重和消化,抵御感染并降低自身免疫疾病的风险[15]。然而,肠道菌群与肝病、肾病和肝肾综合征密切相关[16-18]。与化学药物和生物制剂相比,中药靶点多,作用机制复杂,其药理和毒理学机制可能与人体肠道菌群有关[19]。因此,研究药物毒性机制与肠道菌群的关系,对于全面客观地了解中药具有重要意义。

本研究以灌胃马钱子的大鼠为毒理学研究对象。首先,使用急性、蓄积性和亚急性毒性试验确定马钱子的毒性剂量、毒性强度和毒性靶器官;然后,将装袋算法融入到代谢组学研究中,分析马钱子灌胃前后大鼠血清、肝脏和肾脏中的内源性生物小分子的代谢变化,并提高样本分类的准确率,识别与毒性相关的内源性标记物;最后,通过灌胃后肠道菌群的变化建立各菌群与肝肾毒性之间的联系。本研究的目的是阐明中药马钱子的体内致毒机制,并为其临床上的安全、合理使用提供科学依据。

1 材料与方法

1.1 试剂与仪器

马钱子(批号20200634)由内蒙古民族大学附属医院制剂室提供,在实验之前制备不同浓度的药物水溶液;乙腈和甲酸(色谱纯,美国Thermo Fisher公司);去离子水由Milli-Q纯水仪制备(美国Millipore公司);丙氨酸氨基转移酶(ALT)检测试剂盒(批号43546001)、天门冬氨酸氨基转移酶(AST)检测试剂盒(批号44713101)、尿素氮(UREAL)检测试剂盒(批号48268901)、肌酐(CREP)检测试剂盒(批号47756001)均购自罗氏诊断产品(上海)有限公司;甲醛(批号20180606)购于北京益利精细化学品有限公司;琼脂糖购于西班牙Biowest公司;建库试剂盒购于美国Bioo Scientific公司;测序试剂盒购于美国Illumina公司。利福昔明(rifaximin)购于通辽利群药店。

超高效液相色谱仪(Nexera UHPLC LC-30A,日本岛津公司)+质谱仪(Triple TOF 5600+,美国AB SCIEXTM公司);色谱柱为Waters BEH HILIC Column(100 mm×2.1 mm,1.7 µm,美国沃特世公司);漩涡振荡器(M16710-33,美国Thermo Fisher公司);超声波清洗仪(KQ5200DE,昆山市超声仪器有限公司);台式高速冷冻离心机(Microfuge22R,美国Beckman Coulter公司);超微量分光光度计(NanoDrop2000,美国Thermo Fisher公司);酶标仪(BioTek ELx800,美国Biotek公司);电泳仪(DYY-6C,北京六一生物技术有限公司);PCR仪(ABI GeneAmp®,美国ABI公司);测序仪(Illumina Miseq,美国Illumina公司)。

1.2 实验方法

1.2.1 实验动物

本实验研究经内蒙古民族大学附属医院伦理委员会批准(NMMZDX2021[K]0155)。昆明种大鼠(SPF级,雌雄各半,体重(20±2) g)由辽宁长生生物技术股份有限公司提供(合格证号:SCXK(辽)2015-0001)。动物饲养于内蒙古民族大学蒙医药学院动物实验室(室内温度20~25℃,湿度40%~60%)。

1.2.2 急性毒性实验

a. 预实验

通过预实验来确定100%死亡剂量(Dm)和0%死亡剂量(Dn),为正式实验提供基础数据。在Dm和Dn范围内选个剂量(n=5),计算各组剂量公比r(公式:)和组距k(公式:k=1/r)。

b. 正式实验

取昆明大鼠50只,雌雄各半,按体重和性别随机分为5组,每组均为10只小鼠(马钱子不同剂量给药组:A1~A5)。实验前禁食不禁水12 h,利用预实验所计算出的不同给药剂量对小鼠灌胃给药马钱子。给药后连续观察7~14 d,详细观察并记录中毒表现,如中毒出现的时间、持续时间、恢复时间、最短、最长及平均死忙时间,死忙动物数量等。用Bliss程序计算各组小鼠的半数致死量LD50和LD50的95%可信限。

同时,选取昆明大鼠50只,给予马钱子和利福昔明连续灌胃14 d(利福昔明剂量为50 mg·kg-1·d-1)[20],其余步骤同上。

1.2.3 蓄积毒性实验

40只昆明大鼠(雌雄各半)按体重和性别随机分为正常组、马钱子组,每组均为20只大鼠。给药前12 h禁食不禁水。给药剂量以4 d为1个阶段,第1个阶段每只动物每天给药剂量为LD50的1/10,以后各阶段依次递增1.5倍,直至该组动物死亡一半,同时正常组每日给予与实验组相同剂量的蒸馏水,实验最后1 d计算马钱子的蓄积系数(蓄积系数K=累积剂量/LD50)。

1.2.4 亚急性毒性实验

将30只昆明雄性大鼠随机分为正常组、马钱子高和低剂量组共3组,每组10只。采用经口灌胃染毒法,染毒剂量分别为马钱子高剂量(0.102 9 g/kg)、低剂量(0.051 4 g/kg),染毒1次/d,连续4周,同时正常对照组每日给予与实验组相同剂量的蒸馏水。实验最后1 d染毒前,12 h禁食不禁水,染毒30 min后,对大鼠进行麻醉,从腹主动脉取血,3 000 r/min离心10 min,分离血清,待测血清中ALT、AST、UREAL和CREP等生化指标。取各组大鼠脏器,生理盐水漂洗并用滤纸擦干,称重,取适当肝脏和肾脏固定制作石蜡切片,HE染色,进行组织病理学检查。

1.2.5 代谢产物的前处理

大鼠麻醉腹主动脉取血后,3 000 r/min离心10 min,分离血清,而后立即取100 μl血清样本加入300 μl冷乙腈,震荡提取30 min,在12 000 r/min,4℃下离心10 min,取出100 μl在37℃下真空离心浓缩至干。残渣用100 μl乙腈溶解,于12 000 r/min,4℃下离心10 min,取上清液进样10 μl,用于UPLC-MS检测。质控(quality control,QC)样品为所有样品分别取10 μl进行混合,每8个样品加1个质控样品进行稳定性考察。

将研磨玻璃珠和100 µl冷乙腈添加到50 mg肾脏或肝脏样品中,粉碎3 min。将样品添加到900 µl冷乙腈中,振荡提取30 min,4℃下离心10 min。收集100 μl样品,37℃下真空离心浓缩干燥。将残余物溶解在100 μl乙腈中,4℃下12 000 r/min离心10 min。上清液待测。

1.2.6 色谱和质谱分析条件

色谱分析条件:柱温为35℃,流速为0.300 ml/min。流动相:A,0.1% 甲酸水+1 mmol/L乙酸铵;B,乙腈。流动相梯度组成:0~16 min,5%~50%B;16~20 min,50%B;20~21 min,50%~95%B;21~22.5 min,95%B。

质谱分析条件:分别采用电喷雾电离正离子和负离子模式进行检测,条件如下:离子源温度500℃(正离子)和450℃(负离子),毛细管电压5.5 kV(正离子)和4.4 kV(负离子),扫描范围m/z为100~1 200 u,子离子(破碎离子)扫描范围m/z为50~1 000 u,子离子累积扫描时间为0.01 s,二级质谱选用IDA,“高灵敏度”模式,去簇电压±60 V,碰撞能(35±15)eV。

1.2.7 潜在生物标志物筛选及解析

通过MS-DIAL 4.10软件进行预处理,包括峰提取、去噪音、反卷积,峰对齐,导出CSV格式的三维数据矩阵(原始数据矩阵),再将原始数据导入Matlab 2012软件进行数据分类处理。将提取的峰信息与数据库进行比对,对MassBank(http://www.massbank.jp/,一个高质量的质谱数据库,旨在公开分享从代谢物的化学标准品得到的质谱图以方便用户进行代谢物的鉴定,包含了代谢物的质谱信息以及采集情况)[21]、HMDB(https://hmdb.ca/,加拿大代谢组学创新中心(TMIC)创立的人体代谢组学综合数据库,是最常用的代谢组数据库之一,收录内容包括物质的化学信息、临床数据分子生物学数据等超过11万种代谢物的信息)[22]、GNPS(https://gnps.ucsd.edu/ProteoSAFe/static/gnpssplash.jsp,基于Web的质谱生态系统平台,旨在成为全球范围内组织共享原始、处理或注释碎片质谱数据 (MS/MS) 的开放访问数据库)[23]三个库进行全库检索,筛选生物标记物,这个三维矩阵包括的信息有:样品信息、保留时间、质核比和质谱响应强度(峰面积)。生物标记物筛选条件有:P≤0.05且变量权重值(VIP)≥1;P≤0.05且含量变化倍数(FC)≥1.5或≤0.67。利用HemI软件进行生物标记物的热图分析[24],利用Cytoscape 3.2.1软件建立药物、生物标记物之间的网络关系图,将筛选出的差异代谢产物导入MBRole 2.0软件进行通路富集分析。

1.2.8 代谢组学数据的分类过程

a. 基于装袋算法分类模型的描述

本文使用装袋算法的目的是对马钱子灌胃给药前后大鼠血液、肝脏和肾脏样品的代谢组学数据进行分类[14]。数据集由12组样本组成(正离子条件下正常组和马钱子给药组(血液);负离子条件下正常组和马钱子给药组(血液);正离子条件下正常组和马钱子给药组(肝脏);负离子条件下正常组和马钱子给药组(肝脏);正离子条件下正常组和马钱子给药组(肾脏);负离子条件下正常组和马钱子给药组(肾脏)),每组由8只大鼠组成。在血液代谢数据中,正离子条件下样本数据的维数为2 143,负离子条件下样本数据的维数为716;在肝脏代谢数据中,正离子条件下样本数据的维数为4 112,负离子条件下样本数据的维数为1 226;在肾脏代谢数据中,正离子条件下样本数据的维数为1 668,负离子条件下样本数据的维数为506。

本文采用装袋算法完成代谢组学数据的重采样,即在原始代谢组学数据集上,通过有放回抽样重新选出k个新数据集来训练分类模型。利用训练出来的多个分类器集合来对代谢组学样本进行分类,然后用多数投票或者对输出求均值的方法统计所有分类器的分类结果,结果最高的类别即为最终标签。该方法能够减少单一分类模型容易过拟合的问题,增强学习效果,提高预测准确率。

在实验过程中,为了提高模型的差异性,装袋算法在训练待组合的各个模型的时候是从训练集合中随机抽取数据。对于装袋算法来说,随机采集和训练集样本数n一样个数的样本,得到的采样集和训练集样本个数相同,但是样本内容不同。如果对有n个样本的训练集做k次随机采样,则由于随机性,k个采样集各不相同。该方法通常考虑的是同质弱学习器,相互独立地并行学习这些弱学习器,并按照某种确定性的平均过程将它们组合起来。

如果建立一个由k个分类模型组成的集成模型,假设每个模型在每个样本上的误差是ϵi,该误差服从均值为零,方差为协方差为E=[ϵiϵj]=c的多维正态分布。通过所有集成分类模型得到的平均预测误差是平方误差的数学期望是:

当在误差完全相关(c=v)的情况下,均方误差减少到v,所以集成模型没有任何的效果。如果在错误完全不相关(c=0)的情况下,该集成平方误差的期望仅为1/k*ν,这意味着集成平方误差的期望会随着集成规模增大而线性减小。换句话说,集成方法至少应与其中的任何一种方法表现得一样好,并且如果每一个单独模型的误差是独立的,则集成方法将比其他单一方法表现得更好。

b. 装袋算法结合决策树和KNN模型解决数据分类问题

代谢组学数据具有高维、稀疏,且变量的维度远远大于样本数量的特点。同时,受限于医学实验成本的限制,获取到的数据量是有限的,这样就给此类数据分类模型的建立带来了很大的困难。对于装袋算法来说,可以在不同数据集上训练模型降低分类器的方差,也就是说,装袋算法可以预防过拟合。装袋算法的有效性来自不同训练数据集上单独模型的不同,它们的误差在投票过程中相互抵消。基于上述原因,本文采用装袋算法结合决策树和K最近邻(K nearest neighbor,KNN)模型解决代谢组学数据的分类问题。K最近邻算法是一种监督分类算法。如果一个样本在特征空间中有K个最相似的样本,并且这些样本中的大多数属于某一类别,那么这个样本也属于这一类别[25-26]。

c. 通过训练集和测试集实验得到分类准确率

本文从原始样本集中使用装袋算法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集(k个训练集之间相互独立,元素可以有重复)。对于n个训练集,训练k个决策树和KNN模型,最终分类结果由多数投票的方法产生。在每次实验中,样本数据被分为训练集和测试集,随机抽取训练样本数量n与训练集样本数量相同,其余的测试集样本用于验证模型的分类准确率。同时,通过选择不同训练集和测试集数据的比例,完成不同训练集和测试集的分类实验。

1.2.9 大鼠粪便细菌中总DNA提取与PCR扩增

a. 总DNA提取和检测

按照1.2.4亚急性毒性实验动物处理法,无菌条件下每组收集8只大鼠粪便。利用NanoDrop2000检测DNA纯度和浓度;利用1%琼脂糖凝胶电泳检测DNA完整性。

b. PCR扩增

扩增目标区域为16S V3-V4区,上下游引物序列分别为338F(ACTCCTACGGGAGGCAGCAG),806R(GGACTACHVGGGTWTCTAAT)。

PCR反应参数:95℃预变性3 min;95℃变性30 s,55℃退火30 s,72℃延伸45 s,35个循环;72℃延伸10 min。

c. PCR产物鉴定、纯化及定量

利用琼脂糖凝胶电泳检测产物,每个样本3个PCR重复,将3个重复的PCR产物混合;利用AxyPrep DNA Gel Extraction Kit进行PCR产物纯化;利用QuantusTMFluorometer对PCR产物进行定量分析;利用NEXTFLEX® Rapid DNA-Seq Kit构建Miseq文库,利用Miseq PE300软件平台进行测序。

1.2.10 肠道菌群代谢数据的统计处理

使用Qiime2软件对全部有效的序列进行聚类/去噪,形成特征序列(OTU)。通过与Greengenes Database 13_8,Silva release 132以及UNITE数据库进行比对获得物种注释信息。基于OTU的绝对丰度及注释信息,对不同组别样品在门、纲、目上的群落结构进行统计分析;同时,建立门这个级别上肠道菌群与肝、肾生化指标之间的联系,用以说明灌胃马钱子后肝、肾及肠道菌群发生的相应变化。

2 结果与讨论

2.1 急性毒性试验

预实验中,给药30 s后各组大鼠出现中毒症状,主要表现为焦躁、呼吸急促、心跳加速、全身颤抖、抽搐、最终下肢伸直、上肢弯曲而死亡。死亡时间通常在给药后的5~10 min左右,若30 min内不死则恢复正常。毒性症状的轻重、死亡快慢及死亡率的高低与给药剂量的大小直接相关。马钱子的Dm=271.01 mg/kg,Dn=109.70 mg/kg,r=1.25,k=0.80。

正式实验中,马钱子的LD50值为176.02 mg/kg,LD50的95%可信限为155.18~200.69 mg/kg(表1)。

Table 1 Experimental results for the acute toxicity of SN

2.2 蓄积毒性试验

蓄积毒性是指药物多次少量进入机体后,通过代谢而排出或直接排出,但固定时间内连续反复进入机体时的消化速率超过代谢变化和排泄速率时,药物在体内蓄积量逐渐增加而出现毒性。蓄积作用为出现慢性毒性的基础,通过蓄积毒性实验能够进一步揭示马钱子的毒性特征。

蓄积毒性实验中,给药后第4阶段开始出现大鼠死亡现象,死亡的数量是第5阶段组的一半。此时,大鼠用药总量为1 329.20 mg/kg,蓄积系数K>5,出现了弱蓄积性(表2)。

2.3 亚急性毒性试验

亚急性毒性试验是通过连续3~4周定量给药,研究与药物急性毒性试验结果不同的毒性表现和特点,该实验在毒理学研究中是不可缺少的。由于中药疗程长,亚急性中毒试验占有重要地位。为探讨马钱子的毒性反应性质、量效关系及时效关系,本实验通过给大鼠连续4周灌胃,研究其毒性作用特点。

Table 2 Statistics of total death in the cumulative toxicity test with SN

连续给药4周后,与正常组比较,马钱子高剂量组的AST、ALT和UREAL含量显著升高,说明肝功能及肾功能指标异常(表3)。

组织病理学检查结果显示,正常组肝组织肝小叶结构清晰,组织由膜弹性纤维的致密结缔组织构成,肝细胞圆润、饱满,肝板排列规则、整齐,未见明显的炎性改变(图1a)。正常组肾小球分布均匀,未见明显系膜细胞和基质增生,未见明显的结缔组织增生和炎性细胞浸润(图1d)。马钱子可导致肝组织中少量的肝细胞轻度空泡变性,胞质疏松淡染,可见大小不一的水泡(图1b,c)。马钱子组的肾组织中部分肾小球可见系膜细胞和系膜基质轻微变多,少量肾小管管腔可见嗜酸性物质(图1e,f)。因此,病理变化表明肝脏和肾脏是马钱子的毒性靶器官。由于高剂量马钱子组引起的脏器病理变化更为明显(图1b,e),因此,接下来的代谢组学实验选择高剂量(0.102 9 g·kg-1·d-1)作为实验剂量。

Fig.1 Histopathological changes of the liver (a-c) and kidney (d-f) in rats owing to the subacute toxicity of SN

Table 3 Biochemical indices based on the SN subacute toxicity test(x±s)

2.4 基于装袋算法的数据分类结果

连续灌胃马钱子(0.102 9 g·kg-1·d-1)4周后,采用超高效液相色谱-质谱的正离子和负离子模式分别分析大鼠血液、肝脏和肾脏样品,获得了各组样品总离子流色谱图(图2)。

Fig.2 Total ion flow chromatogram of blood (a, b), liver (c, d) and kidney (e, f) after intragastric administration to rats

在不同组的主成分分析(principal component analysis,PCA)得分图(图3)中,QC样本聚集在一起(几乎重叠),这表明在质谱序列分析期间仪器性能稳定,方法可靠,可以进行后续数据分析。

作为一种无监督的模式识别方法,PCA可以显示数据的原始状态,并直观反映不同样品间的整体差异。马钱子组和正常组(肝脏)之间存在明显的分离边界(图4b)。正常组和马钱子组(血液、肾脏)大鼠的代谢轮廓略有重叠,但有明显的分离趋势(图4a,c)。这些结果表明,马钱子显著影响血液、肝脏和肾脏的代谢过程。然而,PCA有时会存在样本归属不明确的问题。例如,尽管正常组和马钱子组的样本趋于分离,但很难确定重叠部分样本的归属(图4a)。错误的样本分类会导致筛选出错误的生物标志物,并进一步影响代谢通路的推断。因此,下一步将装袋算法应用于组学数据的处理过程。

Fig.3 PCA score plots obtained from the metabolic profiles of blood group (a), liver group (b), kidney group (c)and QC group (d)

Fig.4 PCA score plots obtained from the metabolic profiles of the control group (C), SN group (S) and SN+rifaximin group(S+ rifaximin)

表4列出了决策树和KNN数据分类结果(未使用装袋算法作为内置算法)。通常来说,训练样本的数量越大,模型越可靠,分组准确率越高。决策树的分类结果优于KNN。使用72个训练样本和24个测试样本,决策树模型的分类准确率为87.50%(21/24,24个样本中的21个样本正确分组),KNN模型的分类正确率为79.17%(19/24);使用60个训练样本和36个测试样本,决策树模型的分类准确率为83.33%(30/36),KNN模型的分类正确率为77.78%(28/36);使用48个训练样本和48个测试样本,决策树模型和KNN模型的分类准确率分别为81.25%(39/48)和77.08%(37/48);使用36个训练样本和60个测试样本,决策树模型的分类准确率为78.33%(47/60),KNN模型的分类正确率为73.33%(44/60)。

Table 4 Results of metabonomics data classification(exclusion bagging algorithm)

表5列出了基于装袋算法的决策树和KNN数据分类结果。使用72个训练样本和24个测试样本,决策树模型的分类准确率为95.83%(23/24,24个样本中的23个样本正确分组),KNN模型的分类正确率为87.50%(21/24);使用60个训练样本和36个测试样本,决策树模型的分类准确率为91.67%(33/36),KNN模型的分类正确率为83.33%(30/36);使用48个训练样本和48个测试样本,决策树模型和KNN模型的分类准确率分别为89.58%(43/48)和83.33%(40/48);使用36个训练样本和60个测试样本,决策树模型的分类准确率为88.33%(53/60),KNN模型的分类正确率为80.00%(48/60)。实验结果表明,在使用装袋算法的情况下,决策树和KNN模型的分类准确率显著高于未使用装袋算法的情况,这说明装袋算法有助于提高组学数据的分类准确率。

Table 5 Results of metabonomics data classification (including bagging algorithm)

2.5 主要生物标志物的分析

火山模型用于筛选潜在的生物标志物(图5)。在正离子模式下筛选出2个血液生物标志物(尿素、肌酐);在正离子模式下筛选出2个肝脏生物标志物(甘油单油酸酯、β龙胆二糖),负离子模式下筛选出6个肝脏生物标记物(D-(+)-半乳糖、果糖、海藻糖、帕拉金糖、麦芽糖、华蟾毒精);在正离子模式下筛选出2个肾脏生物标志物(L-谷氨酸、次黄嘌呤核苷)。这些标记物可能是马钱子产生体内毒性的根源。图6显示了不同组别生物标志物的热图,生物标志物信息见表6。

Fig.5 Volcano map for screening the biomarkers (pink dots represent biomarkers with significant changes)

Fig.6 Heatmap of the potential biomarkers that can be regulated by SN

Table 6 Potential biomarkers between the control group and SN group

2.6 血液及肝肾生物标志物的毒性分析

体内多余的氮在肝脏中转化为尿素,尿素在尿液中被当作废物处理。某些疾病发生时,体液(如血液)中的尿素浓度会发生变化,因此,尿素的鉴定在医学诊断领域具有重要意义[27]。高浓度尿素会导致各种严重的疾病,如消化不良、溃疡、癌症、肾功能不全、肾功能衰竭和尿路梗阻等。此外,体内尿素浓度低于正常值可能会导致肝衰竭、肾病综合征、恶病质和其他疾病[28]。肌酸是肌肉代谢的产物,血清肌酐的临床检测是了解肾功能最常用的方法之一。当肾功能不全时,肌酐累积并成为对人体有害的毒素[29]。总之,血液中尿素和肌酐代谢异常表明马钱子可能导致肾功能发生病变。因此,有必要研究肾脏中的代谢产物,以进一步确定马钱子在体内的致毒机制。

通路富集分析显示,与马钱子毒性相关的肝脏生物标志物涉及多种代谢通路,如精氨酸和脯氨酸代谢、ABC转运、蛋白质消化和吸收、维生素消化和吸收,氨酰tRNA生物合成,以及癌症的中心碳代谢等(图7a)。

Fig.7 Bubble diagram of the metabolic pathway based on liver (a) and kidney (b) samples from rats

通路富集分析显示,与马钱子毒性相关的肾脏生物标志物涉及多种代谢途径,如蛋白质消化和吸收、ABC转运蛋白、精氨酸和脯氨酸代谢、突触囊泡循环和嘌呤代谢等(图7b)。

肝脏是参与糖代谢的主要器官,糖代谢紊乱能够导致肝脏胰岛素抵抗[30]。此外,糖代谢的紊乱可能导致慢性丙型肝炎[31]。帕拉金糖是一种蔗糖类似物,其消化速度比蔗糖慢,与蔗糖相比,摄入帕拉金糖可以减少肝脏脂肪生成,更好地维持胆固醇稳态[32];海藻糖对蛋白质和细胞膜具有一定的保护作用,并因其对肝脏损伤的保护作用而引起了广泛关注,海藻糖通过抑制炎症信号、增强抗氧化防御和诱导自噬来保护肝脏[33];果糖被认为是非酒精性脂肪性肝病的主要媒介,临床研究发现,果糖含量与炎症和纤维化程度之间存在显著相关性,果糖诱导许多信号通路,如促进炎症、纤维化等,这表明果糖对肝脏有损害作用,此外,果糖是肝癌发生的危险因素[34],果糖主要在肝脏代谢,有证据表明它在小肠代谢时会导致肠上皮屏障恶化,果糖对肝脏代谢产生负面影响,这在肠-肝轴的病理学中起着关键作用[35];衰老与肝脏的形态和功能变化有关,D-半乳糖可诱导机体衰老,并对肝脏造成各种有害影响[36]。总之,马钱子引起的糖代谢紊乱可能进一步导致肝损伤,这可能是马钱子产生肝毒性的机制之一。

谷氨酸是生物体的主要代谢产物,在各类代谢途径中具有重要意义。谷氨酸是一种参与氮代谢的碱性氨基酸,它在氮同化、氨基酸生物合成和某些胺分解代谢中起关键作用[37]。因此,马钱子引起的谷氨酸代谢紊乱可能导致一系列肾毒性。次黄嘌呤核苷也称为肌苷,它是一种以次黄嘌呤为基础的核糖核苷。转录组中的腺苷脱氨基导致肌苷的形成,这被称为A-to-I RNA编辑。A-to-I RNA编辑在RNA代谢的各个方面都发挥着关键作用,如mRNA稳定性和蛋白质编码等。此外,A-to-I RNA编辑可能与癌症、衰老、神经系统疾病、自身免疫疾病或心血管疾病密切相关[38]。因此,肌苷代谢紊乱可能会产生严重后果。

2.7 肠道菌群致毒机制分析

2.7.1 马钱子灌胃前后肠道菌群的变化

为了确定马钱子对大鼠肠道菌群种类和组成的影响,本文标记了所有样品的OTU。根据门、纲、目分类,对含量前20的菌种进行分析,以确定正常组和马钱子给药组之间的不同菌株。图8显示了肠道菌群的结构变化。

在门水平上,大鼠肠道菌群主要由厚壁菌门、拟杆菌门、螺旋杆菌门、放线菌门、变形菌门、疣微菌门等组成,其中厚壁菌门和拟杆菌门组成约占总细菌数的95%。与正常组(CG)比较,马钱子组(SN)的厚壁菌门、放线菌门和TM7菌门等丰度显著升高,螺旋杆菌门、变形菌门和疣微菌门等丰度显著降低(图8a)。

Fig.8 Schematic diagram of the changes in intestinal flora before and after SN gavage different classification level

在纲水平上,大鼠肠道菌群主要由梭菌纲、杆菌纲、拟杆菌纲、螺旋体纲、产芽胞菌纲、放线菌纲、疣微菌纲、σ变形菌纲等组成,其中梭菌纲、杆菌纲、拟杆菌纲及螺旋体纲的相对丰度占总细菌数的80%以上。与正常组比较,马钱子组的杆菌、拟杆菌、螺旋体纲、生芽生菌纲和TM7_3菌等丰度显著升高,梭菌纲、放线菌、疣微菌纲和变形菌等丰度显著降低(图8b)。

在目水平上,大鼠肠道菌群主要由梭菌目、乳杆菌目、拟杆菌目、螺旋杆菌目、丹毒目、CW040菌目、疣微菌目等组成,其中梭菌目、乳杆菌目、拟杆菌目占总细菌数量的80%以上。与正常组比较,马钱子组的乳杆菌、拟杆菌、螺旋杆菌、丹毒菌目丰度显著升高,梭菌和脱硫弧菌的丰度显著降低(图8c)。

2.7.2 肠道菌群与肝肾生化指标的相关性分析

选择OTU的代表性序列以获取图像注释信息,对每个样品在7种分类水平为界(kingdom)、门(phylum)、纲(class)、目(order)、科(family)、属(genus)、种(Species)上列数目占总序列数的比例进行统计,可以有效地评估样本的物种注释分辨率,图9展示了每个样本中OTU在各分类水平注释的相对程度。从图中可以看出,注释到“属”水平的序列在各个样本中的区分度最高(即在“属”的水平样品个体差异最大),而注释到其他水平的序列区分度不高,因此下一步将分析肠道菌群在“属”水平上相对丰度与血清肝肾功能指数之间的相关性。

Fig.9 Sequence annotation bar chart of each sample at each classification level

为了探讨马钱子影响大鼠肠道菌群的机制,使用Spearman方法分析了肠道菌群在“属”水平上相对丰度与血清肝肾功能指数之间的相关性(图10)。热图分析显示,某些肠道菌群的相对丰度与肝功能(AST和ALT)和肾功能(UREAL)指标密切相关。

马钱子组的UREAL含量与相对丰度降低的益生菌属(Blautia)和拟杆菌属(Bacteroides)呈显著负相关(r=-0.515 5,-0.515 3)(P<0.05)。UREAL是指血浆中的含氮化合物,而不是从肾小球过滤出体外的蛋白质。肾功能不全患者的UREAL水平升高,因此,它在临床上被视为评估肾小球滤过功能的指标[39]。研究发现,人体肠道菌群失调与肾结石形成密切相关。通过比较肾结石组和健康对照组之间肠道微生物的差异,肾结石组中的益生菌属丰度显著降低,这表明肾结石的形成与肠道菌群之间存在关联性,也为肾结石新的治疗方案提供了理论基础[40]。肠道微生物群构成人体最大的微生态系统,该系统与慢性代谢疾病密切相关。研究发现,与对照组相比,慢性肾脏病(CKD)患者的肠道微生物多样性降低,微生物群落发生了显著变化。值得注意的是,CKD组的益生菌属丰度显著下降。本研究结果可作为CKD临床诊断的参考[41]。大量证据表明,肾阳虚证(KYDS)与肠道微生物群的代谢紊乱有关。结合粪便代谢组学和16S rRNA基因测序分析,发现KYDS主要与拟杆菌属的代谢紊乱有关[42]。白藜芦醇可通过调节拟杆菌属和其他细菌的丰度来改善肠道屏障功能、通透性并抑制炎症,进而延缓糖尿病肾病进展[43]。

马钱子组的ALT含量与相对丰度降低的粪厌氧棒菌属(Anaerostipes)和颤螺菌属(Oscillospira)的丰度呈显著负相关(r=-0.648 9,-0.611 7)(P<0.05)。ALT主要存在于肝细胞的细胞质中,其胞内浓度比血清中的浓度高1 000~3 000倍。如果1%的肝细胞被破坏,ALT含量就会翻倍。因此,ALT水平被视为肝功能损害最敏感的检测指标[44]。肝纤维化(HF)是各种慢性肝病的典型表现,它与肠道微生物群的组成和代谢状态密切相关。粪厌氧棒菌属能够促进HF患者肠道中丁酸的生成,进而引发过量氨的生成并影响免疫功能,最终加重HF[45]。研究表明,非酒精性脂肪肝病(NAFLD)受肠道微生物组成的影响。NAFLD组中颤螺菌属的丰度显著低于健康对照组,因此,颤螺菌属可被视为NAFLD发病及进展过程中一种特征性肠道标志物[46]。

Fig.10 Heat map of the correlation between different flora and function indices of liver and kidney

马钱子组的的AST含量与相对丰度升高的双歧杆菌属(Bifildobacterium)和螺杆菌属(Helicobacter)呈显著正相关(r=0.557 8,0.559 2)(P<0.05),与相对丰度降低的粪球菌属(Coprococcus)、脱硫弧菌属(Desulfovibrio)和双茎体菌属(Bilophila)的丰度呈负显著负相关(r=-0.523 5,-0.579 4,-0.622 3)(P<0.05)。AST是肝功能检查的重要指标,可用于检测肝组织是否受损。AST存在于肝细胞的线粒体中,只有当肝组织严重受损时,血清AST才会升高[47]。螺杆菌属,又称幽门螺杆菌,是目前已知的唯一能够在人体胃中存活的微生物物种。流行病学研究表明,感染幽门螺杆菌的患者患非酒精性肝病的风险增加。幽门螺杆菌通过调节激素、促炎细胞因子和肠道微生物组的表达进而影响非酒精性肝病的发病[48]。此外,由幽门螺杆菌感染直接导致的肝病,如NAFLD、病毒性肝炎和肝细胞癌(HCC)等,在全球范围内发病率都很高[49]。非酒精性脂肪性肝炎(NASH)同样受肠道微生物群的影响。研究发现,在NASH患者中,丁酸产生菌(如粪球菌)的丰度显著降低,这表明丁酸产生菌与NASH的发病密切相关[50]。短期过度喂养会导致肝脏脂肪变性,并影响人体肠道微生物群,而双茎体菌属与过度喂养引起的肝脏脂肪变性显著相关[51]。肠道微生物群失衡与丙型肝炎病毒(HCV)感染有关。与健康对照组相比,未经治疗的HCV组中的双茎体菌属丰度降低,表明双茎体菌属可能对HCV感染具有诊断价值[52]。

2.7.3 肠内菌群与马钱子所引起的大鼠体内毒性的相关性

利福昔明是一种广谱肠道抗生素。实验结果表明,长期灌胃给药后,利福昔明对大鼠几乎没有副作用[53]。利福昔明对本实验所涉及的多种肠道菌群(如拟杆菌、粪球菌等)具有非常强的抑制作用[54]。因此,为了验证马钱子的毒性与肠道菌群之间的相关性,以马钱子灌胃大鼠为研究对象,通过急性毒性实验考察利福昔明干预后LD50的变化情况。

在急性毒性试验中,马钱子(利福昔明干扰)的LD50值为209.82 mg/kg,LD50的95%置信限为188.73~234.49 mg/kg。与马钱子组大鼠相比,马钱子+利福昔明组大鼠的LD50值显著升高,表明肠道菌群被抑制后,马钱子的体内毒性降低。实验结果表明,肠内菌群确实与马钱子的体内毒性密切相关。表7为利福昔明干扰后马钱子急性毒性试验结果。

另外,马钱子组和马钱子+利福昔明组大鼠的血清代谢谱界限明显(图4d),说明肠内菌群被利福昔明抑制后,大鼠整体的血液代谢途径发生了较大变化。因此,实验结果进一步表明马钱子的体内毒性与肠道菌群密切相关。

Table 7 Experimental results for the acute toxicity of SN(rifaximin interference)

2.7.4 各组肠道菌群中MetaCyc通路的PCA分析

基于MetaCyc数据通路的功能,采用16S扩展技术获得KEGG数据通路的PCA分析。正常组(C)组和马钱子组(S)之间有分离趋势(图11a),表明两组间存在差异代谢通路。马钱子在大鼠肠道菌群中主要影响P-162-PWY、PWY-7198、PEY-7210、PWY-7315等信号通路(图11b)。下一步工作将对这些信号通路进行逐一分析和验证。

Fig.11 PCA analysis based on KEGG pathway

3 结论

本文通过急性、蓄积性和亚急性毒性试验,分别确定了马钱子致大鼠体内的毒性剂量、毒性强度和毒性靶器官;将装袋算法融入到代谢组学研究中显著提高了组学数据分类的准确率;共鉴定出2种血液内源性代谢物、8种肝脏内源性代谢物以及2种肾脏内源性代谢物,这些代谢产物在大鼠体内的代谢紊乱可能是马钱子毒性产生的根源。根据肠道菌群代谢分析,丰度发生显著变化的粪厌氧棒菌、颤螺菌、螺杆菌、粪球菌、双茎体菌与肝肾功能生理指标密切相关,而益生菌、拟杆菌与肾功能的生理指标密切有关,这表明马钱子导致的肝肾损害机制可能与这些肠道细菌的代谢紊乱有关。下一步将对由马钱子引发变化的肠道菌群信号通路进行逐一分析和验证。本文阐明了中药马钱子在大鼠体内的致毒机制,为马钱子临床的安全和合理使用提供了科学依据。

猜你喜欢

马钱子装袋组学
A Preliminary Study on Legitimacy Identification Standards for Unconventional Treatment Technologies in Traditional Chinese Medicine
新型液动食用菌装袋机的设计要点与应用*
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
板栗的塑料薄膜袋贮藏技术
马钱子碱固体脂质纳米粒在小鼠体内的组织分布
代谢组学在多囊卵巢综合征中的应用
线上称重器给食品装袋带来便捷
马钱子生物碱微囊的制备及评价
蛋白质组学在结核杆菌研究中的应用