APP下载

基于人工智能感官与多源信息融合技术的五味药性二分类辨识方法探讨

2023-05-20任延娜冯文豪范雪花李海洋王艳丽刘瑞新李学林

中草药 2023年10期
关键词:电子鼻B型分类

任延娜,冯文豪,李 涵,范雪花,李海洋,姚 静,王艳丽,刘瑞新*,李学林*

·药剂与工艺·

基于人工智能感官与多源信息融合技术的五味药性二分类辨识方法探讨

任延娜1,冯文豪2,李 涵1,范雪花1,李海洋1,姚 静3, 4, 5, 6,王艳丽3, 4, 5,刘瑞新3, 4, 5, 6*,李学林3, 4, 5, 6*

1. 河南中医药大学,河南 郑州 450046 2. 河南省科学院同位素研究所有限责任公司,河南 郑州 450000 3. 河南中医药大学第一附属医院,河南 郑州 450000 4. 河南省中药临床应用、评价与转化工程研究中心,河南 郑州 450000 5. 河南中医药大学 呼吸疾病中医药防治省部共建协同创新中心,河南 郑州 450046 6. 河南省中药临床药学中医药重点实验室,河南 郑州 450000

探究人工智能感官与多源信息融合技术用于中药五味药性二分类辨识方法的可行性,为中药药性评价提供新的方法借鉴。选取122种仅含单一味不含兼味的5类代表性中药饮片(源自《中国药典》2020年版)及14种常用的食品类样本,使用PEN3型电子鼻及ASTREE、SA402B型电子舌采集136种样本的智能感官信息,以得到的信息矩阵作为自变量(),药典项下的性味描述等作为标杆信息(),利用主成分分析-判别分析(principal component analysis-discriminant analysis,PCA-DA)、最小二乘-支持向量机(least squares-support vector machine,LS-SVM)2种化学计量学方法,分别基于单一型号智能感官设备(单源)和多智能感官信息融合(多源)建立五味二分类(酸/非酸、咸/非咸、辛/非辛、甘/非甘、苦/非苦)辨识模型=(),以交互验证的正判率作为模型优选指标。经留一法交互验证,基于单源信息的五味二分类模型中最大正判率分别是98.53%(ASTREE/PCA-DA、LS-SVM)、97.06%(ASTREE/PCA-DA)、84.56%(ASTREE/LS-SVM)、89.71%(ASTREE/LS-SVM)、84.56%(ASTREE/LS-SVM),基于多源信息的五味二分类辨识模型的最大正判率分别是99.26%[(ASTREE+SA402B)/PCA-DA]、99.26%[(ASTREE+SA402B、PEN3+ASTREE+SA402B)/PCA-DA]、88.97%[(PEN3+ASTREE+SA402B)/LS-SVM]、91.91%[(PEN3+ASTREE+SA402B)/PCA-DA]、86.76%[(ASTREE+SA402B)/PCA-DA],多源信息融合后模型的正判率有所提高,平均提高2.35%(<0.01)。ASTREE型电子舌对于中药五味二分类辨识方面表现良好;多源信息融合后模型的正判率较单独使用任一电子鼻或电子舌均有所提高,为中药五味药性评价提供一定参考。

五味;药性;二分类;智能感官;多源信息融合

中药药性理论包括四气、五味、升降浮沉、归经、毒性等,其中五味理论是中药药性理论的核心内容之一[1]。《神农本草经》指出:“药有酸、咸、甘、苦、辛五味”,首次把药味的概念引入本草著作,产生了药物五味,并将其作为药物五味理论的基本思想[2]。“五味”最初的定义是源于人们对中药滋味、气味的实际感受,故有“非口不能味也”。中药五味药性理论虽然来源于口尝味并和口尝味有着密不可分的关系,且其大部分与口尝味相一致(吻合率为74%[3]),但二者不能完全等同,其含义更多的是中药的功能味、物质基础以及发挥的中药药理作用等。随着广大学者将目光聚焦在传统中医药文化上,越来越多的科学技术被运用在对传统中药饮片五味药性的辨识中。

在生物层面,众多学者采用味觉受体的方式选择五味的受体,探索不同的研究方法,包括对辛[4]、苦[5-6]、酸[7]、甘[8]、咸[9]传统中药五味药性理论的辨识及对其化学生物性实质的系统分析,基于五味药性的定义和功效内涵,从滋味气味、生物效应、体内过程及动力学规律等不同方面,提出中药五味药性的表征方法;在分子层面,韩彦琪等[10]基于五味药性的基本定义以及药物分子-味觉、嗅觉受体的相互作用关系,提出了基于分子对接技术的中药五味药性表征的技术方法和研究路径,尝试从分子学角度区分五味等。以上2方面仅提出了五味药性表征的方法,如何客观地对五味药性进行辨识并量化,人工智能感官(artificial intelligence sense,AIS)技术为其提供了可能。AIS技术是模拟人体感官(眼、舌、鼻、耳和皮肤等)的一类仿生学技术,是判定滋味、气味等的客观方法,最早应用于食品领域[11],主要用于质量评价[12-13]、风味等级划分[14]等。随后在医学保健、药品等多个领域均有所涉及[15],其在中药饮片研究中的应用也越来越受到重视[16]。在中药五味药性评价的过程中,AIS技术能够提取中药的药性特征并依据此进行模式识别[7],这为中药五味药性评价带来新的曙光[17]。中药五味是基于药物的成分,电子舌、电子鼻的响应也是基于药物的成分与物质基础,因此,二者具有一定的联系。

国外学者Kataoka等[18]尝试将电子舌用于有苦味或涩味的药用植物和中药复方的味觉评价和质量控制;国内也有学者对22种常用中药的水煎液进行电子舌检测,得到酸、苦、甜、咸的规律聚类分布图和特征雷达图谱,以及酸、苦、甜味判别分析模型,通过电子舌技术实现了中药不同“滋味”的分类[19];本课题组前期也已采用经典人群口尝法(traditional human taste panel method,THTPM)与电子舌法相结合的方式,以47种天然药物及食品类成分为标准物质,开展了中药4类味觉(酸、甜、苦、咸)的定量与定性研究,达到了80%以上的准确率[20]。以上是对苦味、涩味或是对酸、苦、甜、咸四类“滋味”的研究,并没有对中药的功能味进行系统的研究,也没有对中药功能味做出准确的客观描述,且以上均采用单一的智能感官技术,虽然使用单一智能感官能够通过该仪器的多个传感器获得样本的综合信息,一定程度上具有整体性,但表达的依然是某一感官的单方面信息。那么,将不同的智能感官联合使用,融合多源信息,能否得到更好的五味功能味的分类效果,从而提高中药五味药性评价的准确度,值得深入研究。因此,本研究拟基于智能感官与多源信息融合技术,在前期研究的基础上,扩大样本数量,基于《中国药典》2020年版筛选122种单一味道不含兼味的中药饮片及14种常用食品类成分作为载体,采集136种样本的感官数据,利用主成分分析-判别分析(principal component analysis-discriminant analysis,PCA-DA)、最小二乘-支持向量机(least squares-support vector machine,LS-SVM)2种化学计量学方法分别建立感官数据单源、多源的五味二分类(酸/非酸、咸/非咸、辛/非辛、甘/非甘、苦/非苦)辨识模型,以模型交互验证正判率为指标,探索AIS与多源信息融合技术用于中药五味判别分析的可行性,以期能够实现新的药性定量评价方法的探索。

1 仪器与材料

1.1 仪器

BSA224S-CW型万分之一电子天平,赛多利斯科学仪器有限公司;LCD-A200型电子天平,福州华志科学仪器有限公司;FW-100型高速万能粉碎机,60~180目,北京科伟永兴仪器有限公司;药典筛,四号筛,0.25 μm孔径,浙江上虞市道墟五四仪器厂;30MF5 3L型多功能养生壶,深圳市正云科技有限公司;HK250型科导台式超声清洗器,上海科导超声仪器有限公司;HHS型电热恒温水浴锅,常州普天仪器制造有限公司;TD5M型高速离心机,上海卢湘仪离心机仪器有限公司;PEN3型电子鼻(传感器信息见表1),德国Airsense公司;ASTREE型电子舌(传感器信息见表2),法国Alpha M. O. S.公司;SA402B型电子舌(传感器信息见表3),日本Insent公司。

1.2 材料

所选122种中药饮片均收载于《中国药典》2020年版(酸味12种,辛味31种,咸味7种,甘味36种,苦味36种),因所记载酸味无兼味与咸味无兼味中药较少,同时考虑甘味饮片水煎液味淡,对于后续模型分类贡献较小,增补乳酸、无水柠檬酸、苹果酸、黑醋、白醋为酸味样本;增补食盐、NaCl为咸味样本;增补红糖、蔗糖、果糖、饴糖、麦芽糖、葡萄糖、核糖为甘味样本;共计136种样本,见表4。

表1 PEN3型电子鼻传感器敏感物质

表2 ASTREE型电子舌传感器与味觉信息

表3 SA402B型电子舌8根传感器与11种味觉值的匹配信息

“×”表示无味觉信息值

“×” indicates no taste information value

表4 136种样本来源信息

续表4

编号类别名称产地批号编号类别名称产地批号编号类别名称产地批号 88甘味山药河南2007031105苦味黄连重庆2007231122苦味丹参山西2007223 89 月季花−−106 黄柏四川2007153123 马鞭草−− 90 黄芪甘肃191103107 龙胆辽宁2001022124 浙贝母浙江2008101 91 石斛四川200401108 苦参吉林2001080110125 莲子心湖南191102 92 酒黄精湖北191001109 赤芍内蒙古200901126 绵萆薢江西2006223 93 蜂蜜吉林1909307110 连翘陕西191105127 虎杖安徽2002181 94 红糖山东6926636302689111 大青叶甘肃1912032128 射干河北191119 95 蔗糖山东692663630267112 板蓝根安徽191102129 白蔹湖南1901080062 96 果糖河南−113 山豆根广西19110209130 漏芦内蒙古1904092 97 饴糖河南190421114 大黄甘肃2007093131 大血藤湖北1908101 98 麦芽糖河南20170519115 防己江西1912311132 千里光−− 99 葡萄糖山西20170321116 路路通湖北2001292133 川木通四川2001101 100 D-核糖河南−117 荷叶湖南2006122134 北刘寄奴湖北1912012 101苦味栀子江西200901118 萹蓄安徽1908240102135 北豆根−− 102 王不留行河南200601119 瞿麦河北1909160362136 预知子−− 103 黄芩山西2009101120 槐花山东1812292 104 胡黄连西藏1904091121 茜草山西1912172

“−”表示从市场零售购买,无批号记载

“−” indicates purchase from retail in the market, without batch number record

2 方法

聘请河南中医药大学第一附属医院在中药鉴定方向工作多年有丰富经验的施钧瀚副主任药师对所购买的中药饮片进行初步筛选,根据结果将存在争议的饮片筛选出,按照《中国药典》2020年版项下性状鉴别、显微鉴别、薄层鉴别等方法对其进行检验与验证,若不符合要求,仍需购买新的样本作为补充,最终确定所有样本均为正品且符合《中国药典》2020年版规定。

2.1 智能感官信息(X)值的获取

2.1.1 基于PEN3型电子鼻获取值

(1)样本制备:称取所购买的样本适量,置于万能粉碎机打碎,过4号筛得到粉末15 g,备用。

(2)信息采集:取样本粉末2 g,置于25 mL的烧杯中,双层保鲜膜封口,于室温24 ℃左右、相对湿度82%左右的条件下放置30 min后测试。采用直接顶空吸气法直接将进样针头插入含样本的密封样本杯中,电子鼻进行测定。

测定条件:采样时间为每组1 s;传感器自清洗时间为80 s;传感器归零时间为5 s;样本准备时间为5 s;进样流量为400 mL/min;分析采样时间为60 s。每个样品采集3次,取平均值,得到10根传感器嗅觉信息矩阵(136×10)。

2.1.2 基于ASTREE型电子舌获取值

(1)饮片水煎液的制备[21-22]:参考《中国药典》2020年版推荐用量的均值制备122种中药饮片水煎液。取药典用药量范围平均值(如山茱萸用量为6~12 g,则取9 g)的10倍量90 g制备样本,将其置于煎药壶中,一煎加水以液面淹没过药材约2~5 cm,浸泡30 min,武火煮沸后用文火煎30 min;二煎加水以液面没过药材约1~2 cm,武火煮沸后再用文火煎煮20 min,合并滤液,混匀,冷至室温,4000 r/min离心15 min,取上清液,定容至1000 mL,取100 mL灌装,压盖,高温蒸汽灭菌,备用(煎药所用水均为纯水)。

(2)添加剂样本的配制:所增补食品或食品添加剂类样本的配制:将麦芽糖、饴糖、葡萄糖、红糖、蔗糖、果糖、-核糖、乳酸、-苹果酸、无水柠檬酸、食盐、NaCl配制为质量浓度为4%的溶液;将黑醋、白醋配制为体积浓度为5%的溶液。

(3)信息采集:参考文献报道方法[23-24],每次采样时间120 s,后接清洗时间10 s×2次,每个样本重复测量5次,取后3次测试结果的平均值,实验结束最后的清洗时间为120 s×3次。输出数据发现传感器UMS(鲜味)对于所有样本检测值均为 −9 997.21,该变量对于模型构建或分类无贡献,故删去该传感器,留下6根传感器(如表2所示),得到6根传感器味觉信息矩阵(136×6)。

2.1.3 基于SA402B型电子舌获取值

(1)样本制备:同“2.1.2”项下样本制备方法。

(2)信息采集:参考文献报道方法[25],得到8根传感器输出的11种味觉值的信息矩阵(136×11)。

2.2 标杆信息的获取

122种中药饮片以药典【性味与归经】项下味的描述作为标杆信息(),14种食品类样本以参考文献及古籍等分类为标准,若无参考信息,暂将其“滋味”定义为“药味”。其中,甜味添加剂红糖味甘;麦芽糖性味甘温[26];饴糖、葡萄糖功效与果糖类似[27],具有补体虚寒冷、健壮脾胃、润肺止咳、补中益气,治虚劳腹疼、吐血健脾的作用,认为其为甘味;酸味样本补充为黑醋、白醋,记载于《本草别录》,味酸。样本共分为酸和非酸样本2类,标杆信息“1”代表酸,“2”代表非酸(咸、辛、甘、苦分类同)。

2.3 辨识模型的构建

2.3.1 基于单源智能感官信息的辨识模型构建 分别以PEN3型电子鼻、ASTREE型电子舌、SA402B型电子舌3种感官信息矩阵为自变量(136×,表示传感器/变量个数),以中国药典【性味与归经】项下味的描述等为标杆信息,利用PCA-DA、LS-SVM 2种化学计量学方法建立感官数据的五味二分类(酸/非酸、咸/非咸、辛/非辛、甘/非甘、苦/非苦)单源辨识模型=(),模型验证方法为留一法交互验证。具体建模方法参考文献报道[20]。

2.3.2 基于多源信息融合的辨识模型构建 辨识模型构建方法同“2.3.1”项,其中自变量(136×,表示传感器/变量个数)分别是以PEN3型电子鼻、ASTREE型电子舌和SA402B型电子舌的感官信息两两组合(二源数据融合)与PEN3型电子鼻、ASTREE型电子舌和SA402B型电子舌的感官信息共同组合(三源数据融合)组成的信息矩阵。

2.4 模型原始变量(传感器)对分类贡献度的追踪

以PEN3型电子鼻的10根传感器、ASTREE型电子舌6根传感器与SA402B型电子舌11个味觉变量信息为原始变量,结合模型原始变量载荷图,通过各传感器所携带的变异信息值(Wilk’s Lambda值),追踪各传感器对模型分类的贡献度大小。

2.5 模型的建立与评价

由于传统数据分析和提取方法不适合于多种感官信息交叉的矩阵,本研究在确定自变量与因变量的基础上,建立数学模型实现对感官信息的预测和辨识,且由于中药的特殊属性以及采集的数据量较大,在此基础上还要节约时间成本,因此,选择PCA-DA、LS-SVM 2种化学计量学方法建立感官数据的五味二分类辨识模型,以交互验证的正判率作为模型优选指标,并综合1值对模型判别结果进行评价与探析。PCA-DA算法,即将PCA与DA结合,是一种基于PCA的分析方法,通过最大化类间方差的比率和最小化类内方差的比率来进一步压缩高维数据,从而探索能够解释数据集主要趋势的变量的组合[28-29]。LS-SVM是SVM在二次损失函数形式下的一种扩展,通过求解一组线性方程代替支持向量机中复杂的二次优化问题的非线性建模方法,其保留了SVM处理小样本、高维、非线性问题的能力[30]。其中1值为精确率(precision)和召回率(recall)的调和平均,其取值在0~1,数值越大表示模型效果越好。

1=(精确率×召回率×2)/(精确率+召回率)

精确率=TP/(TP+FP)

召回率=TP/(TP+FN)

TP代表真阳性,FP代表假阳性,FN代表假阴性

3 结果

3.1 酸和非酸二分类辨识结果

3.1.1 基于PEN3型电子鼻的酸和非酸二分类辨识结果

(1)PCA-DA辨识结果:变量选择10个,数据缩放选择自动缩放,识别模式选择线性,验证方法选择百叶窗交互验证。选取4个主成分时判别错误率最低,4个主成分得分之和达99%以上,可解释样本大部分变异信息。模型交互验证正判率为87.81%,且由模型主成分得分图(图1)可以看出,2类样本在二维空间中有部分重叠,但根据模型正判率结果来看,都实现了良好的分类,且不存在未分类样本。

如表5所示,根据PEN3型电子鼻10根传感器所携带的变异信息值,变异信息值越小表明变量所携带变异信息越多。二分类辨识模型中7、10、8、6号传感器所携带变异信息较多,对酸和非酸模型分类的贡献度较大,1号传感器所携带的变异信息较少。结合图2模型变量载荷图,7、10、8、6号传感器均为负相关变量。

(2)LS-SVM辨识结果:变量选择10个,通过优化LS-SVM的核函数类型及gam值(LA-SVM中的正则化参数,决定了适应误差的最小化和平滑程度)等参数来优化模型,选取最优模型正判率为86.03%。

图1 PCA-DA模型主成分得分图(PEN3型电子鼻)

表5 PEN3型电子鼻的变异信息值

图2 PCA-DA模型变量载荷图(PEN3型电子鼻)

3.1.2 基于ASTREE型电子舌的酸和非酸二分类辨识结果

(1)PCA-DA辨识结果:变量选择6个,数据缩放选择自动缩放,识别模式选择线性,验证方法选择百叶窗交互验证。选取4个主成分时判别错误率最低,4个主成分得分之和达99%以上,可解释样本大部分变异信息。模型交互验证正判率为98.53%,且由模型主成分得分图(图3)可以看出,2类样本在二维空间中都实现了良好的分类,且不存在未分类样本。

如表6所示,根据ASTREE型电子舌6根传感器所携带的变异信息值,二分类辨识模型中1、6、2、3号传感器所携带变异信息较多,对酸和非酸二分类模型的贡献度较大。由图4可知,1、6、2号传感器为正相关变量,3号传感器为负相关变量。

图3 PCA-DA模型主成分得分图(ASTREE型电子舌)

表6 ASTREE型电子舌的变异信息值

图4 PCA-DA模型变量载荷图(ASTREE型电子舌)

(2)LS-SVM辨识结果:变量选择6个,通过优化LS-SVM的核函数类型及gam值等参数来优化模型,选取最优模型正判率为98.53%。

3.1.3 基于SA402B型电子舌的酸和非酸二分类辨识结果

(1)PCA-DA辨识结果:变量选择11个,数据缩放选择自动缩放,识别模式选择线性,验证方法选择百叶窗交互验证。选取5个主成分时判别错误率最低,5个主成分得分之和达99%以上,可解释样本大部分变异信息。模型交互验证正判率为94.85%,且由模型主成分得分图(图5)可以看出,两类样本在二维空间中有部分重叠,但根据模型正判率结果来看,都实现了良好的分类,且不存在未分类样本。

如表7所示,根据SA402B型电子舌11个味觉变量信息所携带的变异信息,二分类辨识模型中4、5、9、8号传感器所携带变异信息较多,对酸和非酸模型分类的贡献度较大,6号传感器所携带的变异信息较少。结合图6模型变量载荷图可知,5号传感器为正相关变量,4、9、8号传感器为负相关变量。其中2号传感器距离原点较近,说明该特征属性的波动对样本之间的区别贡献不大。

图5 PCA-DA模型主成分得分图(SA402B型电子舌)

表7 SA402B型电子舌的变异信息值

图6 PCA-DA模型变量载荷图(SA402B型电子舌)

(2)LS-SVM辨识结果:变量选择11个,通过优化LS-SVM的核函数类型及gam值等参数来优化模型,选取最优模型正判率为91.91%。

3.1.4 基于PEN3电子鼻+ASTREE型电子舌+SA402B型电子舌的酸和非酸二分类辨识结果

(1)PCA-DA辨识结果:变量选择27个,数据缩放选择自动缩放,识别模式选择线性,验证方法选择百叶窗交互验证。选取17个主成分时判别错误率最低,17个主成分得分之和达99%以上,可解释样本大部分变异信息。模型交互验证正判率为97.79%,且由模型主成分得分图(图7)可以看出,2类样本在二维空间中有部分重叠,但根据模型正判率结果来看,都实现了良好的分类,且不存在未分类样本。

图7 PCA-DA模型主成分得分图(PEN3电子鼻+ASTREE型电子舌+SA402B型电子舌)

如表8所示,根据27个变量所携带的变异信息值,二分类辨识模型中11号(SRS传感器/ ASTREE型电子舌)、16号(BRS传感器/ASTREE型电子舌)、20号(sourness/SA402B型电子舌)、12号(GPS传感器/ASTREE型电子舌)、13号(STS传感器/ASTREE型电子舌)所携带变异信息较多,对酸和非酸模型分类的贡献度较大,22号(astringency/SA402B型电子舌)、23号(AB/SA402B型电子舌)所携带变异信息较少。且结合图8所示,11、12、16号为正相关变量,20、13号为负相关变量。18号(HB/SA402B型电子舌)距离原点较近,说明其特征属性的波动对样本分类影响较小。

表8 3类传感器融合的变异信息值

图8 PCA-DA模型变量载荷图(PEN3电子鼻+ASTREE型电子舌+SA402B型电子舌)

(2)LS-SVM辨识结果:变量选择27个,通过优化LS-SVM的核函数类型及gam值等参数来优化模型,选取最优模型正判率为97.06%。

因基于PEN3型电子鼻+SA402B型电子舌、PEN3型电子鼻+ASTREE型电子舌与SA402B型电子舌+ASTREE型电子舌的二源感官数据融合下的模型二分类辨识方法与“3.1.4(1)”项均类似,仅自变量有所不同,因此,本项仅保留模型判别结果(下文同),如表9所示。

将136种样本分为酸和非酸2类,二分类辨识结果基本达到了预期。其中,单源智能感官辨识结果中,除电子鼻数据分类结果相对较差,其余都达到了90%以上,且ASTREE型电子舌正判率较高于PEN3型电子鼻和SA402B型电子舌;多源信息融合的结果显示,模型最优正判率高于单源智能感官模型最优正判率。由1值结果可知,PCA-DA模型的1值整体高于LS-SVM,LS-SVM模型中的部分1值不可用,且基于电子鼻的1值较小,表明PCA-DA模型准确度较好。

表9 单源多源数据的酸和非酸二分类模型及参数对比

“*”表示最高正判率,“”表示传感器/变量个数,“NA”表示无法得到有效值,下表同

“*” indicates the highest positive judgment rate, “” indicates the number of sensors/variables, “NA” indicates not available, the table below is the same

3.2 咸和非咸二分类辨识结果

本项下模型二分类辨识方法与“3.1”项均类似,自变量与因变量有所不同,因此,仅保留模型判别结果,如表10所示。

基于PEN3型电子鼻、ASTREE型电子舌和SA402B型电子舌的咸与非咸二分类辨识模型可以得到,单源智能感官辨识结果中,ASTREE型电子舌正判率表现相对较好于PEN3型电子鼻和SA402B型电子舌。多源信息融合结果显示,模型正判率相对较高于单源智能感官模型正判率。由1值可知,除电子鼻外,其他单源或多源的PCA-DA模型的1值整体高于LS-SVM,LS-SVM模型中的部分1值不可用。基于单源、多源数据融合的模型正判率结果见表10。

表10 单源多源数据的咸和非咸二分类模型及参数对比

3.3 辛和非辛二分类辨识结果

本项基于PEN3型电子鼻、SA402B型电子舌和ASTREE型电子舌的辛与非辛二分类辨识模型可以得到,单源智能感官辨识结果中,基于ASTREE型的PCA-DA算法的模型正判率较低于PEN3型电子鼻的,而基于ASTREE型电子舌的LS-SVM算法的正判率较高于PEN3型电子鼻和SA402B型电子舌;多源信息融合结果显示,模型最优正判率高于单源智能感官模型最优正判率。由1值可知,基于PEN3型电子鼻+ASTREE型电子舌的PCA-DA模型的1值大于LS-SVM,其他单源或多源的PCA-DA模型的1值小于LS-SVM,PCA-DA模型中的部分1值不可用。基于单源、多源数据融合的模型正判率结果见表11。

3.4 甘和非甘二分类辨识结果

基于PEN3型电子鼻、SA402B型电子舌和ASTREE型电子舌的甘与非甘二分类辨识模型可以得到,单源智能感官辨识结果中,ASTREE型电子舌正判率结果较高于PEN3型电子鼻和SA402B型电子舌。多源信息融合结果显示,模型最优正判率高于单源智能感官模型最优正判率。由1值可知,基于PEN3型电子鼻+ASTREE型电子舌以及PEN3型电子鼻+ASTREE型电子舌+SA402B型电子舌数据融合的PCA-DA模型的1值大于LS-SVM,其他单源或多源的PCA-DA模型的1值小于LS-SVM。基于单源、多源数据融合的甘与非甘二分类辨识模型正判率见表12。

表11 单源多源数据的辛和非辛二分类模型及参数对比

3.5 苦和非苦二分类辨识结果

基于PEN3型电子鼻、SA402B型电子舌和ASTREE型电子舌的苦与非苦二分类辨识模型可以得到,单源智能感官辨识结果中,ASTREE型电子舌正判率结果较高于PEN3型电子鼻和SA402B型电子舌。多源信息融合结果显示,模型最优正判率高于单源智能感官模型最优正判率。由1值可知,基于PEN3型电子鼻+ASTREE型电子舌+SA402B型电子舌数据融合的PCA-DA模型的1值大于LS-SVM,其他单源或多源的PCA-DA模型的1值小于LS-SVM,PCA-DA模型中的部分1值不可用。基于单源、多源数据融合的苦与非苦二分类辨识模型正判率见表13。

表12 单源多源数据的甘和非甘二分类模型及参数对比

表13 单源多源数据的苦和非苦二分类模型及参数对比

4 讨论

4.1 酸味、咸味样本的分析

由本研究结果可知,基于单源、多源信息融合构建的模型对酸味、咸味二分类能力较好,甘味、辛味次之,苦味最小。且根据1值显示,对于酸味、咸味样本,即使PCA-DA、LS-SVM 2种算法模型的正判率较高,但其对应的1值部分差值悬殊,且部分1值不可用。推测其原因是酸味、咸味样本与其他味样本之间差异大,特征明显,甘味与辛味样本基数较大,所能筛选的共有特点较多,对于模式识别结果存在影响。而苦味正判率相对较小,与中药水煎液的共性——苦有关,因此苦味样本与非苦味样本的差异不够明显,导致模型不易区分,这点从电子舌苦味输出均较高可以看出。

以PEN3型电子鼻响应分析为例,对于酸味样本,由表5可知,对酸和非酸二分类结果贡献度较大的原始变量是7、10、8、6号传感器,根据PEN3型电子鼻10根传感器对应的敏感物质,这些传感器响应的物质主要为硫化合物、烷类、脂肪族、醇和部分芳香族化合物;对于咸味样本,对咸和非咸二分类结果贡献度较大的原始变量是1、3、5、9号传感器,这些传感器响应的物质主要为芳烃化合物、氨、芳香分子、烯烃、芳族、极性分子、硫的有机化合物。结合文献研究,如山茱萸、乌梅等酸味样本,其中山茱萸包括环烯醚萜、鞣质、黄酮、三萜、芳香酚酸、挥发油类等化学成分[31],乌梅中主要化学成分类型为有机酸类、黄酮类、萜类、醇类、芳香类化合物等[32],说明电子鼻能够实现酸味样本辨识是具有相应物质基础的。

4.2 辛味样本的分类

PCA-DA算法模型中,单源信息建模时,电子鼻对于辛+非辛的二分类判别显示出明显的优势,主要原因是所选择的辛味饮片大多气味强烈,如生姜、荆芥、大蒜、薄荷、花椒、丁香、小茴香、八角茴香等,具有明显可嗅的辛辣味道,所含有的挥发性成分多,因此,电子鼻信息值建模效果较好。本研究中,虽然所选择的电子舌不含有辛味传感器,但依然将辛味药物纳括在内,原因在于,一方面,查阅文献可知,已经有相关学者通过电子舌数据分析了辛味药物的物质基础并实现了其分类[33];另一方面,辛味药物常含有较多的挥发性成分,且具有明显的刺激性气味,本研究添加了电子鼻技术作为相应支撑,利用多传感器融合技术将多种感官信息进行组合,提取特征分析,作为分类判别的依据。

4.3 未分类与误分类样本的分析

经统计发现,2种判别模型均存在误分类的样本,不存在未分类的样本,其中,误分类样本在PCA-DA或LS-SVM判别模型中分布较集中,以在本研究中分类结果较好的酸味、咸味为例,如酸味,单源及多源数据融合下,误分类的样本主要集中在山楂叶、布渣叶、花蕊石、黑醋,花蕊石描述为“气微、味淡”,多外用,水煎液味道淡,略苦,不具有明显酸味,其功效化瘀止血,与酸“能收、能涩”相对应,但其味淡可能对于电子舌数据融合表征造成影响以至于分类错误;而黑醋出现多次误分类,考虑其主要原因是所购买的为市售黑醋样本,其中存在的添加剂等成分影响其特征。咸味,单源及多源数据融合下,误分类的样本主要集中在瓦楞子、石决明、珍珠母、地龙等。地龙的药效成分主要为蛋白及多肽、酶类、核苷酸、氨基酸、微量元素 等,与普通咸味药不同之处在于其含有的矿物质较少[34];且有学者曾从地龙水煎液中检测出32个挥发性成分,有12个成分能够嗅出气味,地龙的腥臭味大多源于此[35]。这可能是其与其他咸味样本相比较独特之处。而其他样本未正确分类的原因尚需进一步研究。

4.4 多源信息融合分析

多源信息融合即把多类传感器数据融合并做预处理,在一定准则下加以自动分析、综合的信息处理过程。从本研究结果来看,多传感器信息融合建模的正判率显然更为理想,其中酸味提高的较少为0.73%,辛味提高的较多为4.41%,总体来讲,多传感器信息融合建模后模型正判率较单一的AIS技术平均提高2.35%,多种信息的互补初步实现了中药五味的二分类。本研究是基于多传感器间的数据级融合,未来也可探讨特征级融合和决策级融合是否可以进一步改善其分类性能。特征级融合又称中级融合,即首先提取各传感器原始信息特征矢量,然后基于融合的特征矢量对样本识别和评估。决策级融合又称高级融合,首先分别提取各传感器原始数据的特征信息,生成特征矢量来识别和预测目标,然后融合各传感器的识别结果,得到被测目标的一致性解释说明。且在本研究中,将电子舌与电子鼻的信息值融合在一起,其输出值一定条件下属于两种不同系统的感官信息,在模式识别之前,如何将不同系统的智能感官信息进行前处理,为不同的模式识别提供多样的预处理方法,可能是优化模式识别结果的突破点之一。

5 结论

本研究中,以3种智能感官对五味二分类的辨识结果可见,相比于PEN3型电子鼻与SA402B型电子舌,ASTREE型电子舌输出的信息值整体正判率较高。经多传感器信息融合后,新组成的数据集辨识模型的正判率较单独使用任一电子鼻或电子舌均有所提高。综上,本研究基于AIS与多源信息融合技术建立的中药五味二分类模型,达到了分类需求,能够为中药五味辨识提供一定的参考。

利益冲突 所有作者均声明不存在利益冲突

[1] 鲁耀邦, 赵权. 中药学 [M]. 北京: 中国农业大学出版社, 2015: 17-25.

[2] 张铁军, 刘昌孝. 中药五味药性理论辨识及其化学生物学实质表征路径 [J]. 中草药, 2015, 46(1): 1-6.

[3] 周祯祥, 汪琼, 李晶晶, 等. 基于《中国药典》(2010年版) 中的五味研究 [J]. 湖北中医药大学学报, 2015, 17(2): 63-64.

[4] 孙玉平, 张铁军, 曹煌, 等. 中药辛味药性表达及在临证配伍中的应用 [J]. 中草药, 2015, 46(6): 785-790.

[5] 张静雅, 曹煌, 许浚, 等. 中药苦味药性表达及在临证配伍中的应用 [J]. 中草药, 2016, 47(2): 187-193.

[6] Matsunami H, Montmayeur J P, Buck L B. A family of candidate taste receptors in human and mouse [J]., 2000, 404(6778): 601-604.

[7] 曹煌, 张静雅, 龚苏晓, 等. 中药酸味的药性表达及在临证配伍中的应用 [J]. 中草药, 2015, 46(24): 3617-3622.

[8] 张静雅, 曹煌, 龚苏晓, 等. 中药甘味的药性表达及在临证配伍中的应用 [J]. 中草药, 2016, 47(4): 533-539.

[9] 张静雅, 曹煌, 龚苏晓, 等. 中药咸味药性表达及在临证配伍中的应用 [J]. 中草药, 2016, 47(16): 2797-2802.

[10] 韩彦琪, 许浚, 龚苏晓, 等. 基于味觉、嗅觉受体分子对接技术的中药性味物质基础研究的路径和方法 [J]. 中草药, 2018, 49(1): 14-19.

[11] 刘淼. 智能人工味觉分析方法在几种食品质量检验中的应用研究 [D]. 浙江大学, 2012.

[12] Fei C H, Ren C C, Wang Y L,. Identification of the raw and processedbased on the electronic nose coupled with chemometric methods [J]., 2021, 11(1): 1849.

[13] Li Y, Fei C H, Mao C Q,. Physicochemical parameters combined flash GC E-nose and artificial neural network for quality and volatile characterization of vinegar with different brewing techniques [J]., 2022, 374: 131658.

[14] 韦真博. 伏安型电子舌的研发及其在食品检测中的应用[D]. 浙江大学, 2011.

[15] Nissen F, Quint J K, Morales D R,. How to validate a diagnosis recorded in electronic health records [J]., 2019, 15(1): 64-68.

[16] 白杰, 高利利, 张志勤, 等. 电子舌技术的原理及在中药领域的应用 [J]. 中南药学, 2021, 19(1): 78-84.

[17] 贾灿潮, 李俊妮, 李荣, 等. 中药快速分析技术的发展及其前景 [J]. 药物分析杂志, 2018, 38(9): 1476-1483.

[18] Kataoka M, Tokuyama E, Miyanaga Y,. The taste sensory evaluation of medicinal plants and Chinese medicines [J]., 2008, 351(1/2): 36-44.

[19] 杜瑞超, 王优杰, 吴飞, 等. 电子舌对中药滋味的区分辨识 [J]. 中国中药杂志, 2013, 38(2): 154-160.

[20] 王艳丽, 陈鹏举, 桂新景, 等. 基于电子舌的天然药物的四类味觉分类辨识研究 [J]. 中华中医药杂志, 2021, 36(1): 423-433.

[21] 蒋志, 蒋丽霞, 李智韬, 等. 中药汤剂煎煮方法及影响因素研究进展 [J]. 广州中医药大学学报, 2022, 39(2): 458-462.

[22] 李艳, 白明, 宋亚刚, 等. 中药标准汤剂的研究与思考 [J]. 中草药, 2018, 49(17): 3977-3980.

[23] Lin Z Z, Zhang Q, Liu R X,. Evaluation of the bitterness of traditional Chinese medicines using an E-tongue coupled with a robust partial least squares regression method [J]., 2016, 16(2): 151.

[24] 刘瑞新, 李慧玲, 李学林, 等. 基于电子舌的穿心莲水煎液的掩味效果评价研究 [J]. 中草药, 2013, 44(16): 2240-2245.

[25] 谢亚妮, 沈思涵, 陈光宇, 等. 基于电子舌智能感官评定与人工评价结合的五汁饮矫味技术研究 [J]. 中国现代应用药学, 2022, 39(6): 772-776.

[26] 卢传坚. 孩子肝脾不和, 可以吃点麦芽糖 [J]. 家庭医药.快乐养生, 2019(1): 44.

[27] 刘宗利, 李克文, 王京博, 等. 低聚果糖的理化特性、生理功效及其应用 [J]. 中国食品添加剂, 2016(10): 211-215.

[28] 王小鹏, 张璐, 陈鹏举,等.近红外光谱技术应用于中药四类味觉分类辨识的可行性分析 [J]. 中草药, 2023, 54(4): 1076-1086.

[29] Jiang H Z, Hu Y L, Jiang X S,. Maturity stage discrimination offruit using visible and near-infrared hyperspectral imaging [J]., 2022, 27(19): 6318

[30] 丁海泉, 温江北, 高洪智, 等. 最小二乘支持向量机用于人参皂苷近红外光谱分析研究 [J]. 现代农业装备, 2021, 42(5): 17-22.

[31] 范倩, 陈雪冰, 荣莉, 等. 山茱萸化学成分、生物活性、复方应用及质量控制研究进展 [J]. 天然产物研究与开发, 2020, 32(7): 1244-1258.

[32] 杨亚湉, 王瑞, 钱程程, 等. 乌梅化学成分、药理作用研究进展及质量标志物预测[J/OL]. 中成药. [2023-04-24]. http://kns.cnki.net/kcms/detail/31.1368.R.20220328.1319.002.html.

[33] 曹煌, 张铁军, 张静雅, 等. 基于电子鼻和电子舌技术的辛味中药气-味的表征研究 [J]. 中草药, 2016, 47(11): 1962-1967.

[34] 李思维, 郝二伟, 杜正彩, 等. 广地龙化学成分和药理作用的研究进展及其质量标志物(Q-Marker) 的预测分析 [J]. 中草药, 2022, 53(8): 2560-2571.

[35] 张萌, 徐硕, 高志, 等. 地龙酒炙前后水煎液气味的吹扫捕集-GC-MS-嗅闻联用研究 [J]. 中国医药导报, 2012, 9(35): 129-131.

Discussion on binary classification identification method of five flavors of drug properties based on artificial intelligence sensory and multi-source information fusion technology

REN Yan-na1, FENG Wen-hao2, LI Han1, FAN Xue-hua1, LI Hai-yang1, YAO Jing3, 4, 5, 6, WANG Yan-li3, 4, 5, LIU Rui-xin3, 4, 5, 6, LI Xue-lin3, 4, 5, 6

1. Henan University of Chinese Medicine, Zhengzhou 450046, China 2. Institute of Isotope Research, Henan Academy of Sciences, Zhengzhou 450000, China 3. The First Affiliated Hospital of Henan University of Chinese Medicine, Zhengzhou 450000, China 4. Henan Province Engineering Research Center for Clinical Application, Evaluation and Transformation of Traditional Chinese Medicine, Zhengzhou 450000, China 5. Co-construction Collaborative Innovation Center for Chinese Medicine Prevention and Treatment of Respiratory Diseases by Henan & Education Ministry, Henan University of Chinese Medicine, Zhengzhou 450046, China 6. Henan Key Laboratory for Clinical Pharmacy of Traditional Chinese Medicine, Zhengzhou 450000, China

To explore the feasibility of artificial intelligence sensory and multi-source information fusion technology for the binary classification identification method of five flavors of traditional Chinese medicine (TCM), and provide a new method for the evaluation of drug properties of TCM.A total of 122 representative TCM decoction pieces with only one flavor (derived from the 2020 edition of) and 14 commonly used food samples were selected. The intelligent sensory information of 136 samples was collected by PEN3 electronic nose, ASTREE electronic tongue and SA402B electronic tongue. The obtained information matrix was used as the independent variable, and the description of the nature and flavor under the items in pharmacopoeia was used as the benchmark information. Two chemometric methods, principal component analysis-discriminant analysis (PCA-DA) and least squares support vector machine (LS-SVM), were used. Based on a single type of intelligent sensory equipment (single source) and multi-intelligent sensory information fusion (multi-source), the five flavors two classification (acid/non-acid, salty/non-salty, spicy/non-spicy, sweet/non-sweet, bitter/non-bitter) identification model=() was established, and the positive rate of cross-validation was used as the model optimization index.Through the leave-one-out cross-validation method, the maximum correct judgment rates in the five-flavor two-classification model based on single-source information were 98.53% (ASTREE/PCA-DA, LS-SVM), 97.06% (ASTREE/PCA-DA), 84.56% (ASTREE/LS-SVM), 89.71% (ASTREE/LS-SVM), 84.56% (ASTREE/LS-SVM). The maximum correct rate of the two-classification identification model based on multi-source information was 99.26% [(ASTREE + SA402B)/PCA-DA], 99.26% [(ASTREE + SA402B, PEN3 + ASTREE + SA402B)/PCA-DA], 88.97% [(PEN3 + ASTREE + SA402B)/LS-SVM], 91.91% [(PEN3 + ASTREE + SA402B)/PCA-DA], 86.76% [(ASTREE + SA402B)/PCA-DA], respectively. The correct rate of the model after multi-source information fusion was improved, with an average increase of 2.35% (< 0.01).ASTREE electronic tongue performs well in the identification of five flavors and two classifications of TCM. The correct judgment rate of the model after multi-source information fusion is higher than that of any single electronic nose or electronic tongue, which provides a reference for the evaluation of five flavors of TCM.

five flavors; medicinal properties; binary classification; intelligent senses; multi-source information fusion

R283.6

A

0253 - 2670(2023)10 - 3080 - 13

10.7501/j.issn.0253-2670.2023.10.005

2022-12-22

国家自然科学基金资助项目(81774452);国家自然科学基金资助项目(81001646);河南省中医药拔尖人才培养项目资助(2019ZYBJ07);国家重点研发计划中医药现代化重点专项(2017YFC1703402);河南省高层次人才特殊支持“中原千人计划”—“中原青年拔尖人才”项目(ZYQR201912158);河南省卫生健康中青年学科带头人专项(HNSWJW-2020014);国家中医临床研究基地科研专项(2021JDZY106);河南省中医科学研究基地专项(2021JDZY104);河南中医药大学2022年度研究生科研创新能力提升计划项目(2022KYCX027);河南省科技攻关项目(222102310377)

任延娜(1996—),女,硕士,研究方向为中药饮片临床应用现代化关键技术研究。E-mail: ryn2021@163.com

刘瑞新(1980—),硕士生导师,主任药师,主要从事中药饮片临床应用现代化关键技术研究。Tel: (0371)66233562 E-mail: liuruixin7@163.com

李学林(1960—),男,教授,博士生导师,主任药师,主要从事中药应用形式研究。Tel: (0371)66245142 E-mail: xuelinli450000@163.com

[责任编辑 郑礼胜]

猜你喜欢

电子鼻B型分类
分类算一算
分类讨论求坐标
电子鼻咽喉镜在腔镜甲状腺手术前的应用
基于B型超声的在线手势识别
数据分析中的分类讨论
教你一招:数的分类
飞到火星去“闻味儿”——神奇的电子鼻
B型血的忧伤你不懂
PSS4B型电力系统稳定器参数整定
电子鼻在烤鸡香气区分中的应用