相似中草药植物鉴定技术的研究进展与展望*
2018-03-19张红侠朱正安刘晓娜
张红侠,王 宇**,朱正安,刘晓娜
(1.陕西中医药大学 咸阳 712000;2.辽宁工程技术大学 葫芦岛 125105)
1 引言
西药起效快,疗效高,目前普遍应用于临床,但由于西药大多数是合成剂,副作用也十分明显。相比而言中药药效温和,疗效突出。所以在市场上需求量十分大,人们更倾向于中医治疗。在我国,具有药用价值的中草药就有五千多种,许多中草药性状十分相似,但药理作用却相差很远。由于中草药植物来源广泛,种属相近,性状相似等因素,极易导致错误识别,混淆使用,给病人带来伤害,造成临床意外。例如大血藤和鸡血藤、菟丝子和苏子等中草药植物[1],其中大血藤主要偏于清热解毒,鸡血藤偏于活血补血[2],临床上曾经因为性状相似导致混淆使用,造成患者病情恶化,带来十分严重的后果。即使在现如今,混淆使用中草药的问题也有出现,例如发生于香港的“白英”和“寻骨风”事件,主要是因为混淆使用中药,最终导致病人肾衰竭和尿道癌。
传统的相似中草药植物性状鉴定具有主观性强,而且人力成本高等缺点。因此,实现快速,高效的识别技术必不可少。正确鉴别相似中草药植物对于了解其知识和发扬我国中医文化意义重大,不仅可以保证临床上用药安全,而且也能够促进中药文化的发展。由于鉴定技术的不断完善和进步,相似中草药植物的鉴定迎来了新的发展。
2 相似植物性状鉴别的国内外研究现状
神农尝百草的故事彰显了在中国古代,人们就有了辨识中草药植物的意识。古代本草学是中草药鉴定学发展的基础[3]。由于我国对传统医学的重视,许多中草药鉴定工作者深入研究中药的来源鉴定和性状鉴定,出版了《新编中药志》、《中华人民共和国药典》等书籍,对我国医学的发展起到了极大的促进作用[4]。传统的相似中草药性状鉴别方法主要是依据经验判断,通过眼观,鼻闻,手摸等方式来获取中草药外形特征的形态和理解[5]。显微鉴别技术发展于中草药真伪鉴定,但无法实现质量的评估。色谱指纹图谱适用于中药质量鉴别,但品种来源的鉴定无法实现。高效液相色谱法可以对中药的有效成分进行全面,高效的分析,但其存在着不足,即耗损溶剂多,时间长等缺点。在定性定量研究方面,核磁共振法具有很大优势,但技术复杂,相关仪器价格昂贵。国外对相似植物的鉴定也进行了长期深入的探索,基于多路径稀疏编码的方法是利用SIFI特征研究出的一种新颖的植物识别方法。主要使用了五个路径模型植物图片的形状和纹理特征,有效的避免了创建特征工程时,对植物分类依赖的缺点。但其存在着新样本点的扩展有难度及数据过少不能获得满意结果等缺陷。多器官综合厂网方法,主要利用框架卷积神经网络(CNN)[6]进行初步植物单个器官的识别分析,然后进行线性加权决策分类和支持向量机(SVM)处理。但其数据库需扩大以致覆盖更多植物而且系统的性能也有待提高。近年来,计算机视觉领域不断取得了丰硕的成就,爆炸性的增长趋势突出了计算机视觉技术应用的广泛性。早在二十世纪五十年代,西方计算机视觉技术开始逐步成长,2D图像的分析和探索是当时主要的研究方向。进入二十世纪六十年代,罗伯茨在MIT利用计算机程序从数字图片中成功提取了多维数据集,棱镜等多面体的三维结构,而且清楚的描述了物体的形状与空间的联系。计算机视觉技术的主要原理是借助拍摄设备替换人眼以获取目标图像,进而通过计算机对物体进行追踪,检测和分析。利用计算机视觉技术的WIFI无线智能通讯汽车[7],通过无线网络借助Zigbee和蓝牙,实现了中短距离无线传输和识别图像,避免了人和危险区的接触进而减少危险区的人员伤亡。在表面疲劳裂纹图像识别检测方面[8],计算机视觉技术的突出贡献具有很大的现实意义,其市场发展前景十分广阔。因此计算机视觉技术在国外发展十分成熟,而且普遍应用于各领域。不断发展进步的计算机视觉技术,在植物鉴别方面更趋完善,精确度达到了更高水平。
随着现代技术的蓬勃发展,中草药植物鉴定技术也需要更加完善,不光可以增强我国相似中草药植物鉴定的精确度,同时也促进我国中医医学的进步。
3 植物生物识别技术
许多中药植物外形,味,气十分相似,但它们的药理活性十分复杂。免疫学鉴定和同工酶鉴定技术已逐渐发展成熟,但植物的生长阶段,纬度差异等均会影响其鉴别的准确度。近年来分子生物学和分子克隆学应用前景十分广阔,依据中草药植物遗传物质的不同,以及个体间有着基因组水平上的变异,进行植物间多态性的考察,可以完成相似中草药植物的鉴别,也可以利用限制性内切酶酶切片段长度多态性(RFLP)进行中草药植物品属间,属间的DNA变异情况的研究。通过不断探索研究中草药植物内在基因的分布规律,可以研究出外在性状表现的分布特点。但是大多数中草药植物在进行鉴别时其新鲜度未能保持,DNA已发生部分降解,不过一种聚合酶链式反应技术[9]已越来越成熟,即PCR技术,可以将少量的遗传物质DNA进行扩展以便研究人员进行操作观察。进行引物的设计在多重PCR中占有重要的地位,尤其是同源种属之间变异位点少,保证引物的特异性和不互相干扰是鉴别的关键之处[10]。聚合酶链式反应的自动化和高效优质的特点完成了痕迹量DNA的扩增,其在生物科学领域发展前景十分广阔。作为高科技领域的一项技术,植物生物技术得到了广泛人士的认同。相关研究者进行了实验,Shaw[11]等人对真假人参进行了DNA分子遗传标记,利用PCR技术扩增了真假人参基因,证明了真假人参拥有的DNA指纹图谱不一样。基于DNA条形码[12]的多重PCR不仅可以鉴别多种植物,而且拥有高效,准确等特点,同时也可以对其他多基源中药材鉴别,也可以对市场上以次充好,掺假掺伪等现象进行有力的遏制[13]。由于DNA具有遗传信息多,而且不受外界环境的影响,没有发育阶段因素干扰,所以该植物生物识别技术具有很大优势。植物生物技术能够保护好稀缺中草药植物,辨别真假,准确识别药物的来源,性状,但适用范围小,成本高,程序复杂。此技术虽然发展十分成熟,但测序仪和试剂成本比较高,耗资巨大,存在一定的适用局限性。
4 光谱鉴别技术
光谱鉴别技术主要通过中草药植物有效成分鉴别,避免了一些鉴定技术的片面性而且取样量少。作为景天科植物的中药,凹叶景天在全国分布广泛,消肿,解毒和止血等作用应用普遍。为了使中药凹叶景天资源得到更好的利用,使用紫外可见光谱技术可以对其定性鉴定,但其主要缺点是检测的样品为非单一化合物,所以需要其它检测技术共同鉴定。中草药植物的使用需经过多道程序,例如采收、加工、运输等,其外形多已遭到破坏,不具有完整性,给鉴定增加了难度。由于叶类植物富含叶绿素和鞣质,限制了理化鉴别,而荧光光谱技术灵敏度强,选择性强,对叶类植物鉴定十分高效,但荧光的光强并不强,易受某些离子的干扰,并且持续时间不长。能够定量和定性的分析中草药植物是近红外光谱技术的主要特点,由于该技术专属性高,所以在中草药植物鉴定中普遍应用。其中分子震动模式和亚甲基的六种振动模式是红外光谱所拥有的滑雪特征。其振动模式的数量是依据自由度来确定的[14],但空间中的点需要三个自由度。然后进行光谱吸收带解析,通过对植物成分在近红外光区域的吸收带进行分析,从而得出准确的辨别结果。其主要通过数学模型的建立,完成以下的步骤:挑选具有典型特点的样本,完成模型训练集数据组的测量,然后进行扫描,使用多元校正的计算手法,让样本光谱与组成数据相联,实现数学模型的建立,随后便可进行未知样本的测试。LIU[15]等以近邻法以及多类支持向量机完成了白芷和丹参的准确鉴别。Woo[15]等还采用特殊计算突出谱图的特征,借用SIMCA高效率的完成了药材生产地的鉴别。该类技术能够有效的鉴别形态相近,种属关系相近的中草药植物。聚类分析等模式识别技术对相似中草药的性状鉴别更加准确,Mao[15]等通过研究系统聚类法,对白参,西洋参,红参和三七均能正确的归类。52种大黄样品的鉴别[16]具有相当高的难度,而近红外光谱和人工神经网络技术实现了96%的正确率。该方法已经发展为一种鉴别中草药植物快速,无损,定量分析化学组分的新方法。由于光谱测量的速度极快,所以近红外光谱拥有分析速度快的优势,从而使最后计算的的结果也快。然而近红外光分析的效率主要取决于仪器所具有的模型数量的多少,所以希望在进行植物鉴别时快速得出计算结论,增加仪器模型数量至关重要。近红外光谱技术发展迅速,处理简易,反应灵敏,适用于固体漫反射,可以很好的进行中草药植物的种类,产地,真伪,质量,加工炮制和亲缘关系的识别,也可以作为相似中草药植物鉴别的依据[15],但建模成本较高,模型不通用,不适用于小批量样品。
5 计算机视觉技术
计算机视觉技术可以实现复杂的视觉描述功能,完成图像的准确识别。通过许多海内外学者对图像匹配工作的研究,使此领域技术取得了显著成果。国外深入推进计算机视觉技术和理论的探索,尝试人工系统的建立,以此实现从图片中获取更多的信息和多维数据。使计算机具有能自主适应人类环境的功能,凭借视觉观察的途径进行全面的认识世界,并且在3D环境中,计算机可以实现感知几何信息的功能,具体包括:形状,位置,手势和动作[17]。该技术可以避免人的主观判断,评价,而且可以有效的去除情绪和精神状态的影响。目前,计算机视觉技术已在许多领域广泛应用,主要有工业检测,工业自动化,视觉导航,虚拟现实,卫星遥感等。计算机视觉处理技术在相似中草药植物范围的应用已逐渐深入,主要通过中草药植物图像预处理,特征提取,图像分割,图像匹配等步骤完成鉴别。随着计机视觉技术日新月异的发展,图像识别技术取得了很高的成就,例如人脸识别,指纹识别,虹膜识别,声音识别等,生物特征识别主要在于构造智能人机接口以及利用计算机视觉技术进行真实身份的研究,以及应用于温室环境中的监控和移动机器人的设计等。用计算机代替人的识别和理解过程,实现了准确,快速等功能。在全国开展的中药资源普查中[18],图像识别技术起到了重要的作用。植物叶片的识别在计算机视觉中也有了极大的发展,基于彩色通道植物相似性图像分割方法[19],主要是计算叶片的面积,不用对彩色图像灰度化,直接进行分割。此技术可以直接嵌入到手机中,利用手机的便携性可以进行野外植物观察但须保证光线充足。作为计算机视觉领域当前最为火热的研究课题,不仅带动了与其密切相关的图像处理,模式识别,射影几何的统计推断,统计学习和其他学科的发展,而且也极大的造福了人类。以下是计算机视觉技术各类算法研究。
5.1 K-means聚类植物叶片叶脉提取识别
中草药植物的轮廓和外形提取中,叶脉的处理与分析占有重要的作用。作为叶片主要特征之一的叶脉,众多的研究者从不同的方面深入探索了其提取方法,包括有:神经网络、Hough变换等,但都存在着一定的缺点,神经网络比较耗时,Hough变换不能实现自动化。而K-means算法首先进行彩色空间转换,从人类的视觉系统出发,使用图像的HIS彩色空间更有利于特征参数的提取[20]。继而在使用其I分量,进行植物叶片叶脉的提取。依据数据,从属于无监督聚类中的K-means算法,可以利用从深入分析的叶片的特征信息中探索出相关的联系,然后进行聚类,此空间将会呈现特征相似的像素点组。快捷方便的该类算法在此研究领域中得到了普遍的认同和应用[21]。叶脉提取的准确性直接受到叶片受光是否均匀的影响,受光均匀叶片首先进行图像预提取,然后叶脉和叶片边界的提取,再将其融合;受光不均匀叶片,首先将会去除叶肉像素,再次进行K-means聚类,获得新的叶脉图像,最后进行融合[22]。K-means聚类算法提取效果如图1所示。
图1 K-means聚类算法提取效果[22]
由于现实大多数是绿叶图景拍摄,所以应用前景十分广阔。但也存在着一定的季节局限性,必须所选叶片叶脉像素值比叶肉像素值大,例如秋季的落叶,不适合于本算法的范围。
5.2 叶片形状特征的植物识别
许多研究者将植物叶片的形状,颜色,纹理进行融合,完成相关相似植物的鉴别。颜色和纹理可以辅助进行叶缘叶裂明显的中草药植物叶片识别,但精准度却不会提升。植物叶片识别主要利用了主成分分析(PCA),采用最大间差方法Otsu,完成图像的预处理,去除噪声,剔除杂质。然后以形态学开运算解决叶片的残缺及叶柄的影响,完成叶片8项特征的提取。使用PCA进行降维[23],不仅简化了特征间的繁复,更促进了神经网络的输入向量维数简单。通过设计BPNN,不断输入图像特征进行训练,最终形成准确高效的识别分类器。该类方法对于植物叶片的识别技术又是一个新的提高,对于一些难以识别的种类,以及以颜色和纹理识别效果差的植物都有一个极大的提升,尤其对于有叶缘叶裂的叶片识别效率极高。但该类识别也存在一定的局限性,对于无叶裂,叶缘完整的叶片识别率低。该算法测试在图2植物叶片数据集的测试结果(表1)。
在将来的发展中,研究者将会更多探索叶基形状,叶端形状,此方面有更大的发展空间。
5.3 叶片图像的植物识别
图2 植物叶片数据集[23]
表1 叶片形状特征识别结果[23]
相似植物的鉴定和归类,对于植物间的亲缘关系以及进化规律都有重大意义。传统方法以采集植物标本,进行测量和对比完成归类,工作量大,耗时多,效率低,质量难以保证。其中统计学和模糊数学在早期应用于植物归类,但其需要人工操作,不能满足自动化。而基于叶片图像的植物识别[24]是利用计算机进行的一种模式识别,首先获取叶片的图像,进行图像灰度化处理,亮度较正,为使在去除随机噪声时不致边缘受到影响,使用中值滤波,采用灰度门限法进行图像分割。然后进行叶片图像参数计算,RBF分类器拥有的径向基函数神经网络相比于BP神经网络具有极大的优势,不仅在自学性方面,而且局部极小值的解域问题中都得到了很好的解决。在叶片图像的植物识别程序中,图像匹配[25]是一项尤为重要,关键的技术。早期西方图像处理的发展可以追溯到1920年,英国借助北大西洋海底的电缆,实现了向美国传输一张简单数字处理的照片。随着科技的进步,数千张月表图片的采集,通过计算机视觉技术的处理,最终月球的全景镶嵌图问世。一项造福于人类的技术,是计算机视觉的典型应用,即英国工程师发明的全身CT诊断技术。众多有益于人类和促进发展的应用,都需要计算机视觉技术中图像进行准确的匹配。权值和竖向关系是计算机视觉技术图匹配的核心。其中谱方法,双随机约束松弛法,稀疏约束松弛法等是近年最常应用的算法。借助这些算法,可以实现在两幅或三幅图中找出相似之处,从而实现了对相似中草药植物准确,科学的进行处理。由于噪声,角度,变形等因素的存在,将会导致图像发生一定的变化,即使在相同的环境中,不同的条件也会使图片产生一定的差异,因此增加了图像匹配的难度。只有分析和归纳图匹配的基本要素,科学的组合才是实现图像匹配的科学方法。图匹配中人工智能可视化,三维重建,虚拟现实,增强现实,是研究的重点,其在医学,交通,通讯,植物鉴别等方面做出了巨大贡献。该研究对相似植物自动识别具有重要意义,奠定了一定的基础。
6 结语
在相似中草药植物的准确识别和临床应用过程中,相似中草药植物的鉴定技术发展前景十分广阔。相似中草药植物鉴定技术的种类、特点和应用在中医的发展史中更具有重要意义。相似中草药植物的识别离不开鉴定技术,采用各种不同的鉴定技术,不光可以使人们准确识别中草药植物,而且可以省时省力,不浪费资源,避免临床用药意外。随着生物识别技术,光谱技术等的不断发展,同时计算机视觉技术的更新和应用,相似中草药植物鉴定技术会向着更高速,准确,科学的方向前进。