基于自组织特征映射神经网络的金银花分类研究*
2013-08-21申明金
申明金
(川北医学院化学教研室,四川南充 637000 )
现代医学证明,微量元素对人体健康、生长发育和疾病防治有密切关系,中药药用价值与其富含的微量元素有直接的关系。而中药材生产的地域性较强,药物质量、疗效、微量元素含量及分布与药材的品种、产地密切相关[1–2]。
金银花为忍冬科植物忍冬的干燥花蕾或初开的花,具有清热解毒、凉散风热之功效。我国金银花资源丰富,在全国各地都有分布,传统以河南和山东为道地产区。由于我国地域辽阔,金银花产地不一,品种繁多,金银花的质量鉴别十分重要。金银花常用的鉴别手段除外观鉴定之外还常用聚类分析等化学模式识别方法。笔者以各地产金银花中微量元素含量为指标,用人工神经网络中的自组织特征映射(Self-Organizing Feature Map,SOM)网络对不同产地的金银花进行分类,结果令人满意。
1 SOM网络简介
SOM网络[3–5]是由芬兰赫尔辛基大学神经网络专家Kohonen教授于1981年提出的竞争式神经网络。SOM网络结构如图1所示。
从图1可以看出,SOM网络只有输入层和输出层,且两层之间为完全连接。设输入矢量的维数为n维,则输入层有n个节点;输出层由m个神经元组成二维平面阵列;输入层与输出层各神经元之间完全连接,设连接权重向量为Wij,其中i表示输入层第i个节点,j表示输出层第j个节点。输入层节点并不对输入矢量X进行处理,它只是把输入矢量的各个分量经过连接权传送到输出层,激发输出层各个神经元之间的竞争,因此输出层内的每个神经元与其邻域连接,此连接是相互激励的关系,训练后输出层不同节点代表不同的分类模式。SOM具有训练和分类两种状态。
SOM网络采用Kohonen学习算法,其基本算法过程为:
(1)初始化。对N个输入神经元到输出神经元的连接权值赋予较小的权值。选取输出神经元j个“邻接神经元”的集合Sj。其中Sj(0)表示时刻t=0时的神经元j的“邻接神经元”的集合,Sj(t)表示时刻t的神经元j的“邻接神经元”的集合。区域随着时间的增长而不断缩小。
(2)提供新的输入模式X,计算欧氏距离。输入样本与每个输出神经元j之间的距离:
计算出一个具有最小距离的神经元j*,即确定出某个单元k,使得对于任意的j,都有
(3)给出一个周围的邻域Sk(t),修正输出神经元j*及其“邻接神经元”的权值。修正公式为:
上式中,η为一个增益项,随时间变化逐渐下降到零,一般取η(t)=1/t或η(t)=0.2(1–t/10000)。
(4)计算输出Ok。Ok按式(2)计算:
上式中,f(.)一般为0–1函数或其它非线性函数。
(5)提供新的学习样本重复上述学习过程。
2 金银花微量元素含量分析与分类研究
取金银花药材50 g,用去离子水淋洗、烘干后研成粉末。准确称取样品0.5 g,在电热板上硝化2 h,蒸发掉过量硝酸,然后在500℃灰化3 h。冷却后用6 mol/L HCl溶解,转移至50 mL量瓶中定容。用电感耦合等离子体光电直读光谱仪进行元素分析,得到一组金银花药材中微量元素含量[6],数据见表1。
表1 不同产地金银花药材中微量元素含量 μg/g
表1中的数据样本数为6,变量为17个,确定SOM网络的输入模式为:
利用MATLAB语言[7]中的函数newsom创建一个SOM网络。代码为net=newsom{minmax(X),[6,4]},其中X为输入向量,minmax(X)指定了输入向量元素的最大值和最小值,[6,4]表示创建网络的竞争层为6*4的结构。网络是可以调整的,此处样本量较小,所以选择这样的竞争层是合适的。然后利用函数train和仿真函数sim对网络进行训练并仿真。
当训练步数小于5时,封丘、新密、平邑所产金银花为一类,南京、桂林、昆明所产金银花为一类。这样的分类结果是符合生产实际的,封丘、新密、平邑都属于暖温带大陆性季风气候的北方地区,年均气温14℃左右,年均降水量为600 mm左右,传统上这三地所产金银花为道地金银花。南京、桂林、昆明属于亚热带润湿季风气候区,雨水丰沛,为非道地金银花产区。这体现了气候和地域对金银花品质分类的影响。
当训练步数为10步时,封丘、新密、平邑所产金银花为一类,南京所产金银花为一类,昆明和桂林所产金银花为一类。这说明道地产区金银花所含微量元素含量差异相对较小,非道地产区金银花所含微量元素含量差异相对较大。从地理位置上看,南京地区位于我国南北分界线附近,而昆明和桂林位于我国南方地区。因而,南京所产金银花与南方桂林、昆明所产金银花在微量元素含量有一定差异是合理的。这也体现了由北到南,地理位置对金银花分类的影响。
当训练步数为60步时,道地产区封丘所产金银花为一类,新密和平邑所产金银花聚为一类;而非道地产区南京、昆明、桂林所产金银花各自分为一类。从生产调查和文献资料发现,道地产区封丘种植在黄淮海平原,河南新密种植在山区,山东平邑多种植在山岗梯田,由于山地和平原在土质上的一些差异导致了所产金银花在微量元素含量上的一些差异。而昆明和桂林尽管都处于西南地区,但由于两地海拔差距明显,昆明地处云贵高原,且两地土壤成分也有不同,故这两地所产金银花微量元素含量彼此间也有一定差异。这体现了地势和海拔高低对金银花分类的影响。
当训练步数为120步时,6地所产金银花各自分为一类,这与实际情况相吻合,毕竟各地所产金银花在质量和微量元素含量等方面是不可能完全一致的。
3 结语
SOM网络的自组织学习过程是以无监督的训练学习方式进行的,操作简便易行,只要将有关数据提供给网络,网络就会通过自身训练、学习、竞争,最后输出相应的分类数目和分类结果。在学习算法上,它模拟生物神经系统,利用神经元之间的兴奋,协调与抑制,竞争的作用来进行信息处理的动力学原理,指导网络的学习与工作。与BP神经网络相比,拓宽了神经网络在模式识别、分类方面的作用。应用SOM网络对不同产地金银花进行分类,其分类结果体现了由于自然条件的不同,各地所产金银花药材质量与地域、气候有较为密切的关系,其结果符合生产实际。
[1]范文秀,冯晨.不同产地麦冬中锌、铜、锰、铁的比较研究[J].广东微量元素科学,2006,13(11): 56–59.
[2]赵花荣,温树敏,王晓燕,等.金银花道地品与非道地品的FTIR光谱研究[J].光谱学与光谱分析,2005,25(5): 705–707.
[3]印洪浩,彭中波.船用离心泵故障SOM网络诊断方法[J].中国航海,2012,35(2): 24–28.
[4]涂晓芝,颜学锋,钱锋.基于SOM网络的基因表达数据聚类分析[J].华东理工大学学报:自然科学版,2006,32(8): 992–996.
[5]李娟娟,徐小明.基于SOM网络的江苏省城市现代化水平分类[J].山东建筑大学学报,2011,26(1): 992–996.
[6]张重义,李萍,李会军,等.道地与非道地产区金银花质量的比较[J].中国中药杂志,2007,32(9): 786–788.
[7]葛哲学,孙志强.神经网络理论与MATLABR2007实现[M].北京:电子工业出版社,2007: 175–180.