APP下载

基于数量分类的植物鉴别算法研究

2018-03-05陆国泉

江苏农业科学 2018年1期
关键词:正态学报植物

陆国泉,彭 琳

(云南农业大学/云南省高校农业信息技术重点实验室,云南昆明 650201)

自然界植物资源极其丰富,其中在《中国植物志》中记载的植物就达31 142种[1]。即使是一个资深的植物学专家也不可能鉴别出所有的植物,植物知识也往往存在着存放分散、不易检索等特点,且经典分类学后继乏人,相关的计算机应用也处于较低的水平[2]。因此,植物鉴别对植物知识的快速检索具有重要意义。当下研究人员主要采用以下方法进行植物鉴别:人工鉴别法、人工辅助法(光谱法、色谱法、质谱法)及基于计算机图像识别的方法。人工鉴别法往往需要植物领域知识的支持,对研究人员的素质要求非常高,因此适用面较狭窄;人工辅助法则须要进行大量的样品采集、标本制作和较长时间的观测,因此工作效率较低;基于计算机图像识别的植物鉴别法大多选择叶片作为鉴别依据,且不适用于叶部特征不明显的植物,目前的应用水平较低[3]。基于传统的形态学和统计数学形成了数量分类学[4],并利用该方法先后实现了繁缕属的分类[5]、金银花的选育[6]、山羊豆族植物的分类[7]以及中国传统大菊品种的分级[8]。虽然基于数量的植物分类在多个方面实现了应用,但大多适用于少数品种的精确分类,不具普适性,且在计算机应用中的研究较少,尤其是将其作为信息检索的依据。本研究首先使用正态云模型计算出植物各个形态的隶属度,接着使用灰色关联分析对植物进行综合评价,最后根据综合评分鉴别出植物的属种信息。

1 材料与方法

1.1 试验材料

本研究的植物知识来源于由中国科学院中国植物志编辑委员会历时45年编撰而成的《中国植物志》,它是目前世界上最大型、种类最丰富的一部植物志,共收录309科3 299属维管植物[9]。由于该书采用数字的方式对植物进行描述,且大多附有植物照片,因此极其适合用作文本的知识来源,同时,该书中附带的图片也可以对结果进行检验。

1.2 指标选取

根据科学性、可操作性、完备性、数据可获性等原则[10]选取叶长、叶宽、株高、叶柄长及生境海拔作为评价指标。由于植物具有一定的生长周期,为了扩大应用范围,本研究暂不选取花、果等形态特征作为评价指标;同时,植物在生长发育过程中,叶形也会不断发生变化[11],因此也不考虑叶形作为评价指标。

1.3 植物形态数据库的建立

由于时间限制,暂时不考虑将《中国植物志》中3 229属植物作为本研究的研究范围,本研究结合客观的需求选取云南省种子植物特有属125属共246种植物[12]作为本研究的研究范围,旨在为云南地区植物保护研究提供便捷的方法。本研究采用区间的方式来描述植物的外形特征,以Ex1、Ex2分别表示植物外形特征数据的下限、上限,然而《中国植物志》对一些植物的外形描述并没有采用区间的方式而是采用单个数值L来描述。因此,经过对《中国植物志》的数值研究及植物领域专家的建议,对采用单个数值描述植物外形的区间统一设置为[L×(1-0.2),L×(1+0.2)]。对于无叶柄的植物,结合正态云模型的特点和实际应用将无叶柄植物的叶柄长的范围统一设置为[0.000 1,0.000 7],实际测量的数字统一设置为0.000 4。对于爬藤类植物,默认其株高的范围为[0.000 1,0.000 7],同样将实际测量的数字设置为0.000 4。此外,对于未注明生境海拔的植物,根据该植物的分布地区将其生境海拔设置为[Hmin,Hmax],其中,Hmin为该植物最低分布地区的海拔,Hmax为该植物最高分布地区的海拔。

本研究随机选取10种植物作为研究实例,其中包含了同属不同种及不同属的情况,具体数据如表1所示。

表1 植物外形特征数据

注:Ex1、Ex2分别表示植物外形特征数据的下限、上限。

1.4 基于正态云模型的植物鉴别算法

本研究测试的地胆旋蒴苣苔位于红河州元阳县境内的小新街乡,其海拔为753 m。经过外部测量,其叶长为5.7 cm,叶宽为1.9 cm,由于不具叶柄,因此其叶柄长为 0.000 4 cm,由于是藤类植物,因此其株高为0.000 4 cm。

1.4.2 植物隶属度的计算 根据建立好的植物形态数据库以及正态云模型,植物隶属度计算步骤如下:

表2 植物外形特征的期望值及熵

表3 植物各个指标的隶属度

表4 1~9比率标度的意义

表5 判断矩阵

表6 各指标的权值

步骤二:利用灰色关联分析法进行综合评价。灰色系统理论是由邓聚龙创立的一门学科,通过分析系统中各个因素的关联程度来对事物进行综合评价[26]。本研究定义Xi(i≥1)为每种植物的各个指标的隶属度向量,通过比较排序将X0={0.782 7,0.637 6,1.000 0,1.000 0,0.850 4}定义为参考向量,然后计算出每种植物的各指标差值|Xi-X0|,如表7所示。

表7 植物各指标差值

表8 植物各个指标的关联系数

根据公式Ge(i)=Xi·We计算植物的等权关联度,其中,We=(0.2,0.2,0.2,0.2,0.2)T;利用公式Gw=Xi·Ww计算植物的加权关联度。由表9可知,关联度排名第1的植物名称为地胆旋蒴苣苔,与实际结果相符。在加权关联度中排名第2的植物为大花旋蒴苣苔,而在等权关联度中排名第2的植物为鹭鸶草。根据《中国植物志》记载,大花旋蒴苣苔和地胆旋蒴苣苔为同属不同种植物,表明使用层次分析法给各个指标分配权值明显提高了植物鉴别的准确率。

2 结果与分析

由于不具备实地测量246种植物的条件,本研究设计了以下5组试验:第1组测量值为Ex×(1-0.1);第2组测量值为Ex×(1+0.1);第3组测量值为Ex×(1-0.2);第4组测量值为Ex×(1+0.2);第5组测量值为Ex。定义准确率为P=F/A,其中,F表示准确鉴别出来的植物数量;A表示数据库中所有植物的数量,即246种云南省种子植物特有属。由表10可知,使用本研究的方法基本可以满足植物鉴别的需求,只要鉴别人员掌握基本的植物知识便可以对植物进行无损鉴别。

表9 植物各个指标的关联度及排序

表10 5组对照试验鉴别准确率的测试结果

3 结论与讨论

针对研究人员因不具备海量、完备的植物知识而不能识别每种植物的问题,本研究提出基于正态云模型的植物鉴别算法。该算法融合了植物数量分类思想,结合层次分析法和植物专家的意见对各指标进行权重分配,从而考虑了各个因素对植物鉴别不同的影响程度,最后使用灰色关联分析法对植物的隶属度进行综合评价。结果表明,在鉴别云南省种子植物特有属试验中本研究的方法有效、可行。由于《中国植物志》是由80多个科研单位共计312位植物专家编撰而成,加之植物本身形态各异,导致一小部分植物的信息不完整,因此数据无法被录入植物外部形态特征数据库。同时,为了使本研究方法的通用性更强,本研究采用5个最基本的形态特征作为植物鉴别的指标。在以后的研究中,将联合植物专家进一步完善植物外部的形态数据,采用更多的指标,从而提高植物鉴别的准确率,同时也会将本研究的方法引入到植物领域的信息检索研究中。

[1]中国科学院中国植物志编辑委员会.中国植物志[M].北京:科学出版社,2004.

[2]马金双.中国植物分类学的现状与挑战[J].科学通报,2014,59(6):510-521.

[3]陈永富,刘 华,陈 巧.植物鉴别方法研究现状与展望[J].世界林业研究,2014,27(4):18-23.

[4]张明理.植物数量分类学的流行方法[J].西北植物学报,1986,6(1):67-80.

[5]陈旭波,孟世勇,张小飞,等.石竹科繁缕属与孩儿参属的数量分类[J].植物学报,2014,49(4):432-439.

[6]张山山,黄璐琦,袁 媛,等.栽培金银花农艺性状的数量分类学研究[J].中国中药杂志,2014,39(8):1379-1385.

[7]史传奇,刘 玫,王 臣.东北豆科山羊豆族4属植物叶形态特征及数量分类学研究[J].草业学报,2015,24(5):182-189.

[8]雒新艳,宋雪彬,戴思兰.中国传统大菊品种数量性状变异及其概率分级[J].北京林业大学学报,2016,38(1):101-111.

[9]骆 洋,何延彪,李德铢,等.中国植物志、Flora of China和维管植物新系统中科的比较[J].植物分类与资源学报,2012,34(3):231-238.

[10]高明美,孙 涛,赵天燕,等.正态云模型在皖江地区土地生态安全评价中的应用[J].湖南农业大学学报(自然科学版),2015,41(2):196-201.

[11]黄文娟,李志军,杨赵平,等.胡杨异形叶结构型性状及其相互关系[J].生态学报,2010,30(17):4636-4642.

[12]冯建孟,朱有勇.云南地区中国种子植物特有属的研究[J].生态环境学报,2010,19(3):621-625.

[13]李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34.

[14]刘常昱,李德毅,潘莉莉.基于云模型的不确定性知识表示[J].计算机工程与应用,2004,40(2):32-35.

[15]王迎超,靖洪文,张 强,等.基于正态云模型的深埋地下工程岩爆烈度分级预测研究[J].岩土力学,2015,36(4):1189-1194.

[16]杨朝晖,李德毅.二维云模型及其在预测中的应用[J].计算机学报,1998,21(11):961-969.

[17]张 杨,严金明,江 平,等.基于正态云模型的湖北省土地资源生态安全评价[J].农业工程学报,2013,29(22):252-258.

[18]李 陶,李付伟,李向新,等.地震灾害风险的正态云模型综合评价——以毕节市为例[J].中国安全科学学报,2015,25(10):166-171.

[19]Saaty T L.How to make a decision:the analytic hierarchy process[J].European Journal of Operational Research,1990,48(1):9-26.

[20]庄 倩.基于AHP的江苏省高标准农田综合生产能力评价[J].江苏农业科学,2016,44(6):511-515.

[21]焦 艺,刘 璇,毕金峰,等.基于灰色关联度和层次分析法的油桃果汁品质评价[J].中国食品学报,2014,14(12):154-163.

[22]王 青,戴思兰,何 晶,等.灰色关联法和层次分析法在盆栽多头小菊株系选择中的应用[J].中国农业科学,2012,45(17):3653-3660.

[23]杨天天,潘晓星,穆立蔷.基于叶片图像特征数字化信息识别7种柳属植物[J].东北林业大学学报,2014,42(12):75-79.

[24]王丽君,淮永建,彭月橙.基于叶片图像多特征融合的观叶植物种类识别[J].北京林业大学学报,2015,37(1):55-61.

[25]Satty T L.A scaling method for priorities in structure[J].Journal of Mathematical Psychology,1978,1(1):57-68.

[26]邓聚龙.灰色系统基本方法[M].武汉:华中科技大学出版社,2001:17-30.

猜你喜欢

正态学报植物
致敬学报40年
双幂变换下正态线性回归模型参数的假设检验
将植物穿身上
基于泛正态阻抗云的谐波发射水平估计
半参数EV模型二阶段估计的渐近正态性
植物罢工啦?
植物也疯狂
学报简介
学报简介
《深空探测学报》