植物图像识别理论研究
2022-01-19杜芊芊孟一凡胡琦瑶
杜芊芊,孟一凡,王 吉,胡琦瑶
(西北大学 信息科学与技术学院,陕西 西安 710127)
0 引 言
地球上植物覆盖面积广、种类繁多,如何对已发现的植物进行识别是一项极其复杂的工作。在植物识别的研究中,不同植物有不同的特征,如颜色、形状、大小等,可以利用这些特征建立一个模型对植物图像进行识别。该过程可分为三个步骤:首先,将得到的植物图片进行图像预处理;其次,选择非线性增强的方法得到输出,再利用滤波和平滑处理使得图像可识别度提高;最后,将得到的图像通过混合深度学习网络进行识别并返回结果。
1 图像增强
在图像增强的处理过程中,由于像素点所在的空间不同,所以一般可分为基于空域和频域的图像处理方法。基于空域的方法是指对图像进行点操作和模板操作;而基于频域的方法是通过FFT将图像转换到频域处理,然后再通过反变换得到增强图像。
在对图像进行增强处理之前,首先需要对图像进行如下的均衡化处理:
式中:为规定图像中的灰度级数;E代表灰度映射函数;u和v分别代表原始图像和规定图像同一位置的灰度值;p(u)表示对u出现的概率估计。
完成均衡化处理之后,就可以开始对图像进行如下的规定化处理:式中:表示原始图像中的灰度级数;s和t分别代表原始图像和增强图像同一位置的灰度值;p(s)表示对s出现的概率估计。
在上述过程中,利用规定化图像调整原始图像的对比度,可以使整体效果更佳。
在得到输出图像之后,需要对其进行处理以便程序更好地对图像进行识别。因为改变图像的直方图的形态也相当于改变图像的对比度,所以利用直方图的规定化可以使获得的整体植物图像更均匀。这样处理可以获得规定的图片像素直方图分布情况。把原始图像的直方图替换为所得的直方图,这样可以对图像进行全局优化。考虑到系统在离散空间的复杂度,拟采用单映射规则来获得所需图像,即从小到大依次找到能使下式最小的和,然后将p(s)对应到p(u)去。
在完成对图像的处理之后可以获得规定化所得的图像。对比图1和图2,根据输出的图像可以看出,规定化之后的图像与原图相比全局效果得到改善,对比度的增加可以突出图像的轮廓从而使其更容易被识别,即处理后的图片可识别度更高。
图1 处理前图片
图2 处理后图片
2 图像平滑
对图像进行平滑处理后可以提取图片中物体的轮廓信息,并且能够有效滤除高频噪声。中值滤波器设计简单且实用,主要依靠模板排序实现滤波。这里选择使用中值滤波的方式对图像进行处理。为了减少运算量,采用稀疏的模板处理图像。
3 初始化深度学习环境和导入数据
图像的分析和计算是植物识别问题的核心。将经过预处理的图像加入到深度学习环境中能够提高识别率。学习环境采用多个基础深度网络,然后需要进行任务分组,把相似度较高的图像分到同一组。需要注意的是,应该减小差别较大的植物组间距,提高识别的准确性,并将其与不同的植物物种进行比较,可以加强其与其他植物的区分。
3.1 执行图像数据预处理
样本训练的核心问题在于获得不同植物之间的不同特征,在图像中体现为轮廓和像素点分布以及灰度值的不同。为了提高目标的识别率,可以利用这三个关键点设计一个门网络。通过视觉相似矩阵估计任务间关系,并加入目标函数的流形正则化项,以提高不同植物种间区分度。先构建一个网络映射函数,然后把不同特征信息作为参数自变量,就可以得到特征向量,最后根据反馈修改不同特征的参数值来提高目标的识别度。
3.2 构建神经网络层模型
现有大多数成功的深度卷积神经网络都经过海量样本数据优化了网络结构和权重因子,特别是在图像识别领域中,图像数据集已经拥有了优良性能。本项目中将其应用至类别不超过最大输出维数的一个任务组的植物识别,预期能获得良好性能。因此,选择现有深度网络作为基础网络是可行的。其次,本项目不是简单地将多个基础网络组合成有更多输出维的网络;对于给定的任务组,通过分析和试验选择一个现有深度网络作为基础深度卷积神经网络。计算机在处理的过程中对已提取的特征值利用损失函数进行判断。对不同植物物种的第个任务组提出一种基于深度多任务学习的方法,通过优化联合目标函数来学习相应的第个具有模型参数W=(W, ...,W, ...,W)的基础深度卷积神经网络函数()。
3.3 构建训练模型
初步设计的多任务混合深度网络框架如图3所示。在该模型中,混合深度卷积神经网络需要选择优良的深度网络结构作为基础,并确定任务组间的任务重叠以及基础深度卷积神经网络的组合方式,最后通过迭代来定义自适应强的网络。
图3 多任务混合深度神经网络框架
根据植物分类的复杂度,考虑设计双层网络:一层网络以提取特征值为主;另一层对比不同分组组间的信息,设计成为闭环网络。由此可以确定相互关联的学习任务,如在提取到一幅图片的特征值之后可以根据组间的差别来调整图片的识别位置,在同时对比多组任务之后可以输出一个相似百分比用来标识该图像的确信值;而且当植物图像分配到相同的任务组时,这种植物物种可以具有相似的学习复杂性,使它们得到更充分的比较并显著增强它们的可区分度。
经过测试发现,在单一环境下的图像识别可靠性高,所得识别准确率较高。但在复杂环境下的植物识别效果不佳,主要是在特征提取方面很难实现图像的完整特征提取。测试结果如图4和图5所示。
图4 输出轮廓特征
图5 颜色及轮廓结果
4 结 语
针对当前具有高度相似性的植物物种识别中的难点,本项目设计了一种改进型多任务混合深度网络。对相似图像进行分类时,使用从已有神经网络改进而来的深度混合网络,解决了在对大批量、强相似度的植物种类进行鉴别时混合深度网络成功率较低的问题,实现了对高相似度植物的图像的训练、识别和分类。本设计对植物的识别精确度能达到83%。