图像识别技术在资源环境检测中的应用
2022-09-27岳莹瑛周菁菁
岳莹瑛 周菁菁
(兰州资源环境职业技术大学,甘肃 兰州 730021)
0 引言
目前,由于人为过度放牧、工业制造及各类自然灾害,导致生态系统逐渐失去平衡,进而引发环境问题[1]。近年来,虽然国家加大对资源环境的管理和保护力度,但仍出现优良资源匮乏的问题,并危及生态系统的平衡与稳定。资源环境的健康检测是实现生态环境保护和提升国内生产总值的重要手段,因此相关领域的研究人员对其进行深入研究,并提出多种针对资源环境的检测方法,但现有的资源环境检测方法在实际应用中存在费用高昂、检测结果信息不完整的问题,导致其实际应用价值无法充分发挥[2]。
图像识别技术是人工智能的一个重要领域,利用该技术可实现对图像资源对象的识别,从而实现对不同模式的目标和对象的识别。该技术常被应用于计算机、电力等领域中,其应用效果十分可观。但该技术在环境领域中的应用相对较少,更未涉及资源环境监测[3]。因此,为提升资源环境检测的精度,本研究在图像识别技术的基础上,对其在资源环境检测中的应用展开研究。
1 资源环境高光谱图像采集与标定
为实现对环境资源的高精度检测,在开展相关研究前,对资源环境的高光谱图像进行针对性采集,高光谱图像不仅涵盖了被测对象的空间特征,还可描述被测物体的光谱波段信息[4]。为获取高光谱图像,本研究选用成像仪、扫描设备、支架、数据处理器、高精度分析仪等图像获取装置来获取相关图像。采集过程如图1所示。
图1 高光谱图像采集原理
为确保采集到的高光谱图像能满足资源环境检测需求,应在现有工作的基础上,对设备进行调试与选型,采集设备的具体型号和应用中的技术参数见表1。
表1 高光谱图像采集设备构成与技术参数设计
将采集到的图像保存到成像设备中,保存前对数据格式进行调试,将图像以BIL格式文件进行保存,并对其进行标定处理。在采集过程中,反馈图像极易受自然光线、环境等因素的影响,会出现异常现象,为确保反馈图像具有较高的精度,可在现有工作的基础上,对反馈图像进行校正,该过程被称为高光谱采集图像的标定过程[5]。对此过程进行描述,见式(1)。
式中:R为高光谱采集图像的标定或校正处理过程;I为采集到的原始项;B为校正或标定处理参数;W为校正模板。按照上述方式来对采集到的图像进行采集与标定处理。
2 资源环境检测数据预处理
在完成上述设计后,使用ENV15.3工具来提取对图像中感兴趣的区域。由于采集到的样本图像所在的位置高度不一致,会导致资源环境高光谱图像出现散射问题,导致原有的光谱变化效应被覆盖[6]。因此,在上述内容的基础上,对标定图像进行散射处理。在此过程中,计算出样本图像的光谱值,将此数值作为参照,计算多项式回归系数,采用平滑滤波处理的方式对数据进行预处理,见式(2)。
式中:I为资源环境检测数据的预处理;β为平滑滤波处理;K为图像中多项式回归系数;J为图像中的感兴趣区域覆盖面积。在此基础上,对图像进行归一和约束处理,导出数据,将其作为完成预处理后的环境资源检测数据。
3 基于图像识别技术的光谱图像分类
在完成资源环境检测数据进行预处理后,利用图像识别技术对获取到的光谱图像进行类别划分。利用PCA白化技术对经过处理后的高光谱数据进行特征提取,并选择其中具有代表性的重要波段来代替原有数据[7]。将SVM作为图像分类器,在1到6的范围内对主成分量不断进行选择。结合分类结果的准确率来确定最优的主成分参数。在确定主成分参数时,若分类结果的主成分连续增加,但分类的正确率没有增加,则表示此时对应的数值为最佳主成分数值[8]。利用PCA白化技术对光谱图像进行变换后,在降低数据维度的同时,也保留图像中的大部分信息。在分类过程中,SVM图像分类器的核函数见式(3)。
式中:L(a,ai)为SVM图像分类器的核函数;a为光谱图像中的元素;ai为与a相邻的光谱元素;为径向基系数。利用SVM图像分类器核函数对不同特征进行映射。在映射过程中,可利用SVM图像分类器对光谱图像的二分类问题进行处理。针对不同的光谱图像,可采用多个SVM图像分类器相结合的方式来实现。由于通过资源环境检测技术得到的图像有着HSI数值维度较高、特征较多及数据信息量较大的特点,可采用SVM图像分类器中的ovo模式,即对光谱图像进行一对一的分类识别模式[9]。假设在经过预处理后得到的特征数据中存在i类和j类数据(其中i的取值小于j的取值),则针对i类和j类数据构建一个分类器。在完成映射后,通过映射结果来区别不同的光谱图像。将完成分类的光谱图像特征数据扩展到更多维度的空间中,并完成对高光谱图像的构建。高光谱图像的计算公式见式(4)。
式中:D(X,Y)为多维度D中数据点X与数据点Y之间的距离;X1,…,Xn为数据X在1~n维度空间上每一个维度上的大小;Y1,…,Yn为数据Y在1~n维度空间上每一个维度上的大小。根据公式(4)可在计算机中完成对多个不同资源环境区域光谱图像的分类,为后续资源环境区域面积的检测与识别提供依据。
4 资源环境区域面积检测
在完成对光谱图像分类后,对资源环境区域面积进行检测。通过实地考察获取到的资源环境光谱图像的类别较多,且数据量较大,在检测过程中极易出现冗余现象,可通过F-SVD与XGBoost相结合的方式来解决检测过程中的常见问题。将完成分类的光谱图像投影到维度更低的空间中,以此来避免维数灾难问题的发生,同时实现对光谱图像特征的提取,并将损失的信息量尽可能降到最低[10]。通过FSVD、XGBoost来挖掘原始数据中包含的少数互不关联的潜在变量数据,利用其来实现对原有变量的反应,从而实现降低高光谱的维度。假设通过上述分类后得到的高光谱图像分类数为W,波段数量为V,则其原始变量可表示为Q=(q1,q2,…,qv),其公共因子可表示为F,F=(f1,f2,…,f u),其中u的取值小于v的取值。将原始变量W进行分组,并使组内具有高相关性、组间具有低相关性,利用有限的u个公共因子来表示原数据中的大部分信息,并得到如式(5)所示的公式。
式中:B为因子载荷矩阵;ε为特殊因子。将经过处理后得到的资源环境图像代入到XGBoost当中,并对XGBoost中的参数进行设置,具体设置见表2。
按照表2中的内容对XGBoost中的参数进行设置,从而识别出资源环境图像中属于资源环境的区域面积,并进行标记。根据标记结果,并结合几何面积的计算公式,从而确定资源环境的具体面积,以此来实现对资源环境的检测。
表2 XGBoost参数设置表
5 实例应用分析
在完成对资源环境检测方法的理论设计后,为进一步验证该方法在实际应用中的可行性,将该方法应用到某自然生态环境中,将该自然生态环境作为试验环境,并对其进行资源环境检测。在实地勘察中,通过拍摄方式获取该自然生态环境中的2 000张图像,将其作为研究对象。利用本研究提出的基于图像识别技术的检测方法对获取到的2 000张图像进行识别,为了对检测效果进行评价,选择OA值作为对检测精度评价的量化指标,OA值为图像正确分类样本数与总样本数的比值。OA值越大,则说明正确分类的样本数越多,越能促进检测精度的提高;反之,OA值越小,则说明正确分类的样本数越少,越无法促进检测精度的提升。OA值的计算公式见式(6)。
式中:T为正确分类识别的资源环境图像数量;W为样本中需要进行分类识别的资源环境图像数量。从公式(6)的进一步分析中得出,OA值最小为0、最大为1。根据公式(6)可计算出OA的具体数值。按照OA值与检测精度的关系,计算出2 000张图像的检测结果,具体情况见表3。
由表3中的检测结果数据的精度可以看出,利用本研究提出的基于图像识别技术的检测方法在对样本数量从200张到2 000张图像进行分类识别时,其OA数值始终在0.94及以上,因此该检测方法的精度达到极高水平。
表3 基于图像识别技术检测方法检测精度OA值记录表
由于自然资源环境中存在着较多的不确定因素,无法通过人为的方式进行控制,因此在基于图像识别技术的检测方法检测精度的基础上,引入Kappa系数,利用这个以混淆矩阵为基础的评价参数,对本研究所提出的检测方法的检测精度进行更深入的评价分析,以此也能够进一步提高此次实例应用分析的客观性和可靠性。Kappa系数的计算公式如式(7)所示。
式中:N为需要进行识别检测的图像样本数量;xii为利用本研究所提出的检测方法正确检测识别的样本数量;xi+为各行之和;x+i为各列之和;n为行或列。结合公式(7),明确Kappa的取值为0~1,Kappa值越大,则说明检测精度越高;反之,Kappa值越小,则说明检测精度越低。根据上述理论,再将通过Kappa计算公式得到的结果进行记录,如表4所示。
表4 基于图像识别技术检测方法检测精度Kappa值记录表
与表3相比,表4中的Kappa值尽管在数值上出现了略微的降低,但在环境检测精度上,Kappa值仍在0.90以上,符合对资源环境检测的精度要求。综上所述,本研究所提出的检测方法在实际应用中具备极高的检测精度,可对资源环境的管理和整治提供更有利的技术条件,从而实现对自然资源的保护。
6 结语
当前,各类科技快速发展及全球化步伐的加快,环境问题也在不断加剧,大气污染、土地荒漠、地震等都是由资源浪费而造成的环境问题。此类问题的产生,不仅会影响到人类的正常生活,同时还会对国家经济的发展产生严重影响。对此,为强化资源环境保护能力和水平,引入图像识别技术,对资源环境检测方法进行设计研究,并通过试验对该方法的可行性进行检验。将该方法应用于实际中,可准确识别资源环境,并进一步计算出具体覆盖区域面积,为环境治理提供重要依据。