APP下载

基于U-net神经网络的烟草种植信息提取

2021-11-30张雷刘昌华石林峰张鹰

农业与技术 2021年22期
关键词:烟草图像模型

张雷 刘昌华 石林峰 张鹰

(1.河南理工大学测绘与国土信息工程学院,河南 焦作 454000;2.自然资源部第一大地测量队,陕西 西安 710054;3.河南省现代农业大数据产业技术研究院,河南 郑州 450046)

引言

烟草的种植信息在我国的生产管理过程中有着十分重要的作用,可以为我国的烟叶种植以及收购提供重要的决策支持[1,2]。我国烟草的生产和消费在世界上占有重要地位,但由于我国地域面积广阔,不同地区的地形条件各不相同。传统的烟草面积提取常采用人工实地调查的方法进行,这样不仅耗时费力,而且人为产生的因素可能增大测量的误差[3],很难实现对烟草进行实时监测。

在本原性错误中,近20%的错误为概念理解性错误,近80%的错误为数学推理错误.就数学推理错误进行了访谈,结果发现:职前教师之所以认为昆明空气质量好,是因为主观上认为昆明是全国有名的空气质量好城市,加之计算平均数时发现两者之间差异不大,所以就忽略这种差异,于是“想当然”地推理出“心中的答案”.

随着遥感技术的发展,因其监测范围大、快速成像和多波段的特点,被广泛应用于作物监测中[4-6]。相比传统的依靠人工实地测量的方法,运用遥感技术可以大大节省人力,并且可以提高其准确性[7]。刘芸等[8]采用面向对象方法,根据烤烟的NDVI、光谱、纹理以及形状等特征,提取烤烟种植信息,总体精度达91%;雷春苗等[9]利用随机森林、支持向量机、BP神经网络、SoftMax和最大似然分类器对柴达木地区的枸杞进行提取,几种分类器都有着不错的分类精度。

近年来深度学习兴起,大量学者通过深度学习的方法进行作物分类和识别。Kussul等[10]利用深度学习方法对不同的数据进行农作物分类,取得了较高的准确率;董秀春等[11]利用开放的Google Earth影像结合U-net网络模型,对云南省陇川县甘蔗种植区进行提取,总体精度达92%,面积精度为94%;陈妮等[12]利用U-Net深度学习网络模型对新昌县土地利用进行分类,取得了较高的精度;宋晓倩等[13]利用迁移学习方法提取葡萄种植信息,较传统深度学习方法准确率提高了7%;李涛等[14]在imageNet数据集的基础上,将模型进行微调,对玉米雄穗进行识别,证明深度学习方法在作物特征识别中的良好表现。

洛宁县具有良好的生态环境,非常适合烟草的生长,烟草的种植一直处于洛阳市前列,成为当地的支柱性产业,也是当地人民脱贫致富的重要途经之一。快速准确地掌握烟草的种植分布和面积等情况是政府决策部门的当务之急[15]。

实验的硬件CPU为英特尔Xeon E5-1620v4@3.20GHz,GPU为NVIDIA Quadro M2000。TensorFlow后端的Keras深度学习框架实现U-net模型的搭建与实验行每一个特征点的分类。Keras自带的生成器不支持多波段,所以自己编写实现,并对U-net网络添加BN层和Dropout 层,优化器选用Adam,损失函数为交叉嫡函数。

1 材料与方法

1.1 研究区概况

高分二号(GF-2)卫星是我国自主研制的首颗空间分辨率优于1m(星下点全色分辨率0.8m)的民用光学遥感卫星,在作物识别、建筑物识别、矿山遥感监测、林业监测等方面有着广泛的应用[17]。

1.2 数据来源及预处理

研究区位于河南省洛阳市洛宁县,全县面积2306km2,位于E111°08′~111°49′,N34°05′~34°38′。地形地貌总体呈“七山二塬一分川”,生态环境良好,全县耕地面积约8.67万hm2,适宜种烟面积达3.73万hm2。本研究实验区选择洛宁县小界乡,该乡连续7a被洛宁县政府评为“烟叶生产先进乡镇”,连续4a被洛阳市政府评为“烟叶生产先进乡镇”[16]。

U-net是一个优秀的语义分割模型,如图1所示。U-net网络主要分为上采样和下采样部分,下采样也就是主干特征提取网络,利用主干部分,获得5个初步有效特征层;在加强特征提取网络部分,对获得的特征层进行上采样,并进行特征融合,进而得到一个融合所有特征的有效特征层;利用预测网络,对获得的融合所有特征的有效特征层进行每一个特征点的分类。

结合当地各类作物的物候,7月左右烟草与其它作物最易区分,因此本研究使用高分二号卫星PMS传感器在2020年7月7日的洛宁县区域的5景遥感影像,数据来源于中国资源卫星应用中心(www.cresda.com/CN/)[18]。其中,4景用来制作深度学习训练样本,1景用来烟草信息的提取。另外,利用无人机拍摄的小范围高分辨率影像,集思宝实地调查记录烟草地块空间位置信息数据,辅助后期样本标签的制作。

利用ENVI 5.3对原始影像进行辐射定标、大气校正、正射校正和影像融合等预处理操作。并通过Arcgis软件结合无人机、集思宝数据对烟草地块进行标注。用于制作深度学习训练标签。

1.3 数据集构建

通过ENVI 5.3对高分二号原始影像进行数据预处理,将包含较多烟草的区域剪切出来,并利用ARCGIS进行烟草样本的标注,如果直接将图像输入到深度学习网络中,会导致内存溢出,因此需要将影像剪切成合适的小块,本研究通过python脚本对影像和标签图像进行随机裁剪,生成大小均为256×256的卫星图像和标签图像。因样本数量有限,为了避免训练过程中出现过拟合现象,需要对数据进行数据增强[19]。将裁剪处理后的原始影像和标签图像进行水平翻转、竖直翻转以及对角翻转,样本扩充到2000张。按照7∶3的比例将样本分类训练集和验证集。

1.4 分类方法

由表2可以看出,大学生之所以选择贷款,绝大部分原因是为了补贴生活费.提前消费是选择贷款的一个主要推动力,消费欲望则是选择贷款的另一大推动力.隐藏在校园贷中的一个主要问题是大学生盲目消费,不能合理支配资金.在调查的520个学生中,有123个大学生使用过校园贷.在使用过校园贷的学生中,有56.10%的大学生贷款金额在1 000元以内,贷款金额1 001~5 000元的占20.32%,5 001~10 000元的占10.57%,有13.01%的大学生竟贷款达到了1万元以上,远远超过了他们的承担能力.这表明当代大学生存在很多不考虑自身情况及后果的个体,缺少前瞻性.

在模型训练时,为控制网络的稳定性,初始学习率设置为1×10-4,通过Adam优化器计算损失值相对于网络参数的梯度,将参数进行反向传播,进而降低损失值[21]。设置迭代次数50次,给训练模型设置回调函数,在val_loss连续10轮不下降则训练停止,当3个epoch过去而val_loss不下降,学习率减半。训练后绘制的loss和acc曲线如图2、图3所示,可以看出,训练集和验证集有很好的拟合效果。在进行40个epoch的时候,曲线开始趋于稳定,损失值在0.02左右波动。说明学习率设置较为合理,损失函数实现快速收敛,可见U-net网络对烟草数据集进行了有效的学习。

图1 U-net网络模型

1.5 模型评价指标

为了评价模型在烟草提取中的性能,本研究对测试结果进行准确率(P)、召回率(R)和F1值等评价[20]。计算公式:

(1)

(2)

(3)

从目前的大学生就业形势来看,就业形势严峻并不是工作岗位少,而是工作岗位的匹配度不高,市场上所需的人员和职业,市场营销占据了大多数。但大学生的就业观念还是停留在传统的观念上,认为政府机关、国企、银行、大公司、外资企业的职业是金饭碗,希望到这类地方就业,可是,大学生喜欢的就业部门都存在不同程度的减员增效和机构合并,岗位十分有限,相比之下就显得就业难度较大。此外,由于大学生刚出校门,没有技术经验和资金积累,要想进行创业就要突破许多障碍,但难度较大,成功率较低。即使成功后,由于门槛低、技术性不强等原因也会被市场淘汰。

2 结果与分析

2.1 U-net模型训练

当前建筑企业管理在工作开展过程中并没有严格按照《企业会计准则》等相关文件的指导来开展坏账准备工作。建筑企业过度追求产品销售的利益,在进行赊销销售款收回过程中,其清算工作并没有按时开展,对应的资金收回工作也受到影响。同时,工作人员并没有及时与供货方取得联系,随着时间的推移,建筑企业收回资金的可能性逐渐下降。在这种情况下,购货单位对还款工作的重视程度也会逐渐下降,不断地延迟还款,导致建筑企业的坏账率逐渐提高。

(2)35岁(含 35岁)以下护理人员,调查中显示来自学习方面的压力很少,说明这一年龄段的人员希通过学习来提高自己,针对这个特点,工会可结合自身的“一活动 一工程”等活动开展一系列的职工技能竞赛和培训;

因为网络上并没有公开的烟草数据集,本研究使用自己制作的数据集对初始网络进行训练,输入的图像大小为256×256尺寸,将数据集按7∶3划分为训练集和验证集输入到训练网络中。

式中,TP表示样本的真实类别是正类,并且模型识别的结果也是正类的数量;FP表示样本的真实类别是负类,但是模型将其识别为正类的数量;FN表示样本的真实类别是正类,模型将其预测为负类的数量。

进行基层区队腐败治理的过程当中,还需要做好第四步的工作,凸显出论剑的效果。不断健全相应的监督管理制度,以达到应有的目的。具体而言,第一,应该对企业员工工资与奖金的分配流程予以优化和严格管控,通过组织开展相应的会议,同时将会议的内容予以公开,形成规范化的审批模式,要求员工亲自在工资表上签字,维护好职工的利益。第二,注重基层区队文书的管控。依靠构建相应的业绩考察、沟通互动以及腐败治理等相关机制,达到一定的约束与管控的效果[4]。

图2 U-net训练集和验证集loss曲线

图3 U-net训练集和验证集acc曲线

2.2 图像预测结果及验证

利用训练好的模型对待分类影像进行预测,在预测过程中,如果直接将影像输入到模型中会造成内存的溢出。所以,一般将图像裁剪成较小的图像分别输入到模型中进行预测,然后再将预测结果按顺序拼接起来。如果采用常规的规则网格裁剪,最后预测拼接的效果并不是很好,会有明显的拼接痕迹。因此,采用忽略边缘预测,有重叠地裁剪影像,在拼接时再采用忽略边缘的方法进行拼接。

将预测结果与标注后的真实烟草标签图像进行精度评价,原始图像和人工目视标注的标签图像以及预测结果图像如图4~6所示,将预测结果与实际标注的结果进行精度评价,取得了90.68%的精确率和92.87%的召回率。综合评价指标F1值为91.76%。

图4 原始图像

2.3 不同模型烟草提取结果对比

为了进一步验证本文所使用的U-net网络模型的有效性,使用其它常用的分类模型进行烟草提取并进行精度对比。从图7可以看出,KNN、Decision Tree和Random Forset模型的准确率分别为87.68%、83.65%和89.21%,相比之下,U-net网络模型的准确率比其它模型平均高出3.8%。

图5 人工目视标签图像

图6 U-net网络预测图像

图7 各分类模型烟草提取准确率

以上结果表明,U-net神经网络模型在少量训练样本的时候,依旧可以取得很好的信息提取效果。

3 结束语

本研究使用U-net神经网络模型,实现了对烟草种植的提取,对于没有公开的烟草数据集的情况,通过实地调查结合目视解译制作深度学习训练标签。通过与其它常用分类模型进行精度对比,U-net在少量数据集的情况下,表现出良好的性能。

相关研究还有待深入,需解决面积漏分的问题,需进一步提高训练样本的多样性和优化网络模型;不同烟叶种植地区地形各不相同,本文只对洛宁县山区进行烟草面积提取,后续可在扩大数据集的基础上,开展不同地形情况下烟草种植面积提取研究,并进一步探究U-net网络模型的普适性。

猜你喜欢

烟草图像模型
烟草具有辐射性?
改进的LapSRN遥感图像超分辨重建
重要模型『一线三等角』
有趣的图像诗
重尾非线性自回归模型自加权M-估计的渐近分布
烟草依赖的诊断标准
3D打印中的模型分割与打包
烟草中茄酮的富集和应用
FLUKA几何模型到CAD几何模型转换方法初步研究
遥感图像几何纠正中GCP选取