基于YOLOX的货运源头遥感解译标志库研究
2024-02-23罗卿莉刘宇婷蒋鑫涛
罗卿莉 刘宇婷 蒋鑫涛
(天津大学精密测试技术及仪器全国重点实验室,天津 300072)
引言
车辆超载、超限不仅会降低车辆制动性能,进而严重危害交通运输安全[1-2];另外,车辆超载引起的公路结构性损害也会增加公路的维护费用,造成巨大经济损失[3-4]。
货运源头核查工作是进行源头治超的关键环节,相关管理部门进行了多方面尝试,并取得一定的成果。唐山市交管部门提出使用远程视频监控系统监控出入厂车辆[5];重庆市交管部门搭建治超信息平台,对重点源头装载企业安装称重检测和监控设备,联网接入治超信息平台[6];广西壮族自治区采取对重点源头驻点、巡查以及技术监控的措施[7]。然而,货运源头具有分布不均、类别繁多等特点,且目前货运源头核查手段大多只针对重点源头,很多一般非法源头难以发现。此外,人工方式核查还存在成本高、效率不高等问题[8]。
遥感影像解译是指依据各类解译方法,从遥感影像中根据不同应用需求提取不同目标信息,针对影像特征进行目标性质判断,获取特定数据信息的过程[9]。基于遥感影像所建立的解译标志库是一种能够辨别地物信息特征的数据集合[10]。现有较多关于海岸线、矿山地质、建筑物等的解译标志研究[11-13],但尚无公开的货运源头解译标志库。YOLOX为轻量型目标检测网络YOLO系列中满足实际应用场景中效率与精度平衡要求的网络结构[14-15]。卫星遥感具有覆盖范围广、时效性强的优点[16],利用遥感影像,基于深度学习的方法,建立货运源头解译标志库,可指导货运源头核查工作,有效弥补现有方法存在的源头监察不全面等问题[17]。针对天津市存在大量货运源头以及未有公开的货运源头解译标志库的现状,选择天津市作为研究的主要对象,建立解译标志库应用于天津市遥感影像货运源头解译,以期对相关部门货运源头核查工作提供指导。
1 工程概况
天津市各个区内分布有各种类型的货源源头工厂,如图1所示。基于天津市不同类别的源头分布情况,对货运源头分布地进行标注(见表1)。天津市北部山区主要存在各类矿山和砂石开采及加工工厂,以蓟州区为例,货运源头主要可以分为疑似开采点、沙石囤积点、大型建筑工地、疑似货运源头四大类。该区东部沿海是物流集散的主要地点,存在各类货物的交接运输与囤积,货运源头主要可以分为港口、铁路货车、大型物流园以及大宗货物集散地,其中货物类型主要以铁矿石、煤炭以及原油为主。西南向静海区主要以钢材堆场为主,存在许多大型钢铁生产加工工厂,货运源头主要是钢铁工厂。中部东丽区存在较多新建楼房泥沙需求大,货运源头主要为水泥工厂和囤积点。
表1 货运源头类型解译标志
图1 天津市货运源头分布情况Fig.1 Distribution of Freight Sources in Tianjin
2 货运源头解译标志库建立
2.1 货运源头解译标志
货运源头解译过程就是依据各种解译技术和方法,在遥感影像上进行目视解译,得到各类货运源头的解译结果,再根据结果建立对应的货运源头解译标志,用于指导相关部门进行货源源头核查相关工作。对全市货运源头进行分析,建立对应解译标志库。天津市货运源头解译标志库主要包含的货运源头分为四类企业和四类场站八大类。
四类企业包括矿石(疑似开采点)、钢铁企业、水泥企业以及沙石囤积点;四类场站包括港口、铁路货场、大型物流园以及大宗货物集散地。通过货运源头标志解译,可以实现对遥感影像上货运源头的快速识别与分类,标志解译的质量直接影响后续解译的精度。
2.2 解译依据及流程
影像解译主要依据为货源源头的波谱特征、几何特征、时间特征、植被特征、水系特征等[18]。对影像中货运源头进行描述,并给出典型解译例图,同时结合研究区域的特点,对解译源头进行实际的综合评估和修正。
基于试验区域的遥感影像进行解译标志库建立工作,主要流程包括:①根据货运源头在遥感影像特征进行货运源头信息分析;②根据分析结果进行货源源头分类,制作用于深度学习的各类源头标志图样本;③构建深度学习网络模型使用解译标志样本进行模型训练;④使用训练完成的模型进行遥感影像上的标志获取及分类;⑤基于深度学习生成结果构建货源源头解译标志库;⑥对分类结果中的部分重点结果进行现场确认或具体信息查询,根据实际情况纠正解译标志库;⑦使用纠正后的解译标志图对模型进一步训练提高模型鲁棒性。
基于深度学习的货运源头解译结果,结合现场勘察纠正能够建立较高精度的解译标志库。后续根据实际应用情况,对解译标志库进行进一步调整改进,通过多次实际应用完善网络参数,提高解译结果的可靠性和科学性,最终得到具有鲁棒性的深度学习模型,实现遥感影像准确度较高的自动解译。
2.3 建立货运源头解译标准
利用不同的货运源头目标在遥感影像上不同的纹理特征、光谱特征以及几何特征等,结合周边环境特点分析确定是否为货运源头并确定其类型,制作用于深度学习网络模型训练所需的各类源头标志图样本库,包含四类企业和四类场站八大类。
利用初步建立的解译标志库进一步对蓟县区的货运源头进行现场验证,充分利用遥感监测技术优势解决蓟州区货运源头核查工作存在的一系列难题。对重点研究的蓟县区的货源源头进行细分,确定疑似开采点、沙石囤积点、大型建筑工地、疑似货运源头四类。其中大型建筑工地及疑似货运源头解译标志见表1。针对蓟州区进行重点研究,通过人工方式分析货运源头项目共建立疑似开采点样本206个,砂石囤积点样本109个,疑似货运源头样本26个,大型建筑工地样本25个。
蓟县区各类货运源头解译结果见图2,组织有关执法人员对疑似源头点位60处进行现场核实,共清理砂违法石囤积点7处、违法开采点1处、约谈源头点位相关负责人9人次,纳入重点监管点位42处。
图2 蓟县区解译结果Fig.2 Interpretation Results in Jixian District
2.4 建立基于YOLOX的货运源头遥感解译标志库
(1)制作货运源头数据集
数据源选自Google Earth上截取的卫星遥感影像。为了制作训练网络所需的数据集,使用天津市货运源头遥感核查工作研究中的货运源头遥感变化检测的地理位置数据,利用Google Earth截取遥感影像,针对文件中货运源头随时间的变化情况采集不同时间的遥感影像,实现数据集的扩充。所制作的存储货运源头类别及位置信息的数据集共有743张遥感图像,其中包含的样本有疑似开采点88个、港口75个、沙石囤积点120个、钢铁企业33个、水泥企业35个、铁路货场35个、大型物流园82个、大宗货物集散地18个,将数据集以9∶1的比例划分为训练集和测试集用于后续的训练。
(2)建立YOLOX神经网络模型
制作货运源头遥感影像的数据集后,建立用于检测遥感影像并进行分类的深度学习模型。所建立的深度学习模型基于卷积运算的神经网络,以多层自编码神经网络的方式进行预训练,通过对目标对象进行特征提取来优化神经网络的权值,最终实现预测结果误差下降为最小值,以达到预期的目标检测效果。
根据货运源头样本大小变化较大及实时性要求较高的特点,选用YOLOX作为目标检测算法。YOLOX以YOLOv3的Darknet53网络为基础,并将YOLOv5的CSPnet结构进行改进,能够自适应锚框大小并根据目标对象的大小动态匹配样本。YOLOX的网络结构见图3[19-21]。
图3 YOLOX网络结构Fig.3 YOLOX network structure
YOLOX所使用的主干网络为CSPDarknet,激活函数选用在Sigmoid和ReLU基础上改进后的SiLU激活函数,适用于深层网络。CSPDarknet通过残差卷积来缓解梯度消失的问题,并且使用CSPnet结构对残差进行拆分,将得到的3个特征层送入特征金字塔(feature pyramid networks,FPN)并进行上采样和下采样,融合不同尺度的特征信息。相较于其他的YOLO版本,YOLOX对YOLO Head进行改进,将YOLO Head的解耦头分为2部分,预测时再进行整合,能够有效提高收敛的速度。
3 实验与精度评估
3.1 网络训练过程
建立虚拟环境,基于Tensorflow2.4.0搭建YOLOX网络,CUDA版本为11.6,数据集格式为VOC。将制作好的遥感图像与标签文件送入网络进行训练,训练前加载预训练参数,使加载的模型参数更适用于待训练的数据集,提高训练结果。训练过程使用GPU进行加速,根据损失值大小变化趋势判断训练过程是否结束,当测试集损失维持稳定时,模型基本收敛,结束训练过程。
3.2 目标检测精度评价指标
在目标检测中,使用precision来评价模型某一类物体时预测正确的情况占所有检测目标的比例[22],recall用于评价在某一类物体中有多少比例被模型正确检测。以recall为横轴,precision为纵轴可画出P-R曲线,P-R曲线与横轴的面积即为AP(Average Precision)。
平均漏检率(miss rate)为评价漏检个数的指标,计算式为
(1)
F1score同样为评价分类精度的指标,计算式为
(2)
为评价所使用网络模型的性能,使用AP、平均漏检率和F1score3个评价指标分别评价模型单个类别预测精度、漏检情况和对平均precision与recall情况下单各个类别的检测精度。
3.3 货运源头目标检测精度
利用本文提出的方法,针对滨海新区获取的高分2号和7号影像进行实验,所得到的八类货运源头精度见表2。其中,钢铁企业、水泥企业与大宗货物集散地由于数据样本过少,精度较低,识别效果不佳,漏检率较高。铁路货场样本数据不多,但由于铁路与集装箱的特征明显,检测精度略高于钢铁企业、水泥企业与大宗货物集散地。疑似开采点、港口、沙石囤积点与大型物流园样本量相对较多,精度较高,且港口样本中水体与船只特征明显,利于特征提取,AP可达0.84。
表2 货运源头预测精度
利用训练后所得权值进行预测,结果见图4,能够识别一些主要特征较为明显的货运源头。疑似开采点多为绿色植被包裹的白色区域;钢铁企业多含黑红色钢铁图斑;水泥企业区域内含灰黑色水泥;沙石囤积点有蓝绿色塑料布覆盖黄色沙石;港口为陆地与水域有船只的交界处;铁路货场周围多含铁路或公路;大型物流园与大宗货物集散地多位于港口附近,区域内有大量煤炭等与集装箱堆积。
图4 货运源头检测结果Fig.4 Freight source detection results
3.4 货运源头遥感图像检测平台
实现目标检测可通过命令行的终端窗口,为简化用户交互的过程,需要设计一个图形界面,能够读取所选择要预测的遥感图像,展示预测结果。基于Vue3.0和node实现的货运源头在线识别窗口见图5。检测平台具有单张上传与批量上传的功能,在单张图片预测界面,可通过输入图片url或上传本地图片到后端调用服务器命令行启动算法进行预测,并回传入前端以供浏览;批量上传界面可选择多张图片传入服务器,并接收到服务器预测结束后传回的压缩包文件,实现对一批数据的在线预测功能。
图5 货运源头遥感图像检测平台Fig.5 The detection platform of freight sources
4 结论
遥感影像能够有效指导货运源头核查工作,货运遥感解译标志库作为影像解译过程中的必要参照依据,可为解译结果提供技术支撑。通过对天津市货运源头进行综合分析,确定了四类企业和四类场站八大类解译标志库。
货运源头解译标志实现对天津市货运源头的精细分类,为实现智能解译提供货运源头分类标准,建立能够自动识别货运源头的目标检测算法,搭建货运源头遥感图像检测平台,能够有效减少人工解译时间。解译标志库在天津市蓟县区影像解译中的成功应用,证明解译结果具有可靠性和科学性,能够用于指导相关部门货运源头核查工作。