MobileNet网络模型在地图监管系统中的应用研究

2023-02-22王丽张秀民赵洪霞

科学与信息化 2023年3期

王丽张秀民赵洪霞

山东省国土测绘院山东济南 250013

引言

中国地图作为一种现代化的地理信息和空间信息的表现[1]，与人民群众的生活出行以及工作密不可分。国家版图是一个国家行使主权和管辖权的疆域[2]。“问题地图”主要指存在危害国家主权统一、领土完整、安全和利益等严重问题的地图，不符合我国的公开地图的产品要求，严重违反了我国的主权和领土完整性，因此问题地图的监管是地理信息管理部门一项重要的工作职责。

1 地图监管中常见的问题

随着互联网的快速发展，地图应用服务亦随之不断迅速发展，由于一些单位和个人的国家版图意识不足导致各种问题地图屡禁不止，部分网站或者网民通过国外网站下载使用损害我国领土主权和海洋权益的“问题地图”，包括错绘我国国界线，漏绘我国重要岛屿，登载敏感甚至涉密地理信息等，极大地损害了国家领土主权、安全和利益。本文所指的“问题地图”主要指以下几个方面的错误：①阿克赛钦地区国界线绘制；②藏南地区国界线绘制；③漏绘或错绘南海诸岛各岛点；④漏绘或错绘钓鱼岛、赤尾屿；⑤台湾省底色设置与大陆不一致等[3]。

2 MobileNet网络模型

2.1 卷积神经网络的原理和特点

卷积神经网络（CNN）是一种具有局部连接、权重共享等特性的深层前馈神经网络，其核心是卷积运算。CNN通过减少连接数量、共享权重和下采样来减少参数个数。CNN的每层中的神经元以三维方式排列，从而将三维输入变换为三维输出。每层中的神经元学习原始输入的非线性组合即特征提取。这些激活层成为下一个层的输入。最后，学习到的特征成为网络末尾的分类器或回归函数的输入。在定义网络的各层后，通过准备好的训练数据对网络进行训练。CNN由多个层组成，输入层实现将图像输入到网络并应用数据归一化，卷积层其中的滤波器和步幅层在扫描图像的同时学习由这些区域所局部化的特征，滤波器对输入进行卷积，卷积层是构建卷积神经网络的核心层，卷积层的数量取决于数据的量和复现性。池化层通过将输入划分为矩形池化区域并计算每个区域的最大值或均值来执行下采样，其自身不执行任何学习，但可减少要在后续层中学习的参数的数量。池化层按照一定的步长在水平和垂直方向扫描输入，池化相当于又进行了一次特征提取，从而更进一步获取更高层、更抽象的信息，可使网络能够容忍输入的微小变化，从而提高了泛化性，防止过拟合。全连接层将输入乘以权重矩阵，然后添加偏置向量。对于分类问题，网络的最后一个全连接层的输出参数等于数据集的类的数目，其将所有学习到的特征组合在一起来对图像进行分类。

2.2 经典的MOBILENET模型

卷积神经网络的一个重要特点就是参数多计算量大，模型结构对与模型耗时的影响如图1所示。

图1 不同层的GPU和CPU的时间消耗对比

图1是AlexNet网络中不同层的GPU和CPU的时间消耗，不管是在GPU还是在CPU运行，最耗时的就是卷积层，想要提高网络的运行速度，就得到提高卷积层的计算效率。

MobileNet的提出就是为了能够减少参数数量和计算量，MobileNetv1采用了深度可分离卷积来提高卷积层的计算效率，如图2所示。

图2 深度可分离卷积实现

深度可分离卷积被证明是轻量化网络的有效设计，是MobileNet的核心模块，其由深度卷积和逐点卷积构成。对比于标准卷积，深度卷积可以在不改变输入特征图像深度的状况下,获得和输入特征图像通道数一致的输出特征图。逐点卷积就是1×1卷积，其主要作用就是对特征图像进行升维和降维操作。

3 网络图片的智能分类识别方法实现

为了实现“问题地图”识别，首先要从海量网络图片中快速高效地识别出地图图片[4]，在这个任务中，我们假设每张图像只包含一个对象，采用图像二分类技术进行图片分类。本研究应用主要将MobileNetV1模型改造为二分类卷积神经网络模型，以实现地图图片的快速识别。

3.1 MobileNetv1体系结构上的迁移学习

通过查看MobileNetV1模型的神经网络体系结构，它先经过简单的顺序卷积层，然后再将其输出传递到一组最终的分类层，这些分类层确定了1000个类别的输出，我们的地图识别仅仅需要2个类别的识别即可，因此需要对分类层进行改造。首先我们从几十个政务网站收集整理了两类图片作为样本图像基本不属于MobileNet预先训练类别的图像，一类是地图图片，一类是其他图片，分别下载了2000幅左右，分别定义为1和0类别标签，然后导入TensorFlow，开始基于预先训练的MobileNetv1模型训练我们的自定义对象识别模型。我们在dropout层之前拦截该模型，将新的分类层附加到顶部，然后仅训练这些层以仅预测两个类别1（地图）与0（非地图），这样就保持了预先训练的空间层完整性。加载经过预先训练的MobileNet模型后，我们可以找到瓶颈层并创建一个新的、被截断的基本模型,冻结所有卷积基层以保留模型的训练，这样就可以再利用已经放入模型这一块中的所有处理能力，然后，我们可以将由多层全连接层组成的自定义分类头附加到基础模型的输出，通过降维、摊平数据、设置全连接层、激活函数，以训练成新的TensorFlow模型。最终的全连接层（密集层）仅包含两个单位，分别对应于地图与非地图类别，并使用softmax激活函数将输出的总和标准化为等于1.0，这意味着我们可以将每个预测类别用作模型的预测置信度值。在我们的自定义训练数据上训练我们的新TensorFlow模型，得益于MobileNet的精巧以及它所有的预培训，这次我们仅需要训练10个epoch，普通PC电脑用时不到20分钟就训练完毕。我们随机分别选取了100余幅地图和非地图图片进行识别效果评估，评估结果为：Loss = 0.6102；Accuracy =0.78947，受限于样本数量和电脑硬件条件训练出的模型，其识别效果还是非常理想的。

3.2 MobileNet网络模型技术运用前后的对比图

在MobileNet卷积神经网络技术应用之前，大量图片需要人工判断是否地图，然后再进行是否“问题地图”的识别，通过该技术的应用，对海量图片进行智能化的筛选，大大提高了工作效率，是目前对“问题地图”这一系列问题审核中较方便快捷方法之一，下一步可以将该模型应用于手机等嵌入式设备系统。

4 结束语

本文提出一种基于MobileNetv1模型改进构建的地图二分类识别模型，可快速高效的实现网络地图图片的快速自动识别。我们基于该技术开发的互联网地图识别系统，大大提高了网络图片的地图目标识别能力，采用具有CUDA深度神经网络库硬件加速的普通PC电脑其识别单幅图像的平均用时为0.36s，目标识别的准确率(accuracy)达78%，该方法基于MobileNetv1实现，虽然其识别精度低于ResNet等模型，实际应用中也取得了不错的效果，本文还希望起到一种抛砖引玉的作用。