基于视频的车载屏幕互联与识别算法研究

2019-05-22潘雨哲黎静

无线互联科技 2019年4期

潘雨哲　黎静

摘要：文章研究了基于视频的车载屏幕互联与识别算法。基于智能后视镜搭建路况识别原型系统，依托车载摄像头收集训练图片，运用神经网络与深度学习，将视频图像进行特征提取后，利用支持向量机进行分类识别，实现车辆检测技术。

关键词：人工智能；图像识别；神经网络；深度学习

在车载系统愈发智能化的今天，智能云镜的功能不断创新，导航可用车载导航系统甚至可以用手机，行车记录有传统的行车记录仪和全方位摄像头，停车监控在很多车载操作系统中也有相应的功能，智能云镜功能日益重复[1]。日前，已有部分国家对汽车后视镜的相关政策做出了修订，日本颁布新政策称允许汽车用摄像头代替反光镜；同时，联合国欧洲经济委员会制定的后视镜相关规则也被修订。在智能云镜的发展过程中，物体识别一直是一个重要的研究方向，移动网络由4G走向5G时代，这为移动设备提供了更快的数据传输渠道，因此，对云镜的视频识别功能要求也越来越高[2]。基于以上背景，本文提出了利用视频识别算法与车载屏幕互联实现车辆检测。

1 神经网络与深度学习

人工神经网络（Artificial Neural Network，ANN），简称神经网络或类神经网络，是一种模仿生物神经网络（动物的中枢神经系统）的结构和功能的数学模型或计算模型，用于对函数进行估计或近似[3]。

神经网络由大量的人工神经元联结进行计算，大多数情况下人工神经网络能在外界信息的基础上改变内部结构，是一种自适应系统。人工神经网络可处理非线性统计型数据，具有并行结构对神经网络中的每个神经元进行同样的运算，便于计算机的运算处理。此外，有学习和记忆的功能，通过对一个神经网络的训练能够判别事物和联想记忆[4]。

深度学习是神经网络的一个大分支，深度学习的基本结构是深度神经网络。深度学习网络与传统的神经网络之间的相同之处，就是二者都是相似的分层结构，包括输入层、隐层和输出层的多层网络，其中只有相邻层之间有链接，同一层及跨层之间是没有连接的。不同之处在于，传统神经网络一般只有两层或者三层的神经网络，参数和计算单元有限，对复杂函数的表示能力有限，学习能力也有限；而深度学习具有更多的神经网络，并且引入了更有效的算法[5]。

云计算时代来临之后，作为目标检测两大派系之一的“R-CNN系二刀流”，是第一个成功将深度学习应用到目标检测上的算法，解决了“生成可能区域（Region proposal）&卷积神经网络（Convolutional Neural Networks，CNN）提取特征”和“放入分类器分类和修正”的问题[6]。

不同于经典目标检测算法（如overfeat）中的滑动窗口扫描所有可能区间，R-CNN使用效率更高的selective search方法预先提取所有候选区域。R-CNN结合了高容量CNN应用于自下而上的生成区域算法中，以便对物体进行定位和分割，当标记的训练数据稀缺时，对辅助任务进行监督的预训练，然后进行特定领域的微调，性能将得到显著提升。因此，本文基于R-CNN（Region-CNN）算法，在CNN、线性回归和支持向量机（Support Vector Machine，SVM）等算法的基础上，实现目标检测技术[7]。

2 支持向量机介绍

SVM的基本模型是在特征空间中找到最佳的分离超平面，以便训练集上的正负采样间隔最大。SVM是用来解决二分类问题的有监督学习算法，在引入了核方法之后SVM也可以用来解决非线性问题。且训练完成之后，大部分的训练样本都不需要保留，最终的模型仅与支持向量有关。

一般SVM有下面3种：硬间隔支持向量机（线性可分支持向量机）：当训练数据可线性分离时，可以通过硬间隔最大化学获得线性可分支持向量机；软间隔支持向量机：当训练数据近似线性可分时，可以通过软间隔最大化获得线性支持向量机；非线性支持向量机：当训练数据线性不可分离时，可以通过核方法和软区间最大化来获得非线性支持向量机。由于在实际任务中很难找到合适的核函数，因此，样本在样本空间或特征空间中是线性可分的，所以本文使用SVM的软间隔支持向量机。SVM可以很容易地获得中小样本数据与特征之间的非线性关系，从而避免使用神经网络结构选择和局部最小值问题。它可以高度解释并且可以解决高维问题[8]。

3 车辆识别算法步骤介绍

本文研究内容主要为通过摄像头和智能云镜的相关技术，基于车载智能后视镜平台，研究前后车识别算法，实现基于前后车特征分类的方法，实现特定场景下的识别性能验证。而视频中的图像识别及特征提取主要包括以下4个步骤。

（1）利用摄像头对路况进行实时收集，如图1所示，将视频通过硬件设备进行图像分割形成独立的二值图像，本文采用图像目标检测算法对其进行形状检测，并经过灰度变换、灰度拉伸、去噪、滤波等过程对图像进行预处理得到灰度图。

（2）经过形状检测的灰度图还需进行形状提取，即对经过预处理的灰度图进行二值化处理，用以区分得到更加鲜明的图像，有利于后续的快速处理及分析，即深度学习。在二值化处理过程中，利用迭代法统计并计算出图像的各灰度分布，分为目标及背景两部分并进行多次迭代确定图像的最佳分割阈值。

（3）利用边缘检测算法分离目标与背景区域，仅对车辆部分进行增强。

（4）使用基于形态特征的分割法进行车辆定位，对视频中的图像帧进行特征提取，将提取出的图像利用支持向量机SVM进行图像分类获得车辆特征，如图2所示。

4 结语

本文利用车载摄像头提取视频图像，基于图像识别、特征提取以及神经网络与深度学习，在复杂背景下进行车辆检测。视频识别算法对于智能云镜的研究具有重要意义，定位视野前方的车辆并精确测量其相对于本车的位置，根据危险性给出不同程度的危险预警是进一步的研究方向。

[参考文献]

[1]GIRSHICK R，DONAHUE J，DARRELL T，et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C].Columbus：2014 IEEE Conference on Computer Vision and Pattern Recognition（CVPR），2014.

[2]MARK S N，ALBERTO S A.Feature extraction and image processing[M].Second Edition.London：Elsevier Academic Press，2002.

[3]劉仁云，孙秋成，王春艳.数字图像中边缘检测算法研究[M].北京：科学出版社，2015.

[4]CYGANEK B. 数字图像目标检测与识别：理论与实践[M].宋晓炜，杨蕾，瞿博阳，译.北京：电子工业出版社，2016.

[5]才溪.多尺度图像融合理论与方法[M].北京：电子工业出版社，2014.

[6]周志华.机器学习[M].北京：清华大学出版社，2016.

[7]华校专，王正林. Python大战机器学习[M].北京：电子工业出版社，2017.

[8]佚名.深度学习概述：从感知机到深度网络[EB/OL].（2015-08-27）[2019-02-15].http：//www.cnblogs.com/huicpc0212/p/4761875.html.