基于模糊理论的车型识别技术研究
2023-10-02李旭茹
李旭茹
(山西农业大学软件学院,山西 太谷 030801)
0 引言
图像识别是指利用计算机技术对图像进行分析和理解,以识别各种目标和对象[1]。随着计算机的快速发展,图像识别技术在现实生活中扮演着越来越重要的角色。在农业中,为了给虚拟作物的研究提供依据,可利用图像识别技术分辨作物的类别、作物的生长状况、农作物中病虫害的图像诊断等[2],图像识别技术还广泛地应用于煤仓煤位监测、变电站智能巡检、故障远程监测系统等[3-5]。
本文研究的车型识别是图像识别的一支,是ETC系统重要的组成部分。目前常见的射频识别(Radio Frequency Identification,RFID)电子标签是粘贴于车辆前挡风玻璃上,该电子标签上有存储设备,将用户的信息,如:车牌号、人民币余额、车辆所属的类型等集中存储,读写器接收标签内存储的信息是通过无线、不接触的方式[6]。但在实际应用中,有的车主将RFID电子标签中的信息私自变换,达到逃避缴费的目的,这种情况加大了管控难度。为了解决此问题,引入基于图像的车型自动识别系统非常迫切。
目前,深度学习技术蓬勃发展,对车型识别等方面的相关研究也发展起来,但是深度学习需要有大量的训练样本,实际操作中难以广泛推广和应用[7-8]。本文将模糊理论应用于车辆识别,这种模式简单方便、易于推广和操作。具体过程为当贴有电子标签的车辆经过收费站,系统将提取车辆的有效信息,并自动比较提取的信息与电子标签存储的信息,结果一致的,进行自动扣费并起杆放行;对比结果不一致的,系统自动进行逃费违法行为抓拍。将本文算法应用于实际车型识别中,结果证实算法可行。
1 模糊理论的车型识别
目前,国内外对车型的模式识别还处于探索和发展阶段,相关研究比较少,仅有的研究成果也是在模板匹配和神经网络下的车型模式识别,难以广泛推广和应用。故而本文从实用性角度出发,提出应用模糊理论对车辆进行识别,便于推广和操作[9]。
在实际操作中,车辆在行进中是运动的,运用模糊理论的车型识别方法,通过外部安装的图像采集器拍摄两个时刻同一位置的车辆侧面照,然后将获取的图像信息存储到存储器,提取车辆轮廓和相关信息,再把数据传输到识别模块进行模糊模式识别,流程如图1所示。
图1 车型识别流程图
1.1 图像预处理
图像预处理主要包括图像灰度化、滤波、差影检测。本文采用加权平均法,亦称YUV方法进行灰度图像化,节省图像处理所占用的存储和时间。滤波采用了中值滤波技术,可以更好地保留图像中的细节,同时消除图像中的噪声。下面重点介绍差影检测。
要实现车型识别,首先能够实现对移动对象的检测,目前常用方法是差影法。差影法又称减影技术,其核心就是将同一个目标在不同时间获取的图像或者是同一个目标在不同的波段获取的图像相减。在序列图像中,假设多帧图像之间的相关条件不发生变化,可通过逐像素做减法来检测前后相邻两帧图像之间是否存在差异。如果得到的结果差不为0,表示此处的像素发生了移动。视频连续的两帧源图像为f(t-1)(i,j)和f(t)(i,j),那么绝对差灰度图像如式(1)所示:
得到绝对差灰度图像后,需要选择一个合适的阈值将前景物体(即目标车辆)从背景物体中分割出来,并以此阈值作为灰度阈值M,将目标和背景区域进行分割,获得二值图像。如式(2)所示:
阈值的选取直接影响分割效果的呈现,最常用的是自适应阈值法最大类间方差法,因该算法计算简单,不需要人为设定其他参数,自适应强,成为使用最广泛的图像阈值选取法之一。
1.2 建立模糊模式
我国对汽车的分类有严格的标准,根据最新的标准,可以将汽车分为:轿车、客车、越野车、牵引车、载货汽车、挂车[10]。这几种车辆类型无论外观和尺寸都有非常大的区别,但仍可以以像素为单位,将车辆外轮廓的顶部长度(记为T)与底部前后车轮间离的比值(记为B),还有车辆轮廓的顶部长度与车辆顶部到地面间距(记为H)的比值建立模糊子集,加以区分以上几种车辆,也就是利用T/B和H/B的值来区分。
首先,通过T/B的比值判断,客车一般在1:1以上,载货汽车、牵引车、挂车三种类型一般都在2:5 以下,轿车和越野车的介于其中。那么区分以上三类车型可以在最大隶属原则下进行第一次模糊模式识别;然后根据H/B 进行第二次模糊模式识别区分轿车和越野车,依然运用最大隶属原则。区分载货汽车、牵引车、挂车的同样适用上述方法。
具体方法为:首先把T与B的比值作为论域1,记N1=T/B,显然0<N1<2,并建立3 个模糊子集,论域1 的模糊子集如表1所示。然后再把H与B的比值作为论域2,记N2=H/B,显然0<N2<2,并建立5 个模糊子集,论域2的模糊子集如表2所示。
表1 论域1的模糊子集
表2 论域2的模糊子集
为6 种车型建立隶属度函数,公式见式(3)~(10)所示。
从图像中获得车顶部长度T,底部前后轮间距离B,将二者的比值N1分别代入(3)、(4)、(5)中得到X1(N1),X2(N1),X3(N1),并比较大小,遵循最大隶属度原则,车型就是隶属度函数值最大的模糊子集。假使X2(N1)值最大,那么识别目标为客车。如果X1(N1)值最大,再把H与B做比,将比值N2分别代入式(8)-(10)中,得Z1(N2),Z1(N2),Z1(N2)。根据最大隶属度准则,将上述三个值作比较,隶属度函数值最大的即为车辆类型。如果X3(N1)值最大,则继续把比值N2代入式(6),(7)中,得到Y1(N2),Y1(N2)值,比较大小,遵循最大隶属度原则,隶属度函数值最大的即为车辆类型。完整的车型识别过程如图2所示。
图2 车型识别
2 实验结果与分析
本文采用Matlab编程对图像处理,选取轿车做实验验证。车辆经过收费站时是运动的状态,为了能够捕捉经过车辆的特征,可通过外部辅助拍摄设备拍摄同一位置两个时刻的车辆侧面照,以轿车为例拍摄照片,如图3、图4所示。
图3 T0时刻车辆
图4 T1时刻车辆
首先,对车辆进行边缘检测,可以得到车辆的轮廓信息,但在图像中有一些不连续的线段,影响特征值的提取。可采取闭操作,光滑一些不连续的线段。闭操作之后得到的图像如图5所示。图中的图像边缘是由单像素组成的细线,便于获取目标特征。本文要提取的特征是前文已引入的三个距离T、B、H的值。
图5 闭操作后的图像
特征值的提取要通过图像的二维矩阵获得,该矩阵中只有0、1 值,其中1 代表边缘像素,0 代表非边缘像素。
运行程序,得到车辆的特征数据如下:T=167,B=314,H=131。
首先计算N1=T/B=167/314=0.532,将N1代入式(4)~(6)计算,可得:
可以看到,X3(N1)值最大,参照前图车型分类,可得该车型属于轿车、越野车子集。
为了进一步确定车型,再计算N2=H/B=131/314=0.418,将N2代入(7)、(8)计算,可得:
Max(Y1(0.418),Y2(0.418))=Y1(0.418),即Y1(N2)值最大,最后可判断该车为轿车,实验结果与实际车型相符,识别正确。
最后,本文设计了一个GUI 界面,用来显示最后的识别结果,如图6所示。
图6 识别结果的GUI界面
3 结论
本文提出了一种基于模糊理论的车型识别技术,并通过实验进行验证。结果表明,该算法是可行的,可以实现车型的识别。但是该识别方案仍存在不足,比如在牵引车、半挂车等车型还未能实现完全识别。下一步将优化算法,使识别的范围进一步扩大,适用性更广。