APP下载

基于自适应投影法的数字分割算法研究

2023-03-20赵丽

电子产品世界 2023年12期

赵丽

关键词:水平投影;垂直投影;自适应投影法;数字分割

0引言

目前工业生产中各类仪表数据主要采用人工读取。人工读取存在很多缺点:仪表位置隐蔽,人工不易读取;人工无法实时监控同一个仪表;人工读取速度较慢,并且可能泄露信息;不同的工作人员由于受到主观因素的干扰,在读取数据时,结果会有一定的误差。因此,采用智能的读取方法具有必然性。智能的仪表读取方法既能减少人为因素的干扰,又能实现高效地读取。相关算法包括模板匹配、机器学习训练、骨骼提取等。但是上述算法针对不同情况的准确率不同,不具备普适性。

本文提出了一种自适应投影法,可以对工业现场各种仪表数字进行识别,同时采用一系列的预处理操作,并通过实验确定了分割和预处理的顺序,达到了最佳的分割效果。

1图像分割

数字分割是将数字图片中的数字分割出来,便于之后的特征提取和分类器训练。本文采用投影法对数字表盘进行切分。

1.1投影数字分割算法

投影法可分为水平投影和垂直投影。水平投影主要是指二维图像在y轴上的投影,即统计每一行像素的数量,表明图像在水平方向上的特征。垂直投影主要是指二维图像在x轴上的投影,即统计每一列像素的数量,表明图像在垂直方向上的特征。

运用投影法进行数字分割,步骤如下。

步骤1:数字图片列扫描。对数字图像从左到右逐列扫描,记录每列像素点个数,并将其投影到水平面上,得到垂直投影图。人为设定一个阈值,在垂直投影图上逐列扫描获得每列的像素和,达到阈值则进行分割,直至将所有数字在垂直方向上都分割出来。如果该数字图片中有3个数字,那么垂直投影结束后应该分割出来3个图片,且3个图片的左右边缘均是数字本身的边缘,但是图片上下仍存在多余部分。

步骤2:数字图片行扫描。对数字图像从上到下逐行扫描,记录每行像素点个数,并将其投影到垂直面上,得到水平投影图。设定一个阈值将所有数字在水平方向上分割出来。由步骤1可知,垂直投影后的图片上下存在多余部分,经过了水平投影后,可得到只含有数字区域的部分,上下多余的部分将被分割掉,从而得到精确的数字區域。投影数字分割算法流程如图1所示。

1.2投影数字分割算法的改进

虽然上述投影数字分割算法可以得到精确的数字,但仍存在一些问题,本文对其做出以下改进。

图像的分割阈值是人为规定的,不具有鲁棒性,不同的图片分割效果差别很大。基于此,本文选择遍历垂直和水平投影中的像素点,统计像素点个数和,选择所有像素点个数的平均值作为阈值。针对不同情况的数字图片,这种改进方式均可以选择一个合适的阈值进行分割,效果较好。

此外,即使选择了自适应阈值,如果图片中存在独立、细小的杂质或者干扰物,那么它们也有可能被分割出来。针对这种情况,本文选择设定像素阈值为1000个,如果像素和小于该值就证明该图片为干扰图片,将其删去;如果像素和大于该值就证明该图片为正常数字图片,即可进行后续的分类器预测。

2图像预处理

图像预处理是数字分割中较关键的一步,预处理效果与后续数字分割精确性有直接关系。现场图片因光照、温度、雾霾等影响,采集照片的清晰度并不能得到有效保障,因此,需要经过一系列的预处理过程。

本文对图像进行了一系列的预处理操作,依次为二值化、腐蚀和去除小面积干扰。通过上述操作对图像中出现的各种噪声信息进行处理,可以最大化地利用有效信息,为后续操作提供便利条件。

3实验结果分析

为了验证本文算法的有效性,本文收集了各个工业现场变电站现场的图片,其中包括各种复杂的环境。图2为现场采集数字仪表图片的分割效果。

本文算法对于有粘连的数字处理效果更好,由于受到外界光线以及拍摄角度的干扰,拍摄出来的数字上方可能会有粘连。如果直接对其进行特征提取和训练,图片分割结果可能有误,如图片中本有3个数字,但在单独进行数字分割时,有可台旨分割成2个数字甚至1个数字。而采用本文的算法后,可以将所有的数字完整分割出来,粘连图片投影分割效果如图3所示。

即使数字之间存在粘连,本文算法仍然可以将数字区域准确分割出来,并且分割之后的数字较清晰。只要分割出来的数字保持一个正常的清晰度,后续就可以准确识别该数字。

确定了算法的流程顺序后,本文选择了3组数字图片进行测试(图4),发现分割效果均较好,从而验证了本文算法的有效性。

观察3组分割效果图可以发现,本文算法具有较好的普适性。针对3个数字的图片、2个数字的图片和中间有干扰颜色区域的图片,本文算法均可以准确分割。

4结语

本文对户外复杂环境下的表盘数字分割算法进行优化。采用水平投影与垂直投影相结合的方法对数字进行分割,得到每个数字的精确边缘,再分别对其进行预处理,从而精确地进行数字分割。通过改变算法的流程,可以发现本文设定的算法流程可以精确识别出数字,具有较高的识别准确率。与其他方法相比,本文算法适用性强,可应用于各种形式图片的数字识别,准确性高,具有较高的推广价值。