一种机械式电表读数区域的自动定位方法
2017-03-27赵艳红雷海军赵雨佳
赵艳红, 杨 张,2, 雷海军, 赵雨佳
(1.深圳职业技术学院,广东 深圳 518055; 2.深圳大学 信息工程学院,广东 深圳 518060; 3.深圳大学 计算机与软件学院,广东省普及型高性能计算机重点实验室,深圳市服务计算与应用重点实验室,广东 深圳 518060)
一种机械式电表读数区域的自动定位方法
赵艳红1, 杨 张1,2, 雷海军3, 赵雨佳3
(1.深圳职业技术学院,广东 深圳 518055; 2.深圳大学 信息工程学院,广东 深圳 518060; 3.深圳大学 计算机与软件学院,广东省普及型高性能计算机重点实验室,深圳市服务计算与应用重点实验室,广东 深圳 518060)
针对电表读数区域自动定位这一关键技术的具体应用,提出了一种适合四种类型机械式电表的读数区域自动定位算法;采用同态滤波增加图像前景与背景之间的亮度差异,同时利用改进的Bersen算法,有效的将电表前景与背景分开;利用区域定位对图像进行粗定位,并对粗定位区域纵向投影,根据目标字符的纹理特征和先验知识对目标区域精确定位;经实验证明,该算法对其中四种电表图像的适应性良好。
自动定位;同态滤波;粗定位;精确定位
0 引言
在电表读数自动识别系统中,表盘上读数区域的自动定位是整个识别过程的第一步同时也是最关键的一步,定位的精确与否会直接影响到后面数字字符的正确分割以及识别。但是,要精确定位出电表表盘上的读数区域有一定的难度。
当前对于字符文本的定位方法大致有以下几种:基于区域的方法、基于字符边缘的方法[1]、基于纹理特征的方法、基于机器视觉的方法[2]。
基于区域的文本定位方法简单且易实现,但文本分辨率较低会造成大片区域的定位不准确,文本分辨率太高、色彩过于丰富会造成同一文本的断裂[3]。基于字符边缘的文本定位方法速度较快,但要求目标字符边缘与背景有鲜明的对比。基于纹理特征的文本定位方法通常有较高的鲁棒性,适合对分辨率高以及复杂背景的图片进行定位[4]。基于机器视觉的文本定位方法在复杂背景图像中,文字的风格、排列方式、大小、字体的变化很大,训练出一个推广性很好的分类器相对困难。另外,机器学习也比较耗时。
本研究依据基于字符边缘、纹理特征的字符文本定位方法的原理,研究不同类型机械电表的读数区域定位方法,尤其是利用同态滤波以及二值化对电表图像进行预处理以及粗定位的方法。在此基础上,对粗定位区域纵向投影,实现对目标区域的精确定位。
1 电表读数区域定位方法
首先分析四种类型电表的特征,对电表图像进行裁剪,去除部分冗余信息;然后基于同态滤波对图像进行增强并压缩;再利用一维灰度直方图分布以及二值化算法选择一个合适的阈值,将电表背景和前景有效分开;再采用基于区域的方法对源图像进行粗定位,最后使用基于纹理的电表读数区域精确定位算法,基于纹理特征结合等先验知识来识别区分读数区域与干扰字符或图形,精确定位出电表读数区域。图1为电表读数区域文本定位的流程。
图1 电表读数区域文本定位流程
2 预处理
本文研究的原始图片由深圳市友汇通科技有限公司提供,图像大小为1944*2592,整个图片库有大约270幅图片可用于本文的研究对象,分类后主要有以下四种类型的电表图像:深宝电器仪表有限公司生产的DD45型单相电表,兰吉尔表计(珠海)有限公司生产的CN1605型单相电表,华立仪表集团股份有限公司生产的DD862-4型单相电表以及DD862型单相电表。
采用高斯同态滤波[5]来增强图像的对比度,截止频率D0的选择通过多次实验得到。
首先在频域内对同一副图像采用高斯同态滤波器进行图像处理,改变其截止频率D0,得到相应的图像增强图,并采用改进的Bersen 算法对同态滤波后图像进行二值化,将结果进行对比,如图2至图7所示。表1给出了高斯同态滤波器的表达式的参数取值以及图像增强效果。
3 电表读数区域粗定位
干扰因素(如电表表号、型号、生产厂家、技术参数、条形码等)的存在使得准确定位出读数区域有一定的困难,经观察分析可知电表图像的读数区域都是深色底,经过二值化后其特征尤为明显,此外,本文研究的图像都是按要求进行拍摄的,如电表在图像中的位置一致,这也为粗定位提供了基础。本文的粗定位就是寻找符合先验知识的黑色底框,具体的思想描述如下:
表1 高斯同态滤波表达式参数的选择
将二值化后的电表图像取反,之后进行水平投影,给出两个阈值Th_start(表示进入粗定位区域)和Th_end(表示离开粗定位区域),标记水平投影值大于T_start的行为粗定位区域开始行T_start,标记水平投影值小于Th_end的行为粗定位区域结束行T_end,计算T_start与T_end之间的行数目Tnum,若Tmin<=Tnum<=Tmax,则定位结束,否则,重复以上过程直到定位成功(Tmin表示符合条件的连续行最小值,Tmax表示符合条件的连续行最大值)。
采用以上方法对二值图像进行处理,图8为粗定位结果图,图像的上部分在二值图像中用灰色线画出粗定位区域的上下两个边界,左右边界默认为电表图像的左右边界,下部分是在灰度图中将粗定位区域截取出来的图像。
图8 粗定位结果
4 电表读数区域精确定位
精确定位是针对粗定位所得到的区域进行的,目的是在此区域中确定读数区域的左右边界。虽然前文对整幅图像进行二值化的效果比较理想,但为了能得到更好的二值化图像,本文对粗定位区域对应的灰度图像采用OTSU全局阈值法[6]进行二值化。得到的图像如图9所示。
图9 四种类型电表粗定位区域二值化图像
由以上结果可以看到,对粗定位得到区域的灰度图像经过OTSU算法处理后,得到的二值化图像几乎没有损失,目标与背景分离效果非常好,这为后续的精确定位打下了很好的基础。将以上各二值图像在垂直方向进行投影,如图10所示。
图10 粗定位区域二值化图像垂直方向投影
观察分析以上图像,四幅图像中读数区域像素为255的点分布比较有规律,它们以单个字符为单位聚集在一起,各个字符的宽度、平均高度、中心距的距离都在一定的范围内。而除读数区域的其他干扰字符或图形,它们或者平均高度过高、或者宽度过宽、或者分布两边且相距较远。综合这些情况,本文采用基于以上纹理特征结合一些先验知识的方法来识别读数区域与干扰字符或图形。
电表读数区域精确定位算法流程如下。
步骤1:从左到右从上到下对二值图像进行扫描,将每一列像素值为255的点的个数N依次存放在数组A中;
步骤2:给出列目标像素个数的最小阈值Tmin(取经验值8),将数组A各元素值N与Tmin进行比较,若N 步骤3:遍历数组A,将各连续大于0的元素捆绑为区域,给出每个区域的左边界坐标L,右边界坐标R,中心点坐标M,平均高度H,宽度W; 步骤4:若连通域总个数N_con≤5,则第一个区域的左边界为精确定位的左边界,最后一个区域的右边界为精确定位的右边界,定位结束,否则转到步骤5; 步骤5:若N_con>5,对每个区域的M,H,W进行分析,并计算出相邻区域间的中心距l,若Twmin≤W≤Twmax,Thmin≤H≤Thmax,Tlmin≤l≤Tlmax,保留该区域,否则将该区域删除,最终得到符合条件的目标区域,将符合条件第一个区域的左边界为精确定位的左边界,最后一个区域的右边界为精确定位的右边界,定位结束; 其中Twmin,Twmax分别代表区域宽度最小最大阈值;Thmin,Thmax分别代表区域高度最小最大阈值;Tlmin,Tlmax分别代表相邻区域中心距离最小最大阈值。 粗定位区域图像经过精确定位后的结果如图11所示(白线表示精确定位的左右边界)。 图11 电表精确定位结果 从图像库中随机抽取160幅图片进行定位,能正确精确定位的图片为147幅,成功率为91.87%,不能正确定位的原因有以下几种情况:目标区域被严重污染、图片整体分辨率过低、图片严重曝光等。 本论文在传统字符定位算法的基础上,结合电表图像的特点,提出了一种适合四种类型电表图像的读数区域定位算法。首先针对前文提到的四种电表的特点,裁剪及缩放电表图像,使后续要处理的电表的数据量大大减少,但不影响后续的读数区域的定位。针对图像表面光照不均等问题,使用同态滤波和直方图均衡化来均匀图像光照,然后用改进的Bersen算法二值化,能够很好地将目标和背景分割开,得到效果较好的二值化图像。在经过二值化处理后,结合电表图像的特点,先对电表图像进行粗定位,得到一个包括读数区域的范围较小的区域,对粗定位区域纵向投影,根据目标像素的纹理特征和先验知识对其进行精确定位。 经实验证明,本算法对这四种电表图像的适应性良好。 [1] 廖 佳,王红梅,牛晓东.图像与视频中的文本位技术研究综述[J].多媒体技术及其应用,2010,6(26):3778-7382. [2] 晋 瑾,平西建,张 涛.图像中的文本定位技术研究综述[J].计算机应用研究,2007,24(6):8-11. [3]JainAK,YuB.Automatictextlocationinimagesandvideoframes[J].PatternRecognition,1998,31(12):2055-2076. [4]LeoneM,Sumedha,WeigtM.Unsupervisedandsemi-supervisedclusteringbymessagepassing:soft-constraintaffinitypropagation[J].TheEuropeanPhysicalJournalB,2008,66(1):125-135. [5] 王 伟,何卫平,雷 蕾,等.标刻在金属零件上的二维条码数据提取方法[J].计算机辅助设计与图形学学报,2012,24(5):612-619. [6] 吴海滨,周后伟,王 哲.基于OSTU的动态结合全局阈值的图像分割[J].大气与环境光学学报,2012,7(6):463-468. [7] 许晓丽,卢志茂,张格森,等.改进近邻传播聚类的彩色图像分割[J].计算机辅助设计与图形学学报,2012,24(4):514-519. [8]ShenF,WangH.RealTimeGrayLevelCornerDetector[J].SchoolofElectrical&ElectronicEngineering,2008,2(3):124-143. [9] 殷 羽,郑 宏,王 静,等.一种自适应烟标字符提取方法[J].计算机应用研究,2015,32(4):1248-1252. [10]耿庆田,赵宏伟,GengQingtian,等.基于分形维数和隐马尔科夫特征的车牌识别[J].光学精密工程,2013,21(12):3198-3204. [11]王 刚,段会川.加权模板匹配的二值化阈值不敏感性研究[J].计算机技术与发展,2012,22(1):122-125. A Method of Automatic Locating in Mechanical Meter Readings Area Zhao Yanhong1, Yang Zhang1,2, Lei Haijun3, Zhao Yujia3 (1.Shenzhen Polytechnic, Shenzhen 518055, China;2.College of Information Engineering, Shenzhen University, Shenzhen 518061, China;3.College of Computer Science & Software, Shenzhen University, Guangdong Province Key Laboratory of Popular High Performance Computers, Shenzhen Key Laboratory of Service Computing and Applications, Shenzhen 518060, China) Aiming at the specific application of automatic locating technology for ammeter number area, an automatic locating algorithm, which is suitable for four types of mechanical ammeter number area, is put forward. In order to enhance the lightness distinction between image foreground and background, homomorphic filter is adopted, and improved Bersen algorithm is used to effectively separate the foreground and background of ammeter. First, use the method of area locating locate the probable area which is vertically projected then, and according to the texture of the target character and knowledge which is certified before, locate the target area to require a exact area. As the experiments proved, the algorithm has a fine adaptability of the image of four ammeters. automatically positioning; homomorphic filtering; coarse positioning; accurate positioning 2016-10-08; 2016-11-24。 国家自然科学基金-广东联合重点项目(U1301252);省部产学研项目(2012B091100495);深圳市战略性新兴产业发展专项资金项目(JCYJ20120613113419607);深圳职业技术学院校重点项目(601522k20004) 赵艳红(1969-),女,湖南邵阳人,副教授,硕士研究生导师,主要从事图像处理、信息管理系统方向的研究。 杨 张(1984-),女,四川南充人,助理研究员,博士研究生,主要从事信号处理、智能算法方向的研究。 1671-4598(2017)03-0162-03 10.16526/j.cnki.11-4762/tp.2017.03.044 TP27 A5 实验结果及分析
6 结论