数字图像识别技术在商用车库存盘点中的应用研究

2021-04-20李宗耀潘海斌战婷婷

电子技术与软件工程 2021年1期

李宗耀潘海斌战婷婷

（1.上海远行物流服务有限公司上海市 200072 2.德银天下投资控股有限公司上海市 200072）

随着商用车市场规模的不断扩大，为应对同行业厂商、经销商各个维度的营销竞争，以历史产销数据为依据，通过大数据分析，提前开展车辆排产，完成车辆下线，在营销中以实地展车、实时交车等作为抢占市场的有力手段。库存作为商用车销售管理信息体系中成本管控的重要目标，实时掌握车辆库存信息，是开展采购和排产计划的重要数据支持，也是企业整合内部资源开展市场拓展重要的经济支撑之一。数字图像识别技术由于其在图像的文字识别、数字提取中的准确性和可靠性，在信息化建设中，引入数字图像识别技术，在移动端配置线上盘点模块，针对商用车车体唯一识别码自动完成车辆信息识别和库存盘点校验，生成盘点库存报表。通过互联网信息化技术，解决商用车分散存放的跨区域盘点难题和人员操作误差，实现商用车库存盘点的及时性、准确性。

1 车辆出厂编码自动识别在库存盘点应用中的总体设计

1.1 车辆库存盘点系统架构设计

传统车辆盘点工作，基于盘点人员的现场查勘、比对、登记，最终形成盘点材料，上报总部车辆管理人员，再经审核、校验信息无误后，形成盘点报告和库存报表，耗时耗力，商用车库存数据的准确性和实时性，难以保障。基于数字图像识别技术的车辆出厂编码自动识别，实现车辆的库存盘点功能，此功能以商用车销售管理信息系统为基础，采取B/S（Browser/Server）即浏览器-服务器的Web 技术架构，在手机APP 中实现实时拍照、GPS 定位功能，有效避免传统盘点流程中漏盘、错盘等操作。在上传数据中，定位信息作为图像附属信息，完成拍照即上传至服务后台，完成上传图像、定位数据存储，同时流转至数字图像识别模块，识别结果与盘点车辆信息进行实时对比，并将盘点结果返回移动端盘显示，系统架构图如图1所示。

1.2 Spring Boot框架

本文WEB 服务端应用采用SpringBoot 框架技术，以BS 架构实现移动端（iOS, Android）的业务操作和车辆信息校验。SpringBoot 是由Pivotal 团队提供的全新框架，基于约定优于配置的思想，采用特定的默认配置，解放SSM、SSH 框架中繁杂的配置，大大提高开发效率，缩短项目周期。同时以MVC 的分层设计理念，按照功能形成统一的数据API 接口控制层、业务逻辑处理层、数据存储层，全局配置算法模块和返回数据封装。持久层采用MyBatis框架，是一款一流的支持自定义SQL、存储过程和高级映射的持久化框架，能够使用简单的XML 格式或者注解来配置映射基本数据元素，将接口和 Java 的 POJOs(Plain Ordinary Java Object,普通的Java 对象)映射成数据库中的记录。

1.3 Tesseract-OCR识别框架

图1：库存车辆自动盘点结构图

图2：灰度化效果图

图3：直方图均衡化前后的图像效果比较

Tesseract 是一个开源的OCR 引擎，目前由 Google 赞助，最新的稳定版本是4.1.1，已于2019年12月26日发布，它支持60 种以上的语言，具有很高的精确度和灵活性，且提供了一个字符库训练方法，可以让用户自定义的去训练所需语言或应用场景的字符，能够大幅提高识别正确率。Tess4J 则是Tesseract 在Java PC 上的应用，使用Tess4J 时只需要下载相关Jar 包，导入项目，即可调用相关接口，实现文字识别功能，可移植性比较好。

2 车辆出厂编码图像识别过程

针对车辆出厂编码的字符识别，即采用数字图像识别的技术，将移动端采集到的彩色图片，进行图像灰度化处理-图像增强-区域分割等图像预处理，再调用Tesseract 文本识别接口，进行图像连通域分析、区域检测、字符分裂、文本识别等一系列的图像识别，完成车辆编码字符识别的过程。

2.1 图像灰度化

由于手机采集到的是真彩图像，即RGB 图像，为减少在图像处理过程中的计算量，一般图像处理之前，首先要将RGB 图像转换为灰度图像，本文采用加权平均法，根据RGB 和YUV 颜色空间的变化关系，建立亮度Y 与R、G、B 三个颜色分量的对应表达式：

表1

图4：锐化后图像

图5：不同阈值下的效果图

用此函数对出厂编码图像进行灰度化处理，得到出厂编码的灰度图像如图2所示。

2.2 图像增强

图像拍摄过程中，由于拍摄位置、角度、天气阴晴等外在因素，导致拍摄的图像的灰度级不均匀，字符编码对比度不明显、图像对焦不准、景物相对移动和采样不良等，因此图像识别接口接收到的图片除了噪声因素外，图像一般都要变得模糊，图像增强能够将原来不清晰的图像变得清晰，或者通过抑制图像的某些特征，增强另外一些特征，使处理后的图像质量得到改善，增强视觉效果。

2.2.1 直方图均衡化

由于光线等因素导致图像出现灰度级不均匀和对比度不明显的情况，直接影响车辆编码的识别，因此需要对车辆编码灰度图像进行对比度增强的处理。直方图均衡化是一种使输出图像直方图近似服从均匀分布的变换算法。直方图均衡化通常是对图像灰度值进行归一化的一个非常好的方法,并且可以增强图像的对比度。对商用车车辆编码灰度化后的字符图像图2(b)进行处理，均衡化后的效果对比如图3所示，可以看出，经过直方图均衡化后，图像的细节成分更清晰，图像的视觉效果得到了明显改善。

2.2.2 采用拉氏算子进行图像锐化处理

图像锐化处理通过增强图像中纹理，边缘部分，以补偿图像的轮廓，使图像较清晰。此外，在人或机器分析图像时，常常需要突出目标边界和灰度细节。本文采用空间域图像锐化法中的拉氏算子来实现图像的锐化处理，进一步提升图像对比度和突出车辆编码字符边界。

拉氏算子的表达式为：

对于离散函数，拉氏算子定义为：

拉氏算子还可以用下面的模板来表示：

利用拉氏算子对上一步均衡化后的图像图3(b)进行锐化处理，设置不同的滤波孔径，得到锐化后结果如图4所示。

可以看出，拉氏算子运算后，图像中文字部分得到了锐化，特别是字母与数字的形态特征效果明显增强。

2.3 图像阈值分割

在数字图像处理领域中，被处理的图像都会有一个目标图像，这些目标图像存在于原图像中，是原图像的一部分，在车辆编码目标识别中，目标图像就是车辆编码，车辆编码识别技术的使用目的就是把车辆编码从拍摄的出厂编码图像中提取出来，与噪声、背景等分割出来，清晰地展现在图片中。

阈值分割法是一种简单有效的图像分割技术，用一个或几个阈值将图像的灰度级分为几个部分，将属于同一部分的像素视为相同的物体。阈值是指在图像分割时，作为区分物体与背景像素的门限，大于或等于阈值的像素属于物体，而其它像素则属于背景。

设原始图像为f(x,y)，选取阈值T，将图像分割为两部分，分割后的图像为：

对于目标图像，分别选取阈值为105 和145 时得到的分割后的图像如图5所示，从图5中可观察到，由于选取了不同阈值，分割后的图像中字母与数字特征清晰度也完全不同。故选取合适的阈值便能把大部分目标完整地从背景中分割出来，从而识别出字符特征。

2.4 图像文字识别

本文使用Tesseract-OCR 作为图像文字识别引擎，识别流程如下：

（1）连通区域分析；

（2）字符区域检测（轮廓外形），以及子轮廓；

（3）文本行识别及字符单元分割；

（4）单词分析及聚类识别；

（5）未识别/模糊字符再识别。

在SpringBoot 架构中，引入tess4j 依赖，即可在应用接口中调用tesseract 方法，完成图像识别和返回结果；tesseract 对应参数如下：

输入：图像文件/文本文件

输出：文本文件，一般为输入文件+.txt 的识别结果文件

参数说明如表1所示。

3 平台实现

本系统基于JAVA 的Web 服务架构，结合移动端（iOS,Android）数据采集系统，内置于整车销售系统移动平台车辆库存管理人员在平台用户管理中心完成账号、身份、手机号码等信息注册，经后台管理人员审核通过后，为其设置库存管理权限。库存管理人员在身份合法后，即可通过手机APP 查看其库存盘点任务，并按照任务清单，进行车辆盘点操作，包括拍照，裁剪，上传，图像信息与位置信息经移动端封装后经https 发送至整车销售系统服务后台API 接口，由API 接口完成数据接收后，将信息分类处理。

图6：车辆盘点出厂编码自动识别流程图与APP 页面

首先完成图像、位置数据存储；

其次将图像文件作为参数，调用图像预处理方法，完成图像的灰度化、均衡化、图像分割处理等后，进入Tesseract-OCR 模块，完成图像文字区域分析、检测、分割和识别，返回车辆编码识别结果；同时将位置信息与车辆预置存放位置进行距离计算和误差分析，返回位置识别结果；

再将字符识别结果与位置识别结果传入盘点校验模块，返回是否完成盘点结果。

最后将盘点结果进行后台数据存储，并发送数据至移动端，通知盘点人员自动校验结果。

车辆盘点结果由系统通过车辆编码识别匹配与位置计算所得，匹配成功和位置误差在设定范围内，即可自动识别为盘点通过，无需信息核对和二次确认。盘点自动识别流程如图6（左）所示。移动端页面如图6（右）所示，盘点人员可实时看到最新的盘点进度、盘点结果，可根据出厂编码（车辆流水号）查询相关数据，进行精准盘点和二次盘点。

4 结论

本设计基于信息化手段，结合数字图像识别技术，通过WEB服务模式，提出一种针对商用车库存分散、车辆展存场景多变、盘点人员背景复杂等多因素影响的车辆库存盘点应用研究，设计开发简洁、便捷、易操作用的前端操作页面，获取数据来源，接入成熟的数字图像识别应用接口，快速、准确的对车辆出厂编码进行识别和位置范围计算，完成车辆库存盘点工作。基于此技术应用，可大幅减轻每月库存盘点人员的工作强度，降低库存管理人员对上报库存信息的校验、审核难度，提高车辆盘点数据的准确率和实时性。经业务线上应用，各模块运行稳定，有效降低了盘点工作开展中各环节人员工作强度和提升了盘点工作效率。