街景地图中基于文字识别的自动标注研究
2019-10-16张栖莹
张栖莹
摘 要:当前,我国信息化技术实现了迅猛发展,在各行各业都逐步渗透,并广泛应用,呈现出十分良好的应用效果。在空间信息领域有效引入文字识别技术,结合具体情况,有效利用车载移动测量系统可以切实有效的采集更高清的街景影像,并通过相应的算法,在最大程度上有效针对特定位置展开相对应的定位,并进行相对应的文字识别,之后,通过相对应的数据库检索相关内容,并匹配与之相适应的相关地理信息,然后在街景地图上标注文字,通过这样的方法就可以自动化的标注街景影像。
关键词:街景地图;文字识别;地理信息数据库;地图自动标注
1 概论
当前,信息化技术,计算机技术实现了突飞猛进的发展,由此推进各个行业的信息化程度也逐步提升,当前,计算机文字识别技术有了更良好的发展和完善,促使相关行业的工作效率和工作质量有了更大程度的提升。在具体的应用过程中,街景地图能够结合具体需要,为移动道路智能系统提供相对应的基础数据,也可以供给相对应的街道以及其周围环境全景图像,通过这样的方法,用户能够有切身感受,如身临其境,体验到浏览地图的真实体验,与此同时,也能够从巨量的信息数据库中选择最有用的信息。
2 街景影像采集及预处理
2.1 采集街景影像
通常情况下,在具体的应用过程中,车载移动智能系统提供相对应的街景影像,这个系统结合具体的需要有效运用GPS技术集合激光扫描仪、IMU、相机和里程计等相关设备的优势和特征,把相关内容有效融合在GPS时间系统,通过这样的方法,保证系统内部的数据可以在根本上保持一致。里程计、GPS和IMU等相关设备获取的信息,对其进行优化完善,可以用其导航,这样一来就可以更精准有效的获取系统中的位置数据。
2.2 三维透视变形矫正
在具体的应用环节,有效利用车载移动测量系统,能够很明显的看出,所有的街景影像都具备三维透视变形。由于街景图片基本上全部都是来自于车载移动测量系统,在这样的情况下,如果车辆不同,所采集的图片就会呈现出很大的差别,如果在相同的情况下,有一定意义上的变形问题,也情有可原。
结合具体需要而拼接和矫正原始街景影像,可以为下个环节提供相对来说更清晰,没有发生变形的街景影像。与此同时,对其进行拼接,图像的文字识别效率有很大程度上的改善,工作效率有极大的提升,值得指出的是,这种拼接方法只能用在无分叉路的街道。
3 文字区域定位
3.1 用颜色聚类法初步提取相关的文字区域
这种方法所涉及的内容主要是指在彩色图像像素要根据颜色的相似度分成多种多样的类别,在这样的情况下所获得的图片在颜色方面有着很大差别。因为大多数的时候,自然场景下的文本,有着相对来说更相似的颜色和灰度,但是和背景进行对比,其对比度比较显著,所以在这样的情况下,要结合实际情况应用颜色聚类方法实现文本定位。有针对性的利用同区域文字颜色类似的现象,分割相对应的色彩空间,使相关图像划分成不同类型的图层,在其中选取出相对应的连通区域,在这样的情况下,深入细致的分析和探究區域内颜色分布和区域外接框几何特征,通过这样的方法就可以有效定位文字。
3.2 文字分布法进行文字区域定位
对于颜色聚类法获取的相关图片,实施相对应的初步筛选,把像素比较小的文字剔除出去,有效采取这样的措施,可以使搜索的范围得到显著的缩小,确保识别的效率,能够使识别效率得到更有效的提升。针对每一个图层而言,要对其有针对性的展开图像预处理工作,其预处理工作涉及彩色图像灰度化、图像去噪等一系列相关方面的内容。
预处理完相关图像以后,要结合具体情况,搜索相关的连通域,之后再有针对性的探寻连通域的外接矩形,并针对具体情况判断它的长宽比、面积大小等,并经过不断的筛选,去除与要求不相符合的图形,然后有针对性的结合文字的空间分布的相关性,来实施进一步的筛选。
4 文字识别与自动标注
4.1 结合词库开展文字识别
为进一步大幅度提高具体的识别效率和准确率,首先要从街景地图中的候选区的第1个矩形出发,并且按照顺序依次顺延,在某一个矩形中识别出某一个文字,在这样的情况下,要针对该矩形进行详细的标记,除此之外,也要把同一张图片上的图层进行有针对性的标注,在这样的情况下,可以更有效的显示该区域已经被充分识别,没有必要进行重复识别。
4.2 判断识别效果并实施人工协助软件识别
由于街景图片有着十分显著的复杂性,不确定性特点,所以在具体的检测过程中,它所呈现出的识别结果和正确率往往不能达到100%,所以在这样的情况下,要想确保该技术能够充分应用于实践,要针对识别效果进行切实有效的判断,并结合具体的内容对其实施人工纠错。同时,要有针对性的结合街景影像数量庞大的特征。
5 结语
综上所述,通过上文的分析和论述可以很明显的看出,对街景地图中基于文字识别的自动标注进行简要研究和论述,是十分重要而且必要的。在空间信息领域结合具体情况,切实有效的使用这种文字识别技术,可以在更大程度上及时收集到更高清更精准的街景图像,与此同时,利用与之相对应的科学算法,可以针对相关文字区域进行自动化的识别和定位,另外也可以通过相关数据库中的检索信息进一步标注在街景地图上。
参考文献:
[1]A.Mishra and K.Alahari.Top-Down and Bottom-Up Cues for Scene Text Recognition[J].In Proc.CVPR,2012.8(5):58-60.
[2]柏宏飞.场景图像文字提取方法研究与应用[D].复旦大学,2015.8:96-97.