基于LabVIEW及MATALB混合编程的试卷信息采集系统
2017-07-11杨美程王群
杨美程 王群
摘要:为实现试卷中学号及分数信息的自动采集及分析,应用NI公司下的LabVIEW程序开发环境建立虚拟仪器系统,并配合其他硬件设备,完成对于试卷图像的采集及预处理工作,包括图像灰度化、阈值化和目标数字的提取,然后通过MAT—LAB Script脚本节点调用MATLAB程序对目标数字进行识别,最后对信息汇总即完成了整个系统的设计。实验证明,系统采集信息的准确率及速度都达到了一定要求,并且使用方便,能极大地提高老师的工作效率。
关键词:LabVIEW;图像处理;MATLAB Script;数字识别
很长时间以来,对于试卷学号及分数信息的采集工作,基本都是靠老师人工劳动力完成的,需要大量精力和足够的细心,尤其是考试特别多的时候,手工统分登分的弊端就愈发显著。随着机器视觉即用机器代替人眼完成信息的自动化采集及分析工作,主要由图像获取、图像处理及信息整合显示部分组成的技术陕速发展,现在对于重要的大型考试是将整张试卷扫描到计算机上,在计算机上阅卷后直接将分数录入计算机而实现信息的采集。然而这种方式灵活性差,消耗资源大,不试用于日常教学。因此本文基于LabVIEW及MATALB混合编程,设计了一种具有极大地灵活性及可复现性,能极大地提高工作效率的试卷信息采集系统。
1系统概述
系统的目的是用机器代替人工,无需改动试卷,采用LabVIEW构建的虚拟仪器系统,自动触发工业相机获取试卷图像,再对图像做预处理工作最终将目标数字提取出来,进而来判别结果并记录数据,提高工作效率,减轻教师工作压力,其工作原理图如图1所示。
2系统硬件组成
本系统硬件设备主要由相机支架、工业相机及镜头、条形光源、光源控制器、红外触发装置、数据采集卡、中央计算机组成。各设备主要功能如下:相机支架用于固定相机,其平台用于放置试卷;工业相机用于获取试卷图像;条形光源为拍摄图像补光;光源控制器控制调节光强度,以达到补光最佳效果;红外触发装置用于相机在放置试卷时进行触发拍照;数据采集卡用于中央计算机获取触发装置状态;中央计算机是系统核心部分,控制各硬件协调工作,并完成图像的处理,信息的整合等。
3系统关键技术
3.1图像采集
采用工业相机对试卷进行拍照,在拍摄图像时要注意图像不要因为镜头而畸变,同时调节条形光源的光强度及照射的角度,使试卷与背景之间有足够的对比度,以便从图像中获取信息,使图像采集过程中保证图像的质量。
3.2图像预处理
3.2.1图像灰度化
灰度化是指在RGB模型中,如果令R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值,灰度范围为0-255。在LabVIEW中选中视觉与运动工具包中的IMAQ ExtractSingleColor-Hane控件,输入原始图像,输出目的图像即可完成灰度化处理。
3.2.1图像阈值化
图像阈值化通过合适的阈值将图像分为大于和小于阈值的两部分像素群,对应表示图像中的目标和背景,从而将目标从背景中分离出来。在LabviEW中可通过使用IMAQ Threshold控件实现,控件示意图如图2所示。默认Keep/Replace Value选项为True,Image Src连接原图像,Image Dst连接目的图像,Range为选定阈值的范围,Replace Value為阈值范围问像素的替换灰度值,Image Dst Out为输出的目标图像。
3.3提取目标数字
在不改变试卷的形式,且试卷的放置位置不固定情况下,从整张试卷中提取出学号及总分这两串数字是系统的关键技术之一。本系统中首先利用模板匹配技术将含目标数字的区域提取出来,再从其中截取出目标数字。在LabVlEW中其实现的基本过程是利用IMAQ Learn PaUen4控件先学习一个能够表征搜索目标的模板,然后使用金字塔匹配算法再次使用IMAQ LearnPatten4控件根据模板的特征,在试卷图像中搜寻出具有一定相似匹配度的区域,并用OverPatternMatchingResults.vi将此区域标志出来,此区域包含目标数字,然后根据目标数字相对于匹配出的区域位置固定的特点,利用IMAQ Extract控件将数字截取出来。提取目标数字的程序框图如图3所示。
3.4数字识别
数字的识别算法是基于MATLAB平台设计下的,数字识别前需要再次对含数字的图像做进一步处理,包括以下步骤:数字分割、提取骨架。其中,数字切割即沿着数字的上下左右边缘将数字剪切出来,为了使数字识别更简便。本系统采用扫描的方法,找出每个数字的上下左右切点就可以将数字切割出来。通过选择imdilate,imerode,bwmorph函数的参数进行骨架化,完成骨架后才更好进行手写数字的识别,以下为具体的识别方法:
1)数字“1”:提取数字1离心率最大的特征,经理论验证和大量实验验证,数字1的离心率e最大并且离心率e均在0.99-1.00之间。
2)数字“7”:采用与数字1相同的方法。不同的地方在于取数字7的下半部分求离心率。
3)数字“0、6、8、9”:提取孔洞特征,根据孔洞数量将数字8(两个孔洞)筛选出来。其余三个数字(一个孔洞)根据孔洞位置进行区分。因为每个数字均沿着数字的上下左右边缘将数字剪切出来的,所以数字0的孔洞上下边界均紧贴图片边界,;数字6的孔洞只有下边界紧贴图片边界;数字9的孔洞只有上边界紧贴图片边界。
4)数字“4”:数字4有四交叉点特征,会有规则和不规则四交叉点两种情况,经过对大量规则和不规则四交叉点样本的像素组合进行研究,发现四交叉点都是由放置位置各不相同的“T”字型和“L”字型组合而成。建立“十”字型模板和“T、L”字型的四方向(上下左右)模板,通过模板匹配的方法,只要匹配一个“十”字型模板或者“T、L”字型的四方(上下左右)模板任意两个组合,就可以确定数字4。
5)数字“2、3、5”:提取端点特征,存在一个端点位置在右上时,则为数字5;存在一个端点位置在右下时,则为数字2;端点均在左侧时,则为数字3。
以上为数字0-9的识别方法,通过一定的顺序即可全部识别,数字识别的过程是通过MALAB Scrip脚本节点调用MAT-LAB实现的,调用过程程序框图如图4所示。
4系统操作过程
系统整个操作过程都是在LabVIEW平台下进行的,LabVIEW是基于图形化编程的语言,根据其构造的虚拟仪器系统来创建简洁、可视化、易操作的操作界面,使用户能够极易上手的使用此系统。系统的操作界面及运行结果如图4所示,其具体的操作过程如下:
1)运行LabVIEW程序,会跳转出创建模板的界面,在标准模板试卷中利用矩形框分别选中所需要创建的含分数及学号的块区域,点击OK选项即可完成创建工作。
2)操作界面上的实时显示图形窗会动态显示经过灰度化及二值化处理后的摄取图像
3)确定要处理的试卷图像后,点击拍照按键便会获取到静态图像,并将其按获取图像时间命名存储到相应的文件夹中。
4)点击處理图片按键,匹配图图形窗会显示上一步获取到的图像,并将其置于缓存中等待被模板进行匹配。
5)事先确定匹配过程的相关参数一一匹配分数及角度范围。匹配分数即与模板匹配时相关匹配度,匹配度不能太高否则将由于分数及学号数字的不同导致匹配不成功或匹配速度较慢,匹配度也不能太低否则会导致匹配错误;角度范围为匹配时的匹配图相对于模板图的相对旋转角度,由于试卷是不固定放置的会相对产生位置变化,而且要保证下一步数字相对位置的确定,就需要匹配出的图像和模板图一致,因此给出匹配角度范围。这两个参数的确定是经过一定量的实验,在保证匹配质量确定的情况下确定的。在本系统中选取匹配分数为300,角度范围为-45°一45°。
6)参数确定后,点击开始匹配按键后,匹配图图形窗会显示用红色矩形框圈出的匹配区域。成绩图图形窗显示由IMAQ Extract控件根据相对位置截取出的只包含成绩数字的图,学号图图形窗显示只包含学号数字的图。在经过LabVIEW MATLAB Script脚本节点调用的MATLAB程序对两幅图中的数字识别后,成绩显示字符串及学号显示字符串分别显示相对应的数字识别结果。
7)点击停止匹配按键,标志着对一张试卷上的处理工作圆满结束,此时实时显示图形窗又会重新动态显示经过灰度化及二值化处理后的摄取图像,也就标志着对另一张试卷处理工作的开始。
5实验结果
在针对系统的性能测试实验中选取了20张含不同成绩及学号的试卷作为样本进行实验。对样本采集图像后进行灰度化、阕值化处理,然后提取数字部分进行识别,最终分别产生20份成绩与学号的识别结果,结果的正确率分别为100%和90%。学号识别成功率较成绩低的主要原因为学号数字较多导致出现手写时连笔或书写不规范的情况,下一步可在这些方面作出改进,进一步提高识别率。
6结束语
本文设计了一种试卷学号及分数信息的自动采集系统,该系统结合LabVIEW图形化程序设计,编程实现简单、直观、开发效率高和MATLAB强大的数字图像处理功能的优势,采用LabVIEW及MATLAB混合编程的方式,极大地提高的系统的性能及灵活度,能够实现试卷目标数字信息的自动化采集过程,在很大程度上减轻了老师们的工作负担。此系统的相关研究还可以用于其他有关机器视觉的领域具有良好的应用前景。