基于神经网络在高考英语口语成绩采集中的应用
2017-05-17李东升
李东升
摘要:基于神经网路方法实现高考英语口语成绩的采集,实现口语成绩等级手写体的识别,提高在英语口语成绩处理的效率,实现口语成绩的自动采集。目前该方案应用于苏州市高考英语口语成绩采集。
关键词:成绩采集;模式识别;神经网络;特征提取
中图分类号:G80 文献标识码:A 文章编号:1007-9416(2017)03-0069-01
对于未实行高考口语人机对话的省市,高考口语还是采用打分模式。然后人工采集,为解决这一问题,通过识别手写评分和OCR识别结果比对确保成绩采集的准确。而神经网络很适合用于解决字符识别问题。
1 BP神经网络
人工神经网络是在人类对其大脑神经网络认识理解的基础上人工构造的能实现某种功能的神经网络,是一种典型的前馈神经网络,包含输入层、隐层及输出层。
BP网络是典型的多层网络,分输入层、隐含层和输出层,算法由数据流的前向计算和误差信号的反向传播两个过程构成。通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程[1]。
2 基于神经网络的英语口语成绩采集的实现
为实现更好的采集,需要设计适应识别的评分表,其中定位点、考生条码用于定位到考生并采集成绩,等级手写的分区需要通过神经网络识别等级,OCR等级识别区用采集等级并通过神经网络采集的等级进行比较。
2.1 采集过程
首先预处理图像获取样本进行训练,输入神经网络训练后输出看误差并调整各阶层的权值让输出同OCR值一致,正式识别两种模式结果不一致需要人工干预,有可能等级打错也有可能等级涂错,然后修正结果,确保等级信息准确无误。
2.2 图像预处理
原始评分表的输入有可能产生污点等噪音。所以在识别之前必须对图像进行预处理。预处理一般包括图像分割、灰度、二值化、平滑、去噪音、归一化和细化等。不同识别方法对于处理要求不一样预处理后离散和噪声和归一化和细化处理,将图片形成一个40 ×40 像素点阵(图1得分区图像预处理后图像)。
2.3 神经网络的特征提取
在手写等级识别中,特征的选择是非常关键问题。将经过预处理后的等级数字图像中提取最能体现这个字符特点的特征向量,然后提取出训练样本中的特征向量代入BP网络之中就可以对网络进行训练,提取出待识别的等级样本中的特征向量代入训练好的BP网络中,就可以对等级得分字符进行识别。
2.3.1 英语口语成绩采集中BP神经网络结构
将A、B、C、D等级图像的特征向量作为神经网路的输入,确定输入神经元。经过预处理的为40×40的矩阵,共1600各输入神经元。输出较为简单,只要识别A、B、C、D4个等级,输出节点数为4。为加快神经网络学习速度,3层BP网络最为恰当效率高。同时根据网络收敛性能的好坏来确定隐含层神经元个数。根据经验公式:
s=
其中,n为输入层神经元个数,m为输出层神经元个数[2]。计算可得隐含层神经元个数为79。
2.3.2 BP神经网络的训练
手写字符归一化和细化后的图像为40 ×40 的布尔矩阵,1600个元素组成一个手写字符的列矩阵,即字符的特征向量。由A、B、C、D这4个字符的特征列向量组成一个1600×4的输入矢量,训练次数达到最大值神经网络训练就结束。
2.3.3 口语等级识别等分结果
字符识别的正确率和拒识率与字符识别的判断值有关,判断值越高,识别的正确率就高。为确保成绩录取100%正确,通过识别和OCR识别比较,不同再通过人工识别录入确保准确(图2成绩自动识别等分)。
神经网络在口语成绩登分中的应用过程中大大减轻劳动强度,提高准确率,通过多重比对确保成绩录入准确,经过实践应用和比对成绩登分准确率100%,完全可以满足实际需要。
参考文献
[1]蒋宗礼.人工神经网络导论.高等教育出版社出版,2001(5):26-88.
[2]杜选,高明峰.人工神经网络在数字识别中的应用.计算机系統应用,2007(2):21-22+27.