APP下载

在自学考试中应用笔迹识别技术防范作弊的可行性研究

2015-07-05林杰胡浩

中国考试 2015年4期
关键词:笔迹作弊自学

林杰 胡浩

1 引言

全国高等教育自学考试(以下简称“自学考试”)与普通高考、硕士研究生招生全国统一考试、成人高考被称为国家教育统一考试,即“四大国考”,是国家教育行政部门依法举办的人才选拔和评价活动,按照公开的规则定期、规范、制度化地举行。[1]四大国考不仅关系着国家层面的人才选拔大计,对考生个人而言,往往还意味着升学、就业等人生重要转折的成败,影响着个人价值的实现。与此同时,它也涉及社会多方群体的利益。[2]因而,四大国考具有高利害性的显著特征。

我国正处在社会转型期,经济体制的变革和社会结构的变动致使社会利益格局出现调整以及人们思想观念发生变化。当前,社会诚信体系还很不完善,腐败现象对社会的渗透影响作用很大,并且还存在着大量以非法逐利为目的的社会黑暗产业链,[3]又加之现代信息技术的日新月异,使得社会大环境越来越复杂。在这样的社会背景下,作为具有高利害性特征的国家教育统一考试所面临的安全形势也越来越严峻,具体表现在:第一,除传统作弊方式之外,应用高科技手段日益增多。在信息技术高度发达的今天,考生作弊除了左顾右盼(偷看)、夹带小抄、传递答案和雇用“枪手”替考等传统作弊方式之外,还呈现高智能化的新特点。各类高科技的作弊工具层出不穷,从各种伪装的文具(具有扫描发射功能的笔、尺、橡皮等)到智能移动终端、眼镜式针孔摄像机、隐形无线耳机、跳频传感器等,器材越来越隐蔽,技术越来越专业,有些设备的精度已经达到间谍级别,令人瞠目且防不胜防。第二,参与作弊人群不断扩大,团伙式集团化趋势上升。目前,考试作弊行为已经由极少数考生个人及考生之间的作弊发展到团伙式的集体作弊,由单一的学生群体作弊发展到包括社会人员在内的多方参与的群体舞弊。仅2011年下半年至2012年第一季度,公安机关在全国范围内就发现并打击大型考试作弊团伙上百个,共涉及数千人。[4]第三,组织考试作弊已经形成利益链条,日益专业化、产业化。少数不法分子抓住一些诚信缺失的考生投机取巧、不劳而获的心理,围绕着考试作弊编织形成产业链,内部分工细致,专业化水平高,其疯狂程度前所未有。有的团伙制作、贩卖作弊器材;有的中介组织提供从“枪手替考”到“考务保障”(伪造身份证、准考证,甚至勾结监考教师及管理人员等)的保过一条龙服务;有的甚至不惜代价直接攻击招生考试网站,篡改数据,等等。第四,考试监管仍然存在薄弱环节,技术防控措施尚须加强。有的考试机构存在监管机制不健全,制度执行不到位的现象;有的单位负责人存在思想认识不到位,重视程度不够高,缺乏安全意识的现象。对于组考工作只满足于进行常规性的考务安排和考试期间的事务管理,忽视对考试形势的研判与把握,放松对考点、考场以及考务关键环节的有效管理,存在着安全隐患。有的地方技术防控措施不到位,标准化考点建设工作还没有覆盖全部国家考试;防范高科技手段作弊的相关检查、监测设备或手段还不完备;考生身份验证的相关措施还远未跟上,等等。

复杂而严峻的形势使得国家教育统一考试的权威性和公正性受到巨大挑战,也给考试的组织管理工作不断提高水平提出了新课题。

2 自学考试管理工作的特殊性

自学考试是以学历考试为主的高等教育国家考试,是个人自学、社会助学和国家考试相结合的高等教育形式。自1981年我国推行自学考试制度以来,自学考试一直以考风严肃、考纪严明享誉社会;同时也以其考试的难度较大、通过率较低而著称;其毕业证书一度被认为是仅次于全日制本科教育、含金量较高的文凭,质量得到了社会各界的广泛认可。由于考试性质、生源特点、开考专业规模等原因,自学考试管理工作呈现出以下特殊性。

2.1 组考压力相对较大

相对普通高考而言,自学考试的社会关注程度相对较低,因此各级领导的重视程度相对较弱,人、财、物的投入不到位。有的地方在考务组织和管理上不够严密和规范,甚至有的地方还出现学校不情愿承担自学考试考点工作,教师不情愿参加自学考试监考工作的情况。

此外,自学考试考生作弊行为的违规成本相对较低。由于自学考试是水平考试,每门课程60分及格,不及格可以参加该课程下一次考试,考试次数不限。考生可以每年报名参加2~4次若干门课程的考试,采用单科独进、学分累计的方式完成学业。每门课程考试合格即发放单科合格证并计算学分,考完专业考试计划规定的全部课程并取得合格成绩即可获得毕业证书。按照《国家教育考试违规处理办法》,考生一旦出现考试作弊行为,其所受的处理也就是“当次考试各科成绩无效”。即便是作弊“情节特别严重的”诸如“组织团伙作弊的”、“由他人代替或者代替考生参加考试的”等,所受处理也无非是“暂停参加该项考试1年至3年”、“延迟毕业1年至3年”。实际上,违规成本就是每门作弊课程的几十元报考费用,最多就是推迟毕业时间。

2.2 对自考生采取集体管理难度较大

自学考试的考生多以孤立的、分散的个人学习为主。参加社会助学尤其是全日制助学的考生还只是自考生群体中的极少数,绝大多数考生没有进入到社会助学体系当中。以教育部考试中心的统计数据为例(见表1),2007—2012年自学考试全国报考总规模保持在800万人以上,但是参加助学的考生始终没有超过200万人,其中参加全日制助学的考生始终没有超过90万人,仅占报考总人数的10%左右。因此,组织管理起来不像普通高考那样成建制、有集体管理体系可依,很难做到从组织报名等环节开始就可以采取集体管理的手段逐一核验把关。

2.3 自考作弊行为中替考的危害性最大

目前自学考试开考专业越来越呈现出多品种、小规模的趋势。以天津2014年10月考试专业报考规模统计为例(见表2),报考人数超过1 000人的专业有12个,仅占总专业数的近5%;报考人数超过500人的专业有28个,仅占总专业数的约11%;而报考人数不足100人的专业有164个,达到总专业数的63%。

自学考试的这种报考特点,使得高科技化的现代作弊手段几乎没有用武空间,而且从“投入产出比”考虑,也不划算。因此,自学考试防范作弊的重点仍然是传统的作弊方式,其中影响最大、危害性最大的莫过于替考。

近些年来,由于不法中介组织的推波助澜,加之考试组织管理系统内部个别监考教师及管理人员监管懈怠,使替考作弊的人数呈上升趋势。其负面影响不可小视,它不仅给求学者和社会带来不良影响,而且还影响了自学考试的质量,损害了自学考试的声誉,甚至影响到国家教育统一考试的公信力。

表1 2007—2012年自学考试全国报考总人数、参加助学人数和参加全日制助学人数

表2 2014年10月天津市自学考试专业报考规模

3 在自学考试中应用笔迹识别技术防范作弊的必要性

自学考试由于考试性质、生源特点、开考专业规模等原因使其组织管理工作呈现出组考压力大、管理难度大、替考作弊危害更为严重等特殊性。这些特殊性使得自学考试面临的安全形势显得更为严峻,故而有效防范作弊特别是防范替考作弊行为显得尤为重要。

防范自学考试替考作弊行为,首先要加强对考生的考前教育,加强对监考教师的管理,与此同时还要强化考务组织管理,尤其是要对考生进行准确的身份识别。在严把审查报名关、强化源头管理的基础上,针对自学考试的特点引入相关技术手段,建立考前、考中“人防”与考后“技防”相结合的立体式无死角的身份识别与监控体系十分必要。

考试机构应用笔迹识别技术,核对、查验考生每次考试时填涂抄写的笔迹卡信息,是对自考生进行毕业前身份核验的最后一道关口,是最为重要和必要的一个身份识别环节。以往的身份识别手段主要是采用考前、考中的人工核验法(即“人防”),依靠监考教师人工肉眼将考生本人像貌五官与其准考证、身份证以及考场座次表进行核对查验。然而针对自学考试的特点,非常有必要引入技术防范手段,把对考生身份识别的工作从考前、考中延伸到考后。从单一的考前、考中的“人防”发展到考前、考中“人防”与考后核验考生每次考试时的笔迹卡信息的一致性(即“技防”)相结合。“技防”手段的应用,可以在考后甚至在毕业审核的最后关口设置一道可靠屏障。它是防范考生冒名替考、监考疏于职守甚或是被收买而放纵替考等作弊、舞弊行为的可靠途径,能够有效保证自学考试的严肃性和社会信誉。

4 在自学考试中应用笔迹识别技术防范作弊的可行性

4.1 笔迹识别技术的优势

生物识别技术是指通过人体固有的生理特性、行为特征进行身份认证的一类技术的统称,通常具有唯一性、长久性、可识别性和检验性等特点,[5]主要包括指纹识别、虹膜识别、面部识别、笔迹识别等。其中笔迹识别技术具有独特优势。

4.1.1 可采集性高

指纹识别、虹膜识别、面部识别都需要通过专门的设备进行信息采集,如指纹采集需要通过光学、电感或射频传感设备,虹膜采集需要虹膜摄像机等;同时对于设备的操作及其环境也有很高的要求,设备精度如何、操作是否规范、灰尘污染度等细节都会直接影响信息采集的效果。因此采用这些识别技术,都需要设置信息的采集和验证现场。报名时,要求考生必须本人到达现场,在专业人员指导下完成信息采集。考试时,考场也必须配置大量的设备进行信息验证。与之相比较而言,笔迹识别技术则具有非常好的可采集性,不需要为报名现场和考场配备专门的信息采集和验证设备,考生只需要在考试时将一段文字抄写在特定的信息卡(即笔迹卡)上,便可形成验证样本,操作过程非常简单方便。

4.1.2 可回溯性高

指纹识别、虹膜识别、面部识别都是以个人生理特征为验证对象的识别技术,它们有一个共同的特点,即验证主体在场时才能进行验证,一旦验证主体离开则无法再进行二次验证。也就是说,监考人员只能在考试过程中核验考生身份,一旦考试结束、考生离场,验证系统也就无法对当时情况进行回溯。即使后期发现问题,由于不能复原当时的状况,也无法追究考生和监考人员的责任。2014年6月央视报道的河南高考枪手替考案中的考生入场指纹验证舞弊就是利用这一技术缺陷。而笔迹识别技术则以留存的笔迹卡信息作为依据,可对考生参加考试的信息状况进行回溯验证,可对不同时间、不同科目的笔迹进行多次比较,完全不受时空限制。即使考生的替考行为在考试环节中没有被当场发现,也无法躲过毕业审核时的笔迹核对查验关,最终难以逃避应有的处理。

4.1.3 拒识率低

拒识率(False Rejection Rate,FRR)又称拒真率,是识别技术中的一个重要指标,是指将相同的个人信息误认为是不同的个人信息而加以拒绝的出错概率。[6]其定义表达为:FRR=拒识的个人信息数目/考察的个人信息总数目×100%。当前,尽管不少识别技术的提供厂商通常宣称其产品可以达到的拒识率指标为FRR<0.01%,但从公开发表的学术论文和权威的测试数据来看,这样的指标其实是很难达到的。权威机构一般认为,1%的拒识率是可以接受的。然而在实际应用中,由于时间、地点、环境发生变化,致使拒识率会远远大于这个数字。以指纹识别技术为例,由于报名和考试相隔的时间较长,考生在进入考场时如果忘记了报名时信息采集所用手指及其摆放角度,往往就会导致其无法进入考场。另外,像手指过干、过湿、有油渍以及季节性脱皮等情况也会导致拒识现象的发生。而笔迹识别技术采用后期验证的方法,只是要求考生在考场作答的同时留存笔迹卡信息,不要求即时验证,只在考后或毕业审核时进行笔迹核验。这种后期验证的方法避免了现场拒识情况的发生。即使在后期验证过程中发生自动识别算法无法识别的现象,也可以通过人工判定来辅助完成核验。

4.1.4 经济投入低

通过改进答题卡的设计,笔迹识别技术的笔迹图像信息采集完全可以与答题卡的考试作答采集过程整合在一起,完全不需要额外投入资源,具有很好的经济可行性。而其他识别技术由于必须配备专门的采集和验证设备,一般都需要投入大量的资金。以指纹识别技术为例,一个指纹考场签到器的市场价格大约人民币1 500元,如果以3 000个考场计算,仅此一项就需要投入人民币450万元。

综合上述,对四种主要生物识别技术的特点进行比较(见表3),可以看出笔迹识别技术在可采集性和可回溯性方面具有很高便利程度,并且使用和普及成本低廉,准确率高并且在必要时还可以请专业人员(如公安机关鉴识人员)进行人工介入。

4.2 笔迹图像信息的采集具有大量可借鉴的技术方案

1998年,广西考试院在高考英语科目阅卷中首先尝试应用网上阅卷技术。2004年,教育部将网上阅卷作为“阳光工程”在全国范围推广。经历了十余年的发展和实践,网上阅卷在“图像扫描”和“图像切割”等关键技术上积累了大量可借鉴的技术方案,其在采集介质、操作方式、关键技术等方面与笔迹图像信息的采集具有高度的相似性(见图1),因此笔迹图像信息的采集不存在任何技术障碍。

表3 各种识别技术特点比较

4.2.1 图像扫描层面

图像扫描是利用光电技术和数字处理技术,以扫描方式将图形或图像信息转换为数字信号的处理过程。扫描硬件设备主要分为两类:一是专门为考试行业设计的专用扫描设备,此类设备的信息点识别采用“嵌入式”硬识别技术,扫描和识别速度快;二是以高速文档扫描仪为代表的通用扫描设备,采用“分离式”软识别技术,对纸张的适应性好,成像精度高,有利于后期成本的降低。两类设备都有丰富、成熟的产品系列,可为笔迹信息的采集提供多种硬件平台,从而完成图像扫描。

图1 网上阅卷与笔迹采集流程比较

4.2.2图像切割层面

图像切割是图像扫描之后的第二个关键环节。它分为两步,第一步是按照笔迹识别的纹理、灰度等特定需要,将笔迹图像从笔迹卡中准确地分离出来;第二步是进行逐字切割以供后期识别使用。目前网上阅卷系统能够提供两种成熟的切割方式:一是动态切割技术,即在扫描的同时同步完成切割任务;二是静态切割技术,即扫描完成后针对静态文件进行图像切割。两种方式都有丰富的工具可供选择,均可实现图像切割。

4.2.3 图像存储层面

图像存储的格式也是笔迹信息采集的一个至关重要的环节。由于一些存储格式会对图像进行有损压缩存储,所以存储格式的问题会直接影响到笔迹识别的准确性。一些网上阅卷系统能够提供TIFF、BMP、JPEG三种格式。TIFF格式(标签图像文件格式)是一种较为通用的图像文件格式,支持多种平台,图像质量最好,可作为机器识别的存储格式。BMP格式(位图格式)虽然图像质量不如TIFF格式,但其在纯Windows环境下具有很好的兼容性。JPEG格式(联合照片专家组格式)是一个有损压缩格式,文件所占空间最小,图像质量最差,但其能够广泛支持浏览器方式,可以作为人工浏览的存储格式。三种图像存储格式可以相互补充,既能满足机器识别的精确性需求,又能满足人工识别的快捷性需求。

4.3 笔迹图像信息的识别具有日趋成熟的技术支撑

笔迹识别其实是一个古老的身份认证手段,所谓的“签字画押”就是最早的笔迹识别。随着计算机技术的日益普及,在笔迹自动鉴别方面,国内外已经开展了很多研究工作。

笔迹能够充分、客观地反映一个人的书写习惯。书写习惯一旦形成,在很长一段时间不会改变,包括字体的大小与倾斜角度、笔画的走势和用力的大小等。计算机笔迹识别按取样的方式主要分为离线(off-line)和在线(on-line)两类。离线笔迹识别的对象是写在纸上的字符,这些字符通过扫描仪或摄像机转化为计算机能够处理的数字信号;[7]而在线笔迹识别则是通过专用的数字板或数字仪实时地采集书写信号,它不仅可以采集到笔迹序列并转化成图像,而且还可以记录书写的压力、速度等信息,从而为笔迹识别提供更为丰富的信息。[8]按照采集对象和特征提取的方式又可分为:文本依存(Text-dependent)和文本独立(Text-independent)两种。文本依存是指从检验笔迹和参考笔迹中提取相同字即特征字进行模式匹配;而文本独立则是指从字符集中提取的特征与字符的意义无关的特征,如字间距、行间距、笔画方向、字的大致形态和倾斜角度等。文本依存包括降维处理法、笔划匹配法、模板匹配法、纹理提取法等。目前识别率较高的算法是2003年刘宏等提出的采用SVM和Gabor纹理进行笔迹鉴别,识别率最高可达到97.7%。[9]

5 结语

目前,生物识别技术在安保领域应用越来越广泛,技术也越来越成熟。笔迹识别技术是现有的生物识别技术中最具有优势,也最契合自学考试组织管理特点的身份识别技术。同时,其相关理论与技术的日臻成熟也为我们防范和震慑自学考试替考作弊行为提供了可靠保障。为此,我们要下大力气开展适用于自学考试的笔迹识别系统的设计与研发工作,并对相关业务工作流程和管理环节进行深入分析与认真梳理,建立考前、考中“人防”与考后“技防”相结合的立体式全覆盖的身份识别与监控体系,确保自学考试的考试安全与社会声誉。

[1] 胡向东.我们如何应对国家教育考试突发事件[N].中国教育报,2008-03-04(11).

[2] [4] 姜钢.国家教育考试安全面临的形势和对策[J].中国考试,2013(2).

[3] 谈传生,丁丹.自学考试考风考纪现状问题及对策[J].继续教育研究,2013(1).

[5] 杜秀龙.生物识别技术的特点及未来的发展方向探析[J].中国安防,2014(6).

[6] Zhu X,Xu Y,Chen H,et al.Low false reject rate and false accept rate multi-step fire detection method[J].Optik-International Journal for Light and Electron Optics,2013(24):6636-6641.

[7] Fang B,Leung C H,Ytang Y,et al.Off-line signature verification by the tracking of feature and stroke positions[J].Pattern Recognition,2003(36):91-101.

[8] Fan Kuo-Chin,Lin Chang-Keng,Chou Kuo-Sen.Confusion set recognition of on-line Chinese characters by artificial intelligence technique[J].Pattern Recognition,1995,28(3):303-313.

[9] 刘宏,李锦涛,崔国勤,等.基于SVM和纹理的笔迹鉴别方法[J].计算机辅助设计与图形学学报,2003(12).

猜你喜欢

笔迹作弊自学
作弊
基于先学后教 培养自学力
教学与自学
巧克力能否去除桌上的油性笔笔迹
对“自学·议论·引导”教学法的认识和思考
沈尹默:如何自学书法,才能少走弯路?
有人要你帮忙作弊怎么办
笔迹泄露大秘密
作弊等
没作弊