MOOC学习者身份认证模式的研究*
——基于双因子模糊认证和区块链技术
2017-07-18李凤英何屹峰齐宇歆
李凤英何屹峰齐宇歆
(1.上海交通大学 继续教育学院,上海 200240;2.上海交通大学 文科处,上海 200240;3.闽南师范大学 教育科学与技术系,福建漳州 363000)
MOOC学习者身份认证模式的研究*
——基于双因子模糊认证和区块链技术
李凤英1何屹峰2齐宇歆3
(1.上海交通大学 继续教育学院,上海 200240;2.上海交通大学 文科处,上海 200240;3.闽南师范大学 教育科学与技术系,福建漳州 363000)
近年来,MOOC学分认证越来越受关注。学分认证不仅是MOOC和传统教育接轨的突破口,亦是MOOC服务的焦点之一。为了防止MOOC学习者冒名顶替、抄袭和认定其原创,有必要对学习者身份进行认证。然而,在目前的虚拟网络中对学习者的身份认证是困难的。人工监督和传统的认证模式不能彰显MOOC优势,在线数字认证才是MOOC学习者身份认证的趋势。造成MOOC学习者身份识别困难的原因多种多样,在分析比较国际上MOOC“三驾马车”及其他在线教育对学习者身份认证的基础上,提出了基于双因子模糊认证和区块链技术的MOOC学习者身份识别模式和解决方案,尤其是区块链新技术应用在学习者身份认证方面,尝试了一些新的探索,以期为MOOC可持续发展研究提供借鉴和参考。
MOOC;学习者;学分认证;身份认证;双因子模糊认证;区块链
一、引言
MOOC(Massive Open Online Course,大规模开放在线课程),起源于10多年前西方国家的教育资源开放(Open Educational Resources)运动,成名于美国MOOC的“三驾马车”——Coursera、Udacity和edX。自2012年进入中国后,就迅速掀起了一股研究和实践热潮,至今热度未减。在世界各国竞相进军在线教育的大背景下,我国教育部大力倡导网络精品课程建设,积极引导和推动MOOC的建设和发展。我国高水平大学率先开展MOOC建设,据不完全统计,实施MOOC建设项目的高校已有120多所,几乎覆盖所有的“985”高校[1];清华大学、上海交通大学先后推出了“学堂在线”、“好大学在线”等MOOC平台。
MOOC正以前所未有的方式对高等教育从理念到体制产生着重大影响,以其独特的优势开辟了一个崭新的网络教学时代。然而,MOOC的出现在为世界教育带来强大服务功能的同时,也为其自身建设与管理带来了新的挑战与问题。
(一)学分认证是MOOC学习和服务的关键
在MOOC的发展中,存在许多缺憾与不足,比如,辍学率、学习者身份认证等问题。宾夕法尼亚大学的教育研究生院曾在对MOOC学习者的抽样调查中,发现只有4%的人完成了整个学习课程,约有50%的学习者只听过一堂课[2]。究其原因,学分认证或学成证书是关键所在。在MOOC学习中,学习者关心的是能学到什么?学习成果怎样能得到学校或社会的认可?无疑,学成证书或学分是外在标志,也是学习绩效的判断标准之一[3]。
学分认证与转换也是困扰教育界的重大问题之一,尽管大量的MOOC教育资源是优质的、具有学习价值的,但如果学分认证不能有效实施,那么,就会极大地影响MOOC学习者的积极性,也会影响MOOC的持续、健康发展。可见,学分认证是MOOC和传统教育接轨的突破口,也是当前MOOC研究与开展服务的关键。
在MOOC兴起之初,没有一个完善的评分和评估体系,没有学分认证,没有对服务方和第三方的监督机制等。尽管MOOC平台可以提供学生班级式的学习经验和学习记录,学生也有机会获得相应课程的认证证书,但并不能替代学分,而这也是MOOC辍学率高的原因之一。伴随MOOC的发展,高校进一步开放优质在线课程,不断推动学分的互认和第三方的课程证书认证。于是,MOOC的课程结业证书、凭证或学分正在慢慢被正规教育系统内的院校承认,并转化为真正的学分或学位。
目前在美国,MOOC已经成为学习者们获得文凭、学分、就业机会的途径之一。比如,edX与美国亚利桑那州立大学合作的“全球新生学院(GFA)”,允许第一学年的课程全部在edX网上完成,参加考试,认可学分。麻省理工学院借助edX,向全球推出了“在线+在校”结合的供应链管理硕士课程及相应的硕士学位——“微硕士”,其课程证书、凭证等也逐渐被就业市场承认[4]。
在国内,教育部出台《关于加强高等学校在线开放课程建设应用与管理的意见》,推进了高校MOOC学分认定和学分制度的创新;一些高校也在积极推动学分互认,如,借助上海交通大学研发的“好大学在线”MOOC平台,使盟校间可以互认学分。学分认证问题的突破,意味着部分学生完成MOOC学习后能够得到学分认证或能得到 “含金量”高的学成证书,使得部分区域的MOOC辍学率将得到改善。良性循环一旦形成,MOOC的规模和优势也将会更加突显。
(二)学习者身份识别困难是MOOC学分认证面临的核心问题
MOOC在相当长的一段时间内之所以不能代替学校的学分,与学历的严肃性有一定关系;学分认证应该有一整套完善的考试制度、评估体系和监督体制,即诚信机制。目前,MOOC采用的是多种学分认证模式,在学习过程中或者在学习结束时,安排有监考的考试或考核,但这都对考试有较强的依赖。MOOC学分认证的目的,在于有效证明学习者本人通过真实的学习而获得一定的学习成果,从而体现教育的公平、公正。
然而,MOOC无人监督的在线学习和考试环境,比在校学习和相应考试环境更容易产生欺骗或作弊现象。在虚拟网络中,与我们交互的不再仅仅是具有生命特征的自然人,有可能是远到云端的智能助理,也有可能是近在身边的智能终端设备[5]。人们经常对网络学习环境的相对匿名性表示担心,同时还害怕MOOC的大规模开放特性,将使得学术领域中出现更多的造假和作弊。因此,如何有效核实学习者的网络身份,依然是MOOC学分认证的一大障碍。
为了防止学习者冒名顶替、抄袭和认定其原创,在MOOC考试中,有必要对学习者身份进行有效认证。一般地,MOOC学习者身份认证主要包括人工监督和数字认证两种机制。目前,我国多数MOOC学习评价对于学习者的身份认证主要依靠人工监督完成,比如,通过第三方参与的考试确保学生的诚信。但它存在许多弊端:(1)非自动化。MOOC本身是大规模开放在线课程,使用人工监督,违背了MOOC建设的初衷;(2)成本高。考试中心依赖人工确认学生身份,手段一般比较陈旧,工作量较大,这无疑增加了学生的费用;(3)效率低。对于大规模散布在世界各地的各类学习者而言,人工监督认证很难有效坚持或实施。因此,在线数字认证将是大数据时代MOOC学习者身份认证的研究方向和趋势。
二、MOOC学习者身份认证困难的原因
MOOC的优势在于学习方式灵活,形式上接近传统教育的模式,又有严格的教学计划、课程进度、练习和考试。但学习者最终能否取得与传统教育同等的学历或证书,将取决于学习者能否通过考核。在虚拟网络中,要维护考试的严肃性,学习者身份认证就变得尤为必要和重要。然而,在目前的MOOC学习过程中,大规模进行学习者身份辨认是相当困难的,究其原因,主要有自身因素和互联网结构因素。
(一)MOOC自身发展中存在的矛盾
1.规模过大带来大数据管理的滞后
MOOC种类、数量越来越多,学习者数量也随之增多。网络的快捷连通,使得地球村每一个角落的人都可以免费注册学习,有的仅一门课程,学习者就可达数十万之多。随着学习者的增加、数据流量的增多,由此产生的大数据管理变得更为困难和复杂,管理与服务工作也就有些跟不上了。当前,MOOC面临着数据保存形式和可靠性保证机制等方面的挑战。
2.网络的开放性带来重要数据的泄密
任何人,只要有电脑,连通网络,就可以注册学习MOOC。MOOC架构于因特网平台之上,随着互联网的开放性和便捷性的增加,在平台登录、数据传输和访问过程中,必然会遭到各种攻击和威胁。
3.身份的虚拟性增加了辨认难度
在虚拟的网络空间里,没有面对面的教学、交流和考试,学习者躲在屏幕之后。MOOC学习者跨区域、跨学科、规模大而多元化,教师和学习者素未谋面而又触不可及,这就为学习者身份辨认增加了许多难度。
4.分布式教学带来认证困难
MOOC的教与学、学与学的互动均在网络中进行。虚拟学习空间中的MOOC学习者、学习资源和学习场地等呈现复杂的分布式分布,点对面、点对点、立体网状交叉是MOOC的学习常态。这也为学习者身份认证增加了困难。
5.网络去中心化与交互多元
传统教育以“名师、教室”为中心,而MOOC平台课程资源丰富,标准化课程消失,个性化学习突显;平台集合了世界知名大学的资深教授,很难对教师进行对比,也就不存在所谓的各类“名师”。随着人工智能的快速发展,在某些方面智能专家甚至取代了教师,教师的作用被弱化,由主导变为辅助、帮助学习者完成学习;MOOC平台的开放性也打破了学校的院墙,学习者的学习不再依赖于名师、教室。学习方式由“圈养”变为“散养”,这为学习者的管理和认证带来了新的挑战。
(二)MOOC数据和互联网结构的因素
1.MOOC中的数据种类繁多
MOOC中的数据不仅包括数值类型的结构化数据、表格等形式的半结构化数据,而且还包括图片、视频和音频等形态的非结构化数据,并且非结构化数据越来越多。数据的格式不同,它的存储形式就不同,其访问模式也就有区别。在对MOOC大数据处理中,传统的数据访问模式不再有效,因为大数据处理需要更高的操作级别,即通常是对大数据进行集合操作。而且,MOOC的学习资源和学习工具是多元和冗余的。因此,MOOC学习中更容易出现假冒、伪造、盗取和篡改等;黑客和犯罪分子更容易获得学习者的信息,有更多不易被追踪和防范的入侵手段,因而,可能会出现更高明的作弊或骗局[6]。
2.“TCP/IP”协议存在一定的漏洞
传统的以“TCP/IP”协议为核心的互联网,数据标识与地址一一对应,IP地址具有身份标识和地址双重语义。由于考虑数据的物理地址,要依赖传输端点和传输管道的保护,因此,会出现身份假冒、篡改等安全问题。譬如,在MOOC学习中,经常有这样的情况发生:多人共用一个IP账号,共用一个路由器的集体宿舍、教室或者咖啡馆;一个人同时注册两个或多个账号,作弊者先用其中的一个账号答题而获得答案后,再用另一个账号迅速提交正确答案。据研究者发现,此类作弊形式占据了edX颁发证书的5%[7]。早在2010年,美国国家科学基金委员会(National Science Foundation,NSF)就已开始组织实施构建全新的互联网体系架构,即下一代互联网体系结构——命名数据网络 (Named Data Networking,NDN)[8],目标是以“数据/内容”为中心进行网络体系架构,对以“TCP/IP”协议为核心的互联网进行替代性设计。
三、在线教育学习者身份认证的研究现状
MOOC等在线教育的学分认证,对考试有较强的依赖性。虽考试审查严格,但冒名顶替、贿赂监考等作弊手段依然层出不穷。因此,核实学习者的网络身份仍然是影响MOOC学分认证的一个重要因素。
传统的远程教育考试,对于学习者身份的认证通常采取两种方式:人工监督和委托第三方参与的认证方式。最为常见的是网络教育学院的期中、期末和学位考试,其考试形式大多采用最原始的方法,即老师和学生来到真实的考场,人工验证、人工分发密封好的纸质考卷以及人工监考等;之后人工纸质阅卷、统计分数,而后把分数发布到网上或通知学生。
(一)国际上MOOC“三驾马车”的探索
目前,MOOC的“三驾马车”——Coursera、Udacity和edX,都与全球教育公司Pearson的考试中心合作,提供有监考的课程结业考试。比如,由Coursera提出的五门科目已经被美国教育理事会认证通过,只要学生缴纳一定的费用并通过有第三方参与的认证考试,即可有机会获得相应课程的认证证书[9]。Udacity也是让学生支付一定的费用,前往Pearson设在世界各地的考试中心参加考试。
美国教育合作组织的一项调查显示,40%的学校采用技术手段防止学生在在线考试中作弊[10],如,采用虚拟监考以确认学习者身份。但总体上,目前有关确认学习者身份的技术手段仍处于探索阶段。
edX为了加强“全球新生学院(GFA)”项目在线考试的管理与监督,与软件开发公司Software Secure合作,使用 Software Secure开发的虚拟监考平台——Remote Proctor Now(RPNow)。它在考试之前,先通过注册账号对学习者身份进行确认,然后,利用RPNow平台进行虚拟监督考试。采用RPNow,关健在于必须通过网络摄像头进行全程录像;之后,由视觉识别软件对考试视频进行分析,监考人员也会对每个可疑的行为进行审查[13]。
(二)其他在线教育的身份认证方法
设立在线教育课程,就需要设法保证考试、学位的公平和诚信。著名世界语言学习平台Duolingo在考试时,就要求学习者的手机或电脑的摄像头和话筒必须持续工作,以录下考生的考试过程;在考试结束后,再进行人工审验;并且学习者的考试视频与其学成证书绑定,以便学校和未来的雇佣方查看。
美国罗格斯大学、北德克萨斯大学等高校的在线考试采用了Proctortrack软件。具有“全球第一套自动化远程监考解决方案”美誉之称的Proctortrack,由在美国运输安全管理局工作过的蒂姆·杜塔(Tim Dutta)主导开发,目的是用来验证报名参加在线课程的学生身份。Proctortrack使用计算机算法检测学生的异常行为,比如,从电脑屏幕前离开;然后,将学生按诚信度高低进行分类。
在考试开始前,Proctortrack会通过网络摄像头扫描学生的脸部特征,进行身份验证。当考试开始之后,电脑屏幕上会出现一条红色警示条,表明Proctortrack正在监控考生的电脑并录制视频。这时,要求考生脸朝向摄像头,手必须放到桌面上来。另外,软件还会弹出一个小窗口显示实时图像画面,时刻提醒考生正受到监视。
“365微学习”采取的是人脸识别技术。学习者在网站上注册时,除了登记基本信息外,还要将自身照片存入网站信息库。当学习者参加在线考试时,会输入基本信息,比如,姓名、身份证号码等。根据这些信息调出信息库的人脸信息,然后开启摄像头,让摄像头里的人脸跟调出来的人脸进行信息比对。如果比对成功,则身份认证通过;否则认证失败,学习者无法参加考试。
此外,还有“人人通”,通常采用“身份证号码+学校管理员审核”的方式。其他的还有采用指纹认证、视频录像等手段验证学习者身份。有些学校使用软件来阻止学生在考试过程中打开其他软件或网页浏览器,还有学校通过网络摄像头对学生进行实时远程监考。身份认证的目的是解决替考等问题,很多学校的网络学习环境可以为远程学习者服务,如,“未来工场”等。这种虚拟监控通过模仿教室中的真实体验,大大超越了现场监控课堂的效果。
(三)学习者身份认证研究的突破点
目前多数研究集中于具有固定刚度特性的微纳测头[5-7]。然而,若微纳测头刚度过高,测量过程中易划伤工件表面;若微纳测头刚度过低,容易造成谐振频率低、动态响应慢、稳定性差和误触发等[8]。微纳测头的约束支撑机构是测头机械结构的主体,其刚度特性直接决定测头的整体刚度。因此,通过研究使得微纳测头在使用过程中具有最优的刚度特性,对测头性能的提升具有非常重要的理论意义与实际价值。
综上所述,单纯从技术角度来讲,实现远程在线身份认证或监考已不存在障碍,但实际上仍存在不少问题。如,MOOC平台还使用课程登陆这种传统身份认证的,会有以下几点问题:一是不能排除冒名顶替;二是不能防止多人使用同一IP,如,同一班级或者同一宿舍的学习者有可能使用同一IP;三是学习者需要在特定时间参加在线考试,且需支付一定的费用。
目前,Coursera等MOOC平台的做法也面临着很多困难,比如,参与的学校和公司有限;成本高、效率低;会带来一系列的大数据存储和大数据分析问题;而大数据存储和大数据分析,又会涉及学习者的隐私等大数据的安全问题。就连Proctortrack及其他类似的录像、虚拟考试行为,也同样存在如下问题:
1.隐私和公平
Proctortrack对考生的监控,与传统考试中的监考老师类似,站在某位考生身边,并时刻盯着他(她)。犹他谷大学效率和规划处副主任杰弗里·阿兰·约翰逊(Jeffrey Alan Johnson)把Proctortrack的这种监考方法,跟存在争议的美国运输安全管理局用于识别恐怖分子的机场安检程序做了对比,列出的可疑行为包括:凝视远方和不停打哈欠[14]等。从心理学的角度看,上述行为势必造成对考生思想及其行为自由的侵扰,影响其考试发挥。不仅如此,当让录像成为网络课程的常规程序,以及对考生考试视频的反复查验,甚至交给第三方或未来雇主查看的时候,具有隐私意识的学习者,将会怀疑个人隐私权受到侵犯,从而产生反感或抵触情绪。
2.准确性和繁琐性
Proctortrack要求考生坐直,还要一直面向镜头。任何坐立不安、打哈欠、眼看别处思考、弯腰捡橡皮等行为,都有可能被误认为作弊。一旦碰到这种情况,等学生交卷之后,审查老师会到服务器里回放考试视频,人工辨别考生是否真实存在作弊或违规行为。无疑,这为考试环节增添了不准确性和复杂性,而这些把考生当作“贼”的行为,都将会引起学生的不满与抗议。
3.成本和付费
解决录制后视频的查验问题,目前有两种方法:一种是利用技术解决,但短期内很难实现;另一种就是人工查验。在网络虚拟考场中,无论是对考生全程录像,之后再查验,还是有人员全程实时监控,抑或是两者兼而有之,期间的劳动量都是非常庞大的,这无疑增加了学习者的考试成本。比如,在美国罗格斯大学一次使用了Proctortrack的考试中,学生需为此支付37美元的使用费。事实证明,这种被监控而且需要付费的考试,许多学生不愿意接受[15]。除此之外,虚拟考场视频录像或者人脸识别技术,对于双胞胎来说,也很难做出准确的身份识别。
四、MOOC学习者身份的双因子模糊认证模型
基于上述分析,我们认为,对MOOC学习者的身份认证需要大力改进,改进的目的有二:一要约束学习者,防止冒名顶替、防止抄袭、认定其原创;二要保护学习者的权益,在防止假冒、窃取、篡改和出卖个人学习进度和个人信息的同时,尽量照顾学习者的心理或人格自尊。
传统的身份认证技术,背离了人的生物体;主体为“人”的身份鉴别却与人的生物体割裂开来。静态口令方式,安全级别较低;动态口令方式,不能实现数据加密、保障数据完整性;智能卡方式,需要随身携带,并且容易丢失。直到生物识别技术的成功应用,身份认证技术才真正回归到人的生物体本身。
生物识别是指利用生物特征进行身份认证的一种技术。每个生物个体都有固有的、唯一的可以测量或可自动鉴别和验证的特征,能够区别于其他生物的生理特点或行为模式,即生物特征。生物特征包括身体特征和行为特征。身体特征主要包括指纹、虹膜、脸型、DNA等;行为特征主要包括签名、语音、行走步态等。
上文提到的Courser的“击键生物识别术”、“365微学习”的“人脸识别术”等都属于生物识别技术。该技术具有随身“携带”、不易伪造、保密可靠、唯一性和稳定性强等特点,因此,备受研究者的喜爱。
(一)模糊认证
传统基于生物特征的身份认证方法,通常是首先提取用户的生物特征信息样本,并存储在系统中。当对用户进行身份鉴别时,再次提取用户的生物特征信息,将其与系统中的生物特征样本进行对比,如果二者达到一定的相似度,则用户身份验证成功。这种基于生物特征相似度比较的身份认证方法,需要存储每个用户的生物特征信息,而且存储量非常大,这也是传统的基于生物特征身份认证的瓶颈。新修订的《居民身份证法》要求居民在申领、换领、补领身份证时登记指纹信息,以实现身份证防伪等功能。这将是一次浩大的信息工程,基于中国目前的庞大人口数量,需要有巨大的指纹信息数据库来储存与管理居民的指纹数据。专家预计,仅存储指纹的费用就高达2000亿元,经济成本较高。
因此,从存储角度上讲,Coursera等MOOC平台的做法也是不可取的。上述传统的生物特征认证技术的另一个显著缺点,是实际操作起来有一定困难。以生物特征(如,用户的指纹)作为用户的身份ID,两次指纹扫描数据很难做到完全相同,即ID≠ID’。因此,传统的基于生物特征的认证方法,在MOOC在线考试中也是难以实施或实施成本太高。
由于温度、湿度等外部环境条件及其扫描面积和设备的变化,同一个手指两次扫描录入的指纹信息很难完全相同。但是,同一个指纹在两次扫描采集到的信息会存在一定程度的相同之处;如果是两个不同的人的指纹,则重复的概率极小。依据模糊理论,我们可以利用这种一定程度或比例的相同之处,将用户的某种生物信息 (如,用户的指纹信息数据等)作为身份,实现模糊身份的鉴别[16]。
模糊理论(Fuzzy Logic)的概念最早出现在1965年,是在美国加州大学L.A.Zadeh教授创立的模糊集合理论的数学基础上发展而来。L.A.Zadeh教授是模糊理论的奠基者,他第一次提出了一个表达事物模糊性的重要概念——隶属函数,颠覆了康托尔的经典集合理论。模糊理论以模糊集合(Fuzzy Set)为基础,以精确性为对立面,其主要观点是接受模糊性现象存在的事实,将其量化成计算机可以处理的信息,用以处理概念模糊不确定的问题。
虽然模糊性是精确性的对立面,但我们在处理客观事物时,经常借助于模糊性,因为,将某些因素适当地进行模糊化处理,也可以提高预测精度。模糊理论发展至今已近30年,应用的范围非常广泛,从工程科技到社会人文科学,都可以发现模糊研究的踪迹与成果。比如,一些模糊专家系统应用于医疗诊断和决策支持。在教育领域,模糊性常被用于教学成果评估、心理测验、性向测验和计算机辅助教学等。
(二)双因子认证与双因子模糊认证
一般地,用于身份认证的因子分为三种:(1)你所知道的信息 (What You Know),比如,静态口令、动态口令、口令卡等;(2)你所拥有的东西 (What You Have),比如,IC卡、令牌、USB Key等实物;(3)直接根据独一无二的身体特征 (Who You Are),比如,指纹、虹膜、视网膜、掌纹、面貌等生物特征。
所谓双因子认证,就是必须使用上述三种认证因子中的任意两者的组合,才能通过认证的认证方法。类同于我们生活中的ATM取款,需要一张储蓄卡和卡密码两个因子才能通过认证而取款。为此,我们基于模糊认证定义,使用了模糊集合理论的身份认证,而双因子模糊认证则定义为使用了模糊认证的双因子认证。
2005年,Sahai和Waters提出模糊身份(Fuzzy Identity)的术语,将生物特性直接作为身份信息应用于基于身份的加密方案中[17]。用户的身份不再是简单的单个图文数据信息,而是由若干属性组成的集合,这些属性对应于生物信息的特征值。当用户A和用户A’两个身份的属性集合的重叠(Set Overlap)程度足够高,或者说A和A’足够接近时,由用户A的私钥加密的信息就可以被用户A’的身份验证。
基于Sahai和Waters的基本观点,我们创建了基于双因子模糊认证的MOOC学习者身份认证模型,如图1所示。
图1 基于双因子模糊认证的MOOC学习者身份认证模型
与传统的基于生物特征和基于模糊认证的身份认证方法不同的是,我们对MOOC学习者身份鉴别采用了双因子认证方法,即把身份证和指纹两个能够和其他任何人区别开来的、代表学习者身份的唯一性因素,作为学习者的ID。为什么采取双因子认证?因为学习者身份认证的目的,是为了确保最后学分或证书获得者就是MOOC学习的注册者,单一指纹或身份验证很难判断注册者、学习者、证书获得者是同一个人,即不能防止冒名顶替。
(三)双因子模糊认证的实施
我们认为,认证的实施需要分两个阶段进行:
第一阶段是注册阶段,由四个子过程组成:(1)MOOC注册系统初始化。MOOC注册系统初始化时,运行一次算法,然后输出公开参数,比如,128位公开安全参数、群域模数、公开大素数参数等;(2)MOOC学习者个人信息录入。由于公钥是和学习者身份绑定的,比如,学习者个人信息,因此,不必再由第三方分发公钥;(3)密钥生成。由前两个子过程输出的公钥、公开参数以及作为身份ID的学习者唯一性特征(身份证+指纹),进一步生成学习者私钥;(4)唯一性特征属性集合加密存储。由第三部分输出的学习者私钥对学习者唯一性特征 (身份证+指纹)描述属性集合进行加密,生成加密的学习者唯一性特征属性集合数据,MOOC学习系统存储的正是这个特征属性的集合数据。
第二阶段是验证阶段。学习者再次登录MOOC学习系统时,学习系统将再次提取该学习者的唯一性特征(身份证+指纹)数据ID’,比如,将身份证和指纹进行再次智能扫描,若ID∩ID’至少含有规定的元素个数,则鉴别通过;否则验证失败。
对于大多数基于生物特征的身份认证技术而言,由于每次提取的学习者的指纹信息会随着提取方法、提取仪器和提取环境的不同而不同,即以指纹作为身份的ID≠ID’,每次识别得到的生物信息都不可避免地存在一定的误差(Noise),因此,传统的基于生物特征的身份认证方法具有一定局限性。但是,模糊身份所特有的容错性(Error Tolerance)则使得将生物信息作为身份成为了可能。
(四)双因子模糊身份认证防止学习者冒名顶替
在考试之前,首先需要MOOC学习者在平台系统里填写个人真实有效的信息,并提交个人身份证及其他相关有效证件,由系统管理人员初步确认学习者个人信息。然后,学习者通过智能终端扫描指纹并上传至系统平台,系统将采集到的指纹信息预处理,并提取其中的特征信息作为学习者身份集合;进而,系统平台的密钥生成器根据这些存储的身份信息,通过私钥生成算法,生成学习者的私钥;系统还通过模糊身份鉴别算法,对学习者身份信息生成特征属性集合数据。
这些特征属性集合数据,将被存放在学习者的电子准考证中,因为不需要存储学习者的“指纹+身份证”信息与私钥信息,所以可销毁学生的私钥信息。当学习者参加MOOC在线考试时,再次扫描自己的指纹和身份证,如果扫描结果和学习者准考证中的特征属性集合数据达到一定程度的相同,即被远程考试中心验证通过。身份验证通过之后,学习者才可以参加远程在线考试。
在考试过程中,打开电脑前的摄像头进行录象,为确保MOOC学习者的隐私安全,在下发成绩单后、颁发学成证书之前,并对成绩单无异议的情况下,尽快删除视频录像。在考试结束之后,将学习者的“身份证+指纹”、颁发证书单位和颁发日期等信息制作加入学成证书中,以免证书假冒伪造。
我们认为,相比传统的基于身份的认证模式,基于双因子模糊认证的身份鉴别方法,具有如下优势和特点:
第一,简化了公钥和学习者之间的绑定。因为,人自身的生物特征指纹和身份证具有很强的唯一性,难以在任何学习者之间复制,并且方便携带和通用,不用担心密码忘掉或被窃取;第二,基于模糊身份认证的方法,本身的容错性使得基于生物特征的学习者身份鉴别成为可能;第三,由于不需要存储学习者的大量“指纹+身份证”的图文信息数据,只存储了“指纹+身份证”的描述性属性集合,所以可以减少“指纹+身份证”数据存储的经济与管理成本;第四,采用公钥加密、私钥解密的密码算法,加强了对学习者个人信息等个人隐私的保护。
五、区块链技术介入MOOC学习者身份认证的探讨
(一)区块链技术可确保信息传输的真实可靠
近年来兴起的区块链技术,对于学习者身份认证有较大的应用价值。区块链(Blockchain)最早可以追溯到2008年末,一个化名为 “中本聪”(Satoshi Nakamoto)的人在比特币论坛中发表了一篇论文《比特币:一种点对点的电子现金系统》(Bitcoin:APeer-to-Peer Electronic Cash System),其中首次提出了区块链的概念[18]。我们可以这样理解“区块链”:它作为一份比特币的公共账本,里面存放着比特币的所有转账交易记录,这些记录是分“区块”存储的,每个区块存有一部分比特币交易记录;而且这些交易是有时间标识的,形成一个“链”,因此称之为“区块链”。当有新交易发生的时候,系统会将新交易存储为一个新的“区块”,并连接到区块链上,从而完成交易。并且,区块链的任何新交易都需要网络安全节点的确认,一旦生成,将无法删改。可见,区块链作为一种可追踪、可验证的价值交易活动的数据库清单,可以保障金融活动的可信性和有效性。
区块链的数学原理是基于密码学中的椭圆曲线数字签名算法(ECDSA),来实现去中心化的P2P系统设计。它是一种把每个“区块”的记录“链”成一个有序整体的数据存放形式,密码学算法确保了数据块的不可伪造和篡改,并可对数据记录进行验证和追踪。可见,区块链解决了信任危机,可用于金融、经济和教育等多个领域。
(二)区块链在MOOC学习者身份认证中的应用方案
在教育领域,区块链技术的应用尚处于探索阶段,一些研究者正在对此探讨和研究。区块链通过分布式记账、分布式传播、分布式存储来实现网络系统的去中心化管理,这正迎合了MOOC分布式、去中心化的教育模式。因此,在我们设计的MOOC学习者身份认证方案中,区块链技术可将各个区块——“考试前”、“考试中”、“考试后” 和 “考试结果” 等,“链”成一个有序的整体,形成一个完整的区块链,其功能分三个阶段来完成,见图2。
图2 区块链技术介入的MOOC学习者身份认证方案
1.第一阶段:学习轨迹记录
区块链分布式、去中心化记录数据的特性,可以允许官方教育机构或者组织进行跨区域、跨平台地记录MOOC学习者的考试行为和考试成绩,并且无需事前建立一个中枢存储机制或协调机构,就可以跨平台地提取学习者考试之前的学习行为和学习结果,以便与MOOC考试成绩进行比对。
这些数据一旦被记录,将可以通过云服务永久被保存,而且只能增添、不能删改;学习者可以利用这些数据和文件证明自己的学习经历。但区块链技术对共享云上MOOC学习者学习数据的记录、提取和存储,有可能会涉及学习者的个人隐私,还需要加强保护。
2.第二阶段:有效证书颁发
学习者在接受MOOC考试之后,希望获得有效证书。众所周知,制作数字证书通常利用数字签名来完成。在本方案中,我们采用了基于数字签名算法的区块链新兴技术。它分为三个步骤:
步骤一,系统初始化。主要是生成数字签名方案用到的参数,比如,私钥和公钥等,私钥只有发证机构才能访问,公钥则是公开的;步骤二,签名阶段。系统将区块链技术从第一阶段“学习轨迹记录”中获得的摘要信息,包括学习者的个人身份信息、所学课程信息、成绩等以及在区块链上加进去的发证机构名称、发证日期等,用发证机构的私钥加密,然后与原文一起发给学习者或其他接收者;步骤三,验证阶段。学习者或其他接收者只有使用发证机构所给的公钥,才能解密被加密的摘要信息,然后,利用hash函数算法对收到的原文产生一个摘要信息,将其与解密的摘要信息进行比对。如果相同,则证明证书内容是真实可靠的。这种区块链传递的过程,可以保证MOOC学成证书中学习者信息、课程内容及发证机构名称和颁发日期等相关信息的完整性、可信性、不可篡改性和不可抵赖性。
上述区块链提供的MOOC学成证书的颁发方案是基于hash方程数学原理的。目前,一些组织或机构正在尝试使用区块链技术提供数字证书,比如,麻省理工学院媒体实验室[19],其核心技术并不复杂,和区块链技术本身一样也是基于加密数字签名算法。
3.第三阶段:学成证书验证
在通常情况下,求学/职者需要递交之前的学成证书,由未来的大学或雇主审核,并求助于第三方,比如母校,来存储其档案信息、证书信息或者学习记录等凭证,以便未来的雇主查验;或者一旦原件丢失,就会要求母校给予官方证明或副本(一般会付少量手续费);而雇主也会联系求职者母校,查验证件的真伪。这个过程是繁琐缓慢的,许多雇主因各种原因不去查验,从而导致一些求职者冒险造假。
在MOOC等虚拟在线学习中,由于身份认证的困难,出现学习者身份假冒或者考试作弊的行为会更多。如果MOOC的每个学习者对其所获得的学成证书拥有控制权,或者拥有不怕丢失而能够永久保存学习凭证的方式,在必要的时候还能够自主分享证书给别人查验,那么MOOC的数字化、规模化优势将充分显现。而区块链技术就能够实现这种可能,它可以根据时间戳永久存储和去中心化地管理每个学习者的学成证书,免除学习者怕丢失证书的担心,并方便查验者鉴别学成证书和学习者身份的真伪。
综上所述,在我们设计的MOOC学习者身份认证整体方案中,采用了基于双因子模糊认证和区块链两项技术。双因子模糊身份认证重在解决学习者身份,即确保MOOC注册者、学习者和证书获得者是同一个人,防止冒名顶替和假冒;而区块链技术重在解决信息在传输中的真实可靠、不可篡改和伪造,防止作弊。两项技术融为一体,相得益彰。
六、结论
MOOC学习者身份认证是目前MOOC在线考试的瓶颈和障碍。学习者身份的鉴别直接影响在线考试能否取代人工考试或半自动化考试,并且进一步影响MOOC的可持续良性发展。因此,学习者身份的在线认证,必将是世界各国实践者探索的重要内容和研究者关心的重要课题。但是,目前国际上还未有对解决此问题行之有效的手段、技术和方法,尚处于探索的早期阶段。为此,我们基于双因子模糊身份认证和区块链技术,提出了MOOC学习者身份认证模式及其全过程解决方案。
基于双因子模糊身份认证的MOOC学习者身份认证模式,不同于传统的基于生物特征的身份认证和基于模糊方式的身份认证,其优势在于不需要存储完整的学习者的身份证和指纹信息,就能够实现学习者的身份认证。而区块链技术应用于MOOC学习者身份认证的全过程解决方案,能够实现学习者整个学习流程以及学成证书颁发和验证过程中信息的完整性和真实性。
但若要解决这一世界性的难题,绝非一朝一夕,还需要科研人员不断地深入研究和反复试验,并在实践中不断修正,比如,区块链技术就应用于MOOC。一个突显的问题是,区块链在学习者学习轨迹记录和学成证书验证过程中,关于学习者的隐私保护方面还亟待加强。
显而易见,MOOC学习中的新技术应用可以有效地鉴别学习者身份,可以实现考试的自动化和个性化,能够为全部学习者提供一个公平的竞争平台,甚至能够改善在线教育的整体质量。但MOOC学习若对于考试和技术过分依赖,一方面会强化了功利性学习的倾向,另一方面也降低了MOOC的开放性和便捷性。作为参与上海交大MOOC建设的研发人员,我们深刻认识到,MOOC如果要持续健康发展,还有许多理论和技术难题需要攻坚。
[1]曹培杰.正确认识MOOC的三个关键问题[EB/OL].[2017-03-18]. http://epaper.gmw.cn/gmrb/html/2014-08/26/nw.D110000gmrb_ 20140826_2-13.htm?div=-1.2014-08-26.
[2]Perna L W,Ruby A.Life Cycle of a Million MOOC Users[R]. Arlington,Texas:The MOOC Research Initiative Conference,2013.
[3]Xiao T.MOOC:A Student’s Experience and Thought[J].Communication of the CCF,2012(6):40-43.
[4][12][13]Power铂尔教育网.如何防止MOOC学习者在线考试作弊?[EB/OL].[2017-03-16].https://sanwen8.cn/p/Q57Mal.html.
[5]Gates B.The Road Ahead[M].Beijing:Science Press,1995.
[6]CCF大数据专家委员会.大数据热点问题与2013年发展趋势分析[J].中国计算机学会通讯,2012(12):40-44.
[7]Schaffhauser D.Research Uncovers MOOC Cheating Strategy[EB/OL]. [2017-03-15].https://campustechnology.com/articles/2015/08/26/ research-uncovers-mooc-cheating-strategy.aspx?m=1.2015-08-26.
[8]Jacobson V,Smetters D K,Thornton J D,et al.Networking Named Content[J].ACM CoNEXT,2009.
[9]Long K.UW to Offer Fee-based Courses through Coursera[J].The Seattle Times,2012.
[10]时代青年网.缅甸老师为防抄袭树林考试,盘点那些防作弊的高招[EB/OL].[2017-03-18].http://www.hnqnw.cn/jyxw/218946.html. 2016-01-18.
[11]Udacity blog.Udacity in Partnership with Pearson VUE Announces Testing Centers[EB/OL].[2017-02-18].http://blog.udacity.com./ 2012/06/udacity-inpartnership-with-pearson-vue.html.
[14][15]猎云网.反作弊科技神器陆续走进校园[EB/OL].[2017-03-18]. http://www.gywb.cn/content/2015-05/07/content_3023053.htm.2015-05-07.
[16]Yang P,Cao Z,Dong X.Fuzzy Identity based Signature with Applications to Biometric Authentication[J].Computers&Electrical Engineering,2011,37(4):532-540.
[17]Sahai A,Waters B.Fuzzy Identity-based Encryption[R].International Conference on Theory&Applications of Cryptographic Techniques,Heidelberg:Springer-verlag,2005:457-473.
[18]李青,张鑫.区块链:以技术推动教育的开放与公信[J].远程教育杂志,2017(1):36-44.
[19]Redman J.MIT.Media Lab Uses Bitcoin Blockchain for Digital Certificates[EB/OL].[2017-04-11].https://news.bitcoin.com/mit-blockcerts-certification-bitcoin.2016-10-28.
Research on Pattern of MOOC Learner Identity Authentication:Based on Double-Factor-Fuzzy-Identity-Authentication and Blockchain Technology
Li Fengying1,He Yifeng2&Qi Yuxin3
(1.School of Continuing Education,Shanghai Jiaotong University,Shanghai 200240;2.Division for Department of Liberal Arts,Shanghai Jiaotong University,Shanghai 200240;3.Educational Science and Technology Department,Minnan Normal University,Zhangzhou Fujian 363000)
In recent years,MOOC credit certification is a matter of great concern.Credit certification is the key point connecting MOOC and traditional education,as well as the focus of MOOC service.It depends on the examination strongly.In order to prevent learners from impersonating cribbing and confirm originality,it is necessary to authenticate the identity of the learners.However,authentication for learners in the virtual network is difficult.Manual monitoring and traditional authentication model can’t highlight the advantages of MOOC.Online digital certification is the trend of MOOC learner identity authentication.The reasons for the difficulty of identifying MOOC learners is varous.Through analyzing the ways of international MOOC “three carriages”and other online education patterns,a double-factor-fuzzy-identity-authentication and blockchain based on MOOC Learner Identity Authentication Pattern and solution are proposed.Especially,we have made some new explorations in the aspect of applications of blockchain,for the sake of providing reference for research on the sustainable development of MOOC.
MOOC;Learner;Credit certification;Identity authentication;Double-factor-fuzzy-identity-authentication;Blockchain
G420
A
1672-0008(2017)04—0049—09
李凤英,上海交通大学继续教育学院副研究员,博士,研究方向:在线教育与虚拟学习;何屹峰,上海交通大学文科建设处,讲师,硕士,研究方向:在线教育;齐宇歆,闽南师范学院大学教育科学与技术系副教授,研究生导师,博士,研究方向:远程教育等。
2017年5月6日
责任编辑:吕东东
本文系国家社科基金项目“基于贝叶斯方法的社会网络大数据使用与隐私保护平衡机制研究”(项目编号:16BGLOO3)和教育部人文社科项目“基于数字认证的MOOC诚信机制研究”(项目编号:14YJA880033)的部分研究成果。