APP下载

基于区块链的教育数据共享探索研究

2022-05-30李磊陈静张志鸿

河南教育·高教 2022年8期
关键词:数据共享区块链

李磊 陈静 张志鸿

摘 要:教育数据共享是教育治理能力优化的重要途径,但其普遍面临数据存储分散、数据安全风险、流程烦琐、数据维度有限等问题,而新兴的区块链技术可以有效解决这些问题。本研究提出了一种基于区块链的教育数据共享方案,能够安全、公平、高效地实现教育数据共享,提升教育治理能力。

关键词:区块链;数据共享;教育数据

我国的互联网规模庞大、发展迅速。中国互联网络信息中心发布的第48次《中国互联网络发展状况统计报告》显示,截至2021年6月,我国网民规模超过10.1亿,互联网普及率达71.6%。在线上、线下平台的交互中,各种数据的产生和使用都越来越多,大数据逐渐在各个领域得到应用。对相关数据进行采集、处理、挖掘和分析,可以起到改善工作环境、提高工作效率以及预测发展趋势等作用。在教育领域,大数据的研究和应用也受到学者们的广泛关注。

教育部印发的《教育信息化2.0行动计划》提出实施“教育治理能力优化行动”,要求深化教育大数据应用,以“互联互通、信息共享、业务协同”为目标,打破数据壁垒,完善教育数据标准规范,优化业务管理,提升公共服务,促进决策支持。可见,教育数据共享已成为我国推进教育治理现代化的重要途径。

近年,快速发展的区块链等新兴信息技术为教育数据的大规模共享提供了重要技术支持。区块链作为一种新兴的分布式数据存储技术,具有去中心化、防篡改、可追溯和高度信任等特征,已经在金融、医疗、农业等领域得到应用。习近平总书记在中共中央政治局第十八次集体学习时指出,要探索“区块链+”在民生领域的运用,积极推动区块链技术在教育、就业、养老、精准脱贫、医疗健康、商品防伪、食品安全、公益、社会救助等领域的应用。教育部印发的《高等学校区块链技术创新行动计划》也提出,针对教育管理与服务中面临的版权确认、数据取信、隐私保障等问题,研究基于区块链的教育资源共享、教育成果评价、学生综合测评、教育档案存证与追踪、信息流通控制与隐私保护等技术,构建基于区块链的教育管理与服务协同平台。综上所述,区块链技术对于解决教育数据共享中面临的数据安全和防控教育数据共享中存在的风险等问题,具有重要的实践应用价值。

一、教育数据共享面临的问题

课题组通过对郑州大学教务处、信息工程学院、计算机与人工智能学院、厚山学堂等部门以及中原工学院等院校的调研发现,在教育数据共享中存在以下四个问题:

一是数据分散存储,校际共享难。高校的教育数据具有数据量大、数据异构等特点,这些数据分散存储在多个业务系统中,如教务系统、学生信息系统、档案管理系统等。这些被不同高校的不同部门保存并管控的数据共享非常困难,信息孤岛现象严重,迫切需要打通校际数据共享通道。

二是存在隐私泄露、数据篡改等数据安全风险。高校的教育数据涉及大量学生和教师的个人信息,但系统中的业务办理人员、系统管理人员、数据库管理人员等均有不同级别的数据访问权限,存在多方串通篡改或泄露数据的风险。此外,采用传统的数据存储方式建立的数据共享平台,被不法分子攻击、获取数据并滥用的风险也较大。

三是业务流程烦琐。不同高校之间以及高校内不同部门之间在使用其他高校或部门的数据前,需要层层审批,成本较高。

四是数据维度有限。分散在业务系统中的大多是静态和片面的业务数据,只包含有限的数据维度,这会导致高校在业务协同、决策支持等方面不能获取完整有效的数据,无法满足教育治理优化的需求。

二、区块链的核心技术及其对教育数据共享的支撑

区块链技术是以块链结构作为数据存储载体,以点对点网络作为通信载体,依赖密码学确定所有权和保障隐私,以分布式系统共识框架保障一致性,旨在构建价值交换系统的技术。区块链的核心技术主要包括去中心化的共识协议、以块链结构组织的数据库、公平可信的智能合约。

(一)去中心化的共识协议

区块链按照中心化程度可以分为公有链、私有链和联盟链。公有链的去中心化程度最高,任何节点都可以加入并参与共识协议的运行;私有链的去中心化程度最低,一般由单一的组织进行维护;联盟链的去中心化程度介于上述二者之间,只允许联盟内部节点加入,节点必须经过授权后才能参与共识协议的运行。

区块链中的共识协议保证了分布式系统中的数据一致性。目前,区块链的共识协议主要包括三类:一是证明类共识协议。这类共识协议中,节点在每一轮共识过程中必须证明自己具有某种特定的资源或能力,在竞争中胜出的节点将获得数据写入权,如工作量证明(POW)和权益证明(POS)等。二是随机类共识协议。这类共识协议是为解决证明类共识协议存在的算力浪费问题而提出的。节点根据某种随机方式直接确定每一轮的数据写入节点,如Algorand和所用时间证明(POET)等。三是拜占庭容错(BFT)类共识协议。这类共识协议中,节点通过“投票选举”的方式选出当前轮次的数据写入节点,如实用拜占庭容错(PBFT)和冗余拜占庭容错(RBFT)等。

在这三类共识协议的基础上,学者们还提出了许多优化的、组合的或分阶段的共识协议。通过这些共识协议,在点对点网络上的分布式节点可以达成数据一致,并将数据记录到区块链上。区块链的共识协议为建立去中心化的、分布式的教育数据共享平台提供了技术支撑,是解决校际教育数据分散存储、难以共享问题的有效方法之一。

(二)以块链结构组织的数据库

区块链的核心数据结构是一条由哈希指针链接而成的区块链,每个区块中包含多条数据记录。根据不同的应用场景,数据记录可以设计成不同的字段。基于密码学原理设计的区块结构,可以保证存储在区块中的数据的安全。

区块由区块头和区块体组成。数据记录保存在区块体中,组织成默克尔树(Merkle Tree)的形式。默克尔树是一种哈希树,其叶子节点保存数据记录,非叶子节点保存对应子节点数据的哈希值。数据记录的任何改变都会体现在默克尔树根的值上,因此默克尔树可以验证数据记录是否被篡改过。此外,存储在默克尔树的叶子节点中的数据记录是经过私钥签名的数据,基于非對称密码体制设计的数字签名机制可以保障数据的所有权。

默克尔树根的值保存在区块头中。区块头中还保存有前驱区块的哈希指针、本区块的生成证明以及时间戳等信息。前驱区块的哈希指针用于链接各个区块,并可以用来验证前驱区块的数据是否被篡改过;本区块的生成证明用于说明生成区块的节点的身份信息,该证明与共识协议有关,不同的共识协议需要提交不同的证明信息;时间戳用于记录区块生成时间。

区块链的数据结构为链上的数据提供了防篡改、隐私保护、数据所有权保护等多种安全属性,是解决教育数据共享中数据安全问题的有效方法。

(三)公平可信的智能合约

智能合约的概念最早由密码学家尼克·萨博提出。智能合约可以看作一段能够按照事先约定的规则自动执行的代码。然而,智能合约提出时,由于缺少可信的执行环境而未得到应用。区块链系统的出现为智能合约的应用提供了去中心化的可信环境,使得智能合约得以应用。

区块链系统中,多方用户对规则协商一致后创建合约代码,然后将合约代码作为数据记录写入区块链,一旦满足触发条件,节点将执行合约代码,并将执行后的合约状态写入区块链。智能合约的执行过程和结果由区块链共识协议保证一致性,因此区块链上的智能合约是公平可信的。

智能合约为多方事务处理提供了公平可信的技术方案,是解决教育数据共享中流程烦琐问题,提高数据共享效率的有效方法之一。此外,在区块链基础上,还可以利用数据联邦、零知识证明、同态加密等技术赋予教育数据共享平台更多的能力,满足教育治理优化的需求。

三、基于区块链的教育数据共享方案

在校际教育数据共享场景中,区块链节点属于多个高校以及各高校的多个部门,数据并未面向大众完全公开,加入区块链的节点需要经过主管部门的审核。因此,课题组提出的教育数据共享方案使用的是联盟链。

由于高校内各部门之间的数据共享与高校间的校际数据共享具有不同的数据属性、权限和安全需求,课题组提出了教育数据共享方案,在校内和校际分别建设联盟链,最终构建多层联盟链体系,以满足校际教育数据共享中多样化的需求。基于多层联盟链的教育数据共享平台框架如图1所示。

基础设施层包括云服务器、高性能存储设施和高速网络设施等,可以为教育数据共享平台提供计算、存储和网络等基础服务。基础设施层可以直接利用教育科研网已有的信息基础设施和网络设施构建。

区块链服务层是教育数据共享平台的核心组成部分,包括各高校的校内区块链、校际联盟链以及智能合约模块,可以提供统一安全的数据服务和公平高效的业务流程服务等。区块链服务层中的校内区块链在高校内部构建,采用联盟链系统架构,高校内的教学和行政部门经过授权后,作为校内链节点参与校内链共识,提供教育数据。原始教育数据仍然保存在传统数据库服务器中,但教育数据的哈希值保存在校内链中。每个高校从校内链节点中选举一个节点作为代表节点,与其他高校的代表节点共同构建校际联盟链。代表节点需要经过授权才能参与校际联盟链的共识,代表节点根据需求将校内教育数据的哈希值保存在校际联盟链中。校内区块链和校际联盟链均采用实用拜占庭容错协议作为共识协议。各高校的代表节点同时参与校内区块链和校际联盟链的共识,实现跨链访问功能。在联盟链之上,基于Solidity语言封装智能合约模块,为教育数据共享提供智能合约运行环境。根据需求设计并部署教育数据开放合约、查询合约等,为上层应用提供统一的数据和流程服务。

增值服务层是在区块链服务层的基础上提供的扩展服务。在保障用户隐私、保护数据所有权的前提下,提供数据整合、分析等服务,用以满足教育治理中的各种数据需求。

应用层包括实现各种业务的应用程序,如学分银行、教育评价和档案存证等。应用程序可以进行扩展,以满足用户新增的业务需求。

推进教育治理能力优化,深化教育大数据应用都需要安全高效的教育数据共享平台。区块链技术能够在网络中建立点到点之间的信任,保障数据公平、高效、安全地共享,化解数据共享面临的安全与效率矛盾,为教育数据共享提供了有效的技术手段。课题组提出的基于区块链的教育数据共享方案,能够从技术上解决教育数据共享面临的问题,提高数据共享的效率,促进教育治理能力优化。

参考文献:

[1]中国互联网络信息中心.第48次中国互联网络发展状况统计报告[EB/OL].(2021-09-15).http://www.

cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/202109/

t20210915_71543.htm.

[2]教育部.关于印发《教育信息化2.0行动计划》的通知[EB/OL].(2021-04-18).http://www.moe.gov.cn/

srcsite/A16/s3342/201804/t20180425_334188.html.

[3]习近平在中央政治局第十八次集体学习时强调把区块链作为核心技术自主创新重要突破口加快推动区块链技术和产业创新发展[EB/OL].(2019-10-25).http://jhsjk.people.cn/article/31421403.

[4]教育部.关于印发《高等学校区块链技术创新行动计划》的通知[EB/OL].(2020-07-08).https://www.sdaai.org.cn/newsinfo/574598.html.

[5]蔡晓晴,邓尧,张亮,等.区块链原理及其核心技术[J].计算機学报,2021(1).

责编:初 心

猜你喜欢

数据共享区块链
科学大数据的发展态势及建议
保险企业的区块链技术应用方向选择研究
区块链技术在金融领域的应用与前景研究
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
数字化迎新系统宿舍分配模块的设计与实现
基于区块链技术的数字货币与传统货币辨析
贵州大数据产业发展战略理解和实施建议
面向海上平台机械电气设备的数据共享平台的设计与实现
基于协同办公的会议管理系统设计与实现