教育精准扶贫区块链模型及实现机理研究
2021-11-28张刚要
俞 犇,张刚要
(南京邮电大学教育科学与技术学院,江苏南京 210023)
0 引言
当前,我国的“扶贫开发”正处于以“精准”为指向和原则的攻坚阶段。习近平同志曾强调:“要探索‘区块链+’在民生领域的运用,积极推动区块链技术在教育领域的应用,为人民群众提供更加智能、便捷、优质的公共服务。”[1]然而,我国当下的“教育扶贫”似乎与“精准”尚有些距离,因此经常被诟病。例如,扶贫对象识别模糊[2]、帮扶与需求脱节[3]等“偏离、脱靶”现象时有发生,导致教育扶贫“低质、低效”[4],制约了教育扶贫的真正效果[5]。为摆脱这一困境,利用信息化促进教育精准扶贫的呼声日渐高涨[6]。较为典型的工作有:刘通等[7]提出将区块链技术与学习评价相结合的方案,全方位地跟踪学生学习轨迹,从而改善学生学习行为;张忠义等[8]探索通过卫星和互联网等远程学习方式进行教育扶贫的应用路径;魏顺平等[9]提出基于云服务的教育精准扶贫实施的3 个落地项目;刘军等[10]对教育信息化公共服务平台在民族地区的应用进行了分析与展望。凡此种种,似乎都在表明,技术和环境上的突破与创新,或许是提高教育扶贫精准度的有效途径。近几年,区块链技术发展迅速,并被认为是互联网革命之后的又一个“风口”。与以往研究相比,本研究把焦点集中在区块链技术具有的一些创新性的机制和特征上,如去中心化、开放透明、支持智能合约、数据不可篡改且可追溯等,以期为解决教育扶贫实践中的“脱靶”“失焦”问题提供新思路与技术支持。
1 区块链基本概念与核心机制
1.1 区块链基本概念
区块链最早属于比特币应用的底层技术,之后区块链逐渐脱离比特币,开始在金融、征信、产品溯源、版权交易等诸多领域崭露头角。区块链是一种用于存储数据的特定数据结构,其本质上是一个去中心化的分布式数据库系统,并通过基于P2P 的网络使数据存储在各个节点上。每个节点彼此衔接形成链条,因而被称为区块链[11]。区块链中的数据以区块形式存储,每个区块由区块头和区块体两部分组成。区块体主要用于存储数据信息,其数据基于Hash 算法进行加密存储,并以Merkle 树的结构逐层反映到区块头中。任何底层数据的变动都会通过其父节点沿着路径传到树根,意味着树根的值是对所有数据内容的加密摘要。区块头主要记录时间戳、哈希值、随机数等,以保证区块链上数据的难以篡改与可追溯。每个新产生的区块通过匹配出符合规定的哈希值与前一个区块相连接,构成一个线性的数据链,如图1 所示。
Fig.1 Structure of blockchain图1 区块链结构
1.2 区块链核心机制
区块链随着比特币的兴起而进入公众视野,随后受到前所未有的关注,并广泛应用于各个领域,被认为是“未来世界发展的关键性技术”,其核心机制和特征主要体现在以下几个方面:
(1)去中心化的共识机制。从本质上看,区块链是一个分布式的数据库系统,意味着其没有一个明确的中心对每个节点进行俯瞰式的全面管理。具体来看,区块链网络中的所有节点拥有对等的权限,均有权利对网络中的区块进行维护。而且只要所有节点达成共识,节点的更新或少数节点的过失,不会影响整个区块链网络的正常运作。
(2)智能合约机制。传统契约必须由人手动执行,所以执行过程中不可避免地渗透着人的主观思想。但是智能合约不同,尼克·萨博最早提出智能合约的概念,他认为“智能合约是一套数字形式定义的承诺,包括合约参与方可以在上面执行这些承诺的协议”[12]。也即是说,智能合约本质上是一种预先由代码编写好的数字化合同,当满足触发条件时,就会通过网络节点自动执行,不需要他人操纵。由此,智能合约既避免了手动过程,又可保障违法违约现象不会发生。
(3)可追溯机制。在区块链网络中,数据以区块方式进行存储,并且采取哈希算法,将前后两个相互独立的区块连接起来,进而形成一条链条,为信息的有效传递提供便利。因此,区块链上的每一个区块均可进行实时追踪,一旦出现节点被篡改的情况,可以顺着链条进行精准地定位与分析。
(4)安全机制。根据区块链去中心化的共识机制,任何节点的更新需要得到所有节点共识。这促进了信息在区块链网络中的流通,降低了信息在各个节点之间的不对称性。可追溯机制使得区块链中的每一条数据都可得到查证,确保数据安全、有序。从技术原理上讲,区块链采用了Merkle 树、哈希算法、时间戳与非对称加密等安全强度较高的技术,提升了系统的安全性。
2 基于MC+nSC 架构的教育精准扶贫区块链模型构建
2.1 模型构建原则
针对当前教育扶贫实践中存在的扶贫对象识别模糊、帮扶与需求脱节等“精准偏离”问题,根据前文对区块链基本概念与核心机制的分析,本文提出构建教育精准扶贫区块链模型的几个基本原则:
(1)扶贫对象精准识别、扶贫项目(资金)与扶贫对象精准匹配等环节无需可信第三方背书(与区块链去中心化的共识机制高度契合),系统能够在透明的环境下自动进行智能处理(与区块链智能合约机制高度契合),各种记录不仅难以篡改,而且支持追溯、查询与申诉(与区块链去中心化的共识机制及可追溯机制契合度较高)。
(2)教育精准扶贫区块链上的用户必须实名制,入链前必须经过相关部门的严格审核。同时,还必须设法保护用户隐私。因此,除充分利用区块链的安全机制外,还需要从区块链架构方面考虑数据安全和隐私问题。
(3)目前较为流行的几种共识算法尚存在弊端,如PoW 具有低效、耗能的缺陷,PBFT 网络开销特别大等[13]。因此,教育精准扶贫区块链必须根据实际情况进行综合考虑,选择或设计一种较为优化的共识算法,以提高系统运行效率。
2.2 模型架构设计
传统区块链应用的数据链架构基本都是单链结构,即所有数据都存储在一条通用链上。但该方式存在如下弊端:一是链上所有节点都能访问这些数据(包括用户信息),使得用户隐私得不到有效保护;二是日益增多的数据使得区块链节点臃肿、笨重,极其消耗资源,导致执行速度慢,达不到高并发、快速响应的要求。基于此,本文设计了一种MC+nSC 的数据链架构,其中MC(Main Chain)是主链,即精准匹配链,nSC(Secondary Chain)是多条次链,这里是扶贫项目(资金)链和扶贫对象链,三链有机结合形成了教育精准扶贫区块链模型,如图2 所示。
Fig.2 Blockchain model of educational precision poverty alleviation based on MC+nSC图2 基于MC+nSC 架构的教育精准扶贫区块链模型
为保证3 条链中的原始数据可信、不可篡改,提高系统执行效率,模型通过Hash 运算记录各类数据摘要,并采用Merkle 树的方式进行存储。也即是说,扶贫对象数据、扶贫项目(资金)数据和匹配数据存储在分布式数据库中,并不纳入区块链,而3 条链中的区块数据分别采用Merkle 树存储来自数据库中相应数据的Hash 值。3 条链中区块数据记录结构如表1 所示。
Table 1 Structure of data recorded in three chains表1 3 条链中区块数据记录结构
该架构具有如下优势:①扶贫对象是作为一条单链存在的,因此利用区块链的智能合约与共识机制对其进行精准识别,既能保证公平、公正及不可篡改,又能保证用户的隐私安全;②扶贫项目(资金)链和扶贫对象链的最新Hash值作为精准匹配链的数据项嵌入其块头,使得3 条链能够有机结合起来,进而实现3 链协同工作,提高精准匹配效率;③通过3 条链将扶贫对象信息、扶贫项目(资金)信息与匹配数据分离,可减少区块信息的冗余量,提高系统吞吐率与共识速度。
3 模型主要功能实现机理
3.1 区块链上节点数据共识算法
根据区块链去中心化的共识机制,当有新节点入链时,需要得到所有节点认可,这就涉及到共识算法问题。目前较为流行的共识算法主要有POW、POS、DPOS 和PBFT,其差别主要体现在去中心化程度和计算机资源消耗两方面。本文根据教育精准扶贫的现实需要,兼顾安全性和效率,将DPOS 与PBFT 结合起来进行折中及优化处理[14],即无需全网所有节点都进行数据共识,而是选取几个代表负责共识工作,并将共识结果向全网所有节点广播。这样既避免了POW 效率低及耗能高的不足,又避免了PBFT 对带宽要求过高的缺陷。具体算法流程如下:
步骤1:从全网节点中选取代表,其中总代表一个,普通代表若干个。
步骤2:扶贫对象节点与扶贫项目(资金)节点分别向全网广播扶贫对象信息和扶贫项目(资金)信息,总代表负责收集这些信息,并将其排序后生成信息列表,之后广播给所有普通代表。
步骤3:每个普通代表均对信息列表中的信息进行验证,验证通过后向所有其他普通代表广播准备消息。
步骤4:当一个普通代表收到不少于三分之二其他普通代表的准备消息时,便向总代表广播预确认消息。
步骤5:当总代表收到不少于三分之二普通代表的预确认消息时,则可向全网广播确认消息,即信息列表中的信息得到全网认可,可将其添加到区块链中生成一个新区块。
3.2 扶贫对象精准识别实现机理
扶贫对象的精准识别主要在扶贫对象链中完成,其实现机理如下:
步骤1:贫困户入链时,需要向扶贫系统提供贫困对象属性信息,主要包括:姓名、年龄、家庭所属区域、家庭收入、家庭住房、家庭成员身心健康情况、未成年子女上学情况、目前从事职业及职业技能掌握情况、已受教育程度、是否有受教育的能力、是否有受教育的意愿等,且这些信息必须经过相关部门的严格审核,确保其真实、有效。
步骤2:扶贫系统自动启动贫困对象识别智能合约对用户属性进行分析,精准识别其致贫原因、贫困等级及帮扶需求等信息,进而生成注册记录并打上生效时间戳。
步骤3:利用共识算法验证上述注册记录,若通过验证则生成一个区块。即总代表节点将这些注册记录打包成区块,向全网的普通代表节点广播,从而进行审核与共识。全网确认后,总代表节点将新区块添加到扶贫对象链尾端。
3.3 扶贫项目(资金)与扶贫对象智能匹配实现机理
扶贫项目(资金)与扶贫对象的自适应精准匹配主要在精准匹配链中完成,具体过程如图3 所示。
在精准匹配链运行过程中,扶贫项目(资金)与扶贫对象精准匹配实现机理如下:
步骤1:扶贫系统(以下简写为PAS)生成自己的公钥和私钥,扶贫项目(资金)节点(以下简写为PAP)和扶贫对象节点(以下简写为PAT)生成各自的公钥、私钥与地址。
Fig.3 Intelligent matching process of poverty alleviation projects(funds)and poverty alleviation objects图3 扶贫项目(资金)与扶贫对象智能匹配流程
步骤2:PAP和PAT分别向全网广播自己的消息。其中,PAP 广播的消息主要包括身份以及项目(资金)的类别、用途与目的、使用条件与范围(含禁止使用的情况)等,PAT 广播的消息主要包括身份、致贫原因、贫困等级、帮扶需求等。
步骤3:PAS 自动启动精准匹配智能合约,对PAP 与PAT 进行自适应精准匹配,生成具体的智能合约,并用PAS的私钥进行加密。
步骤4:根据具体的智能合约,PAP 首先到PAT 地址上寻找与之匹配的PAT 公钥,并与PAT 自己提供的公钥进行对比,以验证其身份。一旦身份确认,则向PAT 回传消息(与之匹配的扶贫项目、资金等信息),并用PAT 的公钥进行加密。
步骤5:PAT 收到消息后,首先用自己的私钥解密,查看PAP 的消息,然后通过PAP 提供的地址找到其公钥,确认PAP 身份。对于PAP 的信息内容,如果没有异议,则生成注册记录(即具体匹配计划或方案)并打上生效时间戳。
步骤6:利用共识算法验证上述注册记录,若通过验证则生成一个区块。即总代表节点将这些记录打包成区块,向全网的普通代表节点广播,从而进行审核、共识与监督。全网确认后,总代表节点将新区块添加到精准匹配链的末端。
步骤7:PAP 向PAT 进行自动或半自动的点对点资金划拨,或传送具体的扶贫项目实施方案。
3.4 安全与隐私保护
本模型实现机理为数据安全提供了保障。首先,通过去中心化共识机制,区块链网络中的所有节点形成合力,共同维护节点的更新。其次,精准匹配链中的匹配记录都利用了非对称加密技术,与传统加密方法不同,其通过使用公钥和私钥,进一步增强数据的安全性。另外,对扶贫对象的精准识别、贫困对象与扶贫项目(资金)的精准匹配,都是基于智能合约自动执行的,不需要人为干预,所以匹配过程不受人价值判断的影响。最后,本模型使用多链架构,将贫困对象数据放在一条单独的次链上,扶贫项目(资金)数据放在另一条单独的次链上,实现了在主链上进行私密的精准匹配,有效保障了两条次链数据的隐私性。
4 结语
为解决教育扶贫实践中的“脱靶”“失焦”问题,本文在区块链核心机制的基础上,提出构建教育精准扶贫区块链模型的3 个基本原则,设计了一种MC+nSC 的数据链架构,并从理论上深入剖析3 链协同工作的机理。具体来看:①区块链技术的共识机制和智能合约机制保证了数据的开放性与透明性,从技术层面消除了社会成员之间的不对称性,将无关信息资源转化为“可信任的价值资源”[15],从而精准识别出最需要帮助的人并加以帮扶[16];②可追溯机制与安全机制确保参与者能诚实地工作[17],并且通过对扶贫过程的全面审视与追溯[18],有效保证了数据的客观性与真实性。因此,该模型能够提供扶贫对象精准识别机制以及扶贫项目(资金)与贫困对象的自适应精准匹配机制,同时保证数据信息的透明性、安全性和隐私性,具有很好的应用前景。
中共十九届四中全会明确提出“坚决打赢脱贫攻坚战,巩固脱贫攻坚成果,建立解决相对贫困的长效机制,将扶贫工作持续嵌入至中国特色社会主义现代化建设中。”[19]无疑,区块链能为实现巩固与拓展脱贫攻坚成果的战略目标提供技术支持。但同时也要看到,区块链技术仍处于理论阶段,在很多方面尚存不足。如何破解当前的技术瓶颈[20]、信息孤岛、资源不均衡等问题,是利用信息化促进教育精准扶贫面临的挑战。希望同行及相关机构加大对区块链应用于教育精准扶贫的研究力度,同时提高其在实际扶贫应用中的可操作性。