智能时代教育数据风险治理:实然困境与实践路径
2022-01-13赵磊磊代蕊华
赵磊磊,张 黎,代蕊华
(1.江南大学 教育学院,江苏 无锡 214122;2.华东师范大学 教育学部,上海 200062)
技术应用成效需依赖数据生成、共享等过程。自然语言处理、情感计算等智能技术在教育领域的应用引发了社会公众对于技术的恐慌与对教育数据的关注,技术恐慌的现实成因很大程度上也与数据风险紧密相关。1994年,Hawley委员会首次提出了“数据资产”的概念[1],数据治理由此开始进入人们的研究视野,成为一个新的研究领域。2015年9月,国务院印发的《促进大数据发展行动纲要》明确指出,大数据已成为国家重要的基础性战略资源[2]。自此,各省市地方政府开始积极开展大数据治理[3]。值得注意的是,纵观教育信息化发展历程,信息技术与数据的逻辑关系是当前教育数据服务的关键抓手,信息技术的教育应用虽催生了各种形态的教育数据记录,但也存在数据信息不准确或不完整、数据监管不严、数据应用失范、数据防护安全性不高、数据隐私泄露等方面的风险。随着以5G、人工智能等技术为核心支撑的智能时代的到来,教育数据的存储、运算、共享等众多方面也将进入新的历史发展时期,相应的教育数据风险治理也将面临新的挑战与机遇。由此,本研究对教育数据风险治理的实然困境与实践路径进行剖析,以期激发教育数据应用活力及有效推进教育数据的治理。
一、教育数据风险及其治理的内涵诠释
1.教育数据风险的内涵诠释
技术具有“双刃性”,其存在方式具有不确定性与风险性。信息技术服务的产生与数据价值的释放紧密相关,教育数据存储、采集、共享等若干技术在释放教育数据巨大潜在价值的同时,亦会催生一定的风险和误区。若教育数据风险得不到有效的防范、规避和化解,则会引发各类教育数据风险事件。当前,社会各界对教育数据风险的讨论较为热烈,教育数据隐私安全、教育数据的产权归属与开放共享等若干议题成为教育数据风险领域的关注重点。多位学者已对教育数据风险进行了论述与分析。例如,肖军指出,教育数据风险问题主要包括“数据在采集、存储、共享、使用和监管中的风险”及“数据在政府教育部门、学校、企业和学生之间流动中的风险”、“数据在各利益相关方行使权利和承担责任中的风险”等[4];王娟等人指出,教育数据风险涉及数据管理风险、数据存储风险、数据共享风险和数据发布风险[5];王正青等人聚焦于教育数据质量风险,认为在构建有效的教育数据治理体系过程中,数据质量风险成为当前教育信息化领域普遍关注的议题[6]。综合相关研究发现,教育数据风险可分为教育数据监管风险、教育数据侵权风险、教育数据质量风险、教育数据服务风险四个方面。
第一,教育数据监管风险。一般而言,数据监管以数据的长期保存、组织、维护、管理和再利用为重点[7]。教育领域出现的一系列数据监管失位问题,引发了社会对于大数据时代教育数据监管问题的关注。例如,线上考试前试题库数据非法流出。此类事件屡见不鲜,反映出当前教育数据监管失位现象严重。由此可见,教育数据的采集、管理、分析、共享等过程需要有效的教育数据监管体系予以规制。一方面,在教育数据存储与处理期间,大量教育数据被转换、重组、结构化、清理并分配到单个结构中,若缺乏有效的数据监测机制,这些不同类型的数据移动和更改则可能引发数据损坏与丢失风险。另一方面,若缺乏较有约束力的数据安全监管制度,可能会致使教育领域的数据流转、共享、决策处于失序状态,并进一步催生数据泄露、数据滥用等风险。
第二,教育数据侵权风险。随着大数据时代的到来,教育数据侵权问题因数据规模、种类和更新速度的加快而逐渐增多,且不少学校目前在教育数据隐私保护层面的规章制度尚不完善,导致教育数据侵权风险已成为教育领域数据风险治理的关注焦点。一方面,借助定位系统、多样化的泛在式信息传感设备、数据采集技术,用户全时段的教育活动轨迹、行为内容及其家庭背景、社会交往等个人信息,在教育管理者、教育研究者、商业机构面前“一览无余”,由此牵引出的教育数据隐私权侵犯问题可能会对教育用户造成较大的身心伤害。另一方面,恶意电子邮件攻击、冗余新闻信息推送、木马病毒攻击、黑客技术侵入等数据安全问题频发,使学校教育数据资产所有权与许可权遭遇重大挑战,也引发了强烈的侵权隐患与社会恐慌。
第三,教育数据质量风险。教育数据质量风险主要包括因教育数据存在准确性、一致性、完整性、可用性不高等质量问题而引发的若干数据风险。在教育领域,由于教育数据存储、采集与共享等方面的技术尚待进一步完善,所以教育数据质量因存储空间限制、采集方式单一、共享质量偏差等问题备受质疑,相关的教育数据质量问题频发。例如,相关教育部门倾向于采取个人信息去标识方法,以避免个体姓名、家庭成员等身份信息的泄露,但同时,经过去标识处理的教育数据集往往易丢失部分关键信息;也有教育数据传输渠道不通畅、传输信息失真等所导致的数据信息丢失问题,使得教育数据的完整性与可用性受到影响。这不仅增加了教育管理者、教育研究人员等人提取有用信息的难度,也极大程度上阻碍了教育数据服务功能的扩展。
第四,教育数据服务风险。基于教育数据分析结果制定教育数据服务方案,助力于教育决策与教育服务的科学化转型,是教育数据挖掘的重要出发点与落脚点。但同时,在教育数据服务方案的生成过程中,亦产生了规则算法束缚自由选择、数据预测服务剥夺自主决策等教育数据服务风险。一方面,以海量教育数据为依托,学习预判服务的预判精确度将进一步提升,从而促使学习进程、学习服务等更趋理想化,这也制约了学习者的主观能动性与自主探究能力的提升,在一定程度上禁锢其自由选择的权利和机会[8]。另一方面,基于教育大数据的教育决策虽然已成为教育领导与管理领域的关注重点,但此种决策方式在一定程度上存在人文元素缺失、科学主义过盛、数据更新滞后等风险,难以系统化和动态捕捉学生、教师等群体的教育诉求与反馈建议。
2.教育数据风险治理的概念厘定
随着大数据在教育领域应用的不断深化,教育数据风险的治理成为学界关注的热点。数据风险治理(Data Risk Governance)从属于数据治理(Data Governance)领域,而教育数据风险治理的范畴聚焦于围绕教育数据风险本身的若干领域,同时,其亦具有治理的若干特性。例如,教育数据风险治理的开展需依赖政府、学校、社会、企业等共同参与,也需要在治理主体间构建具有约束力的行动框架与法则。然而,由于数据一词具有多种标准,而且来源不一,目前学界尚未对教育数据风险治理的内涵进行明确界定,故本研究拟从数据治理的学理界定层面及内涵诠释层面进行概念迁移与厘定。
2004年,美国大数据研究权威机构“数据治理研究所”(The Data Governance Institute,DGI)提出,“数据治理”是指企业数据管理中分配决策权和相关职责[9],是针对系统数据相关事务的决策和权责,并需说明谁(who)在什么样的情况(what),可使用什么方法与采取什么行动(how)[10]。随后,数据治理相继被运用到企业、政府、教育等方面的理论研究与实践探讨中[11]。尤其是在教育领域,隐私泄露、恶意攻击等教育数据风险已颇为常见,教育数据风险及其治理备受学界关注。
基于前文对于数据治理与教育数据风险内涵的梳理,我们可对教育数据风险治理的具体概念进行如下界定:教育数据风险治理涉及治理主体、治理客体及治理工具等,是指数据管理机构、数据管理人员、信息技术人员、学校管理人员、学校师生、家长、社会人员等治理主体,应用政策、标准、指导方针和技术手段等治理工具,规约与消解教育数据监管风险、教育数据侵权风险、教育数据质量风险、教育数据服务风险等教育数据风险(即治理客体)的系统性过程,基本框架如图1所示。与不同类型的教育数据风险相对应,教育数据风险治理可划分为教育数据监管风险治理、教育数据侵权风险治理、教育数据质量风险治理、教育数据服务风险治理四个维度。
图1 “教育数据风险治理”框架图
第一,教育数据监管风险治理。一方面,教育数据监管要跨越整个数据生命周期,并重点对教育数据存储、管理、安全等方面进行监管。当引入新型教育数据体系或优化旧的教育数据体系时,需对新旧教育数据体系间的统一与集成全过程进行监测,保障教育数据的存储与管理质量。另一方面,有必要建立教育数据监管组织,这有利于精确厘定教育数据监管内容与责任,可推动教育数据监管策略的合理制定及教育数据监管信息沟通,从而实现有组织的教育数据监管。
第二,教育数据侵权风险治理。在教育领域,数据隐私、机密性、访问权限,以及法规和合同要求至关重要,围绕数据隐私、数据敏感、数据控制权而开展的教育数据侵权风险治理也是直接保障不同群体信息安全的关键治理举措。一方面,为判断是否产生了教育数据侵权行为,对数据侵权边界予以界定与规范成为现实需求。另一方面,致力于促进分布式编程框架、数据加密、细粒度访问控制等技术手段的升级与优化,并构建教育数据容灾备份机制与法规问责体系,有利于为教育数据资产与权利保护提供技术支撑。
第三,教育数据质量风险治理。围绕教育数据质量风险的治理一般聚焦于对教育领域数据采集的质量、数据完整性及可用性的审查。受传统狭隘思维的影响,部分学生刻意隐瞒自身情况、部分学校谎报相关数据资源、部分教育部门数据管理效率不高、教育数据更新滞后等问题[12],均会引发教育数据质量风险。由此,教育数据质量风险治理需关注系统化方案的制定,并确定评估和监测教育数据质量的优先事项,基于教育数据利益相关者的动态需求,确定有关教育数据质量保障的决策方案、责任边界和跨主体行动框架。
第四,教育数据服务风险治理。诚然,利用教育数据资产更好地为深度学习、教育管理、教育研究服务理应成为教育信息化变革的重要趋势。但需要警惕的是,基于教育数据挖掘与分析而生成的服务方案将为教育用户提供预设好的发展轨迹与行动路径,在个体遵循教育数据服务的过程中,其自主决策可能存在被科学主义至上的数据服务所裹挟的潜在风险。此外,学校对大数据的过分推崇甚至依赖,会无形之中阻碍学生自我意识、反思能力、批判性思维和创造性品质的发展[13]。因此,如何围绕主体性价值取向确立、伦理原则嵌入、算法技术优化等多个方面,实现教育数据服务的良性生成,成为影响教育数据价值激发的关键因素。
二、教育数据风险治理的历史变革
信息技术变革具有阶段性,从传统信息技术到人工智能、5G等新技术,信息技术催生了具有不同特征类型的社会时代。从以集中存储技术、个人计算机、早期移动通信技术等为支撑的信息时代,到以大数据挖掘与分析等核心技术为支撑的数字时代,再到以人工智能、5G等高新技术为支撑的智能时代,相应的教育数据来源与应用方式均存在一定的阶段性差别,不同社会背景下的教育数据风险治理也存在诸多差异。对教育数据风险治理的历史变革进行梳理,有益于总结数据风险治理经验,明确未来数据风险治理的方向与任务,促进教育领域数据风险治理的深入发展。具体而言,教育数据风险治理的历史脉络主要分为三个阶段(见图2):“发展萌芽期”、“探索发展期”和“战略转型期”。
图2 教育数据风险治理的历史变革图
1.信息时代:教育数据风险治理的“发展萌芽期”
教育数据风险治理的萌芽最早可从信息安全领域予以解析。20世纪70年代,个人计算机、互联网、移动通信技术的出现和普及推动了信息时代的到来,信息数量、信息传播的速度等均呈现几何级数的增长。与此同时,相应的危害信息安全的事件不断发生,引起了社会与学界的诸多关注,促进了信息安全研究领域的快速发展。此外,随着数据库技术的广泛应用,“数据风险防范”逐渐与“信息安全防护”产生了密切关联,“数据安全”成为信息安全领域的重要组成部分[14]。这一阶段的数据集中存储在传统的数据库中,数据量相对有限,人们对数据的认识停留在“管理数据”的阶段,且该阶段数据面临的主要问题是安全问题,即保护数据不被攻击者非法入侵和获取,确保导出的结果的正确性和完整性[15]。
与此同时,多个国家纷纷启动了围绕信息安全评估领域的研究,并通过制定信息安全标准与法律条文以系统评估信息安全状况。例如,美国联邦政府颁布《隐私法》(1974年)、日本颁布实施《个人信息保护法》(2006年)。综上,在信息时代,教育领域的数据风险治理理念尚未被明确提出,有关教育数据的管理主要聚焦如何防范个人信息泄露、商业企业机密泄露及IT系统防护等信息安全领域,教育数据风险治理依附于教育信息安全防护的话语体系而存在。信息时代的教育风险数据治理尚处于“发展萌芽期”,一方面,“数据资产”的理念尚未深入贯彻,教育数据的潜在价值尚未得到高度认可与深入挖掘,与教育数据相关的风险问题尚未得到教育管理者、师生等群体的高度重视。另一方面,教育数据采集、处理等方面的技术仍不完善,存在诸如数据管理混乱、数据体积过大、同质性过高、更新速度过慢等现实困境,导致教育数据风险治理的效率与规范程度不高。
2.数字时代:教育数据风险治理的“探索发展期”
2010年以后,随着大数据技术在教育领域的深度应用与高速发展,IT(信息技术)时代逐渐过渡到DT(数据技术)时代[16],国内外一些大学逐渐将信息治理(IG)细化为数据治理(DG),教育领域数据风险治理亦逐渐从教育信息安全的内涵框架中分离出来,并成为教育数据治理的关键组成部分。这也意味着教育数据风险治理从信息时代过渡到数字时代,基于大数据挖掘与分析等技术的教育数据风险治理进入“探索发展期”。数字时代的教育数据风险治理将教育领域信息安全与教育大数据进行有机联结与深度融合。信息时代无序、分散、低效的教育数据风险治理模式逐渐被以教育数据库及数据网络系统为治理情境的治理模式所取代,并显现出有序、可靠、高效的治理特性。
作为较早开展教育数据风险治理的国家,美国教育统计中心于2009年开始实施通用数据教育标准的研究计划,并制定了切实可行的教育核心数据规范,旨在促进教育机构与部门间的数据资源共享,为教育数据风险治理提供了可行参照。此外,由美国大学透明度法案授权的联邦学生数据网络系统将受到有关联邦信息安全与隐私法令的约束,其通过个人标识符检索防护、指定信息安全和隐私控制等方式保护学生个人身份信息的安全。同时,为了解决关于教育数据所有权和使用权的复杂问题,美国联邦政府教育部于2014年推出了“在线教育服务指导”,规定学校和学区必须在《家庭教育权利和隐私法案》与《保护学生权利修正案》的严格规约下,才能与关涉学生数据的第三方达成协议[4]。
与此同时,我国在IT时代向DT时代的转变过程中,探索如何开展数据治理[17]。2010年,我国开始数据治理方面的研究。该方面的研究涉及数据的监护、策展与管护等内容[18],数据风险治理理念也逐渐开始对教育领域产生深远影响。2015年5月,在巴西会议上,中国代表团正式提出数据治理的新工作项目建议,并得到国际与会专家的一致通过[16]。随着IT到DT的变化趋势逐渐得到认同,教育数据风险治理研究和应用变得日益迫切,众多学校、大数据建设项目、大数据研究中心、大数据技术联盟等逐渐关注教育数据的风险预警与消解。尽管数字时代的教育数据风险治理尚处于“探索发展期”,但依托并融合了教育大数据、“互联网+”等诸多技术及理念的教育数据风险治理成为我国教育治理工具转型的重要尝试,为我国教育治理提供了新的思路和路径[19]。
3.智能时代:教育数据风险治理的“战略转型期”
近年来,语音识别、图像识别和自然语言处理等智能技术取得惊人突破,前所未有的人工智能商业化和全球化浪潮席卷而来。科大讯飞高级副总裁杜兰则指出,“2017年成为人工智能的‘应用元年’”[20]。随着5G技术研发已纳入我国国家战略,相应地,“5G+教育”的研究也将有序推进,5G与人工智能、物联网等技术协同促进教育的智能变革成为时代趋势[21]。由此,智能时代成为教育数据风险治理的新背景,融入智能技术的教育数据风险治理进入智能时代的“战略转型期”。一方面,传统的教育数据分析能力较为落后,许多数据搜集后并未得以充分利用,而智能时代的到来,极大地提升了教育数据的采集与分析效率。基于智能算法、5G网络等技术,可实现师生教学行为的精准识别、教学需求的动态定位、教学轨迹的智能反馈等。另一方面,智能时代教育数据高速产生与流转,不仅涉及广泛多样的数据源,还包括越来越多的实时、详尽的关系型教育大数据。如何利用人工智能、大数据等技术实现“言谈”“举止”“声情”等若干相关数据信息的智能挖掘与合规流动,存在较大难度与风险。
智能时代的教育数据风险治理应结合师生教育画像、行为特征、教育规律的深度挖掘与智能分析,针对不同情境、不同对象生成教育数据风险的针对性治理方案。5G、云技术与智能教育的整合将加速教育数据的生成、更新与共享。更加开放性的教育数据系统架构将对教育数据风险治理提出更为严峻的挑战。教育数据风险治理变革将面临“战略转型期”,“智能时代教育数据风险治理”应运而生。该概念可用来表达面向智能时代的教育场域数据风险治理,将逐渐凸显“智能化”“个性化”等多重属性。处于“战略转型期”的教育数据风险治理不仅走上“智能教育时代”的快车道,而且也将助力传统教育数据治理的工具、方式与模式实现智能化变革,从而充分激发教育领域的“数据潜能”。
三、智能时代教育数据风险治理的实然困境
治理一词寓意“依理而治”,不仅强调多元参与民主管理之意,也有凸显治理主体依据情理、道理、法理与伦理规约治理客体之意。从教育数据风险治理的分类来看,如前文所述,对于教育数据风险(教育数据监管、侵权、质量及服务风险)这一治理客体的治理成为教育数据风险治理的核心关注点。基于此,本研究主要从教育数据监管风险治理、教育数据侵权风险治理、教育数据质量风险治理及教育数据服务风险治理四个方面梳理与剖析智能时代教育数据风险的治理困境。
1.教育数据监管体系的跨主体协同度较差
新兴智能技术融入教育领域后所产生的教育数据具有复杂性与多维性的特点。而当前信息技术监管职能部门单一主体承担教育数据监管责任的旧模式明显无法适应智能时代教育数据的高速生成与流通,多元主体的协作监管架构亟待建立。如何在教育数据全生命周期中实现智能化协同监管,成为教育数据监管风险治理的一大难题。目前,主要依赖专门的数据监管机构与人员负责教育数据的采集、存储、集成、共享等过程的监测与审查工作。其他群体对于教育数据归属、教育数据产权、教育数据使用等方面的理解与认知存在一定程度的缺失,教育数据监管意识与监管能力不佳。同时,当前教育数据监管体系的跨主体协同度较差,跨平台、跨系统的教育数据监管框架尚需完善,教育数据管理的一致性亟待提升,数据监管的智能活力尚待进一步激发,这些已成为困扰教育数据风险及时预警与有效控制的关键因素。此外,还存在不同教育数据治理主体的数据监管权责不够明确,数据监管的技术手段落后,教学数据报表分析、教育舆情分析、实体画像分析、教育数据异常监测的效率不高等影响因素。因此,如何通过实现教育数据监管风险治理的有机协同,推进教育数据监管体系的智能发展,破除教育数据割裂、教育数据垄断、教育数据窃取等现实问题,尚待进一步探索。
2.教育数据隐私防护机制与法规体系缺位
在教育数据财产化与资源化的背景下,数据经济本身呈现出一种复杂的权益矛盾:在教育用户与经营者之间,用户具有控制个人数据隐私的需要,而经营者对于用户的个人信息亦有数据利用的需要,即通过对用户个人信息的收集和加工来形成某种教育数据资产。而在智能时代高速化、联通性的数据流动“难以控制”的情形下,若缺乏对隐私数据的机制与法律保障,则有可能造成数据风险隐患[22]。一方面,教育数据隐私防护机制尚待建立健全。智能时代的教育数据信息具有数量大、来源复杂、开放程度高、智能处理及信息获得和其使用结果之间相关性弱等特征。如果没有完善的教育数据安全防护机制对相关技术与制度进行系统规划,则极易引发师生信息、教育研究数据、教育政务数据在产生、存储、转移和使用过程中遭受非法盗取等教育数据安全问题,从而加大教育数据侵权风险的治理难度。另一方面,教育数据的法律规范亟待加强。如何在立法层面对教育数据采集、分析、共享、决策实行有效规约,成为智能时代教育数据侵权风险治理的现实难题。尤其是跨主体的教育数据智能共享使得数据所有权难以界定,是以充分保护个人数据隐私为优先对教育用户数据设立财产权,还是以教育数据资产增值为优先赋予数据收集实体以产权,尚未在立法层面明确界定。
3.数据筛选与传输偏差控制缺位制约教育数据质量改进
数据质量管理一直是教育数据治理中的薄弱环节。由于智能时代数据体量急剧扩大,非结构化数据猛增,数据筛选与传输偏差控制缺位成为困扰教育数据质量改进的重大挑战。在数据筛选偏差控制方面,对于可识别的个人资料数据、聚合数据、去识别数据及匿名数据等不同类型数据,当前的数据筛选机制尚难以清晰辨识相应的数据隐私边界。目前,各类教育数据管理机构在对数据集进行去标识化与匿名处理时,往往在数据风险治理中模糊不同类别数据的敏感度,使得某些教育数据因不恰当的去标识化与匿名处理而出现教育数据不完整、价值低等质量风险。在数据传输偏差控制方面,智能时代的教育数据传输存在跨域割裂、流向不明等若干隐患。教育数据管理机构对教育数据共享权限、信用与责任的划分不够科学等多种因素极大程度上制约了教育数据传输偏差风险的有效化解,使得部分有价值的教育数据信息在数据传输过程中遭遇信息失真问题,从而对最大程度促进教育数据质量改进产生阻碍作用。
4.基于人文立场的数据服务伦理秩序亟待构建
智能时代的教育数据服务机制将教育视为一种数据驱动下的智能算法运行场域。教育被不断地进行编码化和算法化处理,从而计算学生的知识掌握程度、情感偏好、思维倾向及能力态度等[23]。智能时代教育数据的来源与去向具有复杂性与不确定性,由此生成的教育数据服务方案虽然致力于秉承技术理性认识论去审视与计算教育数据服务的增值,进而满足师生等教育用户的个性化服务需求,但此种个性化服务需求的满足易陷入不确定的伦理困局,人与人、人与技术、人与数据等主体间的伦理关系将不可避免地受到强烈冲击。由此,教育数据服务机制理应受到伦理准则的规制与伦理秩序的约束,否则,基于数据与算法的教育数据服务可能会走向对技术理性与科学主义的偏执追求,罔顾教育本身的人文属性及价值。综合来看,有关智能时代教育数据服务伦理标准及原则的探讨由来已久,而且由于未能形成其一致性定义,所以不同的分析者及治理群体在实际的治理过程中对于教育领域数据伦理的含义解释与向度厘定可能存在较大差异,这不仅使得教育数据服务在践行过程中极易产生与教育追求相背离的危害与风险,亦在一定程度上导致教育数据服务风险治理举措的成效甚微。因此,基于人文立场的数据服务伦理秩序亟待建立。
四、智能时代教育数据风险治理的实践路径
面向智能时代,当前我国教育领域数据风险治理尚处于关键的战略转型期。面对上述治理困境,未来教育数据风险治理依然任重道远。将智能理念有效嵌入教育数据风险治理领域,并将呆板的算法和冰冷的机器变为实现数据防护、隐私保护的“利器”,是实现智能时代教育领域数据风险治理体系与能力现代化的可行之道[24]。基于此,本研究为回应智能时代教育领域数据风险治理困境的破解议题,有针对性地提出智能时代教育数据风险治理的实践路径(见图3)。
图3 智能时代教育数据风险治理的实践路径
1.构建智能化教育数据监管体系,推动教育数据风险预警与化解
面对不同群体教育数据监管意识等方面存在的巨大差异,传统的教育数据监管职能部门单一主体承担教育数据监管责任的旧模式显然已不符合智能时代教育数据监管风险的治理逻辑。智能时代教育数据监管是多方联动的动态过程,促进教育数据风险协同监管机制的优化,亟须构建智能化教育数据监管体系,推动教育数据风险预警与化解。一方面,在教育数据监管体系结构层面,教育行政部门可针对区域教育数据库建设的实际情况与发展需求,携手组建区域教育数据监管小组,明确划分与规范各监管方的教育数据监管权限、责任与义务;学校层面应积极响应政府教育数据监管要求,携手建立可精准预警与化解各类教育数据风险的校本化数据监管团队。另一方面,在教育数据监管体系功能方面,教育行政部门及学校等治理主体应基于机器学习、智能统计引擎、图像识别等智能技术,实现教育数据风险捕捉、识别、定性,并对其可能性的危害结果与诱因进行系统性分析,实现教育数据风险的及时排查与预警,并基于大数据分析功能实现教育数据风险治理方案的动态生成。
2.关注侵权风险评估与法规建设,优化教育数据侵权防范机制
当前,有关教育数据的法律法规体系尚需深入建设,教育数据产权归属界定模糊,个体教育数据隐私控制权与多方主体利益需求的矛盾愈发激烈,使得教育数据的应用过程存在极大的侵权隐患。同时,随着智能时代教育数据资产战略地位的日益显现,教育数据采集实体之间对用户教育数据的争夺形式也愈演愈烈。在此过程中,受商业利益等驱动的教育数据获取行为应由教育数据隐私法律法规予以规范。而根植多方数据利益需求,制定教育数据法律法规,建立健全基于教育数据风险评估的隐私防护机制,也是对教育数据利益博弈的规范化调控。其一,在侵权风险评估层面,一方面,应对教育数据资产风险(安全漏洞、环境安全等)进行评估,并对不同风险发生的可能性和潜在损失进行分类,对不同响应等级的数据风险采取分类控制的治理举措[5];另一方面,应构建敏感数据安全存储与传输机制,对于师生个人身份信息、学生行为偏好等敏感数据的安全传输,应通过加强密码和多级用户认证或加密电子邮件来完成,并确保所有网站都采用数字证书予以保护。其二,在法律规章层面,应完善教育数据隐私法、学生互联网保护法等关涉教育数据侵权风险防范的法律法规,通过法律条令明确限定教育数据生命周期的管理战略与方法,规范数据定期监测和审查活动,确定教育数据抽取、集成与应用的愿景、目标与方式,厘清教育数据监测系统、分析平台等方面的改善方向。
3.聚焦数据质量异常监测与偏差控制,构建教育数据质量管理体系
智能教育的发展需以高质量、高价值的教育数据集为重要基础。面对智能时代教育数据的高速生成、体量激增、动态数据处理难度加大等特点,亟须聚焦数据质量异常监测与偏差控制,构建教育数据质量管理体系,有效防范因教育数据质量问题而引发的数据风险。一方面,在质量异常监测方面,教育行政部门、学校可与第三方教育数据质量评估机构展开合作,可依托自然语言处理、自适应学习等智能技术,建立教育数据质量异常排查与监测模型,同时通过数据专员的人工审查弥补智能化检测的错漏,综合鉴定教育数据质量异常的风险等级与主要诱因。另一方面,在质量偏差控制方面,教育数据风险治理主体应合理设定教育数据采集、筛选与传输标准,避免过度清除师生关键的个人数据信息,且应着手建立教育数据质量偏差控制机制,确定教育数据质量偏差的控制方案,在教育数据质量偏差纠正过程中关注数据挖掘、清洗与填充的“度”,致力于避免教育信息失真与消解教育数据误差。
4.基于智能教育的人文立场,规范教育数据服务的伦理秩序
从技术伦理的角度看待教育数据服务,虽然其价值负载属性会产生伦理效应,但此种伦理效应的好坏取决于人对于这种伦理后果的伦理自觉与价值取向。若忽视教育数据服务的价值校准与伦理调适,基于智能算法的教育数据服务可能会将教育变成一个完全被数据与算法所操控的世界,而传统教育所秉持的人文立场将变得虚无缥缈。因此,有必要基于智能教育的人文立场,规范教育数据服务的伦理秩序。其一,未来的智能教育需在对客观真理与普遍精神的追寻中回归教育的人文价值,打破数据霸权的核心地位,以此达到对人类自身本质的认知和解放[23]。因此,当务之急便是要建立基本的伦理准则,避免道德失范,推进所有利益相关方的道德自律,约束所有利益相关方的行为[25]。其二,应基于教育数据服务的育人之本,精准定位智能时代教育数据的伦理属性,合理判定教育数据服务的伦理困境与盲区,从而制定与优化教育数据服务伦理风险的化解方案。政府、教育行政部门、学校、师生等均应依据相应的伦理风险识别与归正方案,从一而终地贯彻立足人文人性的教育逻辑,推动校本化教育数据伦理风险调控机制的构建,促进学校教育数据在教育管理、教研活动、学生发展等层面的合规化应用,彰显教育数据服务伦理规范的人文关怀之美。
五、结语与展望
值“十四五”教育信息化发展规划亟须深入推进之际,教育数据风险治理为教育现代化发展、教育大数据环境改善、教育信息化安全防范等提供了更多的可能性选择。纵观教育领域数据风险治理的历史变革,其从萌芽、探索到转型,始终与信息技术的更迭紧密关联,且伴随信息技术的智能升级,逐渐呈现众多“类人”属性。在以人工智能、5G、云计算等技术为核心支撑的智能时代,教育数据风险治理实践如何摆脱唯技术视角,利用数据资源与资产更好地为教育教学服务应该成为教育信息化变革的发展方向。教育领域数据风险治理多年来的发展历程表明,当前教育领域数据风险治理仍面临教育数据监管体系的跨主体协同度较差、教育数据隐私防护机制与法规体系缺位、数据筛选与传输偏差控制缺位制约教育数据质量改进、基于人文立场的数据服务伦理秩序亟待构建等现实困境。本研究致力于探索智能时代教育数据风险治理的实践路径,正是对相应困境破解的有效回应。智能时代教育数据风险治理仍需经过一段时间积累方能形成较为成熟且有效的实践案例与模式,未来有关智能时代教育数据风险治理案例与模式的实践研究有可能成为学界关注热点。