APP下载

数智时代教育大数据风险:表征样态与化解路向

2022-02-26赵磊磊陈祥梅

关键词:数智人工智能时代

赵磊磊,陈祥梅

(1.江南大学 教育学院,江苏 无锡 214122;2.华东师范大学 教育学部,上海 200062)

引言

数智时代以数字化、网络化、智能化和移动化为主要特征,是信息社会、数字时代的概念延续。随着机器学习、自然语言处理、人脸识别等智能技术的快速发展,教育人工智能成为当下我国教育创新发展的热点课题。与任何变革性技术一样,一些人工智能应用可能会产生伦理、法律等方面的风险问题。在教育领域,数据一词往往与信息、资讯、资料等词密切相关。随着基于循证理念的教育研究范式兴起,数据在教育规划、教育决策、教育评估、教育管理等方面的应用逐渐广泛,如何激发教育领域“数据价值”成为影响教育高质量发展的动力支持。数据是教育人工智能功能发挥的基础支撑,其战略地位备受社会关注。2021年教育部工作要点中提出“推动形成教育系统数据资源目录和数据溯源图谱,制定教育基础数据标准规范,实现有序共享”[1]。2021年教育部等六部门下发的《关于推进教育新型基础设施建设,构建高质量教育支撑体系的指导意见(教科信[2021]2号)》中提出“充分发挥数据作为新型要素的作用,推动教育数字转型”[2]。机器学习、自然语言处理等智能技术促使数据挖掘、文本分析、数据集训练等实际功能极速扩展,大数据与人工智能的相互融合助力新时代数据智能技术体系的升级与优化,使得在冗杂的数据堆中采集、筛选、整合与分析各类数据更加便捷与有效。随着5G、人工智能等技术的快速发展,愈来愈多不同形态的教育数据得以动态采集,公众对于教育数据的价值关注也逐渐由“微数据”走向“大数据”“全数据”。随着数智时代的大数据+人工智能的到来,在教育领域,来自师生等人的个体数据采集与流动具有较强的不确定性,数智时代教育数据的分析与应用涉及众多实然风险(如隐私泄露、恶意攻击等),如何应对及规避教育数据风险成为释放教育数据价值的关键所在。2021年9月,国家新一代人工智能治理专业委员会发布《新一代人工智能伦理规范》,旨在将伦理道德融入人工智能全生命周期[3],这也为人工智能与大数据的合规化融合提供了重要参照。因此,本研究尝试探究数智时代教育大数据风险的表征样态、化解原则、化解路向,以期为数智时代教育数据的合规化应用提供价值参照。

一、教育大数据风险的基本内涵

(一)教育大数据

教育数据通常涉及个人、课程、学校、资源等层面的教育资料搜集,单个数据点很难有效呈现完整的教育舆情与全貌。查看在隐私和安全等要求下可以汇集在一起的数据类型,方能有效建构学校教育的完整画面。借助数据有可能将教育转化为个性化体验,满足多样化的个人需求。但是,要实现这一转变,重点需要从搜集个体数据转向有效利用大数据。教育大数据近年来因信息化时代的到来而逐渐受到人们广泛瞩目,成为当下学术领域之重要课题。在关涉数据的诸多定义中,广被引用且最具代表性者应属 Laney提出的3V定义,即规模(Volume)、速度(Velocity)与多样性(Variety)[4]。本研究认为,教育大数据涉及巨量数据本身以及制造、处理与分析这些数据的工具和程序,并且,大数据的“大”并不仅仅代表数据规模与流转速度,而且也呼吁数据多样性的精准采集与分析。教育大数据是大数据的一个子集,系指整个教育活动过程中所产生的以及根据教育需要所搜集到的、主要用于教育发展并可创造价值的数据集合,其主要涉及五个方面:其一,个人层面的教育数据,主要包括教育行政部门规定搜集的教职员工与学生的基本资料、教与学的行为数据等记录;其二,课程层面的教育数据,即围绕着课程与教学而产生的相关教育数据;其三,学校层面的教育数据一般涵盖学生管理、教学辅助、行政运作、财务管理、师资队伍等学校基本情况;其四,资源层面的教育数据主要包括资源投入、奖补助款数据、环境设备使用与防护数据、教室实验室使用等数据;其五,区域层面的教育数据涉及各级教育行政数据、区域教育资源中心、社会教育、家庭教育等相关教育活动数据。

(二)教育大数据风险

大数据的出现与网络通信技术的急速发展密切相连。随着大数据时代的来临,在公共部门依托大数据技术进行社会治理的应用范围也逐渐扩增。例如,行政机关对外的行政监督、行政管制与服务传输,以及对内的知识管理、组织学习与绩效管理等。教育大数据的发展与应用亦是如此,其应用场景与范围急速扩展,为教育教学高质量发展提供了新的资源与机遇。随着大量数据的出现,风险也随之增加。近年来,地方政府和其他公共机构面临更多的网络安全攻击。学校教育领域拥有大量的个人信息数据,但学校可能没有适当的安全资源来抵御入侵者,很容易成为攻击目标。学校可能面临数据丢失并缺乏恢复计划、非法获取学生或敏感地区信息、不当搜集存储或传播敏感信息、没有应对网络安全威胁的标准或准则等问题。学校层面搜集了哪些数据?这些数据存储在哪里?谁可以访问这些数据?谁可以共享此数据?当这些信息在系统中移动时,如何保护它?这些问题均值得进一步思考如何予以解决。

然而,数据的生成、流动与分析的相关技术与原则并非绝对的至善至美,教育大数据的运用不免具有其局限性。首先,针对“大就是好”的误解,更需引起警惕,若仅强调数据量的庞大而罔顾其内容与应用限制,一味放手任凭数据自身说话,有时可能会造成大数据价值的误判。其次,过度夸大数据的正确性与客观性,错误联结和诠释不存在的虚假模式将会不可避免地误导决策方向。再者,数据规模并非愈大愈好,数据缺乏情境背景的衬托将丧失其意义与价值[5]。数据的搜集、分析、传输和使用,与个人和群体的生活能力存在深刻关联,这使得数据风险问题于数据世界中无处不在[6]。但当前,学界对于教育大数据应该做什么、不应该做什么的相关准则尚未做出详细的论述与解读,这也反映出当前教育大数据风险研究存在一定程度的缺失。与传统教育数据相比,教育大数据的体量更大,采集的实时性、连贯性、全面性更强。由此,本研究认为教育大数据风险的内涵可诠释为:在筛选、分析、归纳和整理海量碎片化的教育信息过程中,因违背伦理、法律等规定与行为秩序规范所产生的风险问题。

二、数智时代:教育大数据风险研究的新背景

以人工智能、大数据、5G、云计算、物联网等为代表的新一代信息技术,正在迅速而深刻地推动着各行业从数字化建设向数智化融合的转型升级[7],大数据和人工智能两大要素的有机结合,也推动着教育行业进入创新变革、高质量发展的数智时代。郑思思等指出,从技术角度而言,所谓数据智能就是指大数据与人工智能技术的融合发展,其本质上是对大规模的数据进行处理、分析与挖掘,再通过机器学习、深度分析等智能方式,提取数据中有价值的信息知识[8]。自2015年起,人工智能呈现爆炸式发展态势,其主因离不开新算法的出现及高效能平行运算的提速,加之大容量储存空间和影像、文字、声音、地图等资料技术的迭代升级,亦推动了人工智能的高速发展。由人工智能发展所带来的科技变革引发了人类的生活与学习方式的变革。理论上,人工智能可大致分为弱人工智能(Weak AI)与强人工智能(Strong AI)两类。弱人工智能是基于算法指导计算机装置进行自我学习,以模拟人类智慧解决特定领域的问题。例如,自动驾驶、图像辨识等,均属于弱人工智能的范畴。强人工智能则是指能产生智慧行为并拥有自我意识与真实情绪的计算机装置[9]。

李开复、王咏刚将人工智能定义为能从大数据中进行深度学习的综合体,并以“深度学习+大数据=人工智能”的公式总结大数据对开发人工智能潜能的重要性。一方面,不同于一般性的教育数据,教育大数据强调大规模和大范围,其可被视为母群体所包含的全部数据,而非从母群体中抽取有限样本所构成的代表性数据;另一方面,数据世界里并非仅有数字、算法和机器装置,巨量数据分析所得到的结果也会随着时间的推进和数据的更新而改变,绝非一成不变。此外,大数据的搜集、存取、分析均须依赖高速运算能力与分析技术[10],因此,具有自行搜集资料与计算分析能力的人工智能可能是寻求有效处理、利用大数据的一项解决方案。面对电子化、移动化与虚拟化社会情境中所产生的巨量数据,在人工智能助力下实现教育大数据精准采集与共享,将对提升决策科学性、改善信息处理绩效和降低决策成本有所助益。

教育大数据的发展与教育人工智能的演进相辅相成,以数据和算法为基础法则的人工智能技术,逐渐延伸至教育领域之中,为提升学生学习体验、辅助教师高效教学、助力教师个人发展与师资建设、提供精准评测与科学化教学治理推动教育创新带来了新的机遇。但与此同时,在数智时代,教育数据包含的广泛多样的数据源、与日详尽的实时关系型教育大数据正在形成一个复杂的信息网络体系。在此种信息网络体系之下,数据与利益相关者间的主客体关系均面临特定类型的挑战与风险。由此,数智时代正日益成为教育大数据风险研究的新背景,将“教育大数据风险”这一焦点问题置于数智时代背景下进行深刻省思已成趋势。

三、数智时代教育大数据风险的表征样态

相较于传统的教育大数据,数智时代的教育大数据技术以其突出的智能化特性推动了数据数量和种类的扩展。尽管依托人工智能技术在一定程度上能解决既往教育数据使用低效等问题,但仍需警惕在某种特定情境脉络下采集与应用教育大数据时可能会违背相应的风险消解原则,从而造成诸多负面影响。具体而言,数智时代教育大数据风险的表征样态主要体现在以下层面。

(一)数据所有权与使用权争议

在大数据教育应用的过程中,数据归属问题与使用问题备受争议。在智能时代,教育数据规模急速扩增、流动速度极为迅速,用户难以清晰知晓教育大数据的采集与使用流程,进而引发关涉教育数据所有权与使用权的争议。在教育教学领域,教育数据所有权与使用权划分与归属不清、失范等问题的存在引发了对师生等教育用户数据利益造成严重损害的风险事件,师生关键的教育教学信息、敏感身份信息在不经允许与知会的前提下被私自传播与贩售等现象层出不穷。事实上,一般对于去识别化、以公共教育利益为指向的大数据搜集、流通与使用较无所有权与使用权争议,引起较多争议的一般是教育大数据企业基于商业利益所搜集的教育用户数据的所有权与使用权划分。跨主体的教育数据共享致使数据所有权难以界定,是以充分保护师生隐私为优先对教育用户数据设立财产权,还是以教育数据资产增值为优先赋予教育大数据机构以数据产权尚未明晰。同时,人工智能支持下的教育大数据服务精准分发的实现,使得原先单一化的数字教育环境生发出诸多智能化空间,以个人和社群为单位的教育用户处在物理空间、社会空间、网络空间所构成的教育场域“三元空间”之中[11],且数智时代的技术不确定性和复杂性激增。由此,以教育大数据的采集与分析范围、规模、流通方式,数据权利的归属、边界以及数据使用权责及期限为核心,数据所有权与使用权争议的矛盾化解成为数智时代教育大数据风险规避的关键。

(二)误用或滥用个人信息

人工智能时代教育数据的流转具有不确定性,若师生等个人信息流向非法机构,则有可能造成极为严重的教育安全问题。在数智时代,尽管可通过数据搜集传感装置全方位获取用户大数据,并基于用户身份信息数据分类绘制教育用户画像,克服了以往因教育数据本身的局限性而对于教育决策与优化带来的限制,但是,这些教育用户分类数据与算法标准如何却无从得知,教育用户个人信息的使用进入“算法黑箱”与技术盲区,并可能产生由算法歧视而引发的风险。例如,教育用户个人信息的误用与滥用可能会加剧教育大数据公正伦理的损害并进而形成恶性循环,且可能会催生地下数据交易、不为教育用户所察觉的数据窃取等种种风险,也可能存在某些教育大数据机构在利益驱动下利用职业、居住区域、消费行为习惯等个人信息对其教育用户进行归类处理,使得住在特定地区者或具有特定行为模式的教育用户被差别化对待,或被策略性引导至某种教育消费中等现象,进而导致师生的教育权益遭受严重侵害。

(三)师生身心伤害与关系异化

作为技术产物,人工智能的出现与发展对于大数据技术的升级具有重要推动作用。若大数据在教育应用的过程中缺乏情感关怀,则可能导致师生身心伤害、师生关系恶化等风险的产生。首先,尽管依托教育大数据,教育管理者可以运用数据精准掌控与预测教师的工作状况,由此根据学校需求对教师安排课上、课下的精细化工作,并将校园、学校网络平台的教师行为监控数据作为教师考核评价的重要指标,但是,这些“不分时”“无死角”的监控与评价将大幅降低教师工作的自由度,增加教师的工作负担,影响教师工作满意度与幸福感。其次,学校利用大数据在行为或情绪上监控掌握学生学习情况,可能造成被监控者的心理压力加大,依据大数据分析结果呈现的教育方案往往仅为累加学习任务,所谓技术支持的个性化学习反而增添了学生的学业负担,进而影响其身心健康。再次,数智时代教育大数据发展有可能对现有的师生关系造成严重冲击,师生关系的异化现象在技术的侵袭下呈现不断恶化的态势。教育大数据在参与教育的过程中往往扮演一种模糊评估的角色,且伴随着各种认知效应,教育者将数据分析与决策结果视为评价学生的“金科玉律”,这种可能存在计算偏差的数据分析结果在一定程度上催生了师生关系的异化。

(四)个人自主与隐私权之侵害

如若在追求数据价值的过程中忽视教育用户数据隐私控制权利的合法保障,则会产生教育用户个人自主与隐私权受侵害的风险。首先,广泛嵌入学生日常生活的电子设备和智能化系统(如智能手机、运动手环、校园监控、门禁系统、校园一卡通和在线学习系统等),无时无刻不在采集和传送着数据,追踪并记录学生的实时表现[12]。数智时代的教育大数据监测系统可将学生置于泛在化监视之下,学生的隐私权利在教育大数据透视镜下变得异常脆弱。其次,在人工智能的支持下,教育大数据能够将看似毫不相干的匿名用户数据通过萃取关联从而进行再识别化,教育用户的特质、行为、兴趣与习惯在这个过程中被确认、分析与预测并用以协助智能化教育决策,但此种信息采集与重组无疑对用户隐私安全产生了一定威胁,将有可能侵害用户数据隐私与自主控制权,并引发教育用户的教育数据权益受到压迫、制约与侵蚀等问题。例如,因服务器管理人员的疏忽造成的数据隐私泄露、由于用户对权限的不慎重或认识不清导致的数据隐私泄露、教育产业服务数据流出引起的数据隐私泄露,以及非法攻击和商业数据挖掘造成的数据隐私泄露等。

(五)教育数据系统偏误

相较于传统教育大数据,人工智能与大数据融合可为实现科学的教育数据服务提供更有力的技术与理念支持,但同时,其智能化决策机制可能受限于程序开发者或人工智能的逻辑与算法缺陷、数据不完整、数据质量不高、数据筛选设定不当与潜在偏见等因素的影响,从而产生教育数据系统偏误风险。具体而言,其一,教育大数据采集者以科技手段掩饰偏见,进行非公开的算法歧视,可能导致用户被拒绝某些教育服务或机会的获取,进而延续、强化了教育数据服务偏误现象。其二,在结果主义的影响下,学生被理解为需求与结果相匹配的各种技能的集合体,数据分析结果与教育数据服务方案可能与个体意志相悖。例如,某些学校单凭教育大数据分析结果,强迫学业成绩不佳的学生转专业,一定程度剥夺了学生行使决策权力的机会。其三,数智时代的教育大数据发展与应用存在陷入科学主义陷阱的危险,在数据挖掘过程中,教育决策者建立的经验和规范的假设、意义和价值往往会被强烈的科学主义倾向所掩盖。对于技术的过度依赖可能会弱化采集者的批判性思维,若“通盘接受”所有声称具有数据规律的主张且缺乏正确的价值判断和取舍,同时对教育用户实际需求与价值取向的忽视,易导致教育数据服务偏误的产生。

四、数智时代教育大数据风险的化解原则

如前所述,在数智时代,如若缺乏对教育大数据风险问题的关注与省思,教育领域的智能升级将沦为纸上谈兵。尽管数智时代教育大数据采集与分析效率得到显著提升,但是,随着弱人工智能逐渐向强人工智能转型升级,教育大数据类型与应用场景更为复杂多元,在精准识别和智能筛选教育大数据、智能优化教育数据服务以及方案整合、智能模拟预测教育用户数据变化趋势等多种业务与场景中,均需审慎考虑相应原则的约束与风险的规避。数智时代教育大数据风险消解原则的厘清对于教育大数据的合规应用与潜在风险规避至关重要,这在一定程度上有助于规避伦理风险、平衡各参与方的利益关系、实现大数据生态系统的良性循环、推动人类价值与技术发展的和谐共进[13]。此外,邹太龙等人提出,应借鉴舍恩伯格的大数据教育应用思想,遵循自主原则、删除原则以及公正原则,从而规避大数据教育应用的潜在风险[12]55;B.K.Daniel等则指出,需在正义原则与关怀原则的基础上,构建规范化的教育大数据应用框架[14]。综合相关论点,笔者认为,数智时代教育大数据风险消解的基本原则主要包括透明度原则、规范性原则、关怀性原则、隐私性原则以及科学性原则。

(二)建立阶段:建立围绕社会主义市场经济体制的社会管理体制。1992年,党的十四大明确了建立社会主义市场经济体制的目标,因此围绕实现这一目标的社会管理工作有了新的发展。1993年,党的十四届三中全会提出了关于企业制度、市场体系、调控体系、保障制度、经济体制的改革方向。尤其是在保障制度方面,提出要实行科学的个人收入分配制度,建立适应经济发展的工资制度及工资增长机制,保护法人和居民合法收入和财产,建立多层次的社会保障体系,建立统一的社会保障管理机构。

(一)透明度原则

在数智时代,透明度原则实际上可转化为一个基本的“意识”问题,即教育数据采集机构、教育决策者、教育用户等均需在参与数据治理过程中将透明度原则内化为基本意识。但受智能教育场景的多样性与复杂性影响,教育大数据采集、流动、使用过程的透明度保障成为一种极其复杂的实践行为。首先,在数据搜集之前征求教育用户的同意是不可或缺的,然而,在人工智能时代,教育大数据挖掘过程中将快速检索与整合来自不同用户的教育信息,并不可避免地对数据进行智能过滤与高速共享,也很难向教育用户充分说明其数据的用途范围、分析数据可能产生的信息类型以及披露这些信息可能造成的不可预见的危害,由此,教育大数据采集对象难以充分了解其教育数据采集、使用的程序和方法。其次,透明度与公众对于教育大数据系统的信任程度紧密相关,人工智能可助力教育大数据挖掘分析的更具智慧化与自动化特性,但受制于非公开、不透明的教育大数据机制,数据采集对象对于哪些数据正在被搜集以及这些数据如何被利用的知悉程度严重不足,使得其对于教育大数据产生了应用恐慌与焦虑。综合来看,公开透明的沟通交流有助于实现教育信息良性流转,提升教育大数据采集、传输等方面的透明度是规避数智时代教育大数据风险的重要原则。

(二)规范性原则

数智时代教育大数据风险规避的规范性原则应建立在“自主、有序、客观和平等”的价值意蕴之上,旨在制定和应用普遍、规范的教育大数据处理分析的准则与秩序。数智时代教育数据来源具有多样性与复杂性,且基于数据的教育决策与管理易出现不公正或偏差现象。例如,教育用户身份信息的海量挖掘使得个人信息被误用、滥用的现象层出不穷,教育数据采集与分析机构在借助智能挖掘技术追逐利益的过程中,往往过度采集教育用户的身份信息,甚至有意识地基于其所掌控的数据对不同群体提供区别化的教育服务,从而偏离了教育大数据应用原则,出现公平伦理失范现象。随着人工智能时代的到来,教育大数据规范性原则应聚焦教育大数据治理、访问等监管框架中的规范性问题,研究者尤其需深度理解教育大数据的标准化、公正化应用以及其促进教育教学有序发展的内在价值。

(三)关怀性原则

大数据不能独立于产生、处理和分析它们的思想、工具、实践、背景和知识而存在,虽然许多教育者可能接受大数据的表面价值,并视其为中性的、客观的和预先分析的性质,但大数据背后的伦理意蕴仍是不可忽视的重要维度。一般而言,可以从工具理性和价值理性两个维度来理解技术关怀,前者追求技术使用的规范性、功能性及合理性,后者强调技术与人类社会根本利益相契合[15]。由此,数智时代教育大数据的关怀性原则强调工具理性与价值理性的有机统一,关怀性原则意味着在搜集、分析和使用教育大数据时的一种关系性理解,其更注重人工智能场域下数据主体的交互结构、情感态度与价值驱动,避免在教育大数据应用过程中陷入唯科学主义的误区。首先,基于教育大数据的教育决策、教育管理等若干服务,以及师生教育大数据的性质、使用、管理、隐私和访问的制度规约,都应在关怀性原则的指导下进行谨慎地规划与设计。其次,数智时代教育大数据关怀性原则的实际践行应基于持续生成、动态采集的教育大数据集合,应从教育用户实际需求与利益出发,检视智能化数据服务对于教育用户的情感关怀程度,并致力于构建以“用户关怀”为核心的教育大数据服务架构。再次,不可忽视在人工智能赋能教育教学后关怀原则对伦理关系异化的归正。虽然人工智能赋能教育大数据分析能够助力教师践行“因材施教”的教育理念,满足学生个性化的学习需求,但它也可能导致对智能化教育大数据决策结果的过度依赖,从而忽视师生良好伦理关系的构建与师生能动性的发展。

(四)隐私性原则

随着人工智能时代的到来,教育隐私数据的泄露风险也在不断加剧。面对因教育用户隐私数据泄露的潜在风险,人们通常采用数据匿名化的技术手段,即清除数据集中的部分个人身份识别信息来保护教育用户的隐私数据和防止个人身份信息的越界识别。然而,数智时代的教育大数据采集、分析、处理、决策等流程将以智能算法为核心驱动力,移动终端、可穿戴设备、定位系统、智能传感器的广泛应用,推动教育数据采集与处理过程由静态化到动态化、实时化、智能化转变,这无疑对教育用户的隐私数据防护提出了更大的挑战。例如,智能数据采集系统将汇聚形成同一数据采集对象的多方面、多类型、多时段的教育大数据集合,尽管数据已经剥离个人识别字符,但智能算法有可能将自动对相关数据进行关联并生成教育用户画像,还原个人身份信息,从而实现匿名数据的去匿名化处理。因此,教育大数据的应用过程中需要秉持隐私性原则,并应意识到单一的匿名技术、去标志化技术、脱敏技术等数据保护举措,可能已无法满足数智时代教育隐私数据防护的需求,更需综合考虑隐私数据保护机制构建、责权厘定等系统化议题。

(五)科学性原则

在数智时代,教育大数据面临的一大挑战是其能否基于互联世界、数字平台、智能支持系统来制定教育决策,从一而终地贯彻科学性原则与技术效用准则。教育大数据决策者需反思人工智能与教育大数据的融合是否真正科学有效,人工智能赋能教育大数据能否生成真正有价值的智能化数据服务。具体而言,需对以下问题予以思考与回应:在数智时代,各个学校的课程规划与学习方案制订是否全方位评估了数智时代教育大数据智能化、泛在化的实践影响?数智时代的教育大数据服务是否会更加符合学生、教师等教育用户的利益诉求?面对教育大数据的智能升级,教育体系中的数字鸿沟是否会对教育结构产生消极影响?此外,政府教育管理部门与学校尤其应当考虑,智能化教育数据服务与应用是否真正有助于实现教育决策的科学化、教学过程的精准化与教学评价的全面化,也需反思人工智能赋能教育大数据的“效用”究竟具有何种价值逻辑。无论是趋向于以个性化、生本化的教育目标作为效用价值框架的构建取向,还是以粗放式、功利性的教育成效与绩效作为效用价值框架的构建取向,由此生成的两种大数据应用取向均应体现科学性、准确性、有效性与合理性,这也是判断数智时代教育大数据发展实效的关键指标。

五、数智时代教育大数据风险的化解路向

如何应对数智时代的教育大数据风险成为影响大数据在教育领域的实践运用得以健康有序发展的关键。基于前文所述,下面提出数智时代教育大数据风险化解的关键路向。

(一)厘定教育大数据责任伦理规范,明确数据所有权与使用权基本范畴

如前文所述,数据所有权与使用权间的矛盾在数智时代日趋凸显,而厘定教育大数据责任伦理规范、明确数据所有权与使用权基本范畴则是化解数据所有权与使用权矛盾的重要前提与关键举措。首先,应致力于构建教育数据资产权限划分标准。在人工智能时代,数据挖掘技术可从多个平台与终端获取各类用户信息,各类用户信息较为繁杂且缺乏明确的归属标记,数据归属权的明确及保障教育数据的合法采集、流动与使用具有基础导向价值。应基于教育数据保护的责权厘定、教育数据治理及监管组织构建、高强度数据加密技术运用等举措,引导学校决策者、教师等明确其在教育数据采集、流动与使用等方面的权利、责任以及可能面临的伦理风险。其次,应构建教育大数据责任伦理框架。在数智时代,应确保无论他者采用何种方式获取数据,均应在伦理框架内合规化共享与使用数据,应在数据责任信用体系构建的基础上对大数据与人工智能融合的工具、模式与路径进行伦理规约,也应在原始数据权利人同意范围内并对使用范围、隐私安全等做出承诺前提下享有受限制的数据使用权[16]。再次,应关注教育数据隐私风险的防范与化解。人工智能的应用对教育数据信息的识别与过滤带来更多便利,在教育数据检索和共享时需对相关主体的敏感信息进行隐匿处理,防止用户个人身份信息在教育数据检索、流通等过程中的恶意泄露。在大数据调查研究与分析时应做好调查参与者信息的脱敏处理、确保数据客观性。应加强教育数据保护的严密性,确保在获得原始数据权利人授权的情况下方可使用教育数据,尽可能将数据所有权与使用权矛盾降至最小化。

(二)制定学校教育数据管理标准,避免师生信息违规采集与处理

数智时代教育数据管理的失范无疑将使教育大数据采集与处理面临潜在的风险,甚至在学校教育中产生重大消极影响。因此,应制定学校教育数据管理标准,避免师生信息违规采集与处理。其一,需建立科学的教育大数据管理标准,为智能化数据采集、数据处理、数据运算、数据传输等行为的规范化和合法性提供依据,切实发挥数据立法在教育数据安全防护方面的制度约束作用,也可尝试制定教育数据保密制度以及教育数据问责体系,根据不同主体给予不同的数据使用权限,保障数据信息的隐私与安全[17],依凭法律法规等强制措施确保教育信息免遭违规采集和处理。其二,深化师生等人对数智时代教育大数据道德的重视程度,推动教育数据利益相关者道德教育与熏陶,以教育大数据道德修养提升为抓手,助力教育大数据道德自律共同体的持久维系[18]。其三,可通过数据搜集阶段的伦理嵌入、分析阶段的伦理调适、决策阶段的伦理评估等治理路径[19],及时预警师生信息智能化采集与处理中的潜在风险,也可凭借配给必要数据保护基础设施、应用教育数据加密相关技术、普及教育数据安全知识等举措,尽力化解教育数据垄断、恶意窃取、违规采集和处理等现实风险。

(三)推进人文浸润与数据智能相整合,引导师生身心与学业状态向善发展

人工智能以“热度”赋能教育变革,为提高数据分析与决策效率等方面有所助益,却在一定程度上忽视对“人文温度”的关怀。大数据与人工智能深度融合不仅仅具有技术效能取向,而且也应具有人文关怀取向。在数智时代,教育教学效率、质量等方面虽可有一定程度提升,但是此种技术场域是否会对学生学业积极性、学业意愿等方面带来负面影响尚待明晰,师生的个人隐私和师生关系遭遇前所未有的挑战。一方面,对于学校管理者而言,应避免采用完全被数据思维禁锢的评价模式,仅凭借数据产生的量化结果对师生进行考核评价,并进行所谓的“三六九等”划分与结果评判。对此,应构建“循证”与“关怀”并重的评价体系,提高教育教学评价的科学性与合理性,进而提升师生的工作、学习积极性和满意度。应引导教师能够在潜心教书育人方面投入充沛的精力和情感,而不是花费大量时间疲于应付学校的数据监控。另一方面,应基于学生学习需求和行为特征等数据分析结果,在机器学习、情感分析等智能技术支撑下,动态监测学生的学习状态与身心健康,量身定制基于人文立场的个性化学习计划,在契合学情的前提下挖掘学生的“最近发展区”,促进教与学在数据智能挖掘的基础上向善发展。

(四)以数据安全审查与问责制度为工具,保障师生教育自主性与隐私安全

加强数据安全审查及教育数据治理,规范数据安全审查与问责利益相关者的职责与义务。在人工智能时代,师生教育信息有可能被动态提取与监测,承担数据安全审查与问责的责任主体,不仅肩负保障数据归属、共享合法性与数据质量等义务,还承担数据被搜集后的一系列“存储、整合、呈现、使用、传播、删除”等责任[19]20。明确界定与维护教育数据生成者与提供者的数据权利,尊重教育数据生成者与提供者的数据人格权与财产权。例如,在采集师生个人信息等教育数据之前,须向其明确告知其所拥有的权利类型与边界范围,包括允许或禁止自身数据的采集权与使用权,对数据使用的过程与目的的知情权、数据隐私权,对数据进行删除和销毁的修改权等。同时,健全智能算法及教育数据安全审查与问责制度。算法其实并非价值中立,人工智能的算法偏差往往由主观性认知偏差、数据偏差和“算法黑箱”等因素造成[20]。因此,需重视并加强智能算法的透明度、可解释性、稳定性以及数智时代教育大数据潜在风险的实时监测,保障教育数据挖掘的准确性,建立健全教育数据安全审查与问责制度,保障师生的教育自主性与教育隐私数据的安全性。

(五)加强教育大数据决策服务的动态监测,实现大数据系统偏误的有效预警

在数智时代,若数据采集、智能技术及大数据决策服务出现偏差且未能得到及时的监测与纠正,将造成严重的后果。鉴于此,有必要加强教育大数据决策服务的动态监测,实现大数据系统偏误的有效预警。一是应构建智能化大数据决策服务监测机制。学校管理团队应携手技术开发商、师生、政府相关部门,共建“数据集—智能技术—大数据决策服务”的偏差识别系统,加强监测辐射范围和偏误纠正力度,尤其应保障教育大数据决策服务监测的动态化、过程性特征,实现对教育大数据决策偏差风险的有效监测与分级评估,及时发现基于智能技术的大数据决策服务所存在的偏误。二是加强教育数据来源的精准筛查,提升数智时代教育数据安全性能。具体而言,可通过厘清教育数据归属与共享权责、制定智能技术及数据使用规范、顶层设计教育数据应用标准等方式,保障教育数据的合法性、安全性、完整性及可用性。三是构建教育大数据决策服务偏差的矫正机制。对于因智能估算失真所导致的教育大数据决策偏误问题,或者由不同根源导致的教育数据偏误问题,能够“对症下药”,提供针对性强的有效“处方”,在数据服务、数据管理等多个环节及时“冻结”负面数据决策信息,并加强数据决策利益相关者的协同治理,进行有针对性的数据问责与处罚,及时洞察和扭转不合宜的教育大数据决策偏差。

六、结语

与传统信息技术相比,人工智能在赋能教育大数据方面具有显著优势,它提高了人们的学习和工作效率,但与此同时亦可能会扩大教育鸿沟,侵害教育的人文立场,甚至造成教育用户的利益损失。只有合理规避数智时代的教育大数据风险,方能更好释放教育大数据的智能活力。在人工智能时代,教育大数据可用的技术涉及信息感知、信息捕捉、信息识别等多个方面,在这些技术的支持下,教育数据和信息更容易被获得、分析与共享。然而,此机遇之下也将众多风险问题暴露在公众视野。一般而言,传统教育大数据风险规避的典型模式是识别数据资产和风险,保护危险资产并从数据风险中恢复。而在教育大数据应用场景逐渐具有智能属性,需致力于实现教育大数据风险的智能感知与处理。在大数据与人工智能走向融合的过程中,既不能因忌惮技术发展可能产生的风险而阻滞前进的脚步,也不能任由技术杂乱地“生长”,甚至侵犯人类生活的伦理边界。本研究尝试系统审视数智时代教育大数据风险的规避路径,正是对数据泄露、侵犯隐私、数据系统偏误等教育大数据风险问题消解的回应。对于数智时代的教育大数据发展而言,教育数据采集与共享功能的精准实现固然重要,但教育大数据风险的预警与防范同样也不可忽视,这有可能成为未来人工智能与教育大数据融合领域的研究热点。

猜你喜欢

数智人工智能时代
大数据+智能时代的教师数智胜任力模型研究*
数智时代教练员的数字素养:概念内涵、价值意蕴与发展路径
网安天下担使命数智引领向未来"双引擎"驱动现代警务创新人才培养(计信系摄影报道)
乡乡镇镇通5G”建设助力山西“数智”转型
2019:人工智能
人工智能与就业
数读人工智能
e时代
e时代
e时代