大数据教育应用的限度 *
2020-01-07唐汉卫张姜坤
唐汉卫 张姜坤
(1. 华东师范大学教育学部,上海 200062;2. 北京师范大学教育学部,北京 100875)
近年来,在世界范围内以数据挖掘(data mining)、云计算(cloud computing)、学习分析(learning analytics)、机器学习(machine learning)等技术为支撑的大数据教育应用如火如荼,最新的人工智能技术仍然以大数据为基础。那么,大数据作为一种数据样态、技术手段,同时也是一种新的视角和思维方式,究竟给教育已经带来和将要带来什么,如何看待大数据在推动教育变革中的作用等诸如此类的问题学界已不乏讨论,声音也是多种多样,并且可以断言,伴随科技进步和大数据、人工智能在教育领域的介入程度不断加深,这方面的讨论将更加热烈。但从目前的总体状况来看,关于大数据教育应用,大多数是从正面探讨如何应用以及应用后可能带来的种种好处,人们一般也多持正面、积极、乐观的态度,认为大数据时代给教育带来了美好的前景和无限的潜力,而从反思的角度,从大数据教育应用所面临的深层次的困惑和挑战、局限和不足、短板和硬伤的研究则相对较少。甚至存在一种盲目乐观的倾向,即过高地预估大数据在教育中的作用,将大数据视为研究教育、推动教育变革、解决教育问题的“灵丹妙药”。例如:“一切皆可量化”(迈尔-舍恩伯格等,2013,第97 页),“情感计算将‘生物人’转化为‘数据人’”(彭特兰,2015,第127 页),“每个学生都变成了数据人,一切都可以提前被知道”(黄欣荣,2015,第100 页),“知道‘是什么’就够了,没有必要知道‘为什么’”(迈尔-舍恩伯格等,2013,第71 页),“传统数据绝对集权的弊病已被教育大数据所破除”(张洪孟等,2015,第44 页)等。笔者认为,大数据及基于大数据之上的最新科技应用于教育领域,有非常值得警醒的另一面,即大数据给教育可能带来的负面的、力所不及的、危险的、需要防止的、不应该僭越的等等本文称之为“边界和限度”的一面。当前,既要看到大数据在“驱动国家教育政策科学化、驱动区域教育均衡发展、驱动学校教育质量提升、驱动课程体系与教学效果的最优化,驱动个体的个性化发展”(杨现民等,2015,第54 页)中的重要价值和广阔前景,又要深刻地认识到大数据教育应用本有的和应有的各种“限度”,才能更加理性和全面地把握大数据之于教育的真实意蕴,助成恰当的教育变革。
一、大数据教育应用的本体限度
那种持乐观主义的或认为大数据应用于教育可以彻底实现对教育的解码和控制的观点,其基本逻辑是:大数据可以实现对教育实践的完全数据化,或者说利用大数据可以构造一个同质的、与现实的教育实践相对应的教育的镜像世界;在此基础上,可以通过对大数据的挖掘、获取、处理与分析实现对教育的镜像世界的认识;最后,通过对教育的镜像世界的认识来实现对真实的教育世界的认知和改造。简言之,通过数据完整地再现和重构教育。在这个逻辑链条中,第一个环节很重要,即教育实践的可数据化是大数据教育应用的本体论预设和基本逻辑前提。如果第一个环节出现问题,那么,后续对于大数据教育应用的逻辑论证和实践展开都需要更加谨慎。因此,无论是正面探讨大数据教育应用的现实可能、未来前景,还是分析大数据教育应用可能存在的边界和局限,都有必要从本体论层面对教育的可数据化这一前提性预设进行分析。
从本体论角度看,需要回答大数据对教育的表征和同构的力度、程度到底如何,一切皆数据、一切皆可量化在教育实践、教育世界中是否成立,由此也决定了我们需要以何种态度来对待大数据以及基于大数据的各种新技术在教育中的应用。在某种意义上,这是一个基础性的元问题,并且,随着数据科学的发展和技术进步,人们对这一问题的认识也在逐渐发生变化。换言之,数据和世界、数据和教育的关系是伴随科技进步不断变化的,我们思考的本体论预设在其本身的存在意义上也是处于动态变化之中的。但目前来看,我们认为,大数据是否能够真正地反映和表征教育,需要从两个方面来分析。一方面,首先要看到快速发展的人工智能、以大数据为基础的算法革命给整个世界、给教育带来的颠覆性变革—基于大数据的教育使人类的教育从此超越经验水平而走向真正的科学和精准。这是看待和思考大数据教育应用必不可少的前提和应有的立场,不能无视也无法忽视大数据对教育强有力的表征能力,大数据正在通过对真实教育世界的数据化来构建教育的镜像世界,反映人的“镜像化生存”(杨子飞,2016,第65 页)。全方位、实时的数据收集和处理,能够从多层次、多维度对教育世界予以刻画,教育世界的复杂性、多样性都能够更加清晰完整地呈现出来。人类从来没有像今天这样能够通过数据来实现对自我、对学习、对教育过程等进行高度清晰、立体、实时、个性化的了解和洞察,通过大数据实现对复杂的教育世界的认识、反映和实践达到了不可思议的“分子”水平,为教育真正实现科学化、专业化、个性化、高效化、普及化、民主化等奠定了基础。大数据带来的革命及其远景超过了以往任何一个时代的技术变革带来的影响,未来世界、未来的教育在新技术面前变得更加不可预知和不可想象。
另一方面,大数据虽然从本体意义上给表征、展示、把握、变革教育实践提供了无与伦比的技术手段,但是否就没有缺陷了呢?数据真的能和教育的本体存在完全划等号吗?或者说,教育真的能完全被数据化吗?当然,这也是一个富有争议的开放性的话题,我们认为,大数据有很强的表征能力,但在本体和存在意义上,大数据还是不能完全表征或等同于教育。这其中不仅有数据体量的大小问题、数据算法的先进程度问题,更为重要的是,教育的属人性、人文性特质决定了教育现象、教育存在、教育问题等都和数据的二进制还原特性有着更为根本和更为本质的区别。这在很大程度上构成了大数据教育应用的本体限度,至少表现在两个维度:一是就大数据表征范围而言,教育本身并不能够完全被数据化;二是就大数据表征的质量而言,教育的整体性和数据的节点性存在着不可调和的矛盾。
首先,教育存在本身并不能够完全被数据化。 被誉为“大数据时代预言家”的牛津大学教授维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger)关于数据全面性的一个重要论断是“样本=总体”(迈尔-舍恩伯格等,2013,第37 页),即大数据时代,我们能够获取与某事物相关的全部数据而非样本数据。无论是教育研究还是教育实践,获取尽可能多的数据一直是教育工作者的理想。从理论上讲,一旦获取教育活动、教育系统、教育世界大量的乃至全部的数据,就可以借助当前超强的计算能力,更为精准、深刻、全面地洞察人、洞察教育的奥秘,从而更好地推动教育变革,把教育的实践和研究建立在坚实完备的数据基础之上。教育的精准性、清晰性、预见性、可控性、操作性都大大增强,彻底摆脱或在很大程度上摆脱不确定性、随意性、偶然性的烦恼,教育学的科学性也大大增强。打个不太恰当的比方,掌握了教育中的全部数据和信息之后,就可以像生命科学中的基因重组那样对教育进行更为有效的驾驭和改造。然而,先不说如果真的做到这样是好事还是坏事,值得思考的是,在教育领域获取全部的数据可能吗?答案显然是否定的。
教育是一种高度人文性的活动,人的行为、语言等外在的物质性、生理性的层面可以被追踪和数据化,而人的精神和情感世界,人的意志、思想、意义、价值等内在状态难以数据化。虽然个体的情感、动机与个体行为之间无法分割开来,当前以谷歌图书(Google Books)为代表的试图将人类思维成果数据化的计划也正在逐步推进,但大数据对人的情感、意志、意义、价值等的测量,从本质上讲还是通过替代性的外显的行为或其他可以测量的指标还原为二进制的数据形式,说到底还是典型的科学主义的还原论思维方式。从本体意义上讲,人的精神和情感世界不可数据化,数据化的只是精神和情感的外在表现。大数据对人的处理按照其自身的逻辑将一切简化为数据。在这里,一切差别均消失了,一切都只是二进制数据,差别仅在于二进制数据的具体构成;一切都统一在二进制数据中(高兆明,2018,第164 页)。同时,“科学的认识和知识却不能回答人的精神存在,人生的意义与价值、人与人之间的意义关联等等问题(鲁洁,2000,第4 页)”。人类的一切精神活动的信息,在可预见的未来,仍然不但是无法获取的,而且根本就是无法监测的(潘绥铭,2016,第33 页)。大数据之大在其他完全或者基本可以数据化的领域可能是“样本=总体”,但教育领域可数据化的东西可能永远是有限性的且非常表面的东西。
其次,从教育大数据的表征质量上看,大数据因其本质上是二进制的符号化表征方式,自身具有节点性、碎片性、符号性等特性,注定无法完全表征作为整体性、丰富性、系统性存在且处于不断生长发展之中的人和人的教育,教育大数据不能等同于教育存在本身。当然,在大数据模式下,还会建立各种各样的复杂的数据模型来模拟、建构世界,力图实现以全样本的数据方式来把握和改造世界。但是,一旦大数据运用到教育,就会存在难以克服的困难。除了上述教育中存在的更为本质的精神价值情感等不可数据化的表征难题之外,大数据在将教育中可数据化的部分进行数据化的过程中,还会因其节点性、离散性、符号性特质,无法重构完整的教育世界和人的生命世界。教育实践和教育世界由于人的生命存在而带有独特、复杂、整体、有机、生长、不可逆和不可还原等色彩,而大数据作为认识教育的手段,“数据常常被简化为可与数学模型相匹配的内容(Boyd & Crawford ,2012,p. 667)”。即使主观数据确实能够反映当下状态,理论解释模型也成立,但它恐怕仅具有当代的合宜性,即存在特定情境关联(阎光才,2013,第80 页)。因此,教育的整体性、丰富性和独特性存在,同数据的节点性、碎片化、简化性、特定情境性之间存在不可调和的矛盾。人们可以经由大数据对事物的特性、事物之间的关系、规律等进行发现和探索,但以大数据构建的模型代替对真实完整的教育世界的考察,在另一种意义上讲也是对完整真实的教育生存、教育情境、教育世界的背离。
二、大数据教育应用的认识限度
舍恩伯格认为,“大数据发展的核心动力来源于人类测量、记录和分析世界的渴望”(迈尔-舍恩伯格等,2013,第72 页)。在这个意义上,大数据不仅在本体上试图实现对世界的描绘和重构,同时,大数据也成为一种人们认识和把握世界的重要工具、手段和方式,在很大程度上创造了新的思维方式,实现了“认识论”的转变。从认识论的角度看待大数据教育应用,需要回答大数据究竟能够为认识教育世界提供何种新视角、新方法,以及这样一种新视角、新方法具有什么样的优势和不足。或者说,仍然不能盲目地迷信和过度地拥抱大数据分析和研究教育所带来的认识论变革,仍然需要持批判性的态度。从认识论的角度看,大数据所提供的新视角、新方法的确有助于拓展原有的对教育的思考方式,进一步提升教育研究的能力和水平,但与此同时,也要看到大数据所展示的思维方式和以前的各种思维方式比并不是替代性的、万能的,只是对原有认识方式的补充和丰富,仍然具有一定的限度。
大数据带来的认识论转变,其积极的一面是毋庸置疑的。比如,由于大数据试图在极其丰富和完整的意义上对世界、对教育进行尽可能全面的描摹和刻画,使得大数据成为人们认识世界和教育的中间、中介环节,形成了“主体—数据—客体”的认识路径。这不仅可以大大增强教育研究和认识的客观性、全面性、精确性,同时,由于数据可重复利用和分享、数据处理手段的先进性,还可以大大提升教育研究的效率、共享性和实际使用价值。再如,当前最为人们关注的大数据所展示的相关性思维方式,则是大数据带来的认识方式上的质的转换。所谓相关性是指“当一个数据值增加时,另一个数据值很有可能也会随之增加。相关关系的核心是量化两个数据值之间的数理关系”(迈尔-舍恩伯格等,2013,第71 页)。也即,在本质上,相关关系就是数字计算,是数量关系、数字关系(迈尔-舍恩伯格等,2013,第72 页)。相关性思维的一个重要优点就是在丰富复杂并变化着的各种因素中,能够显示究竟是什么因素之间呈现出明确的相互关联,运用于教育研究,将有利于那些稀少但却有重要价值的教育资源的发现与利用。例如,影响学生发展的非常见因素的出现概率极小,受制于原有的认知水平和认识工具、思维方式,往往很难发现这些因素之间的关联,而凭借大数据对学生发展和教育教学全方位、全时段的数据搜集,再加上相关性研究,就可以使得发现影响学生发展的非常见因素成为可能。根据这些相关性的、特别是罕见结果的相关性发现,就可以进一步地解释和挖掘,既可以拓宽我们对于教育的既有认识,拓展教育的认识图谱,揭秘教育的“黑箱”,也可以引导教育实践的变革。另外,建立在相关关系、相关性思维基础上的大数据趋势预测,也为教育教学提供了新的思路。通过对过往海量数据的挖掘与分析,可以找出事物发展的规律,最终作出一种趋势性的预测(张姜坤等,2018,第44 页)。特别是对于学生发展的关键节点的预测与分析,教育在一定程度上走在了学生发展的“前面”,在一定的范围内可为学生发展提供超前的、精准的、个性化的指导,大大提高教育的效率、效能。基于相关性思维方式所带来的巨大的效益,迈尔-舍恩伯格甚至乐观地认为在认识事物的过程中,“关联就足够了”(迈尔-舍恩伯格等,2013,第66 页)。
然而,在教育研究中,真的是“关联”就足够了吗?事实上,在大数据时代,我们依然无法只依靠相关性思维方式、只凭借探究事物间的相关关系来认识教育,推动教育变革。大数据应用于教育不能等同于运用到一般的行业和领域,有些自然、机械的领域并不需要追根问底,也不需要展示无限的可能性和丰富的意义世界,只要正常运转,满足人们的需要就够了。但教育不同,“关联就足够了”这种判断其实是在回避认识论的基础问题(贾向桐,2017,第11 页)。从学理上说,诸如认识的来源、真假判断的标准、知识的性质等诸多重大问题并不是相关性思维能解决的。从现实中看,相关性思维方式并不能完全替代因果思维,仅靠相关性思维来认识教育是远远不够的。实际上,大数据时代相关性思维方式的重要性不断提升,其根源在于数据本身,而非相关性的思维方式真能彻底取代因果关系。之所以这样说,是因为大数据时代,面对大数据体量巨大、结构多元无序、数据混杂的特性,对于数据因果关系的探索已不再像小数据时代般“简单”,由于无法有效探索教育内在的因果关系,人们才转而关注探索数据的相关关系。从这一角度来看,相关性的思维方式可以说是大数据时代人们认识世界的“无奈之举”,并非相关性思维是对因果思维的彻底超越,并非相关性思维神通广大,足以实现对教育的完全把握和洞察。当然这并不是否认相关性思维本身的价值,只是历史地看待相关性思维的发生发展。“关联就足够了”止步于相关关系不会带来根本上的认识论的进步,对教育世界的认识依然需要在相关关系探索基础上进行因果关系的探究,需要将相关性思维方式与因果性思维方式结合起来应用于教育理论与教育实践。
具体来说,相关性思维方式的局限在于对于发现问题的可能原因具有很大的帮助,而在问题的真正解释和解决方面却相形见绌。大数据对事物相关性的分析是局部的、非全局的。在高度复杂性和高度不确定性条件下,无论人们有着多么先进和高超的大数据处理能力,即使我们确实收集了所有数据并用技术对其进行分析,人类事实上也只能把握点与点之间的相关性,或者把握局部的相关性(张康之等,2015,第9 页)。这种分析也就决定了我们无法从相关性分析中找到事物间普遍的、必然的联系。“我们的先民发现了蛙鸣和下雨之间的关联,知其然,然而不知其所以然。一开始试图通过学青蛙叫来求降雨。多次失败后,就开始走向巫术和宗教。由此,跪求上苍降雨几乎成为古代的一种常规仪式。”(程慕青等,2019,第9 页)这就是只能对相关关系予以把握而无法从根本上探究因果关系而最终导致的认识的表层化、实践的荒诞化。我们可以利用大数据发现问题,但却无法对相关关系进行分析和解释,只能以“因为相关,所以相关”这样的句式来进行自我麻痹。“因为相关,所以相关”的解释仅仅是一种外在表现的描述,而非内在关系的阐发,缺乏对机制、本质的深入思考,也就无法对发现的问题予以必要的揭示、解释与回应。所以,沉迷相关性思维方式将会直接导致认识的“表层化”,问题仅仅是被展示出来而无法被回应、被解答。无论使用如何精巧的大数据分析工具,都不能代替人的理性思考,代替对因果性的追求。相关性思维存在的意义值得肯定,但其缺陷也是显而易见的。
从实践中看,教育自身的性质决定了在教育中单纯依赖相关性思维方式是远远不够的。尽管当前教育变得越来越复杂,人们对教育的要求和期待日益繁多,但教育作为一项有目的的培养人的活动,其自觉自为的、高度的价值选择和理性规划的特性始终没有变,且随着国家需要和个人成长需求的发展仍在加强。教育这一特性也便决定了教育活动中的诸要素皆要围绕为何、如何以及评价等一系列问题来开展,大数据应用于教育也不能例外。人的培养是一个不可逆的过程,任何施加于人的因素都需谨慎,一旦形成影响便将深刻而持久。而片面依靠相关性的思维方式,教育将变成一种不确定性的活动,我们只能发现影响教育活动的可能要素,而这些要素究竟如何发挥作用我们不得而知。如果只能依靠模糊的、不确定的相关性来阐释、把握和指导教育,久而久之,教育便成为一种不自觉的行为,其自觉性、目的性、计划性和调控性将大打折扣,这也必将降低现代教育的理论品质和实践品格,与现代教育的基本特征和发展趋势相背离。因此,面对学生、面对教育中的一系列根本性问题,我们不仅要“知其然”,更要“知其所以然”。
三、大数据教育应用的价值限度
教育蕴涵着丰富的价值意蕴,任何自觉的教育过程始终伴随着价值选择和实践,哈耶克甚至认为“教育上的问题多半为彻头彻尾的价值问题”(哈耶克,1997,第164 页),价值上的追问和反思是教育一刻也不能缺少的。大数据时代,特别是大数据运用于教育,其价值何在,蕴含着何种价值意蕴,同时又可能带来哪些价值上的问题同样值得深入思考和进一步确认。
事实上,从价值论的角度来考察大数据教育应用,仍然是一个丰富的随着实践的深入而不断展开的议题。但至少有两点是清楚的。一是作为一种工具和技术手段,大数据与教育相结合大大提升了学习和教育效果,其工具、功效价值毋庸赘言。目前人们从技术层面所做出的各种开发应用和推广实践就是在最大程度地发挥大数据的工具性价值。抛开具体的操作应用层面,大数据之于教育的这种工具功效价值主要表现为:借助大数据及其相关技术,在教育上史无前例地带来了人的解放,让人的主体性得以充分彰显。启蒙运动以来,如何彰显人的主体性、丰富和发展人之为人的主体性成为教育的现代性任务,成为近代以来教育的不懈追求,也成为中国教育现代性转型的重要目标。大数据的出现,为人的主体性凸显提供了新的契机。大数据对人的主体性价值的凸显,一方面体现在对个体差异性的关注。“现当代很多教育改革的价值诉求之一就是充分发挥学生的主体作用,但在确立学生主体地位的过程中,始终有一个难以逾越的基础性问题,即学生个性化诉求与同步化规模化教学组织之间的矛盾。”(杨晓峰,2016,第10 页)大数据时代,“万物皆联网,无处不计算”的状态正在形成,关于学生个体发展的计算无时无刻不在进行,学生发展过程中的“一举一动”都能被记录。通过对数据的分析以“准确”把握学生的个性化特征。继而为学生定制个性化、动态性的学习方案,以此支撑学生个性化的学习。大数据的教育应用使每个人自由自觉的发展成为可能,凸显了人之为人的本质属性。另一方面,大数据实现了对人的整体性的关照,有利于完整人的塑造。大数据实现了对个体数据横向与纵向的双向获取和整体性获取,特别是大数据强调的相关性、全样本性等,实现了对人与自然、人与社会的相关性表征,在一定程度上消解了人与自然、人与社会、人与他者的对立状态。“人与社会的裂痕在数据中被敉平,人与人、人与社会之间成为休戚与共的人类命运共同体,人在社会关系上不再是孤立的和片面的,而是实现了人的社会关系的整体性回归。”(李君亮等,2018,第47 页)然而,值得注意的另外一点就是,无论大数据的作用、意义、价值有多大,大数据如何帮助人实现自我认识和自我发展,如何提升教育的精准性、个性化和效率,在教育应有的本然、本来的价值面前,大数据应当适可而止,不能越位,不能成为教育最终的标准和鹄的。这在某种意义上构成了大数据教育应用的价值限度。
大数据教育应用的价值限度是指大数据所承载的工具价值不能涵盖、超越或统整教育的育人价值。也就是说大数据再怎么重要也只是认识和把握教育的一种手段和方式,在教育本有的育人价值面前,呈现出的始终是一种工具性的价值和工具性的存在,不应该也不能够把大数据推到教育的前台。迷信和崇拜数据、数据为王、一切用数据说话的做法是不可取的,这样做的后果是把活生生的人、把教育的本然状态和育人为本的价值忽略和置后了。此为大数据应用于教育的另一种规制和边界。
大数据、互联网、云计算、人工智能等技术在当前呈现叠加累进态势,人类社会发生翻天覆地的变化,能否数据化、能否进行大数据挖掘和分析、能否被写成算法几乎是衡量一切行业和领域是否跟得上时代潮流的基本标准。教育领域当然也不应该排斥新技术革命,而且应该充分利用这次新技术革命的契机。事实上教育领域也在积极地拥抱大数据,试图通过大数据来重新透视、构想教育,使自身变得更加“科学”“客观”与“理性”,以此获得自身的新定位、新方向和新发展。可问题在于,当前大数据教育应用日益繁盛的背后却暗含着“唯数据论”的倾向。面对信息化、数据化的浪潮,教育领域中数据崇拜、数据沉迷、数据过度解读,甚至数据本位的苗头已然显现,日益凸显的工具价值也在一定程度上压制了教育本体性的价值诉求,大数据、数据主义正成为教育中的新的“意识形态”。
大数据应用将直接指向人的生长,指向人本身、面对未成年的儿童、面对人自身的揭秘和重塑,而大数据的“意识形态”地位一旦确立,数据至上和数据优先的思想一旦上升为价值判断,大数据工具价值与教育的育人价值的错位和倒置也就发生了。具体来讲,大数据的工具价值对教育的育人价值的僭越,是以教育放弃自身逻辑与价值立场为代价而投靠大数据的“算计性”“有用性”的结果。即教育之培养人、丰富人和发展人的价值追求或终极目的让位于大数据所追求的功利性价值与算计性思维,教育不再培养自由而全面发展的人,转而培养大数据逻辑下具有某种“规格”的工具和“元件”,人自身却退场了。进而,教育的“自我”逐渐被大数据赋予的“他我”所取代,教育也逐渐成为一种听凭大数据安排可以任意“使”之的手段和工具,在大数据所彰显的工具价值主宰下,教育本体性的育人价值必然淡出。
近代以来,科学技术进步的双刃剑效应所带来的问题和导致的异化已为人类所普遍经验,更为一些先贤大哲不断警示和剖析。当数据成为“中心”、走向“前台”的时候,人的边缘化、异化和消解就是必然的了。所以,必须是人,而不是技术成为价值的最终根源和判断标准,是人的最优发展而不是生产的最大限度发展成为一切规划的标准(Fromm,1968,p. 96)。说到底,从哲学意义上讲,数据本身既不能成为教育的价值取向,更不能成为教育的最终目的。正如此前的任何一种新技术一样,在技术应用于教育、技术和教育的互动关系中,应当永远值得注意的是技术是人为的、更是为人的,是为了人更好地生存、生活和成长服务的。在教育这一非常特殊的人类自身再生产的社会实践中,不可能是技术本位或技术优先地考虑问题。技术永远要服务于人生、服务于人的成长,次序不可颠倒。
四、大数据教育应用的伦理限度
人是伦理性的存在,教育不得不面对很多复杂而具体的伦理问题,特别是在全球化、市场化、信息化的今天,人类社会的传统伦理生态和伦理关系正面临着巨大的冲击和挑战。将大数据、人工智能等具有革命性的技术引入教育,将不再仅仅是技术因素决定教育是否变革以及变革的力度有多大,而是在很大程度上受制于人们能否接受这些技术因素所带来的伦理关系的改变和这些技术所带来的伦理问题的解决程度。因此,检讨大数据教育应用的限度,还有一个重要的维度,即伦理的维度。从伦理的维度来看,大数据运用于教育也是喜忧参半,积极的伦理向度和消极的一面、难以解决的伦理问题同在。
一方面,在彰显个性、促进自由、提高教育平等和普及、增强多元价值观念等方面,大数据应用于教育将带来众多积极变化。如前所述,大数据的教育应用在一定程度上能够增进个体自由,凸显学生的自主性。自由是当今社会发展和个人发展都不可忽视的概念,也是教育所珍视、追求与践行的重要价值观念之一。“教育应该保证人人都享有他们为充分发挥自己的才能和尽可能牢牢掌握自己的命运而需要的思想、判断、感情和想象方面的自由。”(联合国教科文组织国际教育发展委员会,1996,第78 页)与大数据结合,教育可以为学生提供更加灵活多样的学习方案,可供学生进行选择的内容更加丰富。特别是广泛数据收集分析之后确定的个性化学习方案,能够凸显学生的主体性,更好地培养学生的个性。同时,大数据教育应用可以推动教育的均衡发展,有助于实现教育公平。大数据时代,各类教育资源以数据流的形式进行跨时空交流逐渐成为可能。如以慕课(Mooc)为代表的在线教育等能够使有限的优质教育资源在更大范围内互换与共享。当前,国内也已经有多家中小学校正在试图通过网络的形式进行课程资源的共享,在一定程度上加强了边远、贫困地区的课程建设,缓解了教育资源的不均衡问题。
与此同时,大数据的教育应用必然伴随一些伦理问题或伦理风险,这是人们在数据挖掘和应用过程中必须面对的障碍和难题,这些难题得不到有效解决,将直接影响到大数据教育应用的深度和广度,甚至使其“寸步难行”,由此也构成了另外一种意义上的大数据教育应用的“伦理限度”。例如:
全方位数据收集侵犯了学生隐私。依靠大数据实现对学生的认知、思想动态和行为习惯进行全方位、实时的关注,通过对学生的一举一动的关注,大数据才能获得分析和预测的基础。也正是“大数据持续的数据监测、跨平台的数据聚合以及数据的广泛分布等特征”(Ben-Porath & Shahar,2017,p. 245),使得学生如同身处“全景敞视监狱”(panopticon)中,时时处处都受到监视,这对学生乃至一个家庭的隐私都构成了威胁。在此,我们不难发现大数据教育应用中存在的一个矛盾:一方面,如果拒绝数据的收集,我们便无法利用大数据及其相关的技术以及与之相伴的各种便利;另一方面,如果允许大数据的收集,由于数据收集过程的全方位、实时性等问题,学生的隐私则必然会受到侵犯。同时,还将存在数据被恶意和非法利用的危险。“许多组织或者个人并没有明确说明他们将如何使用数据、做何种目的使用”(Alharthi,Krotov,& Bowman,2017,p. 287),更有甚者,“假借某种特定名义来获得个人同意后收集的数据可能是为了某些其他目的而收集的”(Douglas,2013)。其实,无论怎么选择,大数据应用必然导致隐私无法保障。
大数据预测功能压制了学生的自由选择。预测是大数据的一个重要功能,通过对学生既往数据的分析,能够对学生后续的学业发展、就业选择进行趋势预测,也可以对学生可能出现的错误进行预警。以此为基础,教师能够及时施加干预,从而更好地保证教育效果。但是,对学生发展的预测在教育中却会产生诸多问题。趋势预测是一种可能性而非必然性,因为“学习和生活轨迹,很少是线性的,不能仅从‘字面上’预测学生的发展”(Zeide,2017,p. 167)。对个体而言,预测可能会剥夺学生自由选择的机会,限制学生未来的发展,影响学生的自我实现。因为,既然未来都已经“写好了”,学生只需要按照既定的路线完成自己的学业,甚至走完自己的一生。教师和家长也有可能不当使用这种预测,在负面和消极意义上使用大数据预测。结果是,大数据预测导致了学生不再需要做出选择,也不再拥有各种可能,学生人之为人的尊严、未来的敞开性和可能性将受到践踏。
永久的数据储存使得学生丧失后续发展的动力。迈尔-舍恩伯格在《删除:大数据取舍之道》(Delete:The Virtue of Forgetting in the Digital Age)一书中指出:“数字技术已经让社会丧失了遗忘的能力,取而代之的则是完善的记忆”(迈尔-舍恩伯格,2013,第9 页)。舍恩伯格在书中呈现了一位单身母亲因自身行为被取消教师资格的案例,史黛西·施奈德(Stacy Snyder)在2006 年完成学业后申请教师资格并通过考试,却因其曾经在MySpace 个人网页上上传头戴海盗帽喝酒的照片而被校方取消资格。即便这张照片已经从个人网页中删除,但却被网络爬虫(web crawler)存档。舍恩伯格旨在通过此案例向我们展示遗忘的重要性,在教育中同样也需要遗忘。技术的发展使“数据存储具有更大的密度、更高的吞吐量和更长的使用寿命”(Bhat,2018,p. 539),数据的永久储存成为可能,学生所有过往的数据都被以电子化的形式存储下来。“过往的个人数据也可能成为入学或求职时的评估依据并为当事人贴上具有某种暗示意味的‘电子标签’。……将学生心理尚未成熟时作出的欠妥行为无一遗漏地全盘记录,并在未来的决策中以此作为主要的评估依据。”(张燕南等,2016,第51 页)学生所有的信息都被保留下来,并且伴随其一生,遗忘不再发生,各种历史记忆始终存在。学生在过去所出现的问题、所犯的错误都将会对现在产生影响,结果也是可怕的,会使学生对过去的错误心有余悸,对未来丧失希望,阻碍学生的发展。
教育大数据作用的对象是人,就像克隆和基因技术囿于伦理限制无法应用于人的肉体生命的复制和改写一样,大数据应用于教育,在某种意义上就是直面人精神生命和人的全身心的塑造和培育,伦理问题终将无法回避。诸多伦理问题同样成为高悬在大数据教育应用之上的达摩克利斯之剑。当然,伦理也处在不断变化之中,面对大数据教育应用带来的这些具有悖论性质的伦理挑战,人们可以通过改造旧的伦理或进行新的伦理创造来适应新的变化,但事情往往并不是这么简单,至少目前如何解决这些问题人们没有共同认可的方案。并不是所有的伦理都可以改造和重设,在历史和道德、科技和伦理的张力和悖论中,也从来就不是简单的非此即彼,大数据应用于教育所导致的深层次伦理困惑和冲突在得到基本的解决之前,大数据在教育领域中进一步的深化发展必然受限。
总之,大数据应用于教育领域,始终带有复杂的两面性。这提醒我们,在拥抱科技、迎接大数据给教育带来的种种福祉和便利的同时,一定要考虑到大数据教育应用的另一面,始终不能把技术想象成可以一劳永逸地解决现实问题的“新上帝”,这在当下技术狂欢的时代尤其重要。现实中大数据、人工智能在教育领域的应用远没有其他领域那么一帆风顺,其中的原因值得深思。再次重申,本文的用意并不在于为大数据教育应用“画地为牢”,排斥新技术和大数据应用,意在指出,对教育大数据应用存在的种种“限度”,从认识和思想层面如何把握,从制度和实践层面如何处理,不仅考验人类的智慧,更是直接关乎在大数据和人工智能时代教育当如何前行,以及究竟能够走多远。