教育数据:制式化、设计及作为研究范式
2017-11-06张远增
摘 要:教育数据是人类主观建构的记载教育系统及其活动和活动结果的体系。在大数据时代,教育数据既是科学研究范式又是产品和资源。此研究论述了教育数据制式及其结构与内容、教育数据设计及其结构与内容,以及作为科学研究范式的教育大数据。教育数据制式由数据形态、数据限度及数据开发三个维度的规定组成。教育数据设计由分析数据需求信息、确定数据目标体系、设计数据结构、确定数据构成要素、确定数据采集方式、确定数据设计结果等前后相继的六项工作组成。教育大数据作为科学研究范式,是对已有教育研究范式的集成或折衷,是一种同时具有有限客观性和主观性的研究范式。它对教育学学术研究提出的实质性挑战是,教育学尽快建立起教育信息学和计算教育学两个分支,为促进教育实现从工业化教育到数字化教育的转型提供理论指导。
关键词:教育大数据;教育数据制式;教育数据设计;研究范式
中图分类号:G40-054 文献标识码:A 文章编号:1671-6124(2017)05-0057-07
科学发展表明,每个科学领域都逐步演变成两大分支:一支负责从实验中收集数据、分析数据、编码数据,形成学科信息学(X-Info);另一支负责模拟该领域的系统及其运转,形成计算学科学(Comp-X) [1 ]。对教育科学领域而言,它即表现为教育学分化为教育信息学(Edu-informatics)和计算教育学(Computational Education)两个分支学科。其中,教育信息学是关于收集、分析和编码教育信息的理论体系;计算教育学是关于模拟教育系统及其运转的理论体系。所谓教育大数据对教育学研究范式转换的挑战,其实质就是,它要求教育学创建出教育信息学和计算教育学用于指导教育研究与实践。如何应对这个挑战,尽快建立起教育信息学和计算教育学,已成为大数据时代教育学学术研究亟待解决的重大问题。教育数据制式化、设计,以及教育大数据作为研究范式,这些均是教育信息学和计算教育学的基本内容,厘清其概念、结构与内容,是基于教育数据创建教育信息学和计算教育学需要解决的基础性问题。
然而,迄今为止,事关学科信息学和计算学科学建立之根基的数据本质研究成果却无定论,这体现在人们对数据的定义上。已有的数据定义可以划分为以下三类:
其一,描述性定义。共同点是利用对数据外延的认识定义数据。例如,将数据界定为:针对客观事物记录下来的、可鉴别的符号,包括数字、文字、音频、视频等 [2-4 ];在科学研究、设计、生产管理及日常生活等各个领域中,用来描述事物的数字、字母、符号、图表、图形或其他模拟量,它包含所需要的信息,能进行计算、统计、传输及处理 [5 ];描述事实的符号序列及信息载体 [6 ];事物的符号表示,是用于表示客观事物的未经加工的原始素材 [7 ]。
其二,形式化定义。共同点是利用对数据内涵的认识定义数据。例如,将数据界定为:浓缩的语言,最简洁的说明书,最清晰的结论,最生动的写照 [8 ];一个有关事实的集合,用来描述事物有关方面的信息,是进一步发现知识的原材料 [9 ];反映客观世界而记录下来的可以鉴别的数字或符号 [3 ];进行各种统计、计算、科学研究或技术设计等所依据的数值 [10 ];人们对客观事物或现象的定性或定量描述,广义地讲,数据就是最原始的信息 [11 ];以数字形式反映内容的内在联贯的符号系统 [12 ];量度和用各种方法取得的,用以概括或推断一般性结论的各种信息的总称,其中未经组织整理过的数据称为原始数据,经加工整理后的数据称为二级数据 [13 ];表征事物现象的逻辑语言,是人类认知活动的产物,是对客观事物的主观反映,广义上讲,数据包括数、量、数据和大数据 [14 ]。
其三,学科视野的定义。共同点是结合学科特点用“种+属差”方式界定数据。例如,统计领域将数据界定为采用某种计量尺度对现象(事件)进行计量的结果,通常指对社会现象或自然现象的某一研究总体在特定的时间、空间条件下,依据总体内个体的特征,采用一定的计量尺度所得到的结果 [15 ];教育统计学将数据界定为随机变量的观察值,是用以反映对教育现象进行观察、测量结果所得到的数字资料 [16 ]。可是,即便同一学科对数据的界定也可能不同。例如,在计算机科学中,有的将数据界定为能被计算机接受和处理的各种描述事物属性的表示,包括整数、实数、字符、文字、表格、图形、图像和声音等 [17 ];有的將数据界定为可由人工或自动化手段加以处理的数字、文字、图形、图像、声音等符号的集合,是用于描述对象、概念、状态或情况的信息基本单元,是信息的存在形式和表示形式 [18 ];有的将数据界定为用于表示客观事物的未经加工的原始素材的符号表示,以及通过物理观察得来的事实和概念 [19 ]。
基于已有的研究成果,本文将教育数据界定为:人类主观建构的记载教育系统及其活动和活动结果的体系。根据此界定,人类自身的发展及其所达到的水平制约教育数据的具体内容与形态,但在特定历史阶段教育数据所反映的内容是客观的,呈现的形式也是确定的。基于该界定,本文探讨教育数据制式化、教育数据设计及教育大数据作为研究范式三个问题。
一、教育数据制式化
制式化是教育数据能成为产品的关键。制式和标准的英文都是standard,意指通过提供可以持续使用的要求、规格、指南或特性,确保材料、产品、流程和服务符合它们的目的的文件,其目的是为组织或团体提供通用的思维框架并解释怎样实施这种思维(International Organization for Standardization(ISO),2009)。具有法律效力的standard是指为了在一定的范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用的和重复使用的一种规范性文件 [20 ]。在我国,制式一词由“制”与“式”合成。“制”既具有权力性、权威性、合法性、强制性的含义,引申为制度、制式、体制等,又具有制止、制裁之意,引申为通过一定的制度、体制及规则形式保障和规范合法性、合理性 [21 ];而“式”则有榜样、模范、制度的意思 [22 ],表现为依准则而形成模式及其基本样式。在合成词中,制式作为语素,指统一制定的标准、规格或样式 [23 ]。例如,按照规定标准和规格生产并列入军队装备体制的装备称为军队的制式装备 [24 ];由制度所决定的、体现制度精神的格式化文章称为制式文章 [25 ];特殊、有定规及限于特定场合使用的文书格式称为制式文字 [21 ]。本文将具有权威性、强制性及统一性的教育数据必须满足的内容、规格及样式的要求称为教育数据制式;将确立教育数据制式与采用教育数据制式表示教育数据的活动及其所形成的结果称为教育数据制式化。endprint
教育数据制式的本质是数据标准,它是为了满足判断教育数据质量、分享教育数据及规范开发教育数据的需要,优化教育数据成本,对作为产品的教育数据的起源、构成及其规格、生成的方法与技术,作出的权威性、强制性、统一性、可操作及可观测的规定。它既可以是由国家作出的制度性规定,也可以是教育领域内作出的行规性规定。教育数据制式由数据形态、数据限度及数据开发三个维度的规定组成。
一是数据形态维度。数据形态指作为产品的数据的最终呈现形态,它刻画了由固有质量、可访问性质量、语境质量及表达质量组成的数据质量标准体系,由符号、载体、包装、标志或标签等变量之可测量的明确规定组成 [26 ]。其中,固有质量是对教育形态数据变量的可观测物理特性取值在正确性、客观性、可信性及形态稳定性方面的规定;可及性质量是对教育形态数据变量可观测物理特性的测量方法与技术参数在可及和可及安全性方面的规定;语境质量是对教育形态数据变量在特定语言环境中呈现方式及涵义在相关性、及时性、全面性方面的规定;表达质量是对教育形态数据变量呈现效果在可解释性、易理解性、简明性、一致性、可传播性方面的规定 [27 ]。好的数据形态规定应当满足下列条件:不存在危及人身、财产安全以及公共利益的危险;符合国家的数据标准;符合其注明采用的数据标准;符合以数据产品说明、实物样品等方式标明的数据质量状况 [28 ]。
二是数据限度维度。数据限度指数据所能发挥的效用及其正常发挥效用所需要的条件 [26 ],它包括教育数据所描述的对象、数据的构造原理、数据的结构模式、数据功用及其作用的范围、正常发挥功用所需要的条件、正确使用数据的建议、数据存在的风险种类及其危害程度。好的数据限度规定应当满足以下条件:限度的内容科学、真实、完整、必须;限度的表述规范、确定、可理解;限度的规定可操作;限度表明的数据及适用范围可检核。
三是数据开发维度。数据开发指以获得数据为目的所开展的实践活动,它包括教育数据活动要遵照执行的操作规定、必须采用的技术参数规定、所开发数据的规格规定、验收教育数据的标准、获得教育数据过程(流程)与方法的规定、认定教育数据合格的技术路径及技术参数规定、数据责任承担者。好的数据开发规定应当满足以下条件:对开发活动的操作性规定有效、可操作、可检核;对作为产品的数据的标准的规定确定、可观测;对数据开发过程(开发方式及过程性标准)的规定正当、可监测;提供当下该数据最经济、最实用、代价最小及效益最大的开发方式,促进绿色数据开发。
以教育数据制式为标准,可将教育数据划分为制式教育数据和非制式教育数据。与制式教育数据以教育数据制式作为质量标准不同,教育数据产品意义的非制式教育数据并不局限于教育数据制式的规定,其数据形态、数据限度及数据开发三方面的具体规定,由教育数据需求者与教育数据开发者双方依法通过签署合同或合作协议的方式确定。
二、教育数据设计
所谓教育数据设计,是指在数据开发前根据教育数据开发目的确定教育数据实际执行的质量标准,运用教育数据生成原理确定教育数据构成要素的质量类型、规格、误差范围,以及数据结构模式及其实现途径、方式和条件,将抽象具体的教育数据构造出来的过程 [29 ]。教育数据设计是人们主动获得教育数据的重要手段,它由分析数据需求信息、确定数据目标体系、设计数据结构、确定数据构成要素、确定数据采集方式、确定数据设计结果等前后相继的六项工作组成。
一是分析数据需求信息。界定需要教育数据者对数据的现实需要是实现其教育数据需要的首要条件 [30 ],而分析教育数据需求信息则是解决这个问题的基础。实践中,需要教育数据者对自己需要通过数据实现自己的需要都至少有较为朴素的认识,教育数据设计的第一项工作就是收集需要教育数据者需要数据的意图,并通过对所收集意图的分析,厘清并确定教育数据需求者真实、完整的教育数据需求。
二是確定数据目标体系。即将已确定的教育数据需要等价转化为用抽象具体规定形式呈现的教育数据,包括对教育数据术语、数据格式、数据类型、数据载体及其所具有的适用性等方面作出抽象具体形式的规定。
三是设计数据结构。即将已确定的教育数据目标体系等价转化为对数据内在结构的规定,它具体包括对教育数据的构成要素,以及各构成要素发挥作用的方式与相互作用方式的规定。一般情况下,这项工作结束时需要提出两个或两个以上的教育数据内在结构方案。
四是确定数据构成要素。即基于实现已经设计的数据内在结构各种方案的需要,遵循可行性原则,对教育数据构成要素的来源、类型、性能,以及其规格、相应的技术参数作出明确规定 [31 ],并以此作为建立教育数据之数据限度标准的基础。
五是确定数据采集方式。即确定被测对象的各种参量(可以是物理量,也可以是化学量、生物量等),通过各种传感元件做适当转换后,再经信号调理、采样、量化、编码、传输等步骤,最后送到控制器进行数据处理,保障可获取相应数据之存储平台的技术参数与规格的过程 [32 ]。精度、速度和可操作是评估数据采集方式的核心标准 [33 ]。
六是确定数据设计结果。即基于数据成本优化原则和最大化数据适用性原则,选定作为产品的教育数据所采用的内在结构,以及其构成要素的来源、形式、类型、性能、规格及相应的技术参数,并以此作为具体教育数据开发活动的依据和质量标准。
需要指出的是,通过教育数据设计所得到的数据尽管不一定是制式教育数据,但在本质上一定是一种结构化的数据,而非大数据意义上的教育数据。例如,抽样调查(普查)形成的教育数据即为其典型形态之一。
三、作为科学研究范式的教育大数据
研究范式意义上的大数据①是大数据科学范式的简称,意指由数据驱动数据探索,以大量观察和观测数据、理论数据及计算机模拟数据为研究对象,利用计算机软件处理,依靠计算机存储,通过挖掘、提取等手段,寻求研究对象的内在规律。endprint
大数据范式理念中的数据是通过数字化手段形成的所有尺度和形状的记录,包括個人的意见及潜在的个人生活 [34 ],主张知行合一,强调认识过程将计算用于数据 [35 ],按不同主体阅读和理解数据 [4 ],把非结构性的数据转变为具有特定结构的结构性数据,使之对于特定的认识主体显得简约有序、有意义。
大数据的方法论“以数据为大” [36 ],其中的“大”具有全体、可扩充、有待挖掘的意思 [37 ]。数据大的程度=数据关联复杂度×价值尺度×发掘难度 [38 ]。大数据的认识论彰显功利目标②,主张样本与总体同一,关注事物的相关关系,分析与某事物相关的所有数据,不追求精确的因果关系数据 [39 ]。它要求以数据驱动的观测、计算、挖掘、分析、验证作为研究方式,以数据采集、数据管理、建模与仿真、算法、信息分析及系统平台作为自己的公共构件 [40 ]。
作为科学研究范式的教育大数据,它表现为教育研究者排他性地认同教育大数据,以及所创造出的无结构性、半结构数据和相应的数据处理能力 [41 ]。已有研究所提出的各种教育研究范式③可归纳为四种范式:实证范式、理解范式、批判范式、人类学范式。教育大数据与这些范式的主张既有共同之处,也有自己的独到之处。
与实证范式相比,教育大数据认同其教育活动具有客观性、必然性、普遍性;教育现象具有普遍性,不受主观价值因素影响,不以知识、理论为中介,不局限于某一特殊的环境和社会情况;教育现象由一系列变量系统构成;主体可以通过对一定工具的操作而获得对教育现象客体的认识,借助于数学工具对数据进行量化处理,进行完全价值中立的客观研究,建立律则性的知识体系用以说明教育“是什么”,以及预测或操作、控制教育活动的公设。但是,教育大数据不排斥价值,不强调可计量的观察和用自然科学的方法、程序收集数据,也不主张将观察、实验与归纳等作为基本的研究方法,以及将寻求因果关系作为教育研究的任务,而是主张将寻求基于自陈性质的教育数据的关联关系作为教育研究的任务。
与理解范式相比,教育大数据认同其教育活动是由人在意识和情感支配下完成的,教育现象是一个有意义的整体,教育研究是从“人类是有意识的”角度出发,从整体上对具体的教育问题进行理解,把握现象背后的意义和价值。成果的形式表现为主题、范畴、类型、概念、假设性的命题、理论,而不是“解释”和揭示其因果关系的公设。但是,教育大数据反对将主体对客体的认识视为主体和客体在互动关系中对客体进行重新解读和建构的过程;反对主体和客体在互动的关系中重新建构客体,以及在客观绝对化语义下否定教育现实的客观性;不认同研究过程的互动性,排斥在自然情境下通过“移情”理解被研究者的行为和思想;并认为包括用现场笔记、访谈、交谈、照片、记录、有关自身的备忘录所表征的研究对象在内的研究对象的各种记载,均是教育数据的具体存在形式,是自己的研究对象。
与社会批判范式相比,教育大数据认同其教育过程是自身的整体性与社会关系的整体性的统一,教育不是社会现状合理化的工具而是促进社会改革和进步的催化剂;教育研究的任务是揭示教育事实背后的意义,促进教育者与学习者的解放意识,通过猜测、反驳、证伪,促进知识的进步,而不是限于描述和阐释动态的教育过程;教育研究要采用“否定的辩证法” [42 ]等公设。但是,教育大数据不认同教育理论是一种符号沟通行为的理论,教育研究是一个主客体共同演化成长达到知识领悟的过程,用批判反省来代替生命经验的重构,也不主张被研究者作为研究者参与到研究之中。
与人类学范式相比,教育大数据认同其将教育同时视作文化存在、社会存在及历史存在,教育是具有普遍联系关系的统一整体;教育研究要进入教育现场,关注“活的教育”及教育事件发生的自然环境与情境;认识过程遵循从具体到抽象的逻辑,是“实践—认识—再实践—再认识”螺旋上升的过程;通过收集同时具有“上下”“左右”“前后”及“内外”关系的田野资料奠定研究的基础 [43 ];文字、图片、声音、影像等均是田野工作的文本;采用比较、综合、分析和概括的方法研究所收集的资料,发现新问题,验证假设,形成正确判断,构建新理论,为社会实践 [44 ]和真正促进人的主体生成 [45 ]作出贡献;认同体质(或生物)人类学研究所主张的从生理、心理的角度研究教育等主张。但是,教育大数据不认同以深度描述方式,为解决教育现实问题提供比较和参照视角的描述性研究 [46 ]。哲学人类学意义上的教育人类学研究,从具体的个案研究中能获得对教育与人性的理解,研究者必须深入异种文化中,在具体的文化中进行研究。教育大数据范式不强调研究者长期生活在被研究对象之中,融入其生活,与他们建立良好的人际关系,以专业性的观察和深度访谈为主要手段,搜集、记录和整理研究对象的行为或每日发生的事情 [47 ];不强调田野文本的典型性和样本性,而将教育叙事法、个案研究、参与式观察等 [48 ]质的研究方法所形成的研究结果均视为数据。
上述分析表明,从某种意义上可以认为,教育大数据范式是已有教育研究范式的集成或折衷:教育大数据既认为被客观性范式所否定的主观性研究具有一定的合理性,并将其吸纳其中,在一定程度上解决研究价值无涉的问题;又认为客观性研究具有一定的合理性,并将其吸纳其中,解决研究缺少可靠证据的问题。正因为此,教育大数据先天就是一种同时具有有限客观性和主观性的研究范式。
教育大数据范式确立的理论标志是教育研究已经成功地解决了收集、分析和编码既有教育数据的问题,以及生成、收集、分析和编码未来教育数据的问题。对于前者,就是形成了关于收集、分析和编码教育信息之理论体系的教育信息学;对于后者,就是形成了关于模拟教育系统及其运转之理论体系的计算教育学。令人遗憾的是,当今人们尽管呼吁用教育大数据范式推进教育研究与实践转型,但却因作为教育大数据范式理论核心的教育信息学和计算教育学的缺失,还只能局限在技术层面使用教育大数据。endprint
四、结 语
作为教育数据一种类型的教育大数据,它只是世界1和世界2的“鏡像”,并不是真实教育世界的本身 [49 ]。因而,不能让教育大数据压倒真实的教育世界,这应该成为运用教育大数据的基本立场。在大数据时代,教育研究的当务之急是创建教育信息学和计算教育学,促成教育大数据从研究教育的技术转变为研究教育的范式,继而推进教育研究与实践转型。实践中,教育组织形成教育大数据范式需要满足三个客观条件:其一,计算机硬件的数据处理能力和计算机算法技术胜任存储、处理和分析教育数据;其二,数据采集和问题解决技术胜任系统、完整、准确地采集数据;其三,数据兼容,形成了统一的数据平台 [50 ]。需要指出的是,随着移动互联网的兴起,教育大数据把“以人为传感器”作为生成和采集教育数据的主要方法,采用数据活化技术恢复数据在物理世界中的关联性,采用数据可视化技术将数据呈献给数据需求者,填补技术与数据需求者之间的理解鸿沟 [51 ]。从微观层面看,智慧校园④已能提供生成和采集学校教育数据的主要方法,使得学校数据驱动个性化的教学、提升学校教育质量成为现实 [52 ]。但从宏观层面看,需要构建基于管理云和资源云的国家数字化教育云服务平台,才能实现智慧教育政策决策⑤,促进我国教育实现数字化教育转型。
注 释:
① 现实中,人们在两种意义上使用大数据术语。其一,大数据是数据发展到当前阶段的产物,是数据的一个新的类别,以无结构或半结构作为本质特征,但其本质依然是数据,与传统的数据具有相同的本质;其二,大数据是基于其上的研究理念、研究策略、研究技术、研究结果形式及研究准则开展研究的系统规定,与科学研究范式具有相同的本质。在读者结合上下文能准确把握术语大数据意义的情况下,本文既在数据意义上使用术语大数据,也在科学研究范式意义上使用术语大数据。
② 即基于数据的决策。
③ 迄今为止,人们提出的教育研究范式名称至少有教育学范式、教育科学范式、实证主义范式、科学主义范式、人文主义范式、理解主义范式、自然科学范式、人文范式、人类学范式、哲学思辨范式、定量范式、定性范式、社会批判(评)范式、复杂系统范式、体系主义范式、实用主义范式、“主义”式研究范式、“问题”式研究范式、哲学—思辨范式、科学—实证范式、人文—理解范式、类推—演绎范式、诠释—理解范式、经验—分析范式、建构范式、“无范式”范式等26种之多。参见:黄志成.教育研究中的两大范式比较:“日尔曼式教育学”与“盎格鲁式教育科学”[J].教育学报,2007(2):3-9;王兆璟.我国教育研究中的四种范式及其批判[J].兰州大学学报(社会科学版),2002(5):158-163;么加利.西方教育研究范式的后现代转换[J].全球教育展望,2012(10):57-61;基夫斯.教育研究方法(上)[M].重庆:西南师范大学出版社:2011:422-425;唐松林,周文娟.教育研究范式类型及演化分析:差异、辩证与融通[J].郑州师范教育,2012(6):5-9;王文静,董奇.创新的教育研究范式:基于设计的研究[M].上海:华东师范大学出版社,2011:76.
④ 智慧校园是指实现环境全面感知、网络无缝互通、海量数据支撑、开放学习环境、师生个性服务的校园。参见:黄荣怀.智慧校园:数字校园发展的必然趋势[J].开放教育研究,2012(4):12-17.
⑤ 智慧教育政策决策是智慧公共决策的一种。所谓智慧公共决策,是指公共组织以实现公共利益为目的,用大数据驱动,以云计算、物联网、移动互联网、新兴网络技术等新一代信息技术作支撑,通过对规模性、快速性、高价性及多样性的大数据资源进行实时感知、智能分析,预测未来发展趋势,辅助决策者更科学有效地决策和行动的公共决策模式。大数据为智慧公共决策提供了网络协同治理的共同经验和行动逻辑,以及实时连续决策的轨迹和路径,这些有助于激发和实现智慧公共决策的公共利益导向和动机。参见:胡税根,单立栋,等.基于大数据的智慧公共决策特征研究[J].浙江大学学报(人文社会科学版),2015(4):1-11.
参考文献:
[1]Tony Hey,Stewart Tansley,et al. Jim Gray on eScience:A Transformed Scientific Method[C]//Tony Hey,Stewart Tansley,et al.. The Fourth Paradigm:Data-Intensive Scientific Discovery. Microsoft Research,2009:xvii-xxxi.
[2]金光熙.现代管理信息处理系统[M].北京:冶金工业出版社,1994:1.
[3]宋 敏,覃 正.国外数据质量管理研究综述[J].情报杂志,2007(2):7-9.
[4]魏瑾瑞,蒋 萍.数据科学的统计学内涵[J].统计研究,2014(5):3-9.
[5]沈以淡.简明数学词典[K].北京:北京理工大学出版社,2003:277.
[6]李 奇.教育数据中的信息与知识[N].光明日报,2015- 04-16(15).
[7]沈霄凤,范云欢.教育信息处理应用[M].上海:华东师范大学出版社,2012:2.
[8]赵 丰.数据[M].北京:中国经济出版社,1995:1.
[9]杨 杰,姚莉秀.数据挖掘技术及其应用[M].上海:上海交通大学出版社,2011:3,15,20.
[10]中国社会科学院语言研究所词典编辑室.现代汉语词典:第6版[K].北京:商务印书馆,2014:1212.
[11]史永刚,冯新泸,等.化学计量学[M].北京:中国石化出版社,2003:11.endprint
[12]韩明安.新语词大词典[K].哈尔滨:黑龙江人民出版社,1991:447-448.
[13]马国泉,张品兴,等.新时期新名词大辞典[K].北京:中国广播电视出版社,1992:546-547.
[14]刘 红,胡新和.数据革命:从数到大数据的历史考察[J].自然辩证法通讯,2013(6):33-39.
[15]陆菊春.应用统计学[M].武汉:武汉大学出版社,2007:10;汪新宇,等.统计学[M].北京:中国经济出版社,2007:29.
[16]谢新观.远距离开放教育词典[K].北京:中央广播电视大学出版社,1999:302-303.
[17]《中国电力百科全书》编辑委员会,等.中国电力百科全书:电工技术基础卷[K].北京:中国电力出版社,2001:314-315.
[18]《数学辞海》编辑委员会.数学辞海:第五卷[K].北京:中国科学技术出版社,2002:476.
[19]International Organization for Standardization(ISO).ISO 704:2009 Terminology work—Principles and Methods[EB/OL].[2016-11-02].https://www.iso.org/obp/ui/#iso:std: iso:704:ed-3:v1:en.
[20]GB/T 20000.1-2002,标准化工作指南 第1部分:标准化和相关活动的通用词汇[S].
[21]张利群.《文心雕龙》体制论[M].桂林:广西师范大学出版社,2010:193,84.
[22]《辞海》编辑委员会.辞海语词分册:上[K].上海:上海辞书出版社,1977:729.
[23]李明君.中国美术字史图说[M].北京:人民美术出版社,1997:170.
[24]李苏鸣.军事语言研究[M].北京:人民武警出版社,2006:190.
[25]徐公持.论秦汉制式文章的发展及其文学史意义[J].文学遗产,2012(1):4-16.
[26]黄 蕾,陈继元,等.国际贸易政策分析[M].武汉:湖北教育出版社,2012:17.
[27]Wang R Y,D.M.Strong. Beyond Accuracy:What Data Quality Means to Data Consumers[J].Journal of Management Information Systems,1996(4):5-33.
[28]中华人民共和国.中华人民共和国产品质量法[EB/OL].[2015-10-27].http://www.liuxiaoer.com/dj/2185_3.html.
[29]张远增.教育评价质量控制论[M].长春:东北师范大学出版社,2013:171.
[30]布劳卿,拉克,等.大数据变革 让客户数据驱动利润奔跑[M].沈 浩,译.北京:机械工业出版社,2014:24.
[31]H.萨姆特.多维与度量数据结构基础[M].周立柱,王 宏,等.北京:清华大学出版社,2011:1.
[32]John Carlo Bertot.大数据与开放数据的政策框架:问题、政策与建议[J].郑 磊,徐慧娜,等译.电子政务,2014(1):6-14.
[33]肖忠祥.数据采集原理[M].西安:西北工业大学出版社,2001:1.
[34]Gordon Bell. Foreword[C]//Tony Hey,Stewart Tansley,et al. The Fourth Paradigm:Data-Intensive Scientific Discovery. Microsoft Research,2009:xiii.
[35]Clifford Lynch. Jim Crays Fourth Paradigm and the Construction of the Scientific Record[C]//Tony Hey,Stewart Tansley,et al. The Fourth Paradigm:Data-Intensive Scientific Discovery. Microsoft Research,2009:177-183.
[36]许小乐.“大数据”与政府统计改革[J].调研世界,2013(5):42-45.
[37]Tony Cass. A Handler for Big Data[J].Science,1998(5389):636.
[38]何 非,何克清.大数据及其科学问题与方法的探讨[J].武汉大学学报(理学版),2014(1):1-12.
[39]朱建平,章貴军,等.大数据时代下数据分析理念的辨析[J].统计研究,2014(2):10-19.
[40]R.Kouzes,G.Anderson,et al.The Changing Paradigm of Data-Intensive Computing[J].Computer,2009(1),26-34.
[41]杨满福,焦建利.大教学、大数据、大变革——edX首门“慕课”研究报告的分析与启示[J].电化教育研究,2014(6):34-37(50).
[42]冯建军.西方教育研究范式的变革与发展趋向[J].教育研究,1998(1):26-30.
[43]陈学金,滕 星.论中国教育人类学的几个根本问题[J].中南民族大学学报(人文社会科学版),2013(3):5-10.endprint
[44]李復新,瞿葆奎.教育人类学:理论与问题[J].教育研究,2003(10):3-13.
[45]冯增俊.教育人类学未来发展展望[J].华南师范大学学报(社会科学版),2006(2):98-103.
[46]吴晓蓉.我国教育人类学学科发展问题审视[J].教育研究,2012(5):12-16.
[47]苏日娜.论教育人类学的学科性质与研究方法[J].中央民族大学学报(哲学社会科学版),2005(3):25-28.
[48]孙冬梅,黄 坤.教育研究范式及方法的变革与融合[J].中国高教研究,2009(2):30-32.
[49]吕乃基.大数据与认识论[J].中国软科学,2014(9):34-45.
[50]徐 鹏,王以宁,等.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6):11-17.
[51]王静远,李 超,等.以数据为中心的智慧城市研究综述[J].计算机研究与发展,2014(2):239-259.
[52]顾小清,黄景碧,等.让数据说话:决策支持系统在教育中的应用[J].开放教育研究,2010(5):99-106.
Abstract:Education data is a system which is constructed subjectively by human and records the state,activities and activity results of education system. In the era of big data,education data is not only a product and resource but also a scientific research paradigm. This paper discusses the standard of education data and its structure and content,the design of education data and its structure and content as well as the education big data as a paradigm of scientific research. The standard of education data is composed of three dimensions:data form,data limit and data development. The design of education data is rooted in six successive activities,which are to analyze the demand information of data,to determine the target system of data,to design the structure of data,to determine the elements of data structure,to determine the acquisition methods of data and to determine the results of data design. In educational academic research,as a research paradigm,the big data of education is an integration or compromise of existing educational research paradigm,and it is a research paradigm with limited objectivity and limited subjectivity. It poses a substantive challenge to the academic research of education:pedagogy should set up two branches of Educational Informatics and Computational Pedagogy as soon as possible in order to provide theoretical guidance for promoting the transformation of education from industrialization education to digital education.
Key words:the big data of education;the standard of education data;the design of education data;research paradigmendprint