APP下载

大数据分析与量化研究的区别与整合
——兼议教育量化研究的未来走向

2017-04-13汪雅霜

关键词:教育学范式分析

汪雅霜,嵇 艳

(1.南京大学 教育研究院,南京 210093;2.南京医科大学 护理学院,南京 211166)



大数据分析与量化研究的区别与整合
——兼议教育量化研究的未来走向

汪雅霜1,嵇 艳2

(1.南京大学 教育研究院,南京 210093;2.南京医科大学 护理学院,南京 211166)

大数据对社会科学研究产生较大影响,大数据分析开始逐渐应用于教育学等研究领域并取得了较好成效。随着大数据分析在学术领域中的使用,人们对大数据分析和量化研究的认识产生了分歧,甚至有学者将大数据分析等同于量化研究。研究表明,大数据分析不同于教育学等研究领域中所使用的量化研究,两者在科学研究范式、数据获取方式、数据分析方法等方面都有所不同。但是,大数据分析与量化研究在学术研究中可取长补短,未来的研究可结合大数据分析和量化研究各自的特点进行整合,拓宽研究的思路与空间。建议在研究范式上强调知识驱动与数据驱动相统一,在数据获取上强调结构与非结构、横断面与历史数据相结合,在数据分析方法上强调统计推断与数据挖掘相融合。

大数据分析;量化研究;教育研究;社会科学研究

一 学术研究已步入大数据时代

随着互联网、云计算以及物联网等计算方法和信息技术的快速发展,数据获取、储存与分析功能获得极大突破。大数据(Big Data)逐渐进入公众的视野,大数据分析(Big Data Analytics)应用的范围也越来越广泛。大数据开始改变人们的认知与生活方式,对社会各界带来冲击与挑战,对学术研究也产生了极大的影响。在教育学等研究领域,虽然有学者对大数据持怀疑和批评态度[1,2],但大数据的倡导者认为,大数据克服了以往传统“小数据”量化研究代表性差、主观性强、准确性低等缺陷,使研究的结果更加客观中立、规范科学。更有大数据的崇拜者由于大数据强大的数据基础及其蕴含的信息和知识,对传统量化研究干脆予以全面颠覆,更断言数据科学家将会取代社会科学家[3]。众所周知,量化研究自出现于社会科学研究领域以来,为经济学、社会学等学科注入了全新的生机与活力。近几年来,我国教育学研究领域也开始大量使用量化研究来对相关教育问题进行分析。量化研究通过把研究对象“量化”为数据,用“数据说话”,使得教育研究真正开始进入“科学”研究的范畴,推进了教育研究科学化的进程。量化研究离不开数据,而大数据分析则把数据的作用发挥到了极致,因此有学者认为,借助大数据分析的推力,教育学等社会科学将脱下“准科学”的外衣,真正进入“科学”的殿堂[4]。那么,大数据分析就是量化研究吗?大数据分析与量化研究又有怎样的联系和区别呢?如何结合大数据分析与量化研究的特点来开展教育研究呢?

二 大数据与大数据分析的内涵与定义

(一)大数据的内涵

有学者将大数据定义为“庞大、多样化、复杂的、纵向的和/或分布式的数据集,由工具、传感器、网络互动、电子邮件、视频、点击数据流和/或其它现在以及将来可使用的数字资源”[5]。维基百科定义大数据为“足够庞大和复杂的数据集,以至于现有的数据管理工具或传统的数据处理应用程序难以处理”。美国高德纳公司(Gartner Group)认为“大数据”是需要新处理模式才能具有更强的洞察发现力、流程优化能力和决策力来适应海量、高增长率和多样化的信息资产。以上几种表述虽然不尽相同,但对大数据普遍的共识是:大数据的数据量庞大、种类繁多、数据复杂以致传统工具难于处理。数据蕴含可供分析的信息,可创造知识和价值。目前,学术界一般用“4V”概括大数据的特征:即种类多(Variety)、速度快(Velocity)、容量大(Volume)、价值密度低(Value)。大数据的意义就在于,可供人类分析和使用的数据量在大增,通过对大数据的整合、交换、分析和挖掘,可以发现新的知识、创造新的价值,带来“大知识”、“大利润”、“大科技”和“大发展”[6]54-58。

(二)大数据分析的定义

大数据引起了人们的广泛关注和高度重视,但大数据的“4V”特征决定了大数据分析才是其核心议题。如何有效处理和分析大数据,进行数据的去冗存精,从大数据中挖掘出有用的信息、发展新的知识、产生行动决策的智慧,才是大数据的关键。那么,何谓大数据分析呢?先从范式层面来看,有学者认为大数据分析是信息时代的产物及显著特征,并构成了信息时代复杂性的基础。知识本质上不再是传统意义上的得到辩护的真信念集合,网络本身成为了知识的本体。因此,知识发现的方式和科学研究的范式改变,不再是预设和检验某种假设,而是直接通过数据对复杂社会领域中的动态变化的法则进行分析和处理[7]。再从技术方法来看,有学者认为大数据分析即根据数据生成机制,广泛采集、存储并清洗数据,以大数据分析模型为依据,在大数据分析平台的有力支撑下,运用云计算技术来调度计算分析资源,最终挖掘出隐藏在大数据背后的模式或规律的数据分析过程[8]。大数据分析的运用主要集中于政界与工业界,用于发现政治或商业等领域的运行规律,使决策者可以在数据所形成的证据基础上推进决策的科学性,使决策更具权威性和准确性。目前,随着信息技术与教育的深度融合,大数据分析也开始逐渐应用于教育学研究领域。大数据分析可以描绘出学生的学习路线图,监测学生学习的全过程,从而为学校提升学生学习质量提供科学的依据。

三 大数据分析与量化研究的比较

(一)量化研究的发展历程

大数据分析基于前所未有的海量数据。那么,大数据分析就是量化研究吗?大数据分析与教育学等研究领域中所使用的量化研究有什么关系呢?要回答这两个问题,还需要追溯量化研究的起源与发展,阐明量化研究的本质,进而揭示两者的关系。18世纪30年代,法国著名的哲学家孔德(Auguste Comte)提出实证主义(Positivism)概念,主张用自然科学方法研究社会现象。实证主义承袭了经验主义哲学的思想,强调感觉经验,反对传统神学和形而上学,认为唯有科学方法才是人类认识客观世界的手段。孔德的早期实证主义思想奠定了量化研究的方法论基础。随后,涂尔干(Emile Durkheim)率先践行了孔德的实证主义社会学,认为社会科学研究在于寻找普遍性的规律和事物之间的因果关系,并且以“社会整合度”分析了自杀行为的原因,证明了在社会科学研究中运用量化的可能性,开创了量化研究的先河。

除了受哲学思潮的影响,自然科学的巨大进步也激发了人们运用自然科学方法研究社会现象的热情,形成了一股列宁称之为“从自然科学奔向社会科学的强大潮流”[9]5。尤其是上世纪50年代以后逐步形成的当代科学技术革命,将这股强大潮流又推向了新的高潮,使社会科学研究中一直存在的科学主义方法论思潮更加根深蒂固。正如赖特·米尔斯(Wright Wills)所说:“在许多问题的研究中,与哲学有别的经验主义方法无疑是游刃有余的。”[10]73

如上所述,教育学等研究领域中所使用的量化研究是在批判神学与形而上学的基础上产生的,因后两者的本体论已超出了人类理性认知的能力[2]。因此,量化研究是以客观主义认识论为基础的,通过统计学测量获得数字资料,寻求能解释社会现象与行为的普遍法则。强调在一个价值无涉、逻辑的还原论和决定论的理论框架下,测量与分析变量之间的因果关系[11]。量化(quantization)是以“量”的形式收集和分析经验材料。量是一个基本的数学概念,以数为基础,作为客观事物之间区分异同的一种属性,是事物可以用数来表示的规定性。通过测量可获得量的大小,测量将量与作为标准的同类量进行比较。因此,量的表达是由数字构成的数的集合以及与物质集合相关的计量单位组成[12]。

(二)大数据分析与量化研究的不同

针对大数据分析与量化研究的考察,我们不难发现两者的不同,大数据分析不能等同于教育学等研究领域中使用的量化研究。首先,在研究的方法论层面上,大数据分析代表了信息时代一种新的复杂性的科学研究范式或知识发现方式。不同于量化研究传统的科学研究范式的特征,基于大数据的科学研究具有数据密集型和数据驱动型的典型特征,与传统科学研究的思维体系有较大的差异[7]。其次,在具体的方法层面上,大数据分析遵循的是量化研究的“量化”思路,但“量化”的本质发生了变化。教育学等研究领域中的量化研究的“量化”是测量研究对象以转化为以数为基础的量。而大数据分析是基于已有生成的数据,包括数字形式的数据,也包括图形、表格、文字等半结构化和非结构化数据,以量化的思想对所有数据进行结构化的转化。最后,在方法程序和操作方式上,大数据分析与量化研究也有所不同。量化研究使用的是传统的基于统计学原理的数据处理与分析方法,而大数据分析则采用基于数据库原理和计算机技术的数据挖掘和分析技术。综上所述,大数据分析已经不再是传统意义上的、基于小数据思想的量化研究。

四 大数据分析与量化研究的具体区别

那么,教育学等研究领域的量化研究与大数据分析具体有何区别?虽然两者都是以数据为基础进行分析,都试图通过数据理解和把握人类社会,但是在科学研究范式、数据获取方式、数据分析方法等方面都有了较大差别。

(一)科学研究范式不同

教育学等研究领域使用的量化研究是实证主义研究范式指导下的具体研究方法,首先遵循传统科学研究“提出假设——构建模型——收集数据——验证假设”的基本研究路径,也就是基于问题收集数据,并通过实验、观察、调查等方法来处理研究对象。其次,量化研究收集的数据来自经抽样得到的、假设能代表总体的样本。因此,量化研究在统计分析时存在由样本推断总体的统计思想。而基于大数据的分析是通过对“总体”数据的分析与挖掘来发现知识。在大数据分析中,数据被认为是“全样本数据”,不存在统计推断的思想,数据分析路径是直接从总体数据中发现规律并预测趋势,加以归纳总结形成结论,即“发现—总结”。挖掘数据不是为了科学验证,而是要发现数据背后隐藏的人类态度或行为的规律[13]。正如数据库研究专家吉姆·格雷(Jim Gray)指出的两者间的区别,大数据分析的典型特征是“数据驱动”,区别于传统的由研究者提出问题或假设、构建框架、假设检验的“知识驱动”路径[14]。大数据分析的认识论基础是直接利用产生于数据中的规律和趋势,而非通过数据分析检验结论。这也意味着大数据分析与教育学等研究领域使用的量化研究所遵循的科学研究范式不同。

(二)数据获取方式不同

教育学等研究领域使用的量化研究中的数据是研究者为了特定研究目的,主动运用抽样技术从总体中抽取出具有代表性的样本,再通过实验、观察、调查等方法收集的,其数据具有有限性、稳定性、不可扩充性等特征。而大数据具有复杂性、不确定性、涌现性等特征[13],主要通过网络技术生成,包含互联网、智能设备、医疗设备、视频监控、移动设备等,除少量数据可以被公开共享以外,绝大多数都掌握在政府与企业手中,研究人员难以获得。与传统数据在研究中的工具性和依据性不同,大数据分析先有数据,再通过对数据的结构化与全面分析获得有价值的结论,数据本身已经上升到蕴含丰富的有待开发的信息和知识的资源地位[12]。尽管传统数据的客观性和真实性等被大数据拥护者们所诟病,但大数据也并非无所不能,也有其先天不足之处。首先,由于大数据的随机生成特点,可能形成众多没有价值的数据,而有价值的信息可能被掩盖,即大数据“价值密度低”的特点。其次,大数据也是基于一定条件下的总体数据,而非随机抽取的能代表总体的个体总和,数据的代表性可能并不如量化研究。例如,研究中来自互联网的数据,因网络用户往往是特定的用户群体,而不能代表所有人群。第三,教育学等研究领域使用的量化研究注重使用问卷管理等技术以确保数据尽可能真实准确,而大数据在产生、管理和使用过程中,由于某些主观因素,例如受利益驱使的人为操控,在可信度方面也有不尽如人意之处。

(三)数据分析方法不同

在量化研究的数据分析阶段,对数据的处理依赖基于数学原理和定律、以概率论为基础的统计学方法。由于研究者难以获取总体数据,由此催生了由样本推断总体的思想,包括一系列抽样技术和参数估计方法。因此,统计学的主要任务就是要克服非绝对随机取样引起的变异,运用分析方法通过对样本数据的统计描述和推断而获得对研究对象总体的认识。而大数据的出现,因数据量之庞大、类型之复杂、发展之快速,使得数据分析仅靠统计学的一己之力已经难以实现。统计学必须加入以计算机科学、数学、逻辑学、系统科学、行为科学等众多学科为基础的数据科学中[13],才能解决大数据分析的问题。为克服统计方法计算能力有限的问题,大数据分析需要依托云计算,主要依赖基于计算机科学的数据挖掘技术,包括机器学习,通过各种算法从数据中挖掘信息,如发现相关性规律、预测分析等,这与教育学等研究领域的量化研究所使用的分析方法不同。

五 大数据分析与量化研究的整合

大数据分析不同于教育学等研究领域中使用的量化研究,但大数据分析的兴起与发展并不意味着量化研究方法的式微。因为目前的技术限制无法完善大数据本身的缺陷,例如大数据更多的是记录人的行为,而较少兼顾主观态度和价值观。因此,大数据分析不能取代抽样调查、实验研究等量化研究在教育学等研究领域中的地位,但大数据分析为量化研究开拓了更广阔的研究领域。两者在知识发现和数据类型等方面存在互补。一方面,量化研究的“小数据”忌讳“数据驱动”,强调基于理论的假设验证,而大数据分析恰恰利用了“大数据”,旨在通过数据发现知识;另一方面,大数据可以弥补量化研究“小数据”的不足,扩大数据的规模并丰富数据的类型。因此,积极应对大数据带来的机遇与挑战,整合大数据分析与量化研究,充分利用大数据的优势,在教育学等研究领域中开展更好的量化研究,这是研究者值得思考的议题,也是教育量化研究的未来走向。

目前,在教育学等研究领域中使用大数据分析来开展研究已成为一种趋势,大量的研究人员开始利用大数据分析技术,在研究中增加新维度、拓展新空间。近几年来,一些学者进行了积极尝试,例如复旦大学的研究者利用慕课平台上的中文课程“大数据与信息传播”后台点击行为大数据,分析了四种视频风格及六种PPT特征,并对分析进行评分者一致性的检验,将视频特征的分析结果与跳转行为频率之间的关系进行比对[15]。那么,具体而言,教育学等研究领域的研究者在大数据背景下如何开展更好的量化研究呢?根据上文所述,量化研究与大数据分析主要在科学研究范式、数据获取方式、数据分析方法三个方面存在区别,这三个方面也是开展科学研究最为关键的环节。因此,以下也将从这三个方面进行阐述。

(一)科学研究范式:强调知识驱动与数据驱动相统一

大数据分析重构了知识的构成问题和研究过程,形成了研究与实践范式的转换,表现为知识驱动转向数据驱动,从知识发现转向某种意义的智慧获取[16]。大数据分析代表了信息时代一种新的复杂性的研究范式,新的研究范式形成新的研究思路与方法,不必拘泥于传统的基于理论来建构模型,只需依赖大量数据就能发现复杂的关系与结构,创造出新的知识。大数据分析拓宽了量化研究的视野,尽管有不少学者将大数据分析思维理解为只需要探究一般的相关关系,即帮助我们在大量的数据中,挖掘出事物之间的相关关系。但基于大数据的量化研究并不能止步于相关分析,而要以相关分析为基础来寻找相关联的变量,再深入科学理论从而发现更为复杂的因果机制。正如有学者指出,大数据时代有助于发现隐藏的“历史事实”,但决定或影响大数据资料背后一系列“历史事实”所构成的整体性现象中的错综复杂关系的因果机制,仍然依赖于运用科学理论不辞余力地去探索,唯有对因果机制的梳理解决,才能更好彰显大数据对量化研究的贡献[17]。因此,在知识驱动模式产生的理论基础上,实现“知识驱动”与“数据驱动”的融合是大数据时代教育学等相关学科研究范式转变的必然趋势。在相关理论的指导下,研究者可以结合现实需求与大数据中的特定数据,改变先有数据后有分析的逻辑顺序,先凝练出大致的研究方向并提出理论假设,再利用大数据平台挖掘数据,从而更好地验证假设和解决现实问题,研究结果也可以进一步补充理论的发展。比如,有学者发现在线学习领域的相关研究大部分集中于在线学习资源建设与教学设计等方面,却忽略了在线学习中学生情绪的测量。因此,江苏师范大学的学者们基于情绪测量理论,采取大数据的一般处理流程,综合网络爬虫、视频监控、情感识别、可穿戴设备、文本挖掘等大数据分析技术等来构建在线学习情绪测量模型。基于大数据的在线学习情绪测量模型强调“知识驱动”与“数据驱动”的融合。模型包括应用层、技术层和数据层,根据其功能划分为四个模块——用户数据模块、反馈交互模块、情绪集成模块以及分析诊断模块。该模型旨在解决在线学习中缺少情感交流的问题,可提高在线学习者加强学习过程中的情感交互,提升学习者在线学习的兴趣,使学习者的积极情绪得以激活以及在线学习效率得以大幅度提升[18]。

(二)数据获取方式:强调结构与非结构、横断面与历史数据相结合

目前,教育学等研究领域中使用的量化研究以分析结构化数据为主,对于内涵丰富的非结构化数据并没有非常适切的分析方法。但大数据分析技术对于数据结构的要求并不像量化研究那样高,人们在互联网上留下的行为习惯信息、社交信息、地理位置信息、偏好信息等各方面的信息都能实时进行处理,全方位的描绘出每一个个体的个性化特征[19]。因此,量化研究若能利用大数据平台,实现结构化与非结构化资料相统一,在大数据中直接获取并筛选出与研究问题相契合的变量,那么量化研究就会如虎添翼,大大节省数据采集与清洗过程中的人力成本和时间成本。另外,除了反映当下状态的横断面数据,历史数据的收集是大数据研究的优势。即便传统量化研究也可以收集纵向的历史数据,但与信息时代的大数据相比是极为有限的。大规模的历史数据有助于将传统的量化研究置于更广阔的时间与空间维度下,帮助研究者理解数据的历史背景与社会制度环境,挖掘清楚“因”导致“果”的关系链条与传导机制[20]。因此,利用大数据平台,从中获取半结构化与非结构化的数据以及丰富的历史数据,是当前教育学等相关领域研究者利用大数据进行量化研究的可行途径。比如,2011年,哈佛大学、麻省理工学院、谷歌研究团队与大英百科全书的学者,在国际顶尖期刊《科学》上发表了题为《使用百万数字化书籍的文化量化研究》的论文。该项研究是借助大数据平台获取丰富历史数据,实现结构化与非结构化资料相统一的典型案例。研究团队借助谷歌图书的海量数字化资料,分析了公元1500年到2000年间500多万本书籍高达5000多亿单词的语料库。通过在语料库中对关键词的使用频率变化进行分析,可以展示500年来人类文化发展史中或饶有兴致或鲜为人知的现象和趋势[21]。

(三)数据分析方法:强调统计推断与数据挖掘相融合

量化研究与大数据分析各有所长。量化研究收集数据带有一定的目的性,是“为研究”而收集,也可以说是基于理论创新而“制造”数据,从这个方面来说,传统小数据比大数据更适合开展具有理论意义和理论突破的研究[22]。而大数据分析更擅长于发现规律和预测趋势。从关注的人群来看,教育学等研究领域中的量化研究关注个体和特定小群体的研究,而大数据分析关注总体人群的研究,从而舍弃了对个体或小群体在研究中的价值。在具体的数据分析方法层面,量化研究方法包括实验研究中的因果推断、调查研究中的相关分析和回归分析等。而大数据分析则主要依靠可视化分析、语义分析以及偏差分析等数据挖掘技术。大数据分析一般很难使用传统意义上的因果推断与回归分析模型,但是考虑到大数据的海量性,如果能把基于大数据所做的数据挖掘技术与统计推断技术进行结合,就能形成具有说服力的证据链[23]。若能发挥两种数据分析方法各自的特点,促进大数据分析与量化研究的优势互补,将会大大促进研究结果的完整性与可信度,这也是在大数据背景下教育学等相关学科开展量化研究的重要方法。比如,在关于慕课的相关研究中就可以很好地把数据挖掘技术与统计推断技术相结合。目前,慕课的具体实现的方法就是教育数据挖掘和学习分析。学习分析是一个跨学科的研究领域,涉及计算机科学、信息科学、学习科学、统计学以及心理学等相关学科。学习分析通过监测学生的学业表现来发现学生学习过程中的相关问题并进行及时干预。而学习分析的重要研究工具之一就是统计推断方法。教育数据挖掘更注重新的数据分析方法与模型,而学习分析则更强调利用已有的统计模型来回答影响学生学习的相关问题[24]。东北师范大学的研究者基于大数据学习分析将数据挖掘技术与统计推断技术相结合来分析在线学习行为,找出影响学生学习结果的预警因素,并建立相关的学习干预模型。同时,研究人员结合深度访谈与问卷调查来对模型的有效性进行验证。研究结果表明干预模型能够有效识别出有学习困难的学生,并能及时向学生发出预警信息以及提供个性化的干预措施[25]。

[1]胡弼成,王祖霖.“大数据”对教育的作用、挑战及教育变革趋势——大数据时代教育变革的最新研究进展综述[J].现代大学教育,2015,(4):98-104.

[2]杨子飞.“第三洞穴”与“数据主义”——论大数据社会科学的内在矛盾[J].自然辩证法研究,2016,(8):63-67.

[3]阎光才.教育及社会科学研究中的数据——兼议当前的大数据热潮[J].北京大学教育评论,2013,(4):77-86.

[4]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012,(9):8-15.

[5]FLORIDI L. Big data and their epistemological challenge[J].Philosophy&Technology,2012,(4):435-437.

[6]涂子沛.大数据[M].桂林:广西师范大学出版社,2012.

[7]戴潘.基于大数据的科学研究范式的哲学研究[J].哲学动态,2016,(9):105-109.

[8]官思发,孟玺,李宗洁,等.大数据分析研究现状,问题与对策[J].情报杂志,2015,(5):98-104.

[9]林聚任,刘玉安.社会科学研究方法[M].济南:山东人民出版社,2004.

[10]赖特·米尔斯.社会学的想象力[M].北京:生活·读书·新知三联书店,2010.

[11]YILMAZ K. Comparison of quantitative and qualitative research traditions: epistemological, theoretical, and methodological differences[J].EuropeanJournalofEducation,2013,(2):311-325.

[12]刘红,胡新和.数据革命:从数到大数据的历史考察[J].自然辩证法,2013,(6):33-39.

[13]李金昌.大数据与统计新思维[J].统计研究,2014,(1):10-17.

[14]蒋家河,陈振华.风险传播视角下对大数据的反思[J].青年记者,2016,(18):28-29.

[15]陈侃,周雅倩,丁妍,严文蕃,吕倩文.在线视频学习投入的研究——MOOCs视频特征和学生跳转行为的大数据分析[J].远程教育杂志,2016,(4):35-42.

[16]方环非.大数据:历史、范式与认识论伦理[J].浙江社会科学,2015,(9):113-120.

[17]韩炯.从计量史学迈向基于大数据计算思维的新历史学——对当代西方史学量化研究新发展的思考[J].史学理论研究,2016,(1):65-74.

[18]晋欣泉,王林丽,杨现民.基于大数据的在线学习情绪测量模型构建[J].现代教育技术,2016,(12):5-11.

[19]大数据非结构与半结构化[EB/OL].(2013-09-09)[2016-11-03].http://www.enkj.com/idcnews/Article/20130909/2447.

[20]陈志武.量化历史研究的过去与未来[J].清史研究,2016,(4):1-16.

[21]陈云松.大数据中的百年社会学——基于百万书籍的文化影响力研究[J].社会学研究,2015,(1):23-48.

[22]唐文方.大数据与小数据:社会科学研究方法的探讨[J].中山大学学报(社会科学版),2015,(6):141-146.

[23]陈云松,吴青熹,黄超.大数据何以重构社会科学[J].新疆师范大学学报(哲学社会科学版),2015,(3):54-61.

[24]张羽,李越.基于MOOCs大数据的学习分析和教育测量介绍[J].清华大学教育研究,2013,(4):22-26.

[25]赵慧琼,姜强,赵蔚,等.基于大数据学习分析的在线学习绩效预警因素及干预对策的实证研究[J].电化教育研究,2017,(1):62-69.

[责任编辑:罗银科]

Differences and Integration Between Big Data Analytics and Quantitative Research——Future Direction of Educational Quantitative Research3

WANG Ya-shuang1,JI Yan2

(1. Institute of Education, Nanjing University, Nanjing, Jiangsu 210093;2. Nursing School, Nanjing Medical University, Nanjing, Jiangsu 211166, China)

Big data analytics has great influences on social science research and has been gradually applied in educational research. However, there are some misunderstandings on big data analytics and quantitative research. Some researchers even think big data analytics is the same as quantitative research. This paper shows that big data analytics is different from the quantitative research in scientific research paradigm, the approach to data acquisition and data analysis method. But the study also shows that it’s possible for integrating the big data analytics and quantitative research in the future educational research. It is suggested that the research paradigm of knowledge-driven and the data-driven be unified, the structure and non-structure data, the cross-sectional and historical data be combined, and the data analysis method on statistical inference and data mining be integrated.

big data analytics; quantitative research; educational research; social science research

2017-02-08

江苏省教育科学“十二五”规划2015年重点资助课题“江苏省本科生学习投入度的实证研究”(B-a/2015/01/002)。

汪雅霜(1985—),男,湖南桃江人,教育学博士,南京大学教育研究院助理研究员,研究方向为教育测量与评价、定量研究方法; 嵇艳(1982—),女,江苏盐城人,教育学博士,南京医科大学护理学院讲师,研究方向为心理与教育测量、教育统计与评价。

G526.5

A

1000-5315(2017)04-0036-06

猜你喜欢

教育学范式分析
究教育学之理,解教育学之惑
——《教育学原理研究》评介
实践—反思教育学文丛
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
隐蔽失效适航要求符合性验证分析
孙惠芬乡土写作批评的六个范式
电力系统不平衡分析
管窥西方“诗辩”发展史的四次范式转换
韦钰:神经教育学与创新力培养
电力系统及其自动化发展趋势分析