大数据视角下问题青少年教育研究范式的创新
2017-03-29杨虎民苏春景
杨虎民,苏春景
(1.鲁东大学 教育科学学院,山东 烟台 264025;2.阜阳师范学院 教育学院,安徽 阜阳 236037)
大数据视角下问题青少年教育研究范式的创新
杨虎民1,2,苏春景1
(1.鲁东大学 教育科学学院,山东 烟台 264025;2.阜阳师范学院 教育学院,安徽 阜阳 236037)
目前,随着大数据时代的到来,对传统问题青少年研究提出了全新的机遇与挑战,它引发了问题青少年研究范式的转变与创新.大数据视域下问题青少年研究范式创新主要包括培育大数据思维方式,找出问题青少年教育研究的内在规律;构建供科学研究使用的问题青少年教育研究数据库,实现资源共享;推进问题青少年研究技术的革新,提高研究计算机与网络的智能化程度;大数据范式拓展与扩充问题青少年研究领域与研究内容;大数据范式在确立问题青少年研究理论框架和分析模型基础上,重视知识的原创性.同时,研究者要清醒的认识到,大数据背景下问题青少年研究容易侵犯问题青少年的隐私,这需要采取必要措施来预防.
大数据;问题青少年;研究范式
随着大数据时代的到来,它已给问题青少年教育研究与整个社会发展带来了全新的机遇与挑战.为了应对这种时代潮流,许多国家把对大数据研究与发展提升到了国家战略层面.本文主要探究了大数据时代背景下问题青少年教育矫正研究范式的转变与创新.
1 大数据时代科学研究的第四范式
大数据的内涵是什么?到目前为止,并没有统一的定义.美国麦肯锡全球研究认为大数据是指规模超出了典型的数据库软件工具的捕获、存储、管理和分析的能力的数据集[1];国际数据中心(IDC)在2011年的报告中把大数据定义为,大数据技术描述了一个技术和体系的新时代,被设计为从大规模、多样化的数据中通过高速捕获、发现和分析技术提取数据的价值[2].与传统数据相比,大数据显著特点表现为:数据规模与体量巨大(Volume)、数据种类多样(Variety)、数据生产与处理速度快(Velocity)、数据具有极大的潜在价值(Value).
在大数据时代,科学研究范式发生了革命性的变化,已由传统的知识驱动科学发展转变到由数据驱动科学发展轨迹中来.吉姆·格雷(Jim Gray)在2007年阐述了“指数级增长的科学数据”背景下数据密集型科学研究的第四范式[3],他认为科学研究范式经历了四种变化,具体包括:(1)实验科学范式.实验科学主要形式是经验主义,客观的描述自然现象并阐述其本质内涵;(2)理论科学范式.理论科学主要采用数学模型和归纳的方法来开展科学研究;(3)计算科学范式.计算科学主要采用模拟的方法来认识更为复杂的现象,以了解事物发展的规律;(4)数据密集型科学范式[4].数据密集型科学也就是格雷所说的科学研究的第四范式,或者被称为“大数据范式”,而且得到了学术界的认同.普林斯基(M.H.Prensky)与格雷的观点基本相同,他指出:“科学家不再必须做出受过良好训练的那种猜想,或者构想假设和模型,通过基于数据的实验和例子来验证它们.相反,他们能够为显示效果的模型采集完整的数据集,来产生科学结论,而无需更进一步的实验.”[5]科学研究第四范式主要形式是数据密集型和统计性探索,利用数据相关性可以找出事物背后隐藏的规律性,引导人们更为深刻的认识事物的发展与变化.吉姆?格雷所谓的范式是指一个时代科学研究的总体特征,这与科学哲学家托马斯?库恩(ThomasS.Kuhn)于1962年在《科学革命的结构》中提出的范式具有很大的差异.库恩认为:“范式有两种意义不同的使用方式.一方面,它代表着一个特定共同体的成员所共有的信念、价值、技术等构成的整体.另一方面,它指为着那个整体的一种元素.”[6]依据吉姆·格雷的自然科学研究范式:从定性研究—定量研究—模拟研究—第四范式,我们也可以认为社会科学研究范式也经历着与自然科学相同的范式,目前正处于崭新的第四范式阶段.
2 第四范式超越传统问题青少年教育研究范式的理论基础
问题青少年是指对家庭学校和社会生活适应不良,偏离或违背社会规范及违法犯罪的特殊群体,主要包括道德沦丧青少年、心理问题青少年和违法犯罪青少年[4].问题青少年教育研究包括预防教育和矫正干预,对正常青少年、虞犯青少年分别进行超前预防、临界预防,对违法犯罪青少年通过实施监禁矫正和非监禁矫正干预,使他们顺利回归社会生活.问题青少年教育矫正研究涉及了司法学、犯罪学、教育学和心理学等不同学科和领域,众多的研究者以各自所在领域的范式进行科学探究,但是传统研究方法已不能满足目前所面临的实际情况了,社会发展需要新的研究范式以应对这一迫切问题.作为科学研究第四范式的数据密集型科学,由于具有容错性、全量样本性和关联性特征,所以它能很好地解决传统定性和定量研究不能解决的复杂问题.具体表现如下:
2.1 注重科学研究的全样本性
传统问题青少年研究范式中,注重通过抽样来发现内在规律,研究水平高低依赖于样本数据大小.而大数据时代问题青少年研究不受样本的影响,因为随着储存和软硬件的经济性和工具的先进,海量数据的处理能力得到提升,数据挖掘算法不断改进与丰富,特别是统计分析和机器学习的神经网络建模技术发展,抽样并非是必要的手段和方法论[7].虽然问题青少年研究的相关数据规模之大、类型之多样化令人目不暇接,但是我们可以采用全体数据取代抽样样本的研究模式,通过处理和问题青少年相关的所有数据,就可以发现数据背后隐藏的内在规律.
2.2 重视科学研究的高效率
在传统的科学研究中,每条数据都包含该研究所需的信息,然后对信息进行归纳、抽象等处理,这使得研究的精确度得以确保.大数据时代,由于数据规模比较大、数据种类较多,因此,研究追求的不仅仅是精确度,也可以允许存在一些不太精确性和一定的误差[8].第四研究范式追求的不是精确性,而是高效性,不必担心单个数据对整体研究的影响.维克托迈尔?舍恩伯格说:对于这些纷繁复杂的数据,企图消耗高昂的成本消除所有的误差是得不偿失的,我们应该试着容许细微错误的存在.”“我们掌握的数据库越来越全面,它不再只包括我们手头现象的一点点可怜的数据,而是包括了与这些现象相关的大量甚至全部数据.我们不再需要那么多担心某个数据点对整套分析的不利影响.我们要做的就是要接受这么纷繁的数据并从中受益.”[9]
2.3 强调科学研究的关联效应
传统科学研究重在揭示自变量如何影响因变量的因果关系,而在大数据时代,科学研究重在于通过相关关系去发现事物的本质规律.所谓关联效应是指通过对信息数据的相关分析、联想分析和聚类分析,可以找出事物之间的内在联系.大数据的研究不同于传统逻辑推理研究,而是对数量巨大的数据做统计性的搜索、比较、聚类、分类等分析归纳[10].在大数据时代,不仅仅探求自变量影响因变量的因果关系,我们更要利用大数据的关联效应来揭示隐藏在社会中关于问题青少年丰富的、联系的、海量数据,然后通过统计方法分析数据中的关联性来寻找问题青少年教育发展中的规律性.正如维克托迈尔·舍恩伯格和肯尼思·库克耶所说:“我们不能再把精确性当成重心,我们需要接受混乱和错误的存在.我们应该侧重分析相关关系,而不再寻求每个预测背后的原因.”[11]
3 大数据时代问题青少年研究范式的创新表现
3.1 深度挖掘问题青少年公共数据资源,以提炼其内在规律
大数据时代的问题青少年研究,需要在科学理论基础上对运用多种方法获取的公共资源数据进行深度挖掘并进行准确的分析,使研究结论真正能为问题青少年研究提供坚实的理论基础.大数据包含着内容丰富的资料,亚历克斯·彭兰特曾指出:“大数据是社会科学的一座金矿.”[12]这座金山需要广大的问题青少年教育者去挖掘和开采,找到更多价值连城的宝物,就像维克托迈尔·舍恩伯格说的:“我们应该对数据进行更深度的探讨,从不同角度、更细致地观察和研究数据的方方面面.”[13]在大数据时代,对大多数问题青少年研究者而言,最为可行的办法并不是亲自去获取大数据,而是充分利用现有的大型数据库,要深度挖掘公共数据资源.这既有利于培育大数据思维方式,以便找出问题青少年教育研究的内在规律,也能根据规律为问题青少年问题解决对策提供理论依据.例如,通过问题青少年对网页浏览的时间、地点、对象等信息可以确定问题青少年的兴趣焦点与活动区域,进而及时掌握问题青少年的学习与生活轨迹,迅速把握其未来发展的动向并采取有效措施应对问题青少年发展中出现的问题,并依据大数据所隐藏的规律为问题青少年的教育矫正发展提供个性化的服务.
3.2 构建“问题青少年教育研究数据库”,实现资源共享
大数据时代,使问题青少年研究方法的改变与创新具备了可行性条件.研究者应该既要利用社会科学方法,又要利用自然科学方法全面收集问题青少年发展的数据资料,构建供科学研究使用的“问题青少年教育研究数据库”,实现资源共享,为问题青少年研究打下坚实的理论基础.在“问题青少年教育数据库”结构方面,软件采用Oracle或MYSQL等数据库平台,硬件采用采用一系列以“86”为结尾处理器作为CPU的服务器.在客户的使用端方面,采用Web化的B/S架构,简化了系统的开发、维护和使用.这保证了系统对数据输入、加工、储存、输出的安全性.在“问题青少年教育矫正数据库”的内容建设方面,既要包括问题青少年的品德、心理健康等方面的内容,又要包括问题青少年监禁矫正和社区矫正的内容.目前,我国正在实施国家大数据战略,其关键在于推进数据资源开放共享.推进大数据战略,并不需要政府花钱大量补贴和建立这一领域的新兴产业,只需加快政府数据开放共享,就能催生一个重要的新增长点——新型的服务业[14].因此,构建不同类型的问题青少年科研信息共享平台具有重要的战略意义.
3.3 推进问题青少年研究技术革新,提高研究的智能化程度
从技术来看,大数据时代问题青少年研究工作者正在由传统教育工作者向现代教育工作者转型,这促使计算机与网络智能化的进一步发展,同时也要求广大问题青少年研究者掌握计算机和网络知识以应对大数据时代的问题.大数据时代,问题青少年研究越来越需要利用信息化技术和智能化的技术来完成信息加工任务,需要利用传感技术敏锐的获取海量数据,需要利用通信技术来传递和交换信息数据,需要利用云计算从海量数据信息挖掘隐藏的科学规律.大数据时代的问题青少年研究内涵已经扩大,面对的是海量的问题青少年信息和数据.研究人员需要采集问题青少年的人口学信息、网络使用信息和同辈群体信息等,但是用传统的方法已经很难处理这些错综复杂和类型多样的信息,这就要求问题青少年研究工作者采用计算机智能化方式对海量信息资源进行自动化处理,充分挖掘这些数据和信息背后的规律,用超前的问题青少年教育信息服务国家问题青少年教育发展决策.
3.4 大数据范式拓展与扩充了问题青少年研究领域和内容
大数据时代,关于问题青少年研究内容正从活生生的现实世界转向虚拟的网络世界.通过大数据研究问题青少年,我们需要记录、分析、研究的数据范围在不断扩大,问题青少年研究涉及不同行业与领域,单一领域的数据已不再满足研究客观需要了.研究者应特别注意要把传统企业数据、机器和传感器数据、社交数据三种类型的大数据信息相互补充以获取问题青少年研究关注的主要内容.问题青少年在网络世界里可以利用虚拟的身份登录,可以隐瞒自己的姓名和性别等.人与人之间没有社会地位的差异,大家都是以平等的身份介入其中并自由、平等的进行交流.问题青少年利用网络浏览感兴趣的论坛与新闻;利用网络进行资金转账,满足自己的购物需求;利用电子信箱、聊天室等作为交流平台,可以没有后顾之忧地说出自己关于世界、他人和自己真实问题,也不必担心自己的隐私遭到泄露.这些信息有利于分析研究问题青少年网络世界的发展趋向,及时、准确的把握问题青少年内心动态与需要,做到有的放矢,从而提高问题青少年研究工作的针对性和准确性,这无疑在很大程度上拓展了问题青少年研究领域.
3.5 大数据范式在确立问题青少年教育研究模型基础上,重视知识的原创性
大数据既为问题青少年教育研究带来了崭新的视角,也为问题青少年教育研究提供了全新的数字化工具.随着社会科学和自然科学的迅速发展,已经形成了问题主导视角和发展主导视角的问题青少年教育研究理论,在此基础上,可以在综合利用信息技术、高级统计技术、认知神经科学和具身认知科学等基础上构建大数据的分析模型,形成具有中国特色的问题青少年教育研究范式.在确立问题青少年教育研究理论基础和分析模型基础上,要特别重视对知识的原创性贡献.长期以来,我国教育学、心理学、犯罪学和社会学等关于问题青少年研究的理论主要是来自于西方国家,要不就是探究在西方某个著名理论视域下的启示,要不就是重复或模仿国外的研究,几乎没有具有中国文化背景的成熟的、系统化的问题青少年教育研究理论,即使有学者提出过某个问题青少年研究理论,因为缺乏学术话语权和独创性,也很难被国际学术界广泛认可.因此,在大数据时代,不同学科背景的问题青少年研究者要群策群力,高度重视理论的原创性,在借鉴西方国家成熟理论和吸取我国优秀传统文化基础上,提出具有知识产权的中国特色问题青少年教育研究理论,为问题青少年研究做出应有的原创性贡献.
4 结语
大数据视域下科学研究范式完全不同于传统的科学研究范式,给问题青少年教育研究带来了极大的高效性和创新性,但是研究者也要防止大数据带来的严重挑战—侵犯问题青少年的隐私.美国科技研究教授希勒·杰瑟诺夫(Sheila Jasanoff)曾指出,大数据可以被视为一种财产、一种公共资源或一种个人身份信息的表达[15],这说明大数据的使用与个体的隐私、社会规则、社会伦理等密切相关.实质上,大数据本身并没有好坏之分,关键在于人们如何使用它.正如美国科技史学家梅尔文·克兰兹伯格(Melvin Kranzberg)提出的一个非常重要的观点:“技术既不是好的,也不是坏的,也不是中立的.”[16]如果大数据被应用于正确的领域,那么通过大数据技术分析出来的结果会促进科学研究与社会文明进步;反之,则会危害社会、国家和他人利益.
〔1〕McKinsey Global Institute.Big Data:The Next Frontier for Innovation,Competition,and Productivity[R].http://www.mckinsey.com/mgihttp://www.mckinsey.com/insights/business technology/ big_data_the_next_frontier_for_innovation.2015-06-28,1.
〔2〕Gantz,J.,& Reinsel,D.Extracting value from chaos[R].IDC iView,2011.1-12.
〔3〕亚历山大·斯扎莱,吉姆·格雷,刘超.指数级增长的科学数据[J].世界科学,2006(5):37-39.
〔4〕Tony Hey,Stewart Tansley,Kristin Tolle.The Fourth Paradigm:Data-Intensive Scientific Discovery[M].Washingtong D.C.:Microsoft Research Press,2009:xviii.
〔5〕Prensky M.H.,Sapiens Digital:From Digital Immigrants and Digital Natives to Digital Wisdom.[J].Innovate:Journal of Online Education,2009,Vol.5(3):1-9.
〔6〕托马斯·库恩.科学革命的结构(第四版)[M].北京:北京大学出版社,2012.147.
〔7〕沈洁,黄晓兰.大数据助力科学研究:挑战与创新[J].现代传媒(中国传媒大学学报),2013(8).
〔8〕冯文全,马星光,张倩.论我国教育研究范式的转变-基于大数据的视角[J].教育科学研究,2016(8):29-33.
〔9〕〔11〕〔13〕维克托迈尔·舍恩伯格,肯尼思·库克耶.大数据时代:生活工作与思维的大变革[M].杭州:浙江人民出版社,2013:15,29,56,81,921.
〔10〕李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域—大数据的研究现状与科学思考[J].中国科学学院院刊,2012(6):647-657.
〔12〕Alex Pentland.SocialPhysice:How Human Social Networks Spread Ideas[EB/OL].http://www.brookings.edu/~/media/events/2014/2/18 -social -physics/20140218_social_physics_transcript.pdf.2015-06-28.
〔14〕张新红.大数据时代三个“关键词”[N].经济日报,2016-09-22(014).
〔15〕Ray Ganong.Big Data vs Your Data[EB/OL].http://fotobounce.com/big-data-vs-your-data,2015-01-20.
〔16〕Melvin Kranzberg, Technology and History:“Kranzberg’s Laws”.Technology and Culture,1986,27(3):544-560.
B844.2
A
1673-260X(2017)09-0145-03
2017-06-08
山东省2015年度青少年规划重点课题:基于复原力提升的不同类型未成年犯罪的社会干预研究(SDYSA150205)