大数据时代思想政治教育研究范式转型的三重维度
2020-01-11宋林泽丁凯
宋林泽 丁凯
摘要:大数据时代的来临将对思想政治教育研究产生重要影响。大数据青睐全体样本、强调研究效率、注重相关关系,将进一步推动思想政治教育研究范式三个维度的转型:研究路径转型,“数据驱动”与“思辨研究”相结合形成新的知识发现模式;研究手段转型,大数据及其技术将成为思想政治教育规律发现的强大手段;研究功能转型,大数据的预测功能将和因果分析统一于思想政治教育实践。大数据也有其价值限度,思想政治教育研究范式转型须避免陷入“数据主义”陷阱、“技术主义”陷阱和“数据伦理”陷阱。
关键词:大数据;思想政治教育;研究范式;反思
中图分类号:G641 文獻标志码:A 文章编号:1001-862X(2020)06-0022-006
数据是国家基础性战略资源,是21世纪的“钻石矿”。党的十八届五中全会提出“实施国家大数据战略”,国务院印发的《促进大数据发展行动纲要》强调要发挥大数据对教育质量提升的支撑作用。就思想政治教育研究而言,大数据提供了一个新的境遇和背景,使得大规模教育数据的收集存储和挖掘分析成为可能。在这种情况下,如何应用大数据开展思想政治教育研究?大数据时代思想政治教育研究范式转型的方向哪里?大数据的价值限度在哪里?只有搞清楚上述问题,才能真正抓住大数据时代思想政治教育创新发展的重要机遇。
一、大数据时代思想政治教育研究范式
面临的困境与转型
虽然关于何为大数据还存在争议,但没人能否认大数据正在构建一个电子化的“数字世界”,并深刻影响着人类社会生活的方方面面。大数据及其技术还为科学研究提供新的视角和方法,从传统社会科学的“小数据辅助”向“大数据发现”转型过程中,大数据对社会科学研究产生了巨大影响。作为信息时代的生产要素,大数据为思想政治教育研究提供全新的视角。
(一)大数据的内涵及其对科学研究范式的影响
提到大数据,一般人想到的是它的数据规模大,而其真正价值在于数据种类的全。[1]大数据进入公众视野并产生广泛影响得益于《自然》杂志在2008年的“大数据专刊”。[2]究竟何为大数据,各方并没有达成统一共识,由于理解视角和关注点的差异,企业、政府、科研技术人员对大数据均有各自的界定。根据美国麦肯锡全球研究所的定义:“大数据是指规模超出典型的数据库软件工具的捕获、存储、管理和分析能力的数据集。”[3]
学术界关于范式的热议要归功于美国科学哲学家托马斯·库恩及其代表作《科学革命的结构》,有学者甚至指出“范式是半个世纪以来科学研究领域最重要的发现”[4]。关于范式的界定历来颇具争议,立足库恩在《科学革命的结构》中的论述,我们可以从两个层面来厘清范式的内涵。一方面,范式是指科学共同体的成员在信念、价值和技术等方面所构成的整体。另一方面,范式是指一定的模型和范例,即作为解答常规科学谜题的基础性参考。[5]
目前,应用大数据进行实证研究的学科主要集中于社会学、政治学、传播学、教育学等。例如,柳建坤等人使用谷歌图书的汉语书籍语料库,考察分析了1949—2008年中国公共话语中的社会分成关注度的变迁模式和影响机制。[6]陈云松等人使用新浪微博大数据分析网络舆情是否影响股市行情,其研究发现基于“利好”和“利空”生成的“微博信心指数”有助于预测“上证指数”。[7]吴青熹等人基于互联网搜索引擎和社交媒体数据分析我国城市的关注度,其研究发现城市的国际关注度并不取决于城市的经济发展水平,而主要受文化资本密集度影响。[8]总体来说,在中文文献中,基于大数据的社会科学实证研究才刚刚起步,但更为重要的是它冲击和挑战了传统社会科学研究的理念、方法、技术。大数据是基于社会计算、复杂网络分析等技术,为社会科学研究所开启的新的研究范式,对社会科学研究的转型和发展起着关键的促进作用。[9]
(二)大数据时代思想政治教育研究和实践面临的困境
思想政治教育的起点范畴是“思想与行为”,如何掌握人的思想和行为活动的基本规律是揭示思想政治教育规律的基础和前提。可问题在于“思想”并非是一种直观现象,对人的思想的研究只能依赖于一些间接因素,例如肢体动作、语言表达、行为轨迹等信息,而传统思想政治教育研究方法较为单一,主要依赖于思辨性分析,基于证据的实证研究明显不足,尤其是基于大规模数据收集和分析的研究更少,这难以适应大数据时代科学研究的客观要求。
以大学生思想政治教育为例,随着“智慧校园”、在线教育、网络课堂、社交媒体的兴起,网络空间日益成为大学生学习、生活、自我彰显与情绪表达的主要场域,各类网络平台和网络空间积累了海量的思想和行为数据,如何充分挖掘利用这些大数据,成为当下高校思想政治教育亟须面对的问题。例如,新冠疫情期间,全国各大高校普遍采取了在线教学的授课方式,如何通过教育教学大数据准确掌握学生在线学习过程中的焦虑与困惑?如何应用“智慧校园”中多元化的数据勾勒出“学生画像”,从而基于个性差异实施精准的思政教育?此外,微信、微博等社交软件已经成为当代大学生信息接收和观点表达的主要平台,如何分析其点赞、评论、分享等网络行为背后所表征的思想动态?面对上述新问题,传统思想政治教育研究范式要么是缺乏利用大规模数据的敏感性,要么是通过小规模的抽样数据得出一般性结论,而无论哪种情况都不利于思想政治教育科学化发展。
(三)大数据时代思想政治教育研究范式转型的优势与特征
思想政治教育研究的对象是人,而人具有主观能动性,这也是造成传统个案研究、抽样调查所得数据有误差的重要原因之一。在互联网和大数据技术出现以前,很难获得研究对象的总体数据,而从有限的经验事实和数据中抽象出关于研究对象的总体认识难免会造成偏差。大数据恰好在这方面具有显著优势,它可以对人的日常行为进行实时记录,可以排除访谈、问卷调查等方式带来的记忆误差和环境干扰,形成真实可靠的数据。海量、实时可得的“全样本”数据,使得很多研究领域从数据匮乏走向数据富集,从而实现对因果规律更全面、更接近真实的描述,呈现出传统研究范式无可比拟的优势。基于大数据的思想政治教育研究范式还表现出以下特征:
一是在研究对象上实现“样本=总体”。对于传统思想政治教育研究范式来说,获取数据的主要方式是对小群体进行抽样调查,而大数据获得的不是抽样数据而是总体数据。例如,疫情期间全国很多大学生通过“雨课堂”进行在线学习,所有的学习过程都可以转化为数据,所得到的总体就是在“雨课堂”学习行为的总体。当然,这个总体不是所有在线学习大学生的总体,我们谈及总体时,要具体看该数据代表的总体是什么。而作为总体的大数据不仅可以为抽样数据提供参考,同时也无须进行显著性检验,因为样本就是总体。
二是大数据提供“全景化”的研究视角。教育对象的思想政治状况会通过语言表达、行为习惯展现出来,但日常语言、行为轨迹所形成数据量较为庞大,在无法存储和分析的情况下,这些能够反映教育对象真实思想状况的数据往往处于一种“沉默状态”。而在大数据时代,沉默的数据将被激活,例如,人们通过社交软件发布的状态、分享的链接、点评的内容都可以被记录、存储、分析。随着数据量的更新和积累,这些数据就可以“全景化”地呈现教育对象的日常生活,包括其思想政治状况。
三是大数据促进思想政治教育向精准化发展。传统的思想政治教育决策建立在经验判断的基础上,具有一定的滞后性,教育供给方式表现为“大水漫灌”。在大数据时代,方方面面的数据能够全面反映教育对象的思想轨迹和真实需求,这为提升思想政治教育决策的精准性和科学性奠定了基础,可以实现“精准滴灌”式的教育供给。
可以说,技术的进步具有其辩证性,一方面大数据对传统研究范式提出了挑战,另一方面大数据也为传统研究范式转型提供了可能。因此,我们有必要探讨大数据时代思想政治教育研究范式转型的方向。
二、大数据时代思想政治教育研究范式
转型的三重维度
大数据时代,海量的数据规模和复杂的数据结构试图在生活世界和数据世界之间寻求链接和统一。生活世界的原生态样貌通过数据化的方式被收集存储,甚至像情感、情绪、态度等不可数字化的现象也可以在一定程度上通过侧重描述和解释的叙事被“数据化”。如维克托-迈克·舍恩伯格所说,大数据是“望远镜”和“显微镜”,能够让我们观测宇宙和微生物,通过收集和分析海量数据更好地理解世界。[10]正是在这个意义上,笔者试图从认识论和方法论的层面上,探讨大数据时代思想政治教育研究范式转型的三重维度。
(一)研究路径转型:“数据驱动”与“思辨研究”相结合的知识发现过程
数据驱动的知识发现过程依靠统计推理、数据挖掘、机器学习等手段,从大数据中提取、发现隐含在数据背后的知识。数据驱动的知识发现过程也被图灵奖获得者吉姆·格雷称为科学研究的“第四范式”,即数据密集型科学。[11]按照吉姆·格雷的划分,科学研究范式经历了以描述自然现象为主的实验科学阶段、以模型或归纳为主的理论科学阶段、以模拟复杂现象的计算科学阶段和以大数据为基础的数据密集型科学阶段。就社会科学研究而言也可以分为四种范式,即定性研究、定量研究、社会仿真研究和大数据驱动的研究。
相较于“数据驱动”而言,当前思想政治教育学科的主流研究范式可以称之为“思辨驱动”。思辨研究也称规范性研究或应然性研究,它主要通過逻辑推理、经验感受来建构思想政治教育的价值、理想、标准、目标等,并以此作为思想政治教育知识的来源。思辨研究为思想政治教育学科中各种基础性价值问题的探究做出了重大贡献。但思辨研究存在着一定的依赖特征,即它依赖于研究者自身的知识结构、思维框架、理性认识能力,这无形当中影响了学科知识的不断累积。
“数据驱动”能够揭示出潜在的、能被人理解的信息和知识。在这种意义上,“数据驱动”与“思辨驱动”相结合,有利于价值判断和事实判断的统一,有利于主观建构与实际问题、理论思辨与实务工作的统一。例如,很多研究者指出短视频的出现对主流价值观的传播产生消解作用,这样的结论更多停留在印象层面,判断也较为笼统。运用大数据技术,我们可以分析相关平台的短视频在用户中的传播情况,甚至通过点赞、关注、分享、评论等网络痕迹勾画出用户的“数据肖像”,为掌握用户主流价值观的认同情况提供经验基础。基于数据驱动的研究路径,不仅可以提出更宽广的问题域,还可以借助大数据的数据挖掘和分析能力为抽象思辨提供根据,从而使思想政治教育的理论建构更具说服力和科学性。
(二)研究手段转型:相关分析成为因果分析的强大手段
对因果关系的把握不仅是人们认识复杂世界的基本遵循,也是思想政治教育研究共同体在常规科学阶段所共同持有的基本范式。舍恩伯格对大数据中的相关分析给予了极高评价,并把识别因果关系看作是“自得其乐的幻想”。《大数据主义》一书也指出“极端的大数据主义者认为无须任何理论,单凭相关性就可以解决一切问题。”[12]大数据是否真的像以上观点所说的那样只要关注相关性就够了,对因果性的探寻只是一种“幻想”。笔者并不认同这样的观点,因为在思想政治教育研究范式中,学者们研究的焦点仍是对因果关系的探寻。相较于极端的大数据主义,笔者更倾向于“如何从相关关系中推断出因果关系,才是大数据真正的问题所在”。[13]
在社会科学研究中,探寻因果关系的最佳途径是进行可控的实验,但由于思想政治教育研究对象的特殊性,使得进行实验的可能性极为狭小。即使采用一些统计方法探寻因果关系和验证理论假设,其准确性也受到变量内生性、变量遗漏和样本代表性等问题的影响。而大数据的优势可以为规律研究提供经验支撑,大数据虽然不能直接显示因果关系,但海量数据反映出来的世界直观背后的复杂结构,却可以帮助人们在深度和广度上更好地认识世界。
在现有的研究成果中,大数据不仅可以用来分析相关关系,也可以用来探讨因果关系。2014年美国学者约翰·格林利用18世纪—21世纪,80个国家、2300次选举、79650个选区、410000场竞选活动的数据来探究选民规模与政党竞争力之间的因果关系。这项研究是典型的大数据研究,通过对样本总体进行一系列检验证明,发现选民规模与政党竞争力之间呈现正向的显著关系,在排除了影响政党竞争力的其他因素(如选民偏好、选区文化、候选人与选民关系等)干预效应模型中,上述研究结论仍旧成立。这与传统观点——选民规模与政党竞争力呈负相关关系相矛盾。网络大数据同样可以用来探寻因果关系,2012年拉塞尔·纽曼从传统媒体与社交媒体中选择了关注度最高的30个议题,包括经济、政治、外交、环境保护、社会保障、种族冲突六个方面。通过对13202条社交媒体的评论数据和5437条传统媒体的新闻报道进行格兰杰因果关系检验,其研究结果表明社交媒体在社会保障、种族冲突问题上存在支配作用,而在经济、政治、外交、环境保护等方面社交媒体和传统媒体均无法主导这些公共议题。[14]从这个意义上说,大数据及其技术应用不仅是一个计算工具,也是一种强大的分析手段,为我们探究因果关系提供了新的起点。
(三)研究功能转型:将预测与因果分析统一于思想政治教育实践
社会科学的研究目的包含三个方面:一是通过对历史的梳理来总结经验教训,二是通过对现实问题的研究来推动理论创新,三是通过对发展趋势的把握来进行预测。
“建立在相关关系分析法基础上的预测才是大数据的核心”[15],大数据的预测功能与社会科学的研究目标不谋而合。就思想政治教育而言,教育现象中蕴含的规律不同于机械运动规律,相较于可以用数学方法处理的科学,思想政治教育规律在知识的精确性方面略显不足。在前大数据时代,涉及教育对象思想和行为的数据过于庞杂,因此很难通过分析他们的生活习惯和语言表达来推断思想政治教育的实际效果,大数据技术的出现使得这一分析成为可能。例如,可以通过对大学生的上网记录、图书借阅、社交媒体表达等情况进行相关性分析,从而勾勒出其数据肖像,全面掌握其思想政治状况。此外,大数据要求相对宽松的容错率,与局限于精准小数据的研究相比,模糊化的数据分析更接近于真实世界的描绘。从理论的层面看,大数据提供的是一种基于“概率模式”和“概率网络”看待复杂世界的方法,通过对诸多要素的整体框架结构的分析,替代对随机活动偶然性的精准探寻,以实现对未来事件的概率性预测。从实际应用的层面看,大数据已经在多个研究领域进行预测并获得成功,这说明人的行为的可预测性比想象中的要强。[16]
当然,完全精准地描述教育对象的思想动态并准确预测其行为轨迹是不可能的,但对未来进行趋势性、概率性把握是可以实现的。这对思想政治教育危机预警和思想政治教育科学决策具有重要价值。
三、大数据对思想政治教育研究范式
转型的价值限度
自大数据科学受到关注以来,思想政治教育学界已经形成一股研究热潮,也涌现了一批研究成果。然而,在这股热潮的背后却需要对大数据及其技术应用进行一些冷思考。围绕大数据的争论从未停止,例如,技术至上主义和理性主义关于相关关系和因果关系的争论、数据主义与人文主义关于数据与人的主体价值的争论。对这些问题的剖析有助于进一步厘清大数据的价值限度,避免陷入大数据时代思想政治教育研究范式转型的“陷阱”。
(一)避免“数据主义”陷阱,重视大数据中人的主体价值
思想政治教育的宗旨是为了实现人的自由全面发展,“以人为本”的价值追求在大数据时代不应改变。而脱胎于大数据时代的“数据主义”却有可能“将人推到一边”,从以人为本走向以数据为本。[17]“数据主义”是指将一切均视为数据,并以数据为核心的世界观。尤其在大数据时代,可收集数据规模的扩大和数据挖掘分析能力的增强,使得“数据主义”成为一种新的世界观或宗教,尤瓦尔·赫拉利在《未来简史》中将这一现象称之为“人文主义的崩塌”。在数据主义的认知范式下,万物皆是数据,人也不例外。在高度“数据化”的世界中,人只不过是一种“算法”,一切事物皆可以转化为二进制的数据加以存储和分析,纷繁复杂的世界在数据化的过程中消灭了一切差别,只剩下数据与算法。
可问题在于作为思想政治教育对象的人是算法吗?“算法”一词源自计算机科学,是指一定情境下为了达到特定的目的而采取的步骤、方法和策略。“人是算法”会消解人与万物的差别。人既是社会历史建构的产物,也是自我建构的产物,不是在物质世界和经验情感世界,而是在意义世界上才能做出人与万物的根本区分。把人看成是算法,将人的一切都数据化,这不是在彰显人的主体地位,而是在消减人的存在和生活意义的价值维度。另外,技术不是外在于人的工具和手段,技术具有人的内在性。从现实的人出发,人具有实践能力,想要满足生活需要就必须从事实践活动,而技术正是在人的实践活动中产生的,它是内在于人的具有创造性的活动能力,离开人的价值属性就不可能真正地理解技术。因此,大数据时代思想政治教育研究范式转型不能背离实现人的自由全面发展这一宗旨,不能陷入“数据主义”陷阱而遮蔽人的主体价值。
(二)避免“技术主义”陷阱,重视数据背后的社会文化意义
科学规范的大数据研究范式,并非单单指一系列数据收集、挖掘和分析的程序和形式,规范固然重要,但形式化的要求必须为内容服务。思想政治教育研究中常常使用的各种概念,如思想道德、政治认同、态度观念等,在其作为可操作性定义被纳入具体分析之前,如果研究者脱离特定的社会历史条件和日常生活中的共在体验,就根本不可能形成有价值的数据。
思想政治教育研究中的數据可以分为两大类:一类是客观数据,例如教育对象的政治面貌、学历层次、学业成绩等。另一类是主观数据,例如,通过调查工具获得大学生对社会主义核心价值观认同的情况就属于该类型。不同于客观数据,对主观数据的分析和处理有其基本的预设,即主观数据虽然带有强烈的个性色彩,但当诸多个体信息汇聚的结果具有统计学意义上的显著性时,主观数据也能够反映现实世界,这一过程也被称为主观数据的客观化。主观数据由于具有强烈的个性色彩,因而更容易受到社会文化的影响,具有“情随境迁”的特点。换句话说,即便主观数据能够反映当下的现实世界,但它的适宜性也会受到特定情境的限制,脱离这种情境,主观数据就会发生改变,进一步影响理论的解释力。
因此,思想政治教育研究中的数据不是单纯的抽象符号,对于研究者而言,如果缺乏对数据背后特定历史和文化的深度理解,缺乏对人的情感和行为的深层体验,那么无论数据规模如何庞大、数据分析的逻辑如何严谨,其分析结果往往会显得武断和苍白。
(三)避免“数据伦理”陷阱,重视大数据中的隐私保护
对大数据的收集、挖掘、分析涉及诸多数据伦理问题,具体表现在:对个人的数据收集应该到哪个层面、各层次的研究主体使用数据的限度在哪里、对基于大数据分析的预测及干预到什么程度等。隐私信息的泄露和数据的滥用会威胁人与技术、人与数据的自由关系。从大数据研究范式来说,数据采集追求一种“全样本性”,也就是对信息的抓取要做到全覆盖。而出于对教育对象的保护,在信息抓取时只能选择其中的一部分,这就造成了教育对象完整数据的缺失,进而影响后续的数据分析和预测。不难发现,大数据所要求的数据完整性与隐私保护之间是存在矛盾的,其中有两个关键词:一是“开放”,另一个是“保护”。“开放”要求最大限度地扩展数字世界的空间,让信息与数据互联互通;“保护”则要求在数字世界中为人留下一片“私密空间”,为大数据的使用画上一道“红线”。笔者认为,想要解决这一矛盾,应当尽快建立和完善基于权利的数据伦理,即在数据收集和使用上坚持知情原则和最小原则。一言以蔽之,数据世界与现实世界应当奉行同样的价值理念:该开放的要最大限度地开放,该保护的必须严格加以保护。
参考文献:
[1]喻国明.大数据方法与新闻传播创新:从理论定义到操作路线[J].江淮论坛,2014,(4):5-7.
[2]陈云松.大数据何以重构社会科学[J].新疆师范大学学报,2015,(5):54-59.
(下转第57页)
(上接第26页)
[3]邓仲华.科学研究范式的演化——大数据时代科学研究第四范式[J].理论探索,2013,(4):19-23.
[4]胡新和.“范式”50年——重读库恩《科学革命的结构》[N].光明日报,2013-01-13(3).
[5][美]托马斯.库恩.科学革命的结构[M].金吾伦,译.北京:北京大学出版社,2012:147.
[6]柳建坤.公共话语中的社会分层关注度——基于书籍大数据的实证分析[J].社会学研究,2018,(4):191-215.
[7]陈云松.基于新浪微博大数据的ARDL模型边限分析[J].社会,2017,(2):51-73.
[8]吴青熹.我国城市国际关注度的总体结构与特征[J].南京大学学报,2015,(5):137-146.
[9]曾凡斌.大数据方法与传播学研究方法[J].湖南师范大学社会科学学报, 2018,(3):148-156.
[10][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,译.杭州:浙江人民出版社,2013:104.
[11]米加寧.第四研究范式:大数据驱动的社会科学研究转型[J].学海,2018,(8):11-16.
[12][美]史蒂夫·洛尔.大数据主义[M].胡小锐译.北京:中信出版社,2015:161.
[13]姜奇平.因果推断与大数据[J].互联网周刊,2014,(18):12-15.
[14]张文静.科学研究进入大数据时代[N].中国科学报,2014-07-11(3).
[15]刘宝存.大数据时代比较教育研究范式的转型[J].比较教育研究,2015,(10):1-5.
[16][美]帕特里克·塔克尔.赤裸裸的未来大数据时代:如何预见未来的生活和自己[M].马慧,译.南京:江苏凤凰文艺出版社,2014:30.
[17]高兆明.数据主义的人文批判[J].江苏社会科学,2018,(6):162-167.
(责任编辑 吴晓妹)
本刊网址·在线杂志:www.jhlt.net.cn
基金项目:国家社会科学基金一般项目“自媒体环境下高校思想政治教育话语创新研究”(17BKS134)
作者简介:宋林泽(1987—),辽宁本溪人,博士,北京邮电大学马克思主义学院讲师,主要研究方向:思想政治教育;丁凯(1977—),吉林省吉林市人,博士,中国人民大学继续教育学院院长,研究员,主要研究方向:教育管理、思想政治教育。