探析深度学习表征的一种新方法:社会认知网络特征(SENS)*
2020-06-08徐浩鑫
冷 静 徐浩鑫
(1.华东师范大学 教育学部 教育信息技术学系;2.华东师范大学 上海数字化教育装备工程技术研究中心,上海200062)
一、引言
随着人工智能时代的到来,当今社会越来越需要具备跨界融合、创新能力的人才;而全球各国之间激烈的经济与科技竞争,对于强化智能基础教育的呼声也日益增高。 为了更好地培养智能时代的人才,必须改变传统的停留于浅表学习的教学模式, 采取能够促进学生积极参与解决复杂问题的教学模式。 深度学习强调对学生的高阶认知目标和高阶思维能力的培养[1],并注重学生的行为和情感等方面的投入,帮助学生构建复杂的认知结构,是一种主动且有意义的学习[2]。目前,对深度学习的效果研究大多是采用问卷或测试题的方式进行[3-4]。 这些评价方式往往都是结果性的测评,而非对过程进行分析[5]。 换句话说,这种测评是对深度学习的不同维度分别进行评价, 是一种“分散式”的测评。 然而,深度学习是一种强调综合性的学习方式,应该对各个维度进行综合考虑。 而如何对深度学习所关注的这些维度进行全面的、 综合的、动态的评估,仍是一个亟待解决的问题[6]。
为了更好地探寻深度学习表征的新路径,我们引入一种结合了定性和定量分析的新研究方法——社会认知网络特征(Social Epistemic Network Signature,SENS)。 首先,通过对相关研究的梳理,论证了SENS与深度学习的契合关系,接着,提出了SENS 在深度学习中的一般应用步骤,然后,通过两个案例对SENS的应用进行介绍,最后,给出使用SENS 的一些经验与建议。 在当今大数据背景下,依靠SENS 中的统计方法能够较好地对定量数据进行表征,发现有意义的深度学习模式,从而提供了一种新的途径来探析深度学习,并提供智能化的教学策略。
二、相关理论
(一)深度学习
随着知识经济和信息时代的飞速发展, 深度学习越来越受到国内外教育研究者的重视与关注[7-8]。Marton 等人早在1976 年就提出教育领域中深度学习的概念[9],他们根据学生的信息加工方式,指出学生的学习有深度学习和浅层学习之分。 2012 年,美国国家研究委员会(National Research Council,NRC)在对深度学习的定义中, 强调知识与技能的可迁移性,并将深度学习能力分成三个维度:认知领域、人际领域和个人领域[10]。 还有一些研究者开展了面向深度学习的项目, 旨在探究教学策略对深度学习的促进作用[11]。 此外,美国研究院进行了一个实验项目, 其研究目标是调查分析实验学校培养学生六种深度学习能力(包括掌握核心学科知识、批判性思维和复杂问题解决、团队协作、有效沟通、学会学习、学术毅力)的策略与途径,以及这些培养策略与途径所带来的学习结果[12]。 基于前人的研究,祝智庭等人将深度学习的六种能力分别对应到三大领域, 得到了如表1 所示的深度学习能力框架[13]。
表1 深度学习的能力框架
虽然现阶段我们对深度学习的定义和内涵,已经有了较为清晰的界定, 但对如何区分学生的认知深度,仍需要进一步探究。 例如,在进行深度学习的效果分析时,认知领域可使用PISA 测试评估学生的批判性思维和问题解决等能力, 使用英语语言艺术和数学测试(ELA)来评估学生的核心学科知识掌握情况;在人际和个人领域,可使用问卷调查的方式来获取关于人际和个人能力方面的数据[14]。 陈蓓蕾等人在探究促进大学生深度学习的研究中, 也采用了问卷和测试题的方式[15]。 这些评估方式固然能够在一定程度上对深度学习效果进行分析,但是,如何对深度学习的过程进行动态的捕捉及分析, 以及如何对深度学习的三个领域进行综合的评估与分析,仍需要进一步的研究。
(二)社会网络分析
为了探究深度学习的人际领域, 可使用社会网络分析(Social Network Analysis,SNA)的方法来进行挖掘。SNA 是对学习者之间关系的研究,是一种用来分析人际之间关系的理论和方法, 它强调人与人之间的普遍联系, 可以对个体或群体的社交特征进行分析。 它使用不同的特征值来评价在社会网络中的个体,如,点度中心度、接近中心度、中间中心度、特征向量中心度等[16]。 这些特征值,能够对各种社会关系进行精确的量化表征和分析,从而揭示其结构,并对其产生的各种现象进行更加深刻而具体的解释,能够反映出不同个体在同一个社会网络中的人际交流和沟通情况。有研究表明,SNA 的一些特征值与学习成绩、创新潜力和社群意识等结果正相关[17-18]。 此外,SNA 还可以识别出与社交网络其他部分相比具有更强联系的参与者群体, 这种对社会网络中的个体进行群体划分的方法,称之为社群识别。所识别出来的社群里的个体,通常具有相类似的特征,这将有助于我们深入了解网络形成的过程。因此,深度学习中的团队协作能力和人际沟通能力, 可以通过学习者在社会网络中的特征值进行分析。
虽然,SNA 能够对深度学习中的人际领域进行分析,但仅使用这一方法,并不能准确、清晰地对不同个体或群体进行定位。学习者在学习的过程中,其社会网络会受到共享的信息类型、 传播内容以及社会与认知过程激活等因素的影响[19]。 因此,在深度学习的研究中, 仅仅使用社会网络分析来研究交流与协作的模式是不够的, 还应该加上对于交互内容的分析。 缺乏内容的社交网络模型注定会失败,因为,群体互动从来都是和内容相关的[20]。
(三)认知网络分析
在深度学习的认知和个人领域, 可以使用认知网络分析(Epistemic Network Analysis,ENA)的方法来进行分析。 ENA 通过对话语数据进行定量分析,来描述个人或团体的认知框架模式[21]。 它是认知框架学习科学理论的“操作化”[22],着眼于复杂领域的专门知识,是知识、技能、价值和决策过程之间的连接网络。 ENA 利用了行为交互、通信、认知和其他相关的群体交互特征, 这些特征可以用在内容分析中使用的适当编码方案来表征。具体地说,认知网络是通过使用分配给协作节点的差异元素的编码来构造的,其中,网络的节点是编码本身。 节点之间的连接基于相关分析单元内的编码的共现关系而建立。ENA 通过节点间连接的强度和网络结构的变化,来表征特征要素的发展变化,如,高绩效团队与低绩效团队的认知网络差异, 或高绩效团队在不同时间的认知网络差异以及变化轨迹等。
虽然,ENA 提供了强大的机制来分析协作话语的相关特征之间的联系, 但其不能针对以下问题进行分析:对于学习者在活动中所扮演的角色、学习中形成的社会结构、学习过程中创建的子社群、合作者之间形成联系的原则等[23]。 然而,这些问题正是SNA可以进行分析的。因此,为了更好地对深度学习进行探究,我们需要结合SNA 和ENA,形成SENS 这样一种能够监控和支持深度学习评估的网络分析技术。 由此,既可以了解个体或群体的社会网络,对其人际领域进行分析; 也能够更好地追踪学习者的认知网络,对其认知和自我领域进行分析。
三、SENS 研究方法
SENS 最开始是由Dragan Gaševic'等人提出,用于对在线协作学习进行研究[24]。 它将现有的分析技术系统地结合起来,以解决学习分析过程中存在的问题。 具体来说,首先,SENS 对学习者的社会交互关系进行提取和建模,接着,利用该模型对学习者进行社群的划分,最后,利用认知网络分析不同社群的认知网络特征。 如,探究高绩效社群与低绩效社群的整体认知网络差异,并为低绩效社群进行相应的干预和反馈等。
图1 中展示了SENS 在深度学习中的一般应用步骤。 首先,深度学习的人际领域可以使用SNA 的方法进行分析,SNA 通过学习者之间的交互关系来构建社会网络, 用于分析学习者之间的人际交互关系[25],探究他们在深度学习过程中的协同和沟通。 接着, 对于深度学习的认知和自我领域, 可以使用ENA 的方法来分析,ENA 通过对协作的话语数据进行内容分析,从而动态地提取与认知、知识和能力相关的网络模型,并通过该模型,深度追踪和分析学生的认知架构、状态、联系和发展历程等内隐信息[26]。虽然这两种方法可以被用于对深度学习的分析,但它们的结合使用仍受到一些限制, 且尚未在网络分析方法的水平上被提出。SENS 正是这样一种新的结合了SNA 与ENA 的研究方法, 能够较好地对应深度学习的三个领域。 以在线学习平台上的深度学习分析为例,平台上记录了大量的学习行为数据,如,学习者信息、在线讨论数据、学习和认知过程等。 对应深度学习的三大领域, 表2 中列出了三个方面具体的数据选择和处理方法。
(一)数据获取
图1 SENS 在深度学习中的一般应用步骤
表2 深度学习三大领域及其对应的数据选择和处理方法
SENS 的第一步是进行数据的获取。 由于SENS需要进行内容分析和社会网络分析,所以,必须在获取数据的同时,得到学习者在学习活动中的话语数据和交互关系。 话语数据一般是指学习者的交流文本、语音或者视频,即记录了学习者交流内容的数据,这些数据能够反映学习者的认知、知识和自我等方面的信息。 交互关系是指学生在交流沟通过程中的信息流向,如,学习者A 与学习者B 之间的一次对话, 或者学习者A 对学习者B 的一次回帖,这些交互信息需要被记录下来以用于后面的社会网络分析。 另外,SENS 需要尽可能地获取到与学习者相关的其他信息,比如,学业成绩、学习背景、学习意图以及性别、年龄等人口统计数据,以便对学习者进行更加深入细致的分析。 如,使用这些数据进行更加精确的社群识别,或分析在学习过程中不同学习背景、不同年龄段或不同性别在深度学习各个领域的差异等。
(二)社会关系提取
SENS 的第二步是进行社会关系的提取。为了研究学习者在深度学习活动中扮演的角色以及形成的社群, 需要提取一个有向加权图来表示在讨论过程中所发生的交互。具体来说,如果在给定的讨论数据中,学习者A 回复了学习者B 发布的消息,那么,将会有一个定向边A->B;同理,如果学习者C 回复了学习者A 的消息,也会有一个定向边C->A;若是学习者A 再次回复了学习者B 的消息, 那么A->B 这条边的权重增加1。 按照此方式,可以对所有学习者的话语数据进行社会关系的提取。
(三)社会网络的构建
SENS 的第三步是社会网络的构建。在提取完社会关系之后,需要构建社会网络图,然后,利用其进行社群识别。 社群识别是指利用某种方法将网络划分成内部联系紧密、相互之间联系稀疏的簇,每一个簇即代表一个社群,在同一个社群的成员,往往具备某些相似的特征。 常用的社群识别算法有Kernighan-Lin 算法、GN 算法、主题模型PLSA、Sim-Rank 算法、RankClus 算法、NetClus 算法以及Louvain 算法等。不同的算法各有优劣,在使用时可根据需求进行选择。 在使用SENS 方法时,可以将一个社群当作一个分析单元, 比较不同社群之间的差异和特点, 以充分反映不同社群群体在深度学习过程中认知、知识和能力的发展情况。
此外,不同的SNA 度量可用于研究学习者在网络和社群中所扮演的角色。 这些度量可以体现网络结构中心性的各个方面,如,加权度中心度、接近中心度、中介中心度和特征向量中心度等。加权度中心度是节点在网络中所具有的边的权重; 接近中心度解释了节点控制网络中通信的可能性, 测量给定节点到网络中所有其他节点的距离, 也就是说它能够度量节点与网络中其他节点连接的可能性; 中介中心度也与控制通信有关, 它计算经过一个点的最短路径的数量,该数量越多,就说明它的中介中心度越高; 特征向量中心度根据该节点相邻点的重要性来衡量该点的价值,也就是说,如果与该节点连接的节点越重要,则该节点也越重要。通过研究深度学习中的学习者在社会网络中所扮演的角色, 能够分析其人际领域的交流和沟通能力。
(四)内容分析
SENS 的第四步是进行内容分析。内容分析主要是分析学习者在学习过程中产生的讨论记录的常用技术。话语数据是一个丰富的协作信息来源,是关于学生参与的认知、元认知、动机和情感方面的数据,是除了自我报告之外,最全面的数据来源。 因此,使用内容分析可以很好地研究学习者在深度学习过程中的认知和个人领域的能力。 内容分析主要使用一种编码方案对话语数据进行编码, 这套编码方案可以是常用的,也可以是最近提出的。而编码的方式可以采用人工的方式进行, 也可以是基于现有的编码方案采用自动的方式进行。 如,在数据量较少时,可以采用人工编码的方式进行,以确保编码的信度与效度;而在数据量较大时,则可以使用机器学习的方法进行自动编码[27]。
(五)认知网络的构建
SENS 的第五步是进行认知网络的构建。 根据SNA 识别所得到的社群, 可以将其按照目标特征的不同,划分到不同的组别,再根据不同的组别将编码好的数据进行划分,最后利用ENA,生成不同社群的认知网络图, 并比较不同社群的认知网络的特点与差异,进而给出相应的反馈建议。 国内关于ENA具体的理论、步骤和方法已有较为详细的介绍,其编码的一般步骤,如图2 所示[28-29]。
图2 ENA 编码与建模的一般步骤
(六)社会认知网络特征
在完成上述的步骤之后,还可以基于ENA 产生的SVD 值进行聚类分析,根据聚类的结果,检测之前的社群划分是否正确,通过这样反复验证的方式,能使研究更有说服力。 总的来说,SENS 从话语数据中进行内容分析和社会关系提取, 在执行SNA 之前,会先基于社会关系创建一个社会网络,以识别学习者扮演的角色和社群,在应用ENA 之前,对话语数据进行内容分析,最后,根据SNA 和ENA 两种分析方法的结果,对深度学习进行探究。为了更好地对SENS 进行介绍,我们将会通过两个实际的案例,来阐释该方法是如何在具体的研究中应用的。
四、案例分析
我们将通过两个案例来介绍SENS 在在线学习中探究深度学习的应用。 案例一关注了一门大规模开放网络课程(简称MOOC),通过分析在线协作数据,来解释形成的社会联系的协作过程,以及描述学习者高分组和低分组之间的差异[30];案例二通过使用SENS 的方法,对在线学习论坛的数据进行分析,并对学习者的批判性思维进行深层次的研究, 以探究学习者的批判性思维发展轨迹[31]。
(一)SENS 用于网络课程的深度学习分析
案例一数据来自Coursera 平台上的MOOC 课程“Critical Thinking in Global Challenges”的论坛讨论数据, 通过该课程论坛共收集了1989 名学生的6158(M=3.10,SD=7.07)条帖子。此外,还收集了学生的最终课程成绩(即是否获得证书)、人口统计等数据。 首先,使用SNA 方法提取了所有学生的社会关系,并构建了社会网络;接着,在包含了该网络79%的节点和99%的边的最大连接组件上执行Louvain方法,共识别出19 个社群;最后,在分析了每个社群在年龄、性别、学术背景、学习意图和最终课程成绩等方面的差异后, 发现不同社群之间在平均最终课程成绩上的差异是最明显的(见图3)。其中,社群3、11、17 的平均成绩最高,而社群6、8、12 的平均成绩最低,因此可以分别得到高分组和低分组。
图3 所有社群的平均成绩
为了研究学习者在网络和社区中所扮演的角色,本案例获取了常用的SNA 度量——加权度中心度、中介中心度和接近中心度,这些度量表征了网络结构中心性的各个方面。 表3 为高分组和低分组中每个社群的网络中心性度量的描述性统计数据。
表3 高分组和低分组的网络中心性度量的描述性统计数据
在进行ENA 之前,本案例使用了自然语言处理中的LDA 方法, 对所有话语数据进行了主题的提取, 共得到12 个主题 (包括与课程内容相关的主题),如,能源(c.Energy)、人口(c.Population)、疾病(c.Diseases)和批判性思维(c.Critical_thinking)等,以及与课程过程相关的主题,如,课程期望(p.Course_expectations) 和课程相关兴趣(p.Course_related_interests)等,每一条帖子都被编码为这12 个主题中的一个或多个。 在进行ENA 时,本案例使用三个帖子为移动窗口构建连接矩阵, 以高分组和低分组为分析单元,进行认知网络的构建,结果如图4 所示,其中,浅色代表高分组,深色代表低分组。
图4 高分组和低分组的认知网络质心图
由图4 可知, 高分组的认知网络与低分组的认知网络,在统计上具有显著差异(t(26)=-2.052,p=.045,cohen’s d=-0.55),这表明高分组与低分组的学习者在讨论过程中的认知网络结构是存在差异的,这些差异,可以通过两者的认知网络图来具体分析。
图5 高分组和低分组的认知网络图
图5a 为高分组的认知网络图,从图中我们可以看出高分组的学生更关注课程过程, 他们在过程相关的主题(课程期望与课程相关兴趣)之间,建立的联系比内容相关主题之间的联系多。图5c 显示了低分组的认知网络, 可以看出低分组的学生在内容相关的主题之间建立了更多的联系。图5b 是两个社群之间的认知网络叠减图, 通过对比两组主题间的连接可以发现,虽然学习者都在课程相关兴趣、课程期望、人性挑战和批判性思维等主题上有连接,但高分组学习者比低分组学习者在这些主题之间的联系更加紧密。
通过本案例我们可以发现,SENS 能够被较好地运用于对MOOC 的深度学习分析。 首先, 可以通过SNA 对学生进行社群划分, 这些社群的划分由学习者之间的人际关系决定。个人的沟通能力和交际技能可以通过SNA 的属性得到反映, 体现了深度学习的人际领域; 通过自然语言处理的方式进行主题的提取,使得大量的话语数据可以自动编码,再使用ENA能进一步对高分组和低分组在认知和个人领域的差异进行分析。
(二)SENS 用于探究思维发展路径的分析
案例二主要围绕大学生的思维发展轨迹来展开研究。 来自华东地区一所大学的教育技术专业的27名学生参与了专业课《教学系统设计》的学习。 在为期一学期的学习里,他们需要通过在线协作,共同完成一个教学设计项目。项目分为三个阶段,每个阶段对应着不同的任务,且从第一阶段(P1)到第三阶段(P3)逐步深入。在学期开始之前,所有学生都填写了批判性思维技能和倾向两份问卷。
在学期结束之后,首先,在线论坛上共收集到帖子数据809 条,每条数据包括学生ID、发帖时间、发帖内容和父级帖子ID 等字段。 之后,由两名研究人员对所有的帖子内容进行编码, 他们编码的一致性系数α=0.932。 所采用的批判性思维模型编码模式,将批判性分为五个阶段:识别/理解/分析/评估/创造,编码分别为R/U/A/E/C[32]。 接着,使用SNA 的方法构建了所有学生的社会网络, 结合社群识别方法和学生批判性思维问卷得分得到两个社群, 分别为高分组和低分组。通过对编码数据进行量化分析,获得了两组学生的批判性思维认知网络图 (如图6 所示),及其在不同阶段中认知网络质心的变化轨迹图 (如图7 所示)。 在这一案例中,认知和自我领域体现为学生的批判性思维能力, 既包括问卷测出的批判性思维技能以及批判性思维倾向(自我领域),也包括讨论中体现的在线批判性思考行为(认知领域)。
图6 高分组和低分组的批判性思维认知网络图
图6b 为高分组和低分组的认知网络叠减图。图中颜色代表的含义是, 如果高分组在某两个编码之间的连接强度大于低分组, 则连接这两个编码的边即为浅色,反之为深色。 从图中我们可以看出,高分组和低分组的认知网络结构图存在明显差异, 且在C-A(创造—分析)和R-U(识别—理解)的连接上,高分组明显强于低分组,而低分组在U-A(理解—分析)的连接上则强于高分组。 在图6a 所示的高分组中, 各个编码之间都存在较为强的连接, 而通过图6c 可以发现,低分组仅在E-A、A-U 和U-E 上有较强的连接, 这揭示了高分组和低分组在运用批判性思维时的整体差异。
图7 所示是高分组和低分组在不同阶段的认知网络质心的变化轨迹图。 从图7a 中我们可以发现,高分组在三个阶段(P1、P2、P3)的认知网络质心是有显著差异的,且具有一定的轨迹(如箭头所示)。这表明高分组在三个阶段运用批判性思维时各有偏重,每个阶段使用了不同的批判性思维元素。由图7b 可知,低分组在三个阶段的质心较为集中,且彼此没有显著差异, 这表明低分组在不同阶段运用的批判性思维元素类似。 案例二中使用了SENS 对学生的批判性思维在线学生行为进行分析,结果表明:高分组和低分组之间的批判性思维认知网络存在显著差异,且高分组的批判性思维认知网络图中的节点间,存在更多的联系和互动,在不同阶段有不同的侧重;而低分组的认知网络图节点之间的联系与互动相对简单,且在不同阶段没有差异。
图7 高分组和低分组在不同阶段的认知网络质心的变化轨迹图
五、经验与建议
结合上述案例应用中发现的问题,我们对SENS方法的使用从适用范围、 技术实现和数据处理等不同方面,给出一些经验与建议。
(一)适用范围
SENS 适用于对深度学习的研究,它具备以下三种特征:一是适合对质性数据进行量化处理;二是适合对学习者的社会交互进行分析; 三是适合对学习者的认知发展轨迹进行分析。 在使用SENS 的研究中,可以利用SNA 来构建在线交互中学习者之间的关系,ENA 则可以对已编码的文本进行量化分析,是对社会交互和认知发展做出解释的研究, 适合对深度学习的各种研究进行分析。
(二)技术实现
SENS 的技术实现难度较大, 需要研究人员对SNA 和ENA 两种方法都有一定的了解,才能正确完整地使用SENS。 在国内关于SNA 的研究已有很多,SNA 的实现可以通过R 语言或Python 语言等编程的方式进行,二者都有功能较为完善的库资源,可以帮助研究者进行SNA 的研究, 如,R 的igraph 库和Python 的NetworkX 等。 除此之外,还有很多较成熟的桌面软件可以使用,如,UCINET 使研究者不用考虑编程的细节,只需对结果进行解释即可。 ENA 也支持使用R 语言进行实现,同时它还有一个网络版本,研究者只需将编码好的数据上传到ENA Webkit(http://www.epistemicnetwork.org/), 设 置 好 相 关 参数,即可生成想要的社会网络认知图,并通过可视化的方式,动态地对网络进行调节。
(三)数据处理
SENS 的步骤与流程较为繁琐,且对数据的收集与处理有一定的要求。 因此,在使用SENS 之前,要确保能够准确地收集相关数据。 SNA 处理的是学习者之间的交互关系,而ENA 处理的是编码与编码之间的共现关系, 所以, 在数据处理时都有不同的要求。 用于SNA 的原始数据可以只包括学习者的交互关系,而不用记录具体的交互内容;用于ENA 的原始数据,要包括学习者的交互内容以及交互的单元,但可以不包括学习者之间的交互关系。 但SENS 是结合了这两种方法进行构建的,所以,在获取原始数据时,一定要包括交互关系和交互内容,否则,SENS就无法实现。
六、总结与展望
SENS 通过将SNA 与ENA 方法进行结合,使得在深度学习的过程中协作话语数据和人际交互信息,可以在本质上被建模为网络。人际交互表现为信息共享和知识建构的网络结构, 而从话语数据中提取的如认知、元认知、社会和情感等维度信息,可以通过认知网络结构来表征。 这些信息并非孤立地发生,而是彼此间共同影响和关联的。 SENS 可以将深度学习描述为人际因素和从话语中提取的因素的相互作用。
我们将深度学习的三大领域与SENS 方法的特点相结合,提出使用SENS 的一般步骤,并进行两个案例的展示,最后给出了使用SENS 的相关经验与建议, 为今后想要使用该方法的研究者提供帮助和指导。 需要指出的是,SENS 方法的核心是基于来自不同学科的几种数据分析方法,因此,使用SENS 需要有相关的技能才能进行,在技术实现上难度较大。 未来,我们可以搭建一个统一的在线平台,以支持使用SNA 的社会关系提取、 话语数据的自动编码或人工编码以及认知网络构建等功能。 这样,研究者们可以更加方便快捷地使用SENS 来分析深度学习,而不用过多地关注一些复杂的底层算法, 这也是本研究下一步需要努力的方向。