APP下载

数学问题提出能力的类别特征:基于潜剖面的分析

2022-02-18洪清玉康春花曾平飞

关键词:评分标准信度类别

洪清玉,康春花,曾平飞

(1.浙江师范大学心理学院,浙江 金华 321004;2.厦门市蔡林学校,福建 厦门 361000;3.浙江师范大学教师教育学院,浙江 金华 321004)

0 问题提出

20世纪80年代初,建构主义和以“问题解决”为核心的数学教育改革在美国迅速兴起,问题提出作为问题解决的一种有效手段,也因此成为西方国家数学研究者的关注对象[1].在数学核心素养的背景下,学生问题提出能力作为数学抽象素养的一种体现逐渐成为数学教育研究和实践领域的主要关注点之一[2],其中数学问题提出能力的评价及其应用是一个值得探究的重要议题.

纵观已有研究,研究者不仅从多角度阐释了学生提问能力的重要性[3-4],还从问题提出的概念、评价方式及学生数学问题提出能力的现状调查和影响因素等多方面进行了探讨[5].但已有测评工具绝大部分并未考虑问题的本质特征,测评指标的可量化程度不够,且测评指标赋权的主观性较大.基于已有研究存在的问题,近期研究者从“问题”和“数学问题”的本质特征出发,提出了数学问题提出能力的测评框架,量化测评指标,并采用层次分析法对各级指标进行科学赋权[6].该研究结果表明:验证性因子分析各项指标均较好(各拟合指标均高于0.9),所提出的模型具有较好的结构效度,各维度的内部信度也较高;最大特征根计算的一致性指标CI和一致性比CR表明:专家对于数学问题提出能力测评指标的赋权具有较高的一致性,且赋权结果具有良好的合理性和科学性[6].

但该研究只是对所提出的测评框架进行了验证(见图1),若要在实践中加以应用,则还需建构各级指标的评分标准,以及验证评分者使用此评分标准的一致性信度.为此,首先本文在图1测评框架的基础上建构各级指标的评分标准;其次请多名评分专家,利用此标准对学生问题提出的表现进行评定,应用多元概化理论分析专家评分的一致性信度,从而验证该评分标准的可行性;最后,利用图1测评框架和本文建构的评分标准,基于潜剖面分析对学生数学问题提出能力现状及类别特征进行探讨,为教学实践提出合理建议.

图1 数学问题提出能力的测评模型

1 数学问题提出能力测评的评分标准

按照图1,数学问题提出能力包括3个1级指标(问题的本质特征、问题的数学特征、问题的语言特征),每个1级指标又包括多个2级指标,评分标准的建构需要将2级指标具体化为可量化的判断标准.首先,在问题本质特征方面,其判断依据包括:1)已知条件合理性,即提出的数学问题对于已知条件的描述是清楚合理的;2)目标状态可解性,即提出的问题明确所要求解的内容,并且是能够实现的、可解答的[7];3)情境理解性,即提出的数学问题是符合题目给定的问题情境的[8].

其次,在问题数学特征方面,其判断依据包括:

1)问题数量,即通过学生所提出的合理、可解的数学问题数量来考察学生的问题提出能力[9-10];

2)问题类型,它在一定程度上体现了学生认知水平,即学生不仅能够提出常规型问题,还能提出非常规型问题[11];

3)问题表征,即学生需要根据所给的问题情境,在已有认知结构的基础上对问题情境进行理解和内化,发现问题空间从而形成问题图式,学生可通过数学语言、符号或图形进行表征[12];

4)问题结构,即提出的数学问题是否具有完整的结构[13];

5)隐含条件,即含有隐含信息的已知条件在认知加工过程中只有对信息进一步挖掘才能达到目标状态隐含条件[14].

最后,在问题语言特征方面,学生的语言表征能力对于学生所提出的数学问题是有一定影响的,其判断依据包括:

1)语言简洁性,即所提数学问题的语言表述应简洁易懂;

2)语言精确性,即所提数学问题的语言表述应准确完整;

3)语言逻辑性,即所提数学问题的语言表述应具有条理性和逻辑性[15-16].

2 数学问题提出能力评分标准的信度验证

2.1 研究目的

因为按照已有研究范式,学生在不同的问题情境下都可以提出多个问题,不同评分者对多个问题从多个角度进行评分,所以该数据结构是具有多重嵌套和交叉较为复杂的,本文采用多元概化分析来对评分者信度进行验证.

2.2 研究过程

该研究的具体过程是:1)在专家的指导下确定自由化的问题情境,并进行施测;2)根据施测结果,保留学生提出相对较多数学问题的问题情境,并进行正式施测;3)根据已有的评分标准,采用Epidata软件来评分;4)随机选取10名在校本科生及研究生,对小学五年级学生所提出的数学问题在不讨论的情况下边阅卷边录入数据,对所有学生提出的所有问题进行交叉评分;5)剔除无效数据,对数据进行清理,梳理数据格式,采用多元概化分析对该测评指标的评分者一致性信度进行验证.

2.3 研究方法

2.3.1 研究工具 1)小学生数学问题情境.研究选取了植树和修路这2个学生较为熟悉的重点应用题,并将它们作为问题提出的测试情境.2)数学问题提出能力的评分标准.

2.3.2 测量设计 对于数学问题提出能力的评分,由10名评分者从3个维度(问题本质特征、问题数学特征和问题语言特征)对175名学生所提问题进行评分.测量目标(p)是学生在3个维度上的表现;评分者(r)是评估的测量侧面.因此,采用多元概化分析对该测评工具的信度进行分析,它是有3个目标变量的单侧面完全交叉设计(p×r).本文通过问题本质特征、问题数学特征、问题语言特征分表来考察学生对于问题本质的理解、学生的数学素质及学生的语言表达能力.因此,本文将这视为3个分测验,将它们分别考察的能力视为在多元概化理论(MGT)中的3个变量,从而构成一个3维度p×r的MGT模型.

2.3.3 被试及评分者 选取福建省某小学五年级学生180名,收集有效学生所提数学问题175份,10名不同专业的在校大学生根据评分标准对测试结果进行交叉评分.

2.2.4 数据格式 本次测评结果数据构成一个175×30的矩阵,共5 250个元素(数据).每个元素,即每位评分者对每个学生在上述某一方面评出的一个分数,是原始评估值,未乘加权系数或作其他变换[17].图2为该批数据的数据格式.

图2 评估数据格式

2.3.5 数据处理 3维度MGT模型的数据分析应用Brennan编制的mGENOVA软件进行统计分析,通过保留数据的原有结构来对该测评指标的评分者一致性信度进行验证.

2.4 研究结果

2.4.1 MGT的G研究结果 根据研究设计,通过mGENOVA软件得到学生(p)、评分者(r)以及学生与评分者(p×r)之间交互效应在3个维度上的方差和协方差分量的估计矩阵(见表1).结果表明:方差分量最大的是问题的数学特征(558.481 4),最小的是问题本质特征(228.129 4).这说明在该评分标准中,问题数学特征的分量最大,其次是问题语言特征的分量,而问题本质特征的分量最小.学生在3个变量上的相关系数及协方差分量较大,这说明用问题的3个特征的得分来确定学生的数学问题提出能力的水平,其结果会比较一致.这样不仅可以从问题的本质特征、数学特征等各个方面分别做评价,还可以将各个方面的分数组合起来做整体性评估.反之,若协方差分量小,则不能用组合总分来做整体性评估.

表1 3维度模型G研究的方差与协方差分量

2.4.2 MGT的D研究结果 1)D研究的方差与协方差分量的估计.在D研究中的方差与协方差分量的估计是建立在G研究估计的方差与协方差矩阵的基础上,对于评分者侧面有10人的评价方案进行D研究.可以进一步估计被试在3个维度上的全域分数以及相应的误差估计的方差分量,进而估计概化系数与可靠性指数(见表2).结果表明:评分者效应(r)及学生与评分者的交互效应(p×r)的方差分量远小于学生(p)的方差分量,因此有理由相信本次评估的误差得到了较好的控制.

表2 评估的D研究方差与协方差分量的估计

2)各效应在3个变量上的G系数等指标.表3显示了被试全域分数在3个变量上的D研究方差分量,3个变量的全域分数的协方差都相对较大,这说明3个变量的相关程度较高,为3个变量得分的最后合成提供了坚实基础.此外,这3个变量的概化系数分别为0.981 2、0.971 0、0.971 2,可靠性指数分别为0.973 3、0.960 2、0.955 8,结果均较好.本测评工具全域总分的合成概化系数为0.990 4(见表4),相对误差较小(方差分量仅为0.302 0),这说明此次测试总体测量信度较高,评分者之间的一致性程度较高.

表3 被试全域分数在3维度上估计D研究方差分量值

表4 D研究合成全域分数的方差分量指标的估计

3 小学生数学问题提出能力的潜剖面分析

3.1 研究目的

研究有以下2个目的:1)通过测评框架和测评指标,采用潜剖面分析方法,直接利用量化的指标对学生数学问题提出能力进行评估和分类,对学生问题提出能力进行分类与解释;2)验证不同问题提出能力水平学生的数学成绩是否有差异.

3.2 研究思路

采用编制好的小学生数学问题提出情境,收集福建省某小学五年级学生270名,评分者为1名在校研究生.通过Mplus8.3和SPSS23.0软件进行LPA及后续分析,使用数学问题提出能力的3个子维度进行潜剖面分析,对不同数学问题提出能力水平学生进行分类.

3.3 研究结果

3.3.1 小学生数学问题提出能力潜剖面分析 潜剖面分析通常是基于多个指标的综合考虑来评价拟合模型的好坏,若一个模型具有更好的熵值,更低的AIC、BIC、aBIC,且达到显著性的LMR和BLRT,则这个模型的拟合程度越高[18].本文分别抽取了2~5个潜在类别模型,拟合结果如表5所示.随着分类类别数的增加,信息指数AIC、BIC和aBIC逐渐减小.结果表明当将学生的数学问题提出能力分为4个类别时熵值Entropy达到最大,信息指数AIC、BIC、aBIC达到最小,当分为4类时似然比检验LMR值达到显著的水平(p<0.01),而当分为5类时LMR 值不再显著.根据Entropy和AIC、BIC、aBIC可以得出,4个潜类别的模型明显优于5个潜类别的模型.

表5 小学生数学问题提出能力的潜在剖面分析(LPA)的各项指标比较

同时,在将学生分为3个类别时的各项指标也是符合分类标准的,且3类和4类的分类结果相差甚少,结果如表6所示.3类别的类别数分别为76、86、108,类别概率分别为32%、40%、28%;4类别的类别数分别为13、68、82、107,类别概率分别为30%、40%、5%、25%.对270名小学五年级学生数学问题提出情境的测验结果进行分类,结果表明当保留3个类别时LMR值也达到显著的水平,并且3类别模型轮廓较清晰,也符合潜在类别分析模型适宜性标准.此外,3类别与4类别的类别概率相差不大,4类的结果是将3类结果的第1类分为2类.综合考虑,根据拟合指数与理论建构,本文认为将小学生数学问题提出能力划分为3类别较合理.

表6 3类别与4类别的类别数及类别概率

小学生数学问题提出能力分类结果如图3所示,结果表明:潜剖面分析的结果将270名学生分为3类,其中A类为较好水平学生(76人),B类为中等水平学生(86人),C类为较差水平学生(108人).无论是哪一个类别的学生,其在3个维度上趋势都是一致的,均为本质特征>数学特征>语言特征,但3类学生的问题提出能力水平却差异明显.

图3 小学生数学问题提出能力的分类条形图

3.3.2 数学问题提出能力类别与数学成绩的关系 收集该批学生的数学成绩,除去未参与考试的学生的成绩,有效成绩为247份.其中数学问题提出表现优异的学生(A类)为70人,表现中等的学生(B类)为81人,水平较低的学生(C类)为96人;男生153人,女生94人;独生子女6人,非独生子女241人.为分析数学问题提出能力与数学成绩的关系,以数学问题提出能力类别为自变量,数学成绩为因变量进行方差分析.单因素方差分析结果如表7所示.p<0.05说明不同数学问题提出水平的学生在数学成绩方面存在显著差异.

表7 不同数学问题提出能力类别与数学成绩的方差分析

为更直观地描述问题提出能力类别与数学成绩的关系,根据学生的数学成绩,将数学成绩前27%的学生分成高分组,后27%的为低分组.不同数学成绩类别的学生在问题提出能力类别上的人数分布如图4所示.数学问题提出能力A类学生占高分组比例最大(50.0%),B类学生占中分组比例最大(44.4%),C类学生占高分组比例最少(16.7%),这也说明了不同问题提出能力的学生在数学成绩上的表现是存在一定差异的.

图4 不同数学问题提出能力类别的学生在数学成绩上的表现

合计的高分组的学生占全部的28.3%,而A类学生在高分组上的比例(50.0%)远高于合计中的比例,合计的低分组的占全部的27.1%,而C类学生在低分组上的比例(35.4%)远高于合计中的比例.这进一步说明了问题提出能力越高的学生的数学成绩往往越好.

研究结果表明:学生的数学成绩与问题提出能力类别存在显著性差异,不同数学问题提出能力水平的学生在数学成绩上的表现是有差异的.已有研究表明:学生的数学问题提出与其问题解决存在显著的正相关,这2种能力之间存在相互促进、相互制约的关系[19].

4 讨论与结论

4.1 数学问题提出能力测评工具的一致性

概化理论综合考虑了影响分数变异的绝大多数误差来源,首先是分解和计算测评误差,其次基于测评误差的分解算出估计的相对误差和绝对误差,并且能够反映在多种因素下(评分者、时间、测验等)对于测验分数影响程度的概化系数或可靠性指数[20].概化理论不仅能够深入评估各维度的信度和总信度,也能够有效衡量其他因素(如评分者人数、评分者的宽严标准)对其信度的影响,这对于教育的测量与评价具有较大的指导意义[20].本文评估的问题提出能力具有多个(3个)测评维度,因此适宜使用多元概化理论(MGT)进行信度评估,在大致保留原始信息的基础上所评估出的测评信度精确度更为准确.

在多元概化理论的G研究中,3个子维度的协方差分量较大,这表明了用问题的3个特征的得分来确定学生数学问题提出能力的水平结果会比较一致.这也进一步说明了测评维度对于评价问题提出能力的一致性程度.研究表明:本次能力评估不论是从各变量(问题本质特征、数学特征和语言特征)来看还是从整体来看都具有较高评估信度.综上所述,数学问题提出能力测评工具的信度较为良好,采用该测评指标对小学生的数学问题提出能力进行评估,评分结果受评分者主观因素的影响较小.

4.2 数学问题提出能力分类结果的合理性

本研究根据数学问题提出能力3个子维度的得分,采用潜在剖面分析(LPA)探索学生在数学问题提出能力上的潜在类别结构,结果表明3个和4个潜在类别的模型均符合测量学的指标[21].其中,3个类别模型的类别数分别为86、108、76,4个类别模型的类别数分别为82、107、13、68.由具体的类别数可以清楚地知晓,4个潜在类别模型是将3个潜在类别模型中的第3类再进行具体的细分.尽管4个潜在类别模型的LMR和BLRT远小于0.005,显著性更高,但其中分类数远小于30人.为了进一步验证分类结果的适宜性,本文对该批学生进行了判别性分析,分析结果与3个潜在类别模型几乎接近一致.因此,有理由相信3个潜在类别模型的分类结果更为合理.

不论是哪种数学问题提出能力类别的学生,其在3个测评维度上的趋势均是一致的,学生在本质特征上的表现均优于在数学特征上的表现优于在语言特征上的表现.A类学生无论是在本质特征、数学特征还是语言特征上的表现均优于B类学生和C类学生.总而言之,数学问题提出能力高的学生无论是在本质特征、数学特征还是语言特征上的表现都明显高于问题提出能力水平低的学生.因此,在教学中可以根据不同类别学生在不同维度上的表现进行有针对性地补偿性教学.

4.3 数学问题提出能力测评工具的适用性

如何充分运用已构建测评工具,以一种易操作可量化的方式运用于实际?已有研究通过问卷调查法、访谈法、改编已有测评工具或者是直接采用已有的测评工具对数学问题提出能力进行评估[22-25].已有研究对学生数学问题提出能力的现状阐述[26-27]大多数是研究者或教师的经验分类结果.

本文提出可量化的问题提出能力测评工具,从测评框架到测评指标到评分标准,再到评分标准运用在该能力维度上,直接明了且易操作地量化学生的数学问题提出能力、学生更具体的表现形式以及如何进一步探究不同学生的不同表现.利用完善的测评指标,采用潜在剖面分析的分类方法来对学生问题提出能力进行分类,了解了不同类别学生的人数及比例,探讨不同的能力类别与数学成绩间的关系,诊断其差异,对于补偿性教学和学生在问题提出能力方面认知结构的完善有着重要意义.从测评工具的构建到测评工具的应用,这对于基础教育质量的能力测评也起到一定的参考价值.

猜你喜欢

评分标准信度类别
基于DOPS评分表细化体格检查评分标准的应用研究*
《广东地区儿童中医体质辨识量表》的信度和效度研究
贵州省体育高考100米跑新评分标准制定研究
平衡损失函数下具有时间效应和通胀因子的信度估计
壮字喃字同形字的三种类别及简要分析
永远的格纹
初高中英语作文评分标准初探
服务类别
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
中文版脑性瘫痪儿童生活质量问卷的信度