“过分自信”效应：中学生考试成绩的自我预估

2013-09-25钟毅平易文婷

湖南师范大学教育科学学报 2013年5期

钟毅平，易文婷

（湖南师范大学教育科学学院，湖南长沙 410081）

一、问题提出

人类的认知机制是有效而且富于适应性的，但是也经常犯错误。当个体对客观事物进行判断时常常会出错，过分自信（overconfidence）就是这种现象之一。以往的实证研究已证实人们通常对自己的特质、能力会表现得过分自信。“过分自信”现象最早在美国和欧洲引起研究者的重视，多采用二择一的常识问题进行测量。研究者从两种不同的角度对过分自信进行定义，第一种定义认为过度自信是个体高估自身实际能力、表现、对事件控制水平以及成功几率的一种认知偏差，研究者称之为过高估计（overestimation，OE）。例如，人们常常过高估计自己完成工作的速度［1］；人们时常过高估计自己对事件的控制能力［2］。第二种定义认为过度自信是个体认为自身（能力等）要高于其他人的一种倾向，即过高定位（overplacement，OP），部分研究者习惯上把这种过高定位现象称之为“优于平均”效应（better-than-average effect，BTA）。例如，大学生们认为自己拥有比其他学生更多的优秀特质（Alicke，1985）［3］，88%的人都说自己的驾驶技术要在平均水平之上，而很少有人说自己比平均水平差（Svenson，1981）［4］。总的来说，过度高估是个体在评价自身绝对能力时所表现出的过度自信，而过高定位则是个体在评价自身相对能力时所表现出的一种过度自信。

那么，是否所有人对自身能力的估计均会出现过分自信呢？Kruger和Dunning（1999）的研究表明，并非所有人都会表现出过分自信的自我评估，通常低于中值成绩水平的学生会显著高估自己的得分和排名位置，而高分学生则较为谦虚，他们将此现象称为“不对称偏差”［5］。部分学者将低分学生的过分自信归因于元认知技能和区分正误能力的缺乏，提出“无技能—无意识”假设［5］。部分学者认为过分自信是由随机误差和不可靠的测量手段造成的一种回归效应［6］。Miller和Geraci（2011）则增加了对信心指数的考察来说明低分学生虽不具备表现好的能力，但并非对自己“无技能”完全无意识［7］。早期也有研究者用自我提升的动机来解释过高定位，认为：人们乐意用积极的眼光和角度去看待自己［8］。上述学者观点要么无差别地探讨了过分自信的原因，要么集中于对低分者的过分自信进行分析，而对高分者的“自谦”却有所忽略。那么究竟什么原因促使高分被试出现自谦的成绩预估呢？

再者，上述“不对称偏差”研究以西方文化为背景，部分学者如Heine等人认为东亚人没有优于平均效应［9］。行为决策领域的研究表明华人在过分自信的表现与传统的“中庸”、“谦逊”刻板形象大相径庭，亚洲人在常识问题中表现出的“过分自信”更甚于欧洲人［10］。面对这些结论不一的研究结果，我们不禁猜想，中国高中生对自己实际考试成绩的预估是否也会产生类似于国外的“不对称偏差”呢？“考试”作为中国学生学习生活必不可少的部分，是学生们了解自我学习能力的一种方式，学生们参加过多次考试，并通过考试成绩的反馈增进对自身能力的了解，从而为后续学习计划的调整和学业目标的设定提供参照，所以准确的成绩预估对其学业目标的实现至关重要。

研究采用高三年级的学生为对象，他们在平时的学习中已经历过大量的考试，获得了相当多的成绩反馈，比高中其他年纪的学生更能精确地预估自身的考试成绩；并且预估项目也是其非常熟悉的领域，在这样的情况下，不对称偏差出现的可能性理应较小。研究结合差异分数、差异百分等级、信心指数及估计百分等级多个指标，来考察“不对称误差”现象是否存在跨文化的一致性和跨考试的稳定性：用实际分数和估计分数之间的差异分数来考察实际成绩的高估或低估；用实际百分等级与估计百分等级之间的差异分数来考察排名位置的高估或低估；用信心指数再次考察所有学生的信心水平；用估计百分等级来考察是否出现整体的优于平均效应。

二、实验一

1.目的与假设

（1）目的考察高三学生学科考试成绩预估是否会出现“不对称误差”。

（2）假设得分较低的学生倾向于高估自己的学科成绩及在全年级的排名情况，而得分较高的学生却出现低估的趋势；超过50%的学生百分等级预估等于或高于50，表现出整体的优于平均效应。

2.方法

（1）对象以湖南省某市高三学生为研究对象，随机选取4个班186名学生为被试，其中文科班学生84人（男生21人，女生63人），理科班学生102人（男生65人，女生37人）；年龄在17～19周岁（M=17.8，SD=0.75）。

（2）材料自编期末考试成绩预估调查问卷

（3）程序表达知情同意后，从湖南省某市高三年级随机抽取4个班的学生作为对象，对愿意参加本研究的学生团体施测。研究在全市统一期末考试的前一周进行，告知所有自愿参与的学生，他们需要对即将到来的期末考试中语文和数学的成绩尽可能准确地预测。首先，要求学生预估自己期末考试的语文、数学的实际得分，单科满分为150分；其次，预估自己每科成绩相对于同年级其他学生所处的百分等级，在百分量表上标明，范围由0（我的排名处于末位）到50（我比一半的其他学生好或者差）到100（我的排名处于首位）；最后，在7点量表上标明对自己这两项估计的信心指数（1=完全无信心，7=非常有信心）。

问卷回收，剔除无效问卷，使用Excel和SPSS录入，采用SPSS16.0进行数据处理。

3.结果

按照语文、数学实际得分将学生分为4组，学生得分类型（底部、第二、第三、顶部四分位数）、学科划分（文科、理科）和性别（男、女）为自变量，进行4（得分类型）×2（学科划分）×2（性别）三因素方差分析。差异分数、差异百分等级为正则为高估，为负则为低估。

（1）语文三项交互作用和两两交互作用均不显著。各四分位数学生对语文考试的各项估计评定分数见表1。

各四分位数学生的差异分数主效应显著，F（3，170）=28.31，p＜0.001，ŋp2=0.333。底部四分位数学生高估实际成绩，其他四分位数学生出现实际分数的整体低估，以顶部四分位数学生（高分学生）出现最多的低估；差异百分等级主效应显著，F（3，170）=68.35，p＜0.001，ŋp2=0.547。底部、第二四分位数学生出现高估排名情况（相对位置）的现象，第三、顶部四分位数学生则低估了自己相对他人的排名；信心指数主效应不显著，F＜1；75.26%的学生估计百分等级高于或等于50，其中底部四分位数被试的估计百分等级高于或等于50的比例为72%，出现整体的优于平均效应。

（2）数学三项交互作用和两两交互作用均不显著。各四分位数学生对数学考试的各项估计评定分数见表2。

各四分位数学生的差异分数主效应显著，F（3，170），p＜0.001，ŋp2=0.16；差异百分等级主效应显著，F（3，170）=25.86，p＜0.001，ŋp2=0.313，此两项预估趋势和语文的预估表现一致；信心指数主效应显著，F（3，170）=6.203，p=0.001，ŋp2=0.099。底部四分位数学生表现出明显的信心偏低，实际得分越高的学生对自己的估计越有信心；60%被试的估计百分等级高于或等于50，其中底部四分位数学生的比例为22%，顶部四分位数学生的比例为96%，出现微弱的优于平均效应。

实验一的结果表明，各自变量之间不存在交互作用，文/理科的划分和性别差异并未对预估产生影响；高三学生在对自身成绩了解比较全面的情况下仍出现了“不对称误差”，这和西方的研究结果是一致的，说明此现象具有跨文化的一致性；两项考试的估计百分等级均显现了整体的优于平均效应，大部分学生均认为自己的排名在中值水平之上；低分学生在语文考试的信心指数与高分学生无差异，而数学考试信心指数的预估，低分学生的信心显著低于高分学生。

表1 期末考试语文成绩预估各维度的平均分和标准差比较

表2 期末考试数学成绩预估各维度的平均分和标准差比较

三、实验二

1.目的与假设

（1）目的考察“不对称误差”现象的稳定性。

（2）假设高考语文、数学的预估结果与“实验一”中期末考试的预估结果一致；文科综合和理科综合考试的预估结果与语文、数学的预估结果一致。

2.方法

（1）对象以湖南省某市高三学生为研究对象，随机选取高三4个班学生178人参与本次问卷调查的实验，其中文科班学生101人（男生25人，女生76人），理科班学生77人（男生50人，女生27人），年龄在 17～19周岁（M=18.0，SD=0.67）。

（2）材料自编全国高等学校入学考试成绩预估调查问卷。

（3）程序表达知情同意后，从湖南省某市高三随机抽取4个班的学生作为调查对象，对愿意参加的学生团体施测。实验在“全国高等学校入学统一考试”的前一周进行，告知所有自愿参与的学生，他们需要对即将到来的高考相关科目（语文、数学、文综/理综）作出尽可能准确的预测。语文、数学、单科满分为150分，文综/理综满分为300分。首先，预估各科成绩的实际得分；其次，预估自己每科成绩相对于同年级其他学生所处的百分等级，在百分量表上标明，范围由0（我的排名处于末位）到50（我比一半的其他学生好或者差）到100（我的排名处于首位）；最后，在7点量表上标明对自己这两项估计的信心指数（1=完全无信心，7=非常有信心）。

问卷回收，剔除无效问卷，使用Excel和SPSS录入，采用SPSS16.0进行数据处理。

2.结果

（1）语文三项交互作用和两两交互作用均不显著。各四分位数学生语文考试各项估计评定分数见表3。

各四分位数学生差异分数主效应显著，F（3，162）=9.18，p＜0.001，ŋp2=0.145，所有学生均高估语文考试得分，底部四分位数（低分学生）出现最多的高估；差异百分等级主效应显著，F（3，162）=57.30，p＜0.001，ŋp2=0.515。底部、第二四分位数学生出现高估自身排名情况（相对位置）的现象，第三、顶部四分位数学生则出现低估；信心指数主效应不显著，F＜1；75.97%学生的估计百分等级高于或等于50，出现了整体的优于平均效应。

（2）数学三项交互作用和两两交互作用均不显著。各四分位数被试对数学考试的各项估计评定分数见表4-1。

文/理科学生对数学考试成绩的各项估计评定分数见表4-2。

表3 大学入学考试语文成绩预估各维度的平均分和标准差比较

表4-1高考数学成绩预估各维度的平均分和标准差比较

表4-2 高考数学成绩预估各维度的平均分和标准差比较

各四分位数学生的差异分数主效应显著，F（3，162）=5.74，p＜0.001，ŋp2=0.096；差异百分等级主效应显著，F（3，162）=48.27，p＜0.001，ŋp2=0.47，此两项的估计与语文成绩预估一致；信心指数主效应显著，F（3，162）=3.35，p＜0.05，ŋp2=0.058，上半部分学生的信心指数高于下半部分学生的信心指数；62.36%的被试的估计百分等级高于或等于50，出现了整体的优于平均效应。

同时，文/理科学生差异分数主效应显著，F（1，162）=38.46，p＜0.001，ŋp2=0.192；差异百分等级效应显著，F（1，162）=13.15，p＜0.001，ŋp2=0.075；信心指数上也表现出显著的差异，F（1，162）=8.25，p＜0.05，ŋp2=0.048，理科学生比文科学生表现出更多地高估得分、排名位置和信心指数。

（3）文科综合按照101名文科班学生的文科综合成绩所处四分位数将其分为4组，进行4（得分类型）×2（性别）两因素方差分析；各四分位数学生文科综合考试的各项估计评定分数见表5。

表5 高考文科综合成绩预估各维度的平均分和标准差比较

双向交互作用不显著，F＜1。

各四分位数学生的差异分数主效应显著，F（3，93）=8.78，p＜0.001，ŋp2=0.221；差异百分等级主效应显著，F（3，93）=30.86，p＜0.001，ŋp2=0.499。底部、第二四分位数学生出现高估成绩和排名的现象，第三、顶部四分位数学生出现微弱低估；信心指数主效应不显著，F（3，93）=1.82，p＞0.05，ŋp2=0.055；59.41%的被试的估计百分等级高于或等于50，整体出现微弱的优于平均效应。

同时，不同性别学生的差异百分等级主效应显著，F（1，93）=5.45，p＜0.05，ŋp2=0.055。男生（M=4.036，SD=4.84）比女生（M=-8.516，SD=2.346）更多地高估排名位置。

（4）理科综合按照77名理科班学生的理科综合成绩将其分为四组，进行4（得分类型）×2（性别）两因素方差分析。各四分位数学生理科综合考试各项估计评定分数见表6。

双向交互作用不显著，F＜1。

各四分位数学生的差异分数主效应差异显著，F（3，69）=9.47，p＜0.001，ŋp2=0.292。所有学生出现整体的高估，底部四分位数学生高估最多；差异百分等级主效应显著，F（3，69）=15.66，p＜0.001，ŋp2=0.405，顶部四分位数学生低估了自己相对他人的排名。信心指数主效应显著，F（3，69）=4.18，p＜0.05，ŋp2=0.154；底部四分位数学生表现出相对较低的信心指数；76.62%的学生的估计百分等级高于或等于50，出现了整体的优于平均效应。

同时，不同性别学生的差异分数主效应显著，F（1，69）=7.05，p＜0.05，ŋp2=0.093；估计百分等级差异显著，F（1，69）=4.62，p ＜0.05，ŋp2=0.063，男生对分数和排名的估计比女生更乐观。

“实验二”中对语文、数学、文科综合、理科综合的成绩预估出现了与“实验一”同样的“不对称误差”。各自变量之间不存在交互作用；理科学生在数学成绩的预估项比文科学生更为自信，男生在文综、理综科目的预估项上比女生更为自信；4科考试均显现了整体的优于平均效应，大部分被试均认为自己的排名在中值水平之上；各四分位数学生语文、文科综合的信心指数无差别，低分学生的数学和理科综合的信心指数显著低于高分学生。

表6 高考理科综合成绩预估各维度的平均分和标准差比较

四、总讨论

首先，“实验一”中高三学生对语文、数学两个科目的成绩进行预估时表现出了“不对称偏差”，即低分学生对成绩实际得分和相对排名的估计表现得过于自信，而高分学生表现得过于自谦，得分越高的被试倾向于作出更多的低估，此现象具有跨文化的一致性。同样“实验二”的结果也显示，对于语文、数学、文综、理综的预估，“不对称偏差”始终存在，此现象存在跨考试科目的稳定性。研究中采用高三的学生作为研究对象，以他们熟悉的学科考试成绩作为评估项，那么，不管是高分学生还是低分学生，他们对自身的能力和相对位置理应具备“元认知洞察力”。而且优秀学生估计的精确度并不高，这些均从一个侧面说明“元认知洞察力”的缺乏不足以解释此类现象。

其次，从综合差异分数、差异百分等级和信心指数中可看出，在所有的科目预估中，高分学生在对自己所作出的两项估计表现出了一贯的高信心，这与实际成绩和相对位置的低估在方向上不一致。是否“怕壮”心理在困扰着他们，因此在表现“自己”时，这些“谦虚”的优秀被试，为了社会赞许而动机性地进行“自贬”。杨中芳认为，至少有两个因素使中国人对“自己”的评价比较偏低。第一，过分夸张自己的价值，是不为社会所容许的。第二，中国文化强调“自省”，亦即不断地检讨自己，以求“自己”的向上进步，这个“自省”的过程也可能促进我们对自己的评价不会太高［11］。再看低分学生的信心指数。他们对语文考试和文综考试的信心指数估计与高分学生并无差异，但数学、理综考试的信心指数估计却显著低于高分学生，也就是说，低分学生虽然不具备取得高分的能力，但并非对自己的“无技能”表现完全无意识。从“自我动机”角度来看，低分学生可能为了维护自尊和社会赞许而动机性地提高实际成绩和排名的估计，但同时他们又对自己所作出“过于自信”的估计表现略有“心虚”，表现为信心指数偏低。再者，学科的差异化也可能是导致有差别信心指数出现的原因。因为，相比数学和理综考试，语文、文综的主观性试题较多，低分被试也更“期待”作出主观上的高估。

再次，从各科目估计百分等级的预估结果可看出，大部分高三学生认为排名在中值之上，出现了整体的优于平均效应，说明优于平均效应存在跨文化的一致性。这说明，为了增强和保护自尊，任何人都需要积极地肯定自我，特别是对于低分被试而言，这种肯定则尤为重要。

最后，就研究对象而言，高中生在学校多半读过西方传入的书籍，也处于自我意识高涨的时期。他们在对自我的分析及表达能力方面，显然比一般大众好，因此他们代表研究中国人“自我”的一个偏差的样本。杨中芳认为，自我是一个与受测者过去经验的影响相当深刻的概念。因此，要真正研究一般中国人的“自我”，必须离开研究“学生”这个安乐窝［12］。不然。我们很容易就会发现我们的研究结果，总是得到和美国人没有分别的中国人的自我（Bond&Cheung，1983）［13］，或是千篇一律的西方理论验证。所以，在后续的研究中，扩大研究范围、对象选择范围、对象的年龄段等因素及其背后所隐藏的心理机制则显得尤为重要。

五、结论

首先，强调“自谦”文化氛围并不妨碍低分被试作出过高的自我评估，“不对称误差”现象存在跨文化一致性和跨考试稳定性。

其次，中学生表现出了整体的优于平均效应，大部分学生认为自己的排名在中值水平之上。

最后，理科学生在数学成绩的预估项上表现比文科学生表现得更为自信；男生比女生在文综、理综科目的预估项上表现更为自信。

［1］Buehler R，Griffin D，Ross M.Exploring the“Planning fallacy”：Why People Underestimate Their Task Completion Times［J］.Journal of Personality and Social Psychology，1994，（3）：366-381.

［2］Presson P K，BenassiV A.Illusion ofControl：A meta-analytic Review［J］.Journal of Social Behavior and Personality，1996，（3）：493-510.

［3］Alicke，M.D.Global Self-evaluation as Determined by the Desirability and Controllability of Trait Adjectives［J］.Journal of Personality and Social Psychology，1985，（49）：1621-1630.

［4］Svenson，O.Are We All Less Risky and More Skillful Than Our Fellow Drivers?［J］.Acta Psychologica，1981，（47）：143-148.

［5］Kruger，J.，Dunning，D.Unskilled and UnawareofIt：How Difficulties in Recognizing One’s Own Incompetence Lead to Inflated Self-assessments ［J］.Journal of Personality and Social Psychology，1999，（77）：1121-1134.

［6］Krueger，J.，Mueller，R.A.Unskilled，Unaware，or Both？The Better-than-average Heuristic and Statistical Regression Predict Errors in Estimates of Own Performance［J］.JournalofPersonality and SocialPsychology，2002，（82）：180-188.

［7］Tyler M.Mille.，Lisa，Geraci.Unskilled But Aware：Reinterpreting Overconfidence in Low-Performing Students［J］.Journal of Experimental Psychology：Learning，Memory，and Cognition，2011，（2）：502-506.

［8］Taylor S E，Brown J D.Illusion and Well-being：A Social Psychological Perspective on Mental Health［J］.Psychological Bulletin，1998，（2）：193-210.

［9］Heine，S.J.WhereisTheEvidence forPancultural Self-enhancement？ A Reply to Sedikides，Gaertner，and Toguchi［J］.Journal of Personality and Social Psychology，2005，（89）：44，531-538.

［10］Yates J F，Lee J W，Shinostuka H.Beliefs about Overconfidence，Including Its Cross-national Variation［J］.Organizational Behavior and Human Decision Processes，1996，（65）：138～147.

［11］杨中芳.论述中国人的“自己”：理论与研究方向［A］.高尚仁.中国人·中国心：人格与社会篇［C］.台北：远流出版公司，1991.

［12］Bond，M.H，Cheung，T.S.The Spontaneous Self-concept of College Students in Hong Kong，Japan，and the United States［J］.Journal of Cross-cultural Psychology，1983，（14）：153-171.

［13］杨中芳.回顾港台“自我”研究：理论与研究方向［A］.高尚仁.中国人·中国心：人格与社会篇［C］.台北：远流出版公司，1991.