APP下载

北京市事业单位新进人员通用能力考试的因素结构稳定性分析

2016-06-05辛南平姜亚丽陈海平丁玎栗小霞

中国考试 2016年4期
关键词:题型载荷稳定性

辛南平 姜亚丽 陈海平 丁玎 栗小霞

北京市事业单位新进人员通用能力考试的因素结构稳定性分析

辛南平1姜亚丽1陈海平1丁玎2栗小霞2

通过对北京市事业单位新进人员通用能力考试(管理岗)2012年至2014年9次考试的40 877名考生数据的探索性因素分析,验证其因子结构的稳定性。结果表明,9次考试有8次考试的因素分析都只有一个公因子,且其大多数因子载荷总和都达到30%以上;阅读理解、逻辑推理和图表解读3种传统题型的因子载荷值历次都最高,新开发的句段排序、计划编排、实用写作3种题型的因子载荷略低但也都可接受。历次考试各个题型的公因子数目相同,且其因子载荷相当稳定,证明了它具有稳定的因子结构,表明尽管题目变动,但其仍然具有稳定的筛查功能。

通用能力考试;探索性因素分析;因子载荷

1 引言

北京市事业单位新进人员通用能力考试(以下简称“通用能力考试”)是北京市事业单位公开招聘考试,全市统一组织,各用人单位自愿参加,2012年开始推广使用,每年组织3次考试。它基于北京市事业单位公开招聘工作人员的基本需要研发,重点考察进入事业单位岗位工作所需的公共基本能力,报考岗位分为管理岗、专业技术岗和工勤岗。有研究表明,通用能力考试具有良好的信效度;[1]朱凤艳等人(2103)对该项考试创设的新题型进行预试研究,发现新题型总体来说对考生难度适中,区分度较高,信度α系数中等;[2]为了提高考试对岗位的针对性,同时减少考试时间,以便提高考试效率和效度,陈海平等人(2015)探究了在考试为单因子的情况下,基于因素分析结果选择最优简版测验的问题,最优判别综合考虑了测量误差、α和β错误、统计检验力、覆盖率、考试时间5项标准。[3]姜亚丽等人(2015)继续深入研究了不同统计方法在组成简版测验上的优劣,对比了分别使用逐步回归法和因素分析法构建的简版测验在不同及格线上的覆盖率、正命中率和总命中率。[4]然而,所有的公开考试都具有一个显而易见的特点,那就是题目的非重复性,[5]即每次考试的题目是不一样的,这点不同于一般的心理测验。题目的非重复性是考试性能稳定的最大威胁。每次变换新题目,不仅题目本身的性能参数及其测验性能参数都是问题,不同考试之间的可比性降低,更重要的是整个考试的测量目标和测量要素都可能发生变化,以致损害考试预设的甄选功能。因此,探究公开考试的因子结构稳定性,确定历次考试的测量因子是否稳定,可以为这类考试的合理性、公平性和公正性提供依据。

此外,除了题目的非重复性,通用能力考试(管理岗)使用的“计划编排”、“规则解读”和“实用写作”等题型都属于创新题型,缺乏前期研究基础,编题和审题也缺乏足够的经验和规范,因此,更容易给考试的测量目标带来不稳定。

鉴于上述原因,在整个考试不能实行等值设计的情况下,为了保证历年、历次的考试分数基本具有相同的价值,实现历年、历次考试的大致可比性,需要证明考试的测量目标具有稳定性,以此证明其实现了考试的甄选功能,这对保证整个考试的公平、公正,避免考生的命运交由题目变动造成的随机性,具有十分重要的意义。证明考试测量目标稳定性的方法之一,就是考察整个考试因素结构的稳定性,本研究选取管理岗9次考试的考生成绩进行探索性因素分析,检验全部题型的因子结构是否稳定。

2 研究方法

本研究所用数据为通用能力考试(管理岗)2012年至2014年9次考试全部40 877名考生的真实数据,使用SPSS18.0统计软件,运用探索性因素分析方法,按照题型而非单个题目考察其每次考试的因素结构及其变化。

通用能力考试(管理岗)有9种题型,每种题型的试题数量和分值见表1。

3 结果与分析

3.1 因素分析的适合性

首先需要检验2012年至2014年9次考试的题型分数是否适合做因素分析,结果如表2。

表1 通用能力考试(管理岗)试卷结构

KMO值表示的是变量间的相关程度,是衡量变量间是否可以做因子分析的重要指标,取值在0和1之间,越接近于1表示变量间的相关性越强,原有变量越适合作因子分析。特征根是每一公因子对全部项目的解释力度,通常要求大于1。

从表2可以看出,这9次考试数据的KMO值都大于0.8。根据Kaiser给出的KMO常用度量标准,0.9以上表示非常适合,0.8表示适合,0.7表示一般,0.6表示不太适合。因此可以认为通用能力考试(管理岗)各题型分数间的相关性较好,适合做因素分析。

3.2 公因子数目及其解释的分数变异量的稳定性

判断测验因子结构的稳定性首先要考察探索性因素获得的公因子数目和其解释的分数变异的波动。通常,探索性因素分析以特征根大于1为判定测验公因子合理数目的根据。从表2大于1的特征根数目看,除了2013年6月考试的公因子数为2个外,其余都为1个公因子。这说明,尽管题目的变化确实可能影响到测量目标的稳定性,进而影响整个考试的公因子数目,但这种影响只是偶然的,变动很小,可以认为通用能力考试(管理岗)的公因子数目是比较稳定的,只测量1个公因子。

再从表2中公因子特征根所解释的变异来看,除2014年6月的考试解释了高达82.94%的分数变异外,其余几次考试解释的变异都在32%~45%之间。按照因素分析理论,所有公因子特征根总和解释的变异需在60%以上才可接受(理想的情况甚至要求70%),这说明,尽管管理岗考试的9种题型只测量了1个公共因子,但这个公因子解释考试总分的变异是不够理想的,一些影响考生分数的重要因素没有能够通过考试考察出来,也就是说决定考生分数高低的,除了这个公因子,还有其他的重要因素。但考虑到事业单位新进人员入门考试本身的复杂性及其招聘选拔考试分数分布基本呈负偏态的特点,还是可以认为这个水平的解释比例是可以接受的。原因在于:第一,作为入门考试,考试内容的覆盖面必须足够广泛,能够包容所有性质的事业单位以及所有可能的管理岗位的素质要求,这意味着考试内容必须具有针对所有岗位的通用性,即考查所有考生的“应知应会”,这容易导致题型的增多和考生之间分数差距的缩小,具体体现在150分钟的考试时间内安排了9种题型,而每种题型的满分分值又很小。第二,录取政策导致考生分数的天花板现象。一方面,不同的事业单位招聘岗位提供的待遇和发展空间差别巨大,乃至其吸引的考生群体水平也相差特别大;另一方面,北京市人力资源和社会保障局规定,任何招聘单位的原始分数录取线不得低于60分。这意味着为了保证每一个参加这一考试的招聘单位都能有可供甄选的过关考生,必须适当降低考试的整体难度,试卷大部分题目的难度不能太大,以便确保被考生认为待遇差、发展空间小的事业单位也能有足够数量的过关考生。而降低整个考试难度的结果就是压缩了整个考试的变异空间,减小了分数波动的范围,这就增大了不可控的随机因素对分数变异的影响权重,进而降低了分数变异解释的占比。当然,2014年6月考试的公因子是1个,而特征根解释率高达82.94%,这凸显了在因子保持1个的条件下提高特征根解释率的可能性,也说明了题目变动对特征根的解释率存在较大的影响。

表2 通用能力考试(管理岗)考试数据的因素分析前提检验

3.3 各题型因子载荷的贡献及其稳定性

因子载荷是指某个变量(题目或题型分数)在某个公因子上的负荷,反映了该变量在该因子上的相对重要性。因子载荷越大,则该变量对该公因子的作用越大,能解释该因子的变异越多。各个题型的因子载荷见表3。

从表3可以看出,不同题型的因子载荷是有差异的。相对于其他题型,阅读理解、逻辑推理和图表解读3种题型9次考试的因子载荷都比较大,都在0.6以上(其中图表解读2013年3月的考试略低于0.6),这一定程度上说明这3种题型对测量目标具有更大的重要性,解释率也更稳定,这验证了这3种题型之所以被大家公认为成熟、国内外各个大型考试比较常用的合理性。规则解读、文稿校对、句段排序这3种题型的因子载荷大多在0.5以上,说明这3种题型也是相当稳定的,对整个考试的因子结构具有稳定的重要贡献。比较而言,客观题的因子载荷还都比较理想,而主观题(实用写作)的因子载荷大多偏低(除2014年6月考试外),在0.5以下,再就是波动很大,这可能与主观题题意模糊、解析困难、评分主观性大有关,也显示实用写作测量的要素可能主要不在于公因子,其测量目标可能不同于其他题型。由于考试实践中,专家和用人单位都一致认为主观题更能考察考生的综合素质,为保证考试的表面效度和社会的满意度,未来的考试研究需要多关注主观题型如何提高特征根解释率并保持稳定的问题。

表3 通用能力考试(管理岗)各题型的因子载荷变化

2013年6 月考试探索性因素分析为2个公因子,从表3看出,“计划编排”题型更适合归属于第二个公因子(载荷值0.680),其归属第一个公因子的载荷值仅仅为0.366,说明这次考试的“计划编排”题型的测量目标有所偏离,可能测量了与其他题型测量要素之外的能力要素,这表明这种题型容易“偏题”,需要在命题和审题环节加以特别的防范。

3.4 因子载荷的时间稳定性

从表3可以看出,每次考试不同题型的因子载荷是波动变化的。2014年6月考试虽然只有1个公因子,但特征根解释率高达82.94%,而且每个题型的特征根解释率都在0.837以上,这揭示该考试因子结构具有很好的单一性,9个题型有着很大的重合,可以合成一个指标(即总分)来代替。然而从事业单位进人考试需要综合考察多方面素质的需求看,单一因子的结构和过高的特征根解释率并不一定吻合其功能设定。简单来说,9种题型重合太多,说明了它们之间的测量要素没有太大差异,测量要素的范畴缺乏足够的覆盖面,并且从效率的角度讲,测量同一要素的题型太多有点浪费考试时间。

历次考试不同题型的因子载荷稳定性仅有很小的差异。从图1看,所有题型的因子载荷基本上稳定,并且每种题型的因子载荷总体上都呈现轻微的上升趋势,只有计划编排、句段排序和实用写作这3种题型波动相对其他题型略微大一些,显示这3种题型测量要素不够稳定,需要在编题中加以规范。

图1 各题型因子载荷变化趋势

4 讨论和结论

通过以上对2012年至2014年9次考试数据的统计分析,可以得出通用能力考试(管理岗)因子结构稳定性的结论如下:

第一,9次考试数据中8次考试数据都为单个因子,说明北京市事业单位新进人员通用能力考试总体上每次都只测量了一个共同的内容,即可认为是胜任事业单位管理岗位工作的通用能力。公因子数量的稳定,很大程度上证明了整个考试因子结构的稳定性。

第二,大部分题型的公因子载荷都比较高,其中阅读理解、逻辑推理和图表解读这3种经典题型的因子载荷在每一次考试中都比较高,而且明显比较稳定,不仅说明这几种题型比较成熟,而且表明它们测量的要素对胜任事业单位管理岗位的工作具有更大的重要性。

第三,历次考试各个题型的因子载荷相对稳定,从组成成分层面证明了整个考试因子载荷的稳定性,并非完全是平均效应,而是具有各个题型因子载荷稳定性的坚实基础。

这三方面都证明通用能力考试(管理岗)的因子结构除了偶尔有波动,整体上是相对稳定的。当然,这种稳定性还需要更多的证据来证明,例如需要通过再测信度来加以佐证。另外,这个结论毕竟只是针对管理岗的考试而言,并没有包含专业技术岗和工勤岗,因此,推断整个考试的因子结构稳定性还需要进一步的证据。

[1]黎颖.事业单位公开招聘考试探讨[J].才智,2010(4):221.

[2]朱凤艳,陈海平,车宏生,等.事业单位公开招聘考试新题型预试研究[J].心理学探新,2013,33(3).

[3]陈海平,姜亚丽,车宏生.事业单位新进人员通用能力考试最优简版探究[J].北京师范大学学报(自然科学版),2015,51(3).

[4]姜亚丽,陈海平.事业单位通用能力考试简版的比较研究——因素分析法与逐步回归法[C]//第十七届全国心理学学术会议论文摘要集.北京,2014.

[5]罗永莲,贾玉芳.项目反应理论在题库建设中的应用研究[J].计算机应用与软件,2015,32(1).

An Analysis on the Stability of Factor Structure in the General Abilities Test for the New Staffs of Beijing Public Institutions

XIN Nanping,JIANG Yali,CHEN Haiping,DING Ding&LI Xiaoxia

In order to verify the stability of its factor structure comprised in the General Abilities Test for the New Staffs of Beijing Public Institutions(GAT-BPI),the explorative factor analysis is conducted for the data of nine GAT-BPI testing samples with 40 877 candidates in all who apply for management positions from 2012 to 2014. The result shows that eight of nine testing examples have one common factor,and its sums of factor loadings mostly are above 30%.The traditional question types of Logic Reasoning,Reading Comprehension and Graph Understanding maintain the highest loadings,and the factor loadings of new developed question types such as Sentence Reordering,Plan Making-up and Practical Writing present a little lower,but acceptable.Based on the same number of common factors and quite stable loadings of all types of questions in all tests,it concludes that GATBPI owns a stable factor structure and plays a stable role with a screening function in spite of its changing items.

General Abilities Test;Explorative Factor Analysis;Factor Loading

G405

A

1005-8427(2016)04-0029-5

本研究得到北京市人事考试中心委托课题“北京市事业单位同步考试数据分析及新题型完善”及北京师范大学哲学社会科学报告支持项目“基于大数据的我国彩票业发展监测平台研究”(编号:SKZZP2013003)资助。

陈海平,男,博士,北京师范大学心理学院教师暨北京师范大学中国彩票事业研究中心研究员。

1北京师范大学心理学院(北京 100875)

2北京市人事考试中心(北京 100036)

猜你喜欢

题型载荷稳定性
交通运输部海事局“新一代卫星AIS验证载荷”成功发射
离散型随机变量常考题型及解法
常见数列创新题型归纳
一类k-Hessian方程解的存在性和渐近稳定性
SBR改性沥青的稳定性评价
巧妙构造函数 破解三类题型
随机抽样题型“晒一晒”
滚转机动载荷减缓风洞试验
作战体系结构稳定性突变分析
一种基于白噪声响应的随机载荷谱识别方法