APP下载

新高考改革背景下不分文理的数学成绩差异研究

2018-08-24关丹丹景春丽

数学教育学报 2018年4期
关键词:文理科文理等值

关丹丹,景春丽



新高考改革背景下不分文理的数学成绩差异研究

关丹丹,景春丽

(教育部考试中心,北京 100084)

高考不分文理科是此次考试招生制度改革的一个重要举措.选取Y省高考现有文理科考生的数学成绩为研究样本,将文理数学试卷中的共同题作为内锚,采用等值技术对比分析了Y省现有文科考生与理科考生的高考数学成绩的差异,并对使用同一试卷的不同省份的文理差异程度进行了分析.研究发现:(1)理科考生群体的数学成绩普遍且明显高于文科考生群体.以Y省为例,基于共同题等值后,两个考生群体的数学成绩平均相差13分.(2)不同省的文理科考生群体在数学成绩的差异上程度明显不同,文理数学水平差距最大的省比文理差距最小的省在差异程度上又有12分之多.文理科数学成绩差异及不同省差异程度的问题值得关注,为进一步落实高考数学文理不分科提供参考.

新高考;数学;文理差异

1 背景

2014年9月,国务院颁布《关于深化考试招生制度改革的实施意见》,启动高考综合改革试点,确定了高考不分文理科的改革方向,考生总成绩由统一高考的语文、数学、外语3个科目成绩和高中学业水平考试3个科目(学生自选)成绩组成[1].在中国,高考数学一直以来分为文科数学试卷和理科数学试卷,“考试大纲”和“考试说明”对文理科提出了不同要求[2-3].在考试内容范围上也有不同,文科要少于理科22个知识点,且相同的知识点要求的层次也有所不同[4].因此长期以来,文科数学试卷总体上比理科数学试卷容易.中国台湾地区现行的大学入学考试包括学科能力考试和指定科目考试,学科能力考试的数学科目一般考查学生对高一、高二课程中概念性知识、程序性知识的理解与掌握,以及基本数学能力的运用;指定科目考试的数学科目以进一步考查学生阅读、表达、推理以及连结的能力为主,并为协助大学各校系选才,考虑学生未来修习各专业课程时所需的数学知识进行较具深度的考查.其指定科目考试中数学科目分为数学甲与数学乙,与大陆的理科数学和文科数学基本相对应.数学乙的题目计算量较少,整合性试题在比例上也较少;数学甲则较多整合数个概念的问题,计算量也较多[5].

如何落实高考数学不分文理科这一改革举措,一方面要从国家课程标准和考试内容要求出发,如已有研究者对文理不分科的数学科考试内容进行了深入调查和研究,提出了合理的文理不分科的数学考试内容设计[6].另一方面也要考虑文理两个考试群体的差异,对文理科学生的数学科水平总体差异以及两个群体不同层次的考生差异进行比较研究,可以为改革后的高考数学科命题提供定量的参考资料,对于高考数学命题重构数学考试难度量表、精确区分考生至关重要.

现行高考文理科考生使用不同的试卷,在文科生和理科生的数学原始分数中,由于既有两个群体考生能力的不同,又混有文理数学两个试卷版本在内容和难度上的差异,因此不能直接比较用来描述文科生和理科生在数学水平上的差异.但随着文理科数学试卷中共同题的出现,为基于等值技术量化文科生和理科生数学水平的差异提供了可能.该研究主要回答两个问题:一是基于等值技术量化文科考生群体与理科考生群体在数学成绩上的差异;二是探讨全国不同省份现有文理两个考生群体的数学成绩差异是否程度上明显不同?

2 理论依据与研究设计

2.1 等值理论简介

等值(Equating)是一种在两个或多个测验版本的分数之间建立相互关系的过程,即将测量同一特质的不同测验版本的分数置于同一尺度上,使得参加不同测验版本的考生的分数可以直接相比[7].

通常而言,要么有同一批被试(或认为能力分布相等的两批被试),要么有同一批测验题目(称为锚题或锚测验),才能有实现两个测验版本等值的媒介.如果采用锚测验设计,锚题可以放在两个测验版本的里面,也可以单独成卷与原来两个版本测验分开施测.当锚题是两个测验的组成部分的时候,称之为“内锚设计”;当锚题是两个测验之外的独立部分的时候,称之为“外锚设计”.锚测验设计既不假设两组被试来自同一总体,也不假设两组被试具有同样的能力水平,运用得很广泛.因此,Von Davier等人(2004)又将其称之为非等组锚测验设计(Non-Equivalent groups with Anchor Test,NEAT)[8].当不同的测试版本施测于不同的考生样本时,NEAT设计可以借助于锚测验(即表中的A)的桥梁作用,将考生能力水平差异从测试版本(X和Y)差异中分离出来,因而成为如今最常用的等值设计.表1为非等组锚测验设计表.

表1 非等组锚测验设计表

2.2 以共同题为锚进行等值——将文科和理科分数转换到同一量尺

若数学(文)和数学(理)有一部分题目是相同的,将共同题作为内锚,可将两个考试群体在文理不同卷子上的得分转换到同一量尺上.具体操作:将理科数学作为基准,以共同题为锚,将文科数学成绩转换到理科数学的量尺上.由于经过等值处理,等值后的文科数学成绩相当于是文科学生做答理科数学试卷的成绩,即两个群体的成绩在一个量尺上,可以直接比较.通过二者平均数的比较,可以量化文科生和理科生数学成绩的差异;以总分为横轴,比较等值后文科生成绩和理科生成绩的累积分布,可以直接看出两个群体中不同层次考生的差异情况.

2.3 数据分析方法

等值所用方法为核等值法(kernel equating)[8],名字中的kernel来自一种数据平滑算法核平滑(kernel smoothing).前面提到有了NEAT数据收集设计方案,还需要一种等值计算方法从上面收集到的数据中得到等值函数.核等值法被认为是一种综合各种统计技巧、使线性等值和非线性等值统一在一个模型下,并提供对等值函数进行诊断的工具,无论是从理论上,还是美国教育考试服务中心(ETS)近些年在一些考试项目的实践上,都表现出了极大的优越性.核等值法可以用5个步骤来描述:一是使用对数线性模型对非连续的观察分数分布进行预平滑;二是在预平滑的基础上估计分数概率;三是使用高斯核平滑法完成连续化的任务,将两个间断的分布转换为两个连续的和可微的分布;四是使用等百分位等值方法计算两个连续分布的等值函数;五是估计等值标准误(SEE)和两种等值函数之间的差异的标准误(SEED)[7-8].等值分析软件为KE login3.1,其它数据处理与分析使用SPSS 20.0.

3 数据分析与结果

3.1 基于等值技术量化文理科数学成绩的差异——以Y省为例

以使用全国III卷的Y省2016年高考数学数据为例,分析中所用数据删除了总成绩为零的数据,采用文理科共同题目作为锚题进行等值,将文科数学等到理科数学上.由于该省理科考生人数远远超过文科考生人数,共同题设计需要进行等值的样本量不能差别太大,所以对理科数学采取随机抽样,抽取和文科数学考生样本量大致相同的样本.参与等值计算的理科考生共67 996人,文科考生共69 341人.该省理科总人数为123 537人,总成绩平均分为74.31,标准差为21.03;抽样平均分为74.44,标准差为21.05,说明理科考生抽样随机,能很好的代表总体.

Y省文科和理科数学试卷共同题情况:7个选择题,2个必考计算题,1个选考题.满分69分.文中选择选考题均为23题的人参与等值计算.具体分析数据如表2和图1~4所示.

研究发现:(1)该省文科数学与理科数学原始分数相差7分,等值后两个群体数学成绩的平均分差异约为13分;(2)从表2和图3可以看出在中等及偏下水平的考生(第一分位数、第二分位数之间)中文科数学与理科数学的差异最大,两个群体数学水平的差异在16分左右.

另外,由于Y省文理科考生的水平均比较低,高分段考生人数较少,一方面导致高分段等值的标准误较大(见图2),另一方面可能会低估文理两个群体的实际差异.

3.2 全国不同省文理科数学成绩的差异程度分析

研究中Y省文理科学生数学水平存在明显差异,平均相差13分,中等层次考生相差16分之多.任子朝等(2015)采用锚卷等值的方法发现另外某省文科考生低于理科考生约24分,且总体上成绩排名中上的文理科考生成绩差异最大[9].是否不同省文理科成绩差异不同呢?

表2 等值前后文理科考生数学成绩的基本描述统计

图1 等值关系

图2 等值标准误

图3 文理科数学成绩累积分布

图4 文理科数学成绩密度

图5为使用全国I卷的各省2016年文理科数学平均分比较.

图5 全国I卷不同省高考理科数学与文科数学平均分差异

对于使用全国I卷的各省而言,理科数学原始分比文科数学原始分平均约高出29分,A省差异最大约为35分,D省差异最小约为23分.尽管图5中文科数学和理科数学使用的是不同卷种,直接比较既有试卷难度造成的差异,也有文理考生两个群体能力上的差异,但由于这些省使用的都是同一套文科试卷和同一套理科试卷,即可以假定试卷难度造成的文理分数差异在各省是一致的,因此可以认为不同省之间文理数学平均分差异的差异,直接反映了不同的省文理差距程度不同,如A省文理两个群体的考生水平差别最大,而D省文理两个群体的考生水平差别最小,A省数学文理差异程度显然要比D省文理差异大出12分之多.由于A和D两省都是使用全国I卷,如果对文理数学试卷进行等值处理,这两个省的文理数学成绩转换的等值函数理论上是相同的,也就意味着,经过等值处理后,A省数学文理差异程度理论上仍然是要比D省文理差异大出12分之多.即可以认为使用I卷的不同省文理两个群体的数学水平差距的程度明显不同.

同理,对于使用全国II卷的各省而言,理科数学比文科数学平均约高出14分,L省差异最大约为19分,R省差异最小约为7分.对于同样使用全国II卷文科数学和理科数学的各省而言,可以认为L省文理两个群体的考生水平差别最大,而R省文理两个群体的考生水平差别最小,L省数学文理差异程度要比R省文理差异大出12分之多.也即意味着,经过等值处理后,L省数学文理差异程度理论上仍然是要比R省文理差异大出12分之多.即可以认为,使用II卷的不同省文理两个群体的数学水平差距的程度明显不同.

图6 全国II卷不同省高考理科数学与文科数学平均分差异

另外,文科数学卷是比理科数学卷容易的,研究一基于等值技术已经证实等值后文科考生的数学成绩平均下降6分.结合以上比较,也就是说虽然研究二只是用原始分比较了使用全国I卷、II卷的各省文理科考生水平的差异,但可以断定,如果使用等值技术处理后,两者差异将会更大.

4 结论与思考

综上,可以得出结论:(1)理科考生群体的数学成绩普遍且明显高于文科考生群体;以Y省为例,基于共同题等值后,两个考生群体的数学成绩平均相差13分.(2)使用同一试卷的不同省的文理科考生群体在数学成绩的差异上程度不同,文理数学水平差距最大的省比文理数学水平差距最小的省在差异程度上有12分之多.

文理两个考生群体数学成绩差异之大,且各地差异程度又有所不同,这就对高考数学命题、特别是多省使用同一套试卷的统一命题提出了更高的挑战.高考数学科目如何落实文理不分,怎样才能更好的区分不同层次的考生呢?

一种思路:文理不分,提供同一份试卷.首先要回答考试范围怎么确定,以及考试难度怎么确定.根据对试点省市350名中学数学教师的调查显示,71.03%赞同新高考数学的考试范围按照老高考对文、理科数学的要求折中选取;69.82%赞同新高考数学试卷的难度按照老高考数学文、理科试卷的难度折中确定.实践中,试点省市在新高考数学试卷难度编排上创造性地采用文科头理科尾的做法,调查显示,65%的中学教师认为能区分不同层次的考生.可见,即使文理同用一张试卷,命题专家们通过对高考命题进行改革,创新题型设计,优化试卷结构,也是能够做到精确区分考生,为高校选拔新生提供有效的数学成绩;甚至还能促进中学生数学水平的全面提高[9].

另一种思路:文理不分,提供难度不同的多份试卷.考虑到数学水平文理差距如此之大,各省差别又各有不同,全国统考多省共用一份试卷,操作难度极其大,是否可以文理不分,但按难度分层提供多份试卷呢?以同在改革进程中的英国GCSE(General Certificate of Secondary Education,中等教育普通资格,相当于高中学业水平考试)和A-level考试(相当于高考)为例,改革前一直坚持分层模式(原来部分课程提供基础和高级两种试卷,个别科目提供基础、中等和高级3种试卷),此次改革方向是尽量使所有学生都参加同一套试卷.但他们也认为个别学科中同一张试卷无法对所有学生进行有效评价,因此新方案中数学考试继续采取分层试卷[10].可见就考生群体而言,数学水平参差不齐是各国学生的普遍情况.无独有偶,中国台湾地区在其“大学招考2021长程规划”中也提出计划将学科能力考试中的数学科目由现行的只有一张试卷改为AB版,以提升对考生数学成绩评价的科学性.另一方面,就不同院校和专业对数学的要求而言,也是不同的.因此,中国研究生数学考试从专业差异出发将数学分为数学一、数学二、数学三等多种试卷,当然这些试卷除了难度上的差异之外,在考试内容、考点结构上也有差别.如果采取难度分层的方式对学生进行考核(如试卷分为难度1、难度2、难度3等水平卷),高校招生根据专业要求和人才培养需要选定不同难度水平的试卷,是否更为合适?根据对试点省市的调查显示,八成教师赞同新高考数学试卷采取难度分层方式,认同占比分别为上海83.08%、浙江81.55%.

如果新高考数学实施难度分层考试:(1)于考生,进一步增加了学生的选择性.(2)于教学,有了分层考试,自然就有分层教学,不仅更利于因材施教,也可以很好地解决试点省市教师普遍反映“理科吃不饱,文科消化不了”的现象.(3)于考试,试题的难度与考生的水平越契合越有利于区分考生,给不同水平的考生提供不同难度层次的试卷更有助于提升考试的科学性与公平性.(4)于招生,目前高校针对试点省市普遍开展大类招生,高校若按照大类提出对考生数学层次的要求也符合人才培养需要.

总而言之,文理两个考生群体的数学差异是普遍存在的,且在不同省表现出了不同程度的差异.高考数学如何在确保考试科学与公平的基础上,更好地落实不分文理这一改革举措,需要进一步研究,也值得进一步研究.

[1] 国务院.国务院关于深化招生考试制度改革的实施意见[EB/OL].(2014-09-04)[2017-10-27].http://www.gov.cn/ zhengce/content/2014-09/04/content_9065.htm.

[2] 教育部考试中心.普通高等学校招生全面统一考试大纲(课程标准实验版)(2010年版)[M].北京:高等教育出版社,2009:9-30.

[3] 教育部考试中心.普通高等学校招生全面统一考试大纲的说明(课程标准实验版)(2010年版)[M].北京:高等教育出版社,2009:35-53.

[4] 任子朝.高考数学科考核目标研究[J].数学通报,2013,52(7):1-7.

[5] 郝保国.台湾大学入学考试数学试题述评[J].数学通报,2017,56(2):56-61.

[6] 任子朝,陈昂.高考文理不分科后数学科考试内容改革研究[J].数学通报,2015,54(6):1-4.

[7] KOLEN M J, BRENNAN R L. Test equating, scaling, and linking: methods and practices [M]. 3th ed.New York, NY: Springer, 2014: 1-27, 89-93.

[8] DAVIER V A A, HOLLAND P W, THAYER D T. The kernel method of test equating [M]. New York, NY: Springer, 2004: 19-86.

[9] 任子朝.高中文理科学生数学水平比较研究[J].课程·教材·教法,2015,35(6):62-67,121.

[10] OFQUAL. Consultation on setting the grade standards of new GCSEs in England [EB/OL]. (2017-07-01) [2017-10-27]. https://www.gov.uk/government/consultations/setting-the-grade-standards-of-new-gcses-in-england.

A Comparative Study of Mathematics Scores between Liberal Arts and Science Major Students in the New College Entrance Examination Reform

GUAN Dan-dan, JING Chun-li

(National Education Examinations Authority, Beijing 100084, China)

The decision to eliminate the distinction between arts stream and science stream was an important measure in the new College entrance examination reform. The present article selected candidates from province Y who participated the mathematics test in 2016 college entrance examination. The differences in mathematics scores were analyzed between liberal arts and science major students by the equivalent technology using common items, as well as the degree of difference between two candidates groups in different provinces were compared. Conclusions were as follows: (1) In general, science major students had significantly outperformed liberal arts major students in mathematics. In province Y, for example, the average difference of the two candidates’ scores was 13 points. (2) The variance of mathematics scores gap between liberal arts and science major students in different provinces was large, the largest gap between two candidates groups from one province was 12 points larger than the smallest gap from another province. Attention should be paid to the difference between two candidates groups and the difference among different provinces, suggestions for putting forward the mathematics reform in the new college entrance examination were also discussed.

new college entrance examination; mathematics; the difference between liberal arts and science major students

[责任编校:周学智]

2018–03–08

2017年国家社会科学基金教育学重点课题——新高考制度实施及动态调整研究(AFA170006)

关丹丹(1980—),女,黑龙江黑河人,副研究员,主要从事教育考试与评价研究.

G632

A

1004–9894(2018)04–0031–04

关丹丹,景春丽.新高考改革背景下不分文理的数学成绩差异研究[J].数学教育学报,2018,27(4):31-34.

猜你喜欢

文理科文理等值
异步电动机等值负载研究
文理生的battle
学校召开文理科学报编委会换届会议暨学校一流期刊建设座谈会
The Historical Development of Literary Anthropology in China
《生理学》课程文理科生学习效果评价——以湖州师范学院护理专业为例
广东水利电力职业技术学院2016 年普通高考文理科招生计划表
电网单点等值下等效谐波参数计算
高二学生的理科态度及性别刻板印象对文理分科的影响
基于戴维南等值模型的静稳极限在线监视
汉语国俗语义在维吾尔语中的等值再现