APP下载

基于题库的高考英语听说考试的实施困境及对策研究

2024-07-10李琴刘迪

广西教育·B版 2024年5期
关键词:高考英语题库对策

李琴 刘迪

作者简介:李琴,1985年生,广西南宁人,硕士研究生,助理研究员,主要研究方向为考试命题与考试管理;刘迪,1988年生,湖北恩施人,硕士研究生,主要研究方向为考试命题与考试管理。

摘 要:听和说是英语语言运用中两项必不可少的基本技能,英语听说考试是我国高考英语科目改革的重要部分。基于题库的高考英语听说考试的实施是一项涉及面广、系统性强的工作。本文在综述我国高考英语听说考试实施现状的基础上,结合英语听说考试的特点,从题库建设成本、考试环境要求、考试公平以及考试分值使用等方面分析基于题库的高考英语听说考试实施过程中的难点问题,并提出优化考试实施的对策和建议:提高命题质量,促进题库动态可持续发展;利用机器预估难度,有效解决试题等值问题;将人工智能技术融入大规模教育考试组织和管理;科学使用考试分数,促进对教学的积极反拨作用。

关键词:题库;高考英语;听说考试;实施困境;对策

中图分类号:G63 文献标识码:A 文章编号:0450-9889(2024)14-0004-04

《国家中长期教育改革和发展规划纲要(2010—2020)》提出,“以高等学校人才选拔要求和国家课程标准为依据,完善国家考试科目试题库,完善统一命题和分省命题方式,保证国家考试的科学性、导向性和规范性。探索有的科目一年多次考试的办法,探索实施社会化考试”。国务院《关于深化考试招生制度改革的实施意见》中提出“推进全国高考英语制度改革,外语科目提供两次考试机会”。这些政策的出台,为教育考试机构向专业化、标准化转型指明了方向。教育考试机构意识到,考试招生制度改革的专业化方向不仅要关注制度设计,而且要注重考试的公平公正和有效性,特别是让考试回归测量工具的科学属性。

高考英语口试始于20世纪90年代,由最初的考官与考生面对面考试发展到现在的“人机对话”。机考和题库是解决大规模口语考试的有效途径和载体。随着计算机技术和心理测量理论的发展,不少发达国家的专业考试机构,如美国教育考试服务中心(ETS)、美国大学入学考试(ACT)、英国剑桥评价(Cambridge Assessment)、荷兰教育评价院(CITO)都已建立了适应大规模考试的题库系统[1]。近年来我国部分省(自治区、直辖市)先后实施高考英语科目改革,推出英语听说考试,建立题库,并以此为突破口,探索科学的考试开发过程,为大型考试题库建设、构建一年多考的考试平台积累了科学的数据和实践经验。

一、我国高考英语听说考试的实施现状

多年来,随着考试招生制度改革的不断深化,我国对高考英语改革的研究和探索从未停止,其中包含了对高考英语听说考试改革的不断探索[2]。2011年以前,我国英语听说测试基本是以传统的方式进行,即听力考试采用传统的纸笔考试,而口语则是采取考生与考官面对面交流的方式进行。随着计算机网络技术的迅猛发展,计算机化考试逐渐趋于完善,机考开始在我国教育考试领域中推广应用。2011年,广东省在高考英语科目改革中,取消笔试卷中的听力部分,推出高考英语听说考试“人机对话”,并以15分的分值计入高考总分,2021年分值调整为20分。随后,广西、上海、北京等其他省市也纷纷推出高考英语听说机考:广西于2011年开始实施英语听力口语考试,分数作为高校相关专业招生录取的参考;上海于2017年开始实施高考英语一年两考,增加英语听说测试,以满分10分计入高考总成绩;北京于2021年开始增加高考英语口语考试,以50分的成绩计入高考总分。此阶段的高考英语听说考试,听力和口语考试不再分项实施,而是采取“听”和“说”有效融合为一体的考核方式,不仅从测试形式和测试内容上实现语言交际能力的科学测评,而且还提高了测试的信度和效度,更为真实地实现了听说交际能力的测评。

二、基于题库的英语听说考试实施的基本要求

对基于题库的英语听说考试而言,考试的实施重点强调两个基本要求。

一是公平一致的实施条件是确保考试信度的基本要求。英语听说考试的实施需要保证考试按设计的要求进行,确保所有考生在公平、一致的实施条件下参加考试。关于公平、一致的考试实施,学者们分别从不同的角度对实现这一目的进行了探索。其中,一致的考试环境,特别是进行听说考试时的环境准备是确保考试公平性的硬件保证[3];此外,不少学者从心理学角度关注考试实施公平性的问题。20世纪90年代计算机考试模式刚刚兴起时,计算机考试给受试者带来的焦虑及其对考试成绩的影响受到普遍关注,ETS对此发布了不少调查和研究报告,发现计算机考试实施模式中,受试者因机考形式产生的焦虑与成绩表现有关联,因此,有学者强调应在日常学习中给予受试者更多机会接触计算机,使其对计算机考试有更正面的态度[4]。

二是试题保密及考点的设备安全问题是决定考试公平性的重要因素。在基于题库的计算机考试实施中,试题保密问题是保证题库安全和考试公平性的重点。刘庆思指出,计算机辅助考试的安全性涉及试题传送安全、数据安全和考试环境安全的问题,他的观点对基于题库的计算机辅助考试的实施有重要的启示[5]。

三、基于题库的高考英语听说考试的实施困境

(一)题库建设及维护成本高

题库建设是实施计算机化考试的重要环节。机考的基础是题库系统,考试的实施是利用题库中的试题组成科学的试卷来测试和评价受试者。题库的建立,可以满足英语听说考试一年多考的供题需要,以稳定的试题质量对受试者的英语听说能力做一个比较客观的测量。首先,题库作为一种考试命题管理模式,不仅是管理试题、组配试卷的工作平台,而且日益成为测量理论、考试技术、评价方式的研究平台[6]。一般而言,题库建设的周期至少3年以上,而且要保证题库有足够数量的试题,以满足组卷的需要。其次,题库建设还涉及一系列的问题,比如题库系统和考试系统的设计与开发、试题的命制、题库的使用与维护等诸多问题。与传统的听说能力独立测评的方式不同,英语听说考试更加注重对听说能力的融合考查。而口语试题具有较强的时效性,题库试题使用周期较短,随着题库试题容量的积累,有的题目还没使用就已经“过期”。为了使题库实现良好的循环,就需要不断更新题库试题,要根据社会发展和考生群体的变化对试题进行调整和删减,及时修订试题,使题库试题“保鲜”,但这会大幅度提高题库建设后期维护的投入费用。

(二)考试环境及设备要求严格

考试环境是考试施考的基本条件,也是确保考试公平的基础。传统的面试型口试由于受到人力、场地等条件的限制,很难大规模实施考试,也无法在短时间内完成对所有考生的测试。英语听说机考采用计算机辅助的形式,在专用考场内进行,并全部在计算机系统中完成,一定程度上解决了传统面试型口试实施受限的问题,但也对考试环境有较高的要求。英语听说机考实施的主要特点是以标准化的考试环境、难度值相当的考题以及稳定的考试平台,为不同时间及不同场次的受试者提供信度和效度可靠的能力测量[7]。考场环境对考试信度和效度的保证有重要影响,尤其涉及听、说技能相关的考试时。调查发现,机考受测试环境、录音设备质量影响,其中抱怨最多的是声响效果不理想[8]。英语听说机考原则上要求安排在专用考场进行,要求所有考点按照计算机辅助考试的技术原则和设备要求建设标准化考场,配备符合系统要求的电脑、耳机等设备,如上海投入建设了250个英语听说考试专用标准化考场,分布在全市的各个学校,确保所有考生都能在较短时间内抵达考场,且各考场均统一配备了耳麦,都具备身份验证、作弊防控、视频监控和考试环境独立、实时数据检查等功能,确保对所有考生没有偏颇,以实现考试的公平性[9]。专用考场建设需要投入不少财力物力,这对考点来说是很大的经济负担。而且在使用过程中还会存在机器设备老化、设备故障、设备需升级改造等这样或那样的问题,这些都是限制英语听说考试在大规模高利害考试中实施的重要因素。

(三)主观性试题等值技术仍有待提升

由于受到考场设备的限制,英语听说考试无法在同一时段内向全体考生施考,必须分多个批次才能完成。为确保考试的公平性,不同批次的考试往往会使用不同的试卷,以确保已考和未考的考生之间无法传递信息,但这也就意味着必须要解决不同试卷之间的可比性问题。这就涉及试题的等值问题。等值是将一个测验不同版本的分数统一在一个量表上的过程,是实现测验公平的保证,也是题库建设的重要环节。对于客观题的等值,目前国内外已经有较为成熟的解决方法。第一种是通过试测收集数据,利用项目反应理论模型将每一道试题映射到同一张量表上,通过计算机组卷组成一份符合预期的试卷;第二种是在考试结束后,将所有考生分数进行等值处理,报告一个经过处理的量表分[10]。但在实际的考试实施中,高考作为一项大规模的高利害考试,社会影响力大,出于试题安全保密的要求,在考前无法通过试测获取试题参数,泄题风险高。与客观题的等值相比,口语试题的等值难度更大。一方面,口语的主观性决定了其评分无法做到完全客观化,因此很难保证评分者的信度高度一致;另一方面,主观题一般题量较少,容易曝光,不具备直接设置锚题的条件,就目前的等值技术而言,很难实现等值,因而绝大多数考试的主观性试题分数是未经过等值处理的[11]。这些问题都是在大规模高利害考试中实施英语听说考试的难点。

(四)成绩使用对教学的积极反拨作用力度不够

考试的反拨作用,通常指考试对教师和学生以及教与学的影响。目前,我国各省份实施的高考英语听说考试,其分值计分及其使用办法均不统一。考试分值的使用,对英语教师和学生的听说教学态度、教学安排、教学材料、教学内容和教学活动等均会产生反拨作用[12]。高考英语听说考试已经是一项较为成熟、稳定的考试。实践表明,上海、广东、北京等省市将英语听说成绩计入高考总分的做法,对高中英语教学产生了正面反拨作用,教师和学生对英语听和说能力的重视程度大幅度提高。但是受客观因素限制,目前大多数省份实施的英语听说考试,其成绩仍然只是作为高考相关专业录取的参考。虽然在高校招生录取中发挥了有效的作用,但是对教学的积极反拨作用力度还不够。许多学校和教师认为成绩只作为录取参考,作用不大,对相关教学的关注力度还较弱。

四、对策及建议

目前基于题库的考试组织模式已经逐渐成熟和完善。通过分析各地多年英语听说考试的实践,我们发现基于题库的英语听说考试目前在实施过程中仍存在一些亟待解决的难点问题。基于以上难点问题,笔者建议从以下方面做出更多尝试。

(一)提高命题质量,促进题库动态可持续发展

题库考试是一个大规模的系统在运作,命题、组考及评分等功能模块环环相扣。在保留良好的传统考试实施管理经验的基础上,我们需要意识到,基于题库的考试实施的高效、公平和安全性更多地依赖专业技术。可持续性的考试题库建设是考试实施的保证,因此,提高题库的使用效率和科学性,是最大限度地提高试题库运转效益和优化命题机制的重要途径。题库考试实施的可持续性发展需要一个专业的人才队伍来保障。建立一支具备较高专业素养的命题和审题专家队伍,加强命题教师的能力和水平,在命题环节采取一系列措施和方法控制试题质量,包括制定详细的命题工作手册、题库命题工作管理办法、试题命制和审核标准、加强命题教师培训等,从命题环节就有意识地指导命题教师减少时效性强或随着时间的推移内容可能改变的试题的命制,提高题库试题质量,避免产生试题沉积。

(二)利用机器预估难度,有效解决试题等值问题

试题等值一直是高考英语听说考试题库建设的难点问题。高考的高利害性及高考试题的保密要求,决定了考试无法在考前通过试测来获取参数。近年来,随着科学技术的飞速发展,我国在大数据和人工智能技术领域已取得重大突破,目前已经有学者开始对机器预估难度进行探索,利用其在自然语言处理、文本语义识别和深度学习领域的优势,以历年考试试题及考生答题情况为基础,通过人工智能算法对相关数据进行设计整合,经过不断地训练迭代,建立起试题文本信息和试题难度之间的对应关系模型,最后再由计算机自动算出新命制试题的难度值,从而有效地解决试题等值的问题;在主观题等值方面,也有学者尝试将客观题听力理解部分作为锚题等值设计的尝试,但是否具有可行性,还有待进一步研究。总体而言,这些方法都对试题等值提供了很好的解决路径,改变了试题必须通过测试才能获取统计数据的传统观念,为从根本上解决高利害考试试题等值的问题提供了参考。

(三)将人工智能技术融入大规模教育考试组织和管理

基于题库的英语听说考试实施是一项涉及多方面、多部门的工作,涉及题库和计算机辅助考试手段两个重要环节。考前准备、考试实施和考后评分等各个阶段的工作有其独特性,需要同时兼顾考试组织模式、受试者、考务培训、考场建设、考试系统和题库的安全与维护等各因素的协调安排。随着人工智能技术的发展,人工智能未来在大规模教育考试领域中将发挥越来越重要的作用,教育考试组织和管理的智能化将成为可能。2022年,国务院印发《“十四五”数字经济发展规划》提出深入推进智慧教育。推进教育数字化是我国教育考试现代化进程中的一项重要且紧迫的任务。教育考试机构管理部门应转变观念,积极探索新型的听说智能考试方式,实现考试管理、考前培训、模拟考试等功能一体化,将考前、考中和考后各项工作纳入其中,减少人工工作量,降低人力成本,不断优化考试管理流程,提高考试组织和管理的效率,真正实现考试管理模式的智慧转型。

(四)科学使用考试分数,促进对教学的积极反拨作用

随着高考改革制度的不断深化,越来越多的省份都在探索将英语听说考试纳入外语高考的整体改革方案中。但没有社会认可度的考试是没有生命力的。一个有信度的考试需要从试题命制、考试实施和分数报告等各个环节的各个方面确保公平性。考试开发和设计者应在设计考试时,首先考虑考试结果的解释和使用对考生所产生的影响,包括正面的影响和不良后果。高考涉及面广、社会影响深远,英语听说考试作为高考英语的重要组成部分,对教师和学生的反拨作用也应值得关注。目前很多学校依然以应试为主来实施英语听说教学,这就要求教育管理者和考试设计者在考试改革的规划和实施过程中,深入调查基层教师的教学意识,从顶层设计层面去思考如何才能有效发挥考试的正面积极反拨作用,切实培养考生的综合语言运用能力,从而真正实现考试改革的预期目标。

信息技术的飞速发展不断促进我国教育考试的专业化发展。题库是教育考试标准化和命题专业化建设的重要体现,是教育考试机构核心竞争力的重要体现。在大数据和人工智能时代,如何将大数据和人工智能等信息技术手段充分应用到高考英语听说考试的实施与管理当中,使其更好地服务教育考试专业化建设,成为教育考试工作面临的一个重要课题,也是新时代教育考试题库建设的发展应用前景。

参考文献

[1]李光明,关丹丹.关于题库建设若干问题的思考[J].中国考试,2014(9):3-6.

[2]刘庆思.高考英语学科40年[J].中国考试,2017(2):13-19.

[3]Laborda,J.G.& T.M.Royo.Training Senior Teachers in Compulsory Computer Based Language Test[J],Procedia Social and Behavioral Sciences 1,2009,141-144.

[4]张浩,吴莎,郭茜,等.高考英语计算机化改革的态度调查研究[J].基础教学,2019(6):101-112.

[5]刘庆思.高考英语科目采用计算机辅助考试探析[J].中国考试,2016(10):15-19.

[6]马鹏飞,李建军,柴橚.高中学业水平考试题库系统的设计及运行模式的实现[J].中国考试,2022(5):64-72.

[7]邓斯芮,周杰.我国英语无纸化考试研究综述[J].教育文化论坛,2019,11(3):106-111.

[8]屈连胜.从问卷调查看机考测试的信度与效度[J].教育教学论坛,2017(8):55-56.

[9]徐雯.口语测评在大规模高利害考试中的实践:以上海高考英语听说测试为例[J].外语测试与教学,2021(1):21-27.

[10]张泉慧,张颖,何佳,等.基于固定共同题方法的IRT等值模型比较研究[J].中国考试,2017(6):65-69.

[11]彭恒利,张秀秀,刘慧.主观性试题分数等值连接可行性初探[J],2014(12):24-31.

[12]程晓,张诗蕾,钱金袁.上海英语新高考听说测试的反拨效应研究[J].外语教学理论与实践,2021(3):83-94.

注:本文系广西教育科学“十四五”规划2023年度招生考试研究专项课题“英语听说考试题库建设中试题沉积问题及对策研究”(2023ZJY099)的阶段性研究成果。

(责编 周翠如)

猜你喜欢

高考英语题库对策
诊错因 知对策
“勾股定理”优题库
“轴对称”优题库
对策
“轴对称”优题库
“整式的乘法与因式分解”优题库
面对新高考的选择、困惑及对策
防治“老慢支”有对策
注意书写 常抓基础 多背文章 增强语感
语法翻译法对高考英语艺术生复习探究