APP下载

高校普通话水平测试工作评价标准研究

2023-12-12宋一硕

考试研究 2023年3期
关键词:评价标准高校

宋一硕

[摘要]大规模测试需求与信息技术的进步,要求评价标准与之适应。在人机结合的测评模式和复杂的测试流程背景下,普通话水平测试标准研制经受住了特殊测试环境的检验。以测试工作问题为导向,在专家指导及一线调研的基础上,形成了由5个一级指标、10个二级指标、51项评价要素组成的评价标准。通过理论研究结合实地调研,建立高校普通话水平测试工作的评价标准。实践证明,该标准有效地提高了高校普通话水平测试的管理水平,具备一定的推广价值。

[关键词]高校;普通话水平测试;评价标准

[中图分类号]G424.74[文献标识码]A

[文章编号]1673—1654(2023)03—091—009

支撑课题天津市教育科学研究院《天津市普通话水平测试高校测试点流动评级制度的探索调研》。

一、高校普通话水平测试需要建立相应的评价标准

(一)信息技术的进步,要求大规模测试建立与之相适应的评价标准

天津市自1998年开始普通话水平测试工作(以下简称“测试工作”)。初期采取人工测试形式。随着信息技术手段的进步,2007年底,天津市成为首批全国13个“国家计算机辅助普通话水平测试试点城市”之一[1]。社会对于普通话水平证书的需求和认可度逐步提高,高校考生报名数量逐年遞增。与此同时,计算机辅助测试的形式极大提高了测试效率,在技术上能够满足高校日益增长的测试需求。但在实际测评工作中不难发现,各高校对测试工作的重视程度不同,执行测试任务的质量参差不齐,如何对测试工作进行有效评估,是测试管理机构面临的重要问题。

测试工作由于其技术特殊性,需要测试点院校配备专业设备和相对固定的考务人员,每年根据学生的报名情况制订考试计划,对人员和场地的依赖程度较高,导致每个测试点在每批次的测试执行中都可能会出现不同的问题。因此,探索一套适合高校测试点的评价制度势在必行。评价过程应与每批次考试同步进行,及时更新和梳理实测过程中出现的问题,总结好的经验做法全面推广,同时对发现的问题进行集中总结培训,规避测试失误情况的发生。

(二)人机结合的测评模式及复杂测试流程需要进行全过程监督评价

作为语言文字推广工作的重要组成部分,普通话水平测试诞生于20世纪80年代。测试考查应试人员的普通话规范程度、熟练程度,认定其普通话水平等级,属于标准参照性考试[2]。作为一项汉语口语考试,普通话水平测试既要具备应用语言学的学术性又要兼顾大规模标准化考试的权威性,是一项综合口语测试。

普通话水平测试分为四个部分,分别是读单音节字、读多音节词、朗读文章和命题说话[3]。测试开展初期,全部采取由评测员与考生面对面考查的方式完成测试评分。随着测试规模的不断扩大,人工测评的形式无法满足日益增长的测试需求,信息技术的不断发展,使得计算机辅助测评成为可能。自2007年起,普通话水平测试开始在部分城市试行人机结合的测评模式[4]。其中前三项有文字凭借,由计算机评测打分;最后一项围绕主题即兴表达,没有文字凭借,后期由评测员根据考生语料录音打分。考生最后的普通话水平等级要综合四项的得分确定。

人机结合的测评模式,使得普通话水平测试区别于其他口语考试,具有对测试环境、测试设备和考务流程的特殊要求。对比其他语言类口语测试,如英语雅思口语考试,采用的是直接式口语测验方式,通过考生与考官之间进行一对一直接交流的形式对考生的口语水平进行考查[5]。考官与考生面对面交流,不存在因为录音质量不佳而影响评测结果的情况。为保证收音质量,普通话水平测试对机房环境要求严格,需要单人佩戴单向吸音的耳机话筒,并保证连接无误。在以往的测试中,曾出现过由于考前装机没有按照流程逐步操作、缺乏相应监督,而导致耳机话筒收音效果不佳、设备连接不畅、影响考试效果的问题。这就要求考试前负责技术的考务老师提前检查系统环境和设备连接情况,避免因为软硬件出现问题而影响测评质量。因此对考务全过程各个环节的准确评估,可以帮助院校在测试工作中提高效率并有效避免人为原因造成的测评失败情况。

除人机结合的测评模式外,普通话水平测试与其他考试的主要区别还在于考试准备环节较多,包括候考、备考、测试三个步骤(图1)。考生需要在固定的时间按照候考室、备考室、测试室的顺序移动,并要注意各个环节的过程衔接以便顺利完成测试。每个环节对各个点位的监考人员工作内容均有不同要求,必然需要对全过程逐个细节的准确评估来保证考试顺利进行。例如在备考环节,考生随机就座后开始阅读纸质试题,这时需要监考老师在学生的准考证上填写座位号,此座位号与最终测试室座位号相对应。监考老师需提醒学生,进入机房后按照准考证上的座位号就座。如果备考室的监考老师没有按照流程操作这个环节,将导致考生在测试室无法找到对应机位,从而无法按照备考试卷内容进行考试,这会影响考生成绩及下一轮测试的顺利进行。

(三)特殊环境下需要防疫安全评估

2020年新冠肺炎疫情以来,普通话水平测试工作面临极大挑战,市语委办按照《教育部语用司关于在疫情防控下统筹做好普通话水平测试工作的通知》以及市疫情防控部门有关要求,下发了《市语委办关于在疫情防控下做好我市院校普通话水平测试工作的通知》(津语委办函〔2020〕4号),通知要求我市测试工作在天津市语言文字工作委员会、天津市教育委员会的领导下,由天津市教育科学研究院国语中心统筹组织指导实施。明确我市高校学生及教师普通话水平测试实行属地管理,在确保疫情防控到位的前提下,各院校应做好本区域学生及教师的报名和测试工作。

2020年纳入属地管理开展测试的院校共28所,参加测试19201人次;2021年开展测试的院校达38所,参加测试59655人次。属地化管理既满足了高校师生的测试需求,又有利于做好疫情防控,保证测试工作安全高效运行。在执行测试监督管理的过程中,参与测试的院校各自所具备的测试软硬件条件不同,学生的测试需求也有差异,学生数量、专业设置等的不同,会对测试工作完成质量产生影响。例如师范类与非师范类院校,参加测试的学生规模差异很大。一些设有播音主持专业的院校,学生对于考取一级甲等证书需求较高。考生的这些测试需求,直接反映在各校对于测试工作的重视程度不同,各校在执行测试流程标准和防疫措施上有明显差异。普通话水平测试的特殊性,决定了只有从学校宏观管理层面对测试给予充分的关注与必要的支持,才能推进测试工作稳步发展。加之测试需在机房这一相对封闭的空间内进行,每个场次学生重复使用耳机话筒等设备,在疫情防控常态化期间,存在一定程度的防疫风险。在这种情况下保证各高校测试工作安全平稳运行,必然要求测试管理机构具备较高的统筹管理水平和完整的测试工作评估体系。

另外,国语中心考务负责人员实行每人对应几所学校对接考务的制度,相关部门制定了一系列考务流程标准及内部工作要求,但缺乏统一的对于院校测试工作的评价标准。若要进一步规范各校考务流程,严格防疫管理,推广先进做法,制定一套测试工作评价标准势在必行。

二、標准研制的简要过程及指标筛选与权重

(一)标准研制过程概要

本研究自2020年测试工作实行属地化管理以来,结合目前已有的工作流程和测试中经常出现的各类问题,查阅了大量相关文献及规章制度。从全国来看,自2003年6月15日起开始实施的《普通话水平测试管理规定》以及《普通话水平测试工作评估指导标准》(教语用司函〔2003〕17号)和《普通话水平测试规程》(教语用司函〔2003〕18号)为测试工作规范化发展提供了制度保障[6]。全国部分省份(如湖南、湖北、广西、浙江等)在此基础上,结合本省测试工作具体情况,也制定了适用于各自的评估标准和细则。云南省、江苏省和上海市更是出台了一系列地方政策和制度,针对普通话培训、测试、考务等各个环节,形成了系统的文件政策。

在文献研究的基础上,通过广泛征求意见、实地调研、发放问卷、组织考务人员座谈等多种形式,充分吸纳一线考务人员意见,并组织专家就标准研制给予指导,梳理出影响普通话水平测试能否顺利进行的五个关键点作为五项一级指标,分别为测试管理、队伍建设、测试实施、特色项目及一票否决项目。一级指标确立后,按照逻辑顺序展开相应工作流程,逐项落实细节。一级指标下设10个二级指标,总计51项评价要素(其中包含47个正面清单项目及4个负面清单项目),力求全面真实反映测试全过程,以评促测,推动高校普通话水平测试及语言文字推广各项工作全面发展。

(二)标准指标筛选及权重

在研制标准的过程中,充分评估了各项评价因素的重要程度,尤其注重实际考务工作中的可操作性,对关键岗位关键环节赋予更高的权重分值。在百分制的评价标准中,“测试实施”是五个一级指标中占比最高的一项,共计55分。分步骤将测试全过程纳入评价体系中,分为开测前“信息发布”(4分)、“测试报名”(6分)、“装机自查”(17分)、测试中“测试规程”(26分)及测试后“证书管理”(2分)五个部分,详细说明了各个环节中应执行的标准和须注意的问题,目的在于鼓励学校在开展测试前对照此部分内容逐一自查。

有了固定的工作流程,还需要一支专业的考务教师队伍及学校管理层面的资源整合,才能保证测试顺利进行。一级指标“队伍建设”共计20分,明确了测试工作各岗位具体的人员要求;一级指标“测试管理”共计15分,以学校对测试统一管理的顶层设计作为考核依据。“队伍建设”对应的二级指标分别为“人员组成”(12分)和“队伍管理”(8分),规定了考务负责人、技术负责人及测试现场各监考点位对应的人员要求,明确了各岗位间的相互沟通协助及队伍建设和培养规划。“测试管理”对应的二级指标分别为“组织领导”(6分)、“管理措施”(4分)、“财务管理”(5分)三个方面,确定了普通话水平测试在学校年度工作中的定位,以提升学校对语言文字工作的重视程度。

一级指标“特色项目”共计10分,此项为加分项目,旨在激励测试工作开展良好的学校进一步总结经验,发挥自身优势,带动其他院校,共同做好天津市高校测试工作。此项得分需要提供相关文字或音视频资料作为支撑材料,同时鼓励院校开展语言文字推广相关科研工作及承担片区内其他高校测试任务。以上四项一级指标均为“正面清单”,以加分的形式明确测试工作的规范流程。第五项一级指标“一票否决项目”为负面清单,旨在为院校敲响警钟,杜绝违纪行为及防疫漏洞的产生,保证测试工作安全平稳运行。此项中一旦有一个类似情况发生,则判定等级为不合格,需要暂停该校测试并限期整改。

三、标准的初步使用效果

以2021年度开展的测试工作为例,共有三所院校试行了评价标准,评价具体过程分别由教科院巡场考务人员与信息技术员在各校测试工作期间依据评价标准进行现场评估:一人逐项打分,另一人进行得分复核,如两人就某一项得分产生分歧,则现场重新审核评定。这样的评分方式相对公平,避免了信息不对称产生的评分误差。通过试行评价标准,极大地调动了学校对测试工作的积极性,也在评估过程中初步检验了标准的有效性及需要改进的内容。通过各校反馈,标准初步使用效果体现在以下几个方面:

(一)督促各高校全面梳理测试工作

在试行评价标准的过程中,各高校纷纷表示,通过对照评价标准重新梳理本校测试工作,考务负责人感觉找到了测试考务工作的“抓手”,进一步提高了学校对语言文字工作的重视程度,帮助相关部门建立健全符合自身情况的测试工作管理规定、测试经费财务管理制度及疫情防控常态化下的防疫工作预案。经统计,开展评价以来,因考务流程执行不到位造成的测评失败情况,由原来的4%下降到2%,极大地提高了测试工作效率。以往从开始报名到最终测试需要近一个月的时间准备各项工作且流程繁复,现在可以逐项对照评价标准,进行清单式检查,准备工作时长也缩短了三分之一。

(二)帮助各高校组建一支人员相对固定、熟悉工作流程的考务人员队伍

在评价过程中发现一些高校考务负责人频繁更换,这在很大程度上影响到测试工作规范性的延续,易产生测试流程上的漏洞。还有一些院校未能充分重视考前对各点位监考教师统一进行考务培训,使得测试当天前几轮的流程衔接出现断档。面对这些问题,在评估标准中将这两项得分值占比提高,引起学校对人员安排与考务培训的重视,进一步保障了测试的顺利进行。学校内具体负责测试组织的部门和人员在整体沟通协调时也会借助评价标准作为依据,相关辅助的部门和人员在了解了评价标准的具体要求后,能够更加积极地配合,共同为平稳开测做好服务保障工作。

(三)严格执行测试全过程管理,鼓励学校按照标准开展自查

在制定评价标准时充分总结了以往各校的测试经验,例如有的学校考务负责人经验不足,在考前临时出现调整考场等情况,这会造成考试系统的重新配置和整个考务流程路线的重新规划,学校如能按照标准先进行自查,就可以避免突发状况对测试造成影响。而特色项目及一票否决项目奖惩分明,明确底线。通过试行评价过程,优秀院校总结自身测试工作承办经验,在全市普通话水平测试考务人员及信息技术员培训会上做了分享。院校畅谈各自考务工作的宝贵经验,也都提到了对照评价标准逐项梳理工作流程后,测试失败的比例明显下降,有的学校甚至杜绝了评测失败情况的发生。

(四)促进信息化评测方式的进一步升级

评价标准的试行大幅降低了测试流程中不确定因素对测试产生影响的可能性。测评失败率的减低,为评测方式的进一步信息化升级创造了条件。目前测试中前三项试题为计算机评测,最后一题综合计算机评分和两名人工评测员评分,未来将逐步探索升级为综合计算机评分和一名人工评测员评分,减轻人工评测工作压力,提升评测效率,缩短从测试到公布成绩的时间,真正做到服务于广大考生。

四、标准仍需完善的内容

(一)确定开展评价工作的具体方式

在测试工作评价标准执行初期,可以采取两种方式推动评价工作开展。方式一是依靠行政力量推进,如市语委或教科院以通知公文形式将评价标准下发至各校,并要求院校遵照执行;与此同时,由发文部门牵头组成专门的评审员队伍,深入院校监督测试过程并进行评价。此种评价方式的优点是权威性强,能够大幅提升学校对此项工作的重视程度;缺点是需要牵头单位投入大量人力物力,组织一支专业的评审员队伍并进行系统培训。方式二是将院校根据地理位置或类型特点分成片区,片区内的院校互相进行评价,此种方式的优点是可以促进院校间的沟通交流,互评互助互学,实现测试水平的同步提升;缺点是对于评价标准执行的严谨性难以有效衡量。以上两种方式各有利弊,在未来的评价过程中可以分别试行以检验评价效果,通过对评价具体方式的不断完善,最终确立合理有效的评价机制。

(二)发挥评价结果对测试工作的促进作用

设立高校测试工作评价标准初衷是为了解决院校测试需求与自身承办能力之间的矛盾。随着每一次测试的进行,用细化的评级评价标准评估测试的各个环节,做到“一测一评级,一评一整改”,将院校下一次的测试规模与本次测试工作评级成绩相挂钩,评级高的学校可以保持或适当扩大下次测试的人数规模;存在问题的学校需缩减下次测试的规模或暂缓扩大规模,并针对评价中发现的问题进行整改。这样既可以鼓励测试管理水平高的院校积极承接测试任务,又可以对管理水平暂未达标的院校提出整改要求,使院校之间形成比学赶超的良好氛围,不断推动测试工作规模化上水平。但评价结果与下一次考试规模的动态相关性应如何科学合理地设定,是下一步实际运用评价结果过程中需要重点解决的问题。

与此同时,通过横向比较各院校的评价结果,进一步优化测试流程,推动片区化管理进程。以评价结果作为对学校承办测试能力的考核依据,对符合条件、承办能力良好的学校,可以尝试作为片区内的牵头院校,根据实际情况适当承担片区内其他学校的部分测试工作,赋予其更多职能。执行评价标准的过程也可以第一时间搜集各校在测试中遇到的共性问题,为进一步优化测试流程、实现天津市高校测试工作高质量发展提供参考。

参考文献:

[1]天津市贯彻《中华人民共和国国家通用语言文字法》进行执法监督工作的体会和建议[C]//教育部语言文字应用管理司编.国家语委“语言文字依法管理工作现场会”文集.上海人民出版社,2008:94.

[2]中华人民共和国教育部《普通话水平测试大纲》[EB/OL].(2003-10-17). http://www.moe.gov.cn/srcsite/A18/s3133/200310/ t20031017_78537.html.

[3]马赟鹤.近二十年汉语口语测试研究综述[J].青海师范大学学报(社会科学版),2022,(01):44-49.

[4]朱丽红,韩世梅.远程计算机辅助普通话水平测试的改进策略研究[J].中国远程教育,2013,(110):74-79.

[5]郭莉.汉语水平口语考试(HSKK)与雅思口语考试的比较分析[D].西安:西安外国语大学,2021:26-27.

[6]姚喜双.普通话水平测试若干问题研究[J].云南师范大学学报(哲学社会科学版),2011,(11):146-151.

Research on the Evaluation Criteria of Putonghua Proficiency Test in Colleges and Universities:Based on the Data in Tianjin

Song Yishuo

Tianjin Academy of Educational Sciences,Tianjin,300191

Abstract:The evaluation standard of the Putonghua Proficiency Test has to be adapted to the situation that the demand for large-scale testing has been increasing and information technology has been advancing. Under the background of human-machine integrated testing mode and complex testing process,the development of the Putonghua Proficiency Test standard has withstood the test of the complex testing environment. To address the issues surrounding the Putonghua Proficiency Test,a set of criteria,including five first-level indicators,ten second-level indicators,and fifty-one evaluation factors,are laid down on the analysis of the survey data under the guidance of experts. This paper aims to establish the evaluation standard of the Putonghua Proficiency Test in colleges and universities through theoretical research and practical investigation,taking Tianjin City as an example. The practice has proved that this standard can effectively improve the management level of the Putonghua Proficiency Test in colleges and universities in the Tianjin area,which is worth popularizing to a certain degree.

Key words:Colleges and Universities, Putonghua Proficiency Test,Evaluation Criteria

附件:

天津市高校普通話水平测试工作评价标准(草案)

(责任编辑:陈畅)

猜你喜欢

评价标准高校
现行研究生教育评价体制下的优秀学位论文培育策略思考
小学英语教学的普遍现状及对策
浅谈广告摄影的创意与发展
高职软件技术实训考核评价标准构建
建筑工程绿色施工指标体系评价标准的研究
提升高校官方微信公众平台传播效果的几点思考
中日高校本科生导师制的比较
试论高校党建工作中的党史教育
学研产模式下的医药英语人才培养研究
高校创新型人才培养制度的建设与思考