职业学校学业测评方法的比较研究
2021-05-25封漭龚凌云
封漭 龚凌云
2019年2月,国务院发布了《国务院关于印发国家职业教育改革实施方案》(国发【2019】4号),加强职业教育办学督导评价是其中的一项重要举措,提出建立健全职业教育质量评价和督导评估制度。以测试和评价推动高职教育提质增效是提升高职人才培养质量的有力抓手。但职业教育的学业评价又是一个见仁见智的难题,因为人才培养评价的多维度、多层次和全方位是一个止于至善的过程。当前,国内职业院校对学生的理论和实践能力的测评还是以纸笔测试和动手实操二个维度为依归,以可度量、可观察的形式作为学生学业测评和职业能力考核的主要方式。
首先,测评数据释疑力刚性不足。广州铁路职业技术学院自2000年改制以来,确立了以特色兴校的办学理念。本着“做优轨道交通专业、优强先进制造专业、做实现代服务专业”的办学方针,优先发展学校骨干专业群,专业课程重复出现率显著降低,给专业教学质量检测带来了不便。
其次,测评课程各自为主。专业链对接产业链,课程对接岗位,岗位对接职业能力。把岗位职业能力归类、汇总,形成学习领域方案,再结合产教融合的学习载体,即可完成学习情境的设定,也即课程是为了实现人才培养目标,是在学校教育目标的统领下,为完成岗位的核心能力而开设的。各门课程间的你中有我、我中有你的交叉互溶,彰显了专业课程体系统领实际工作岗位的能力。因为测评课程的各自为主与测评重点的因师而异、因测试班而异,而让专业课程体系培养的人才规格出现结构性失衡。课程间的以邻为壑,导致专业人才培养目标与成长路径和学校教育目标相悖。
最后,测评内容重“硬”轻“软”。人的能力高低不仅表现为可观察、可测量的知识积累和设备操作等“硬”技能的展示,更体现在人与人之间的生产关系上。纸笔测试是以纸笔为载体,以可度量的形式测量人是否具有或具有某项能力的高低;设备操作实则是纸笔测试的翻版,只不过是把测试的空间从二维平面纸面答题挪移到三维空间设备操作上,测量的结果依然以对错、多少、精度等客观评估的形式进行。
一、目标分类测评理論及其结构性瓶颈
根据布卢姆的目标分类理论,任何一个学习目标都可细分为可测标准与目标层次,每一个可测标准都可按知识和技能所达到的等级按“从无到有、从有到优、从优到创”分层,浅层次的如记忆与理解是基础层,中层次的如应用与分析是操作层,高层次的如评价与创造是创新层。教学评价以教学目标为标的,学习者的学习实效以实际学习所得与学习标的之间的差距大小来衡量。简言之,布卢姆的目标分类理论解决了学习链上前后相贯的三个问题,即“学什么?”“怎么学?”“学得如何?”这三个问题连接成一条线,规整着教育教学目标的建构、教学活动的组织与实施、教学多元主体评价三者的步调,这也是目前学生学业评价的理论依托。现在职业教育课程的构建,强调以工作过程系统化为依归,工作过程是载体,是针对具体的工作任务构筑任务层面的“一、二、三”,是形而下的“术”,是战术层面的具象操作,是对工具、量体、夹具或设备的掌握和运用;系统化是旨归,是对具体任务的抽象,强调学习者的再学习能力和职业岗位的迁移能力,是源于任务层面又高于任务层面的“三生万物”的能力,是形而上的“道”,是战略层面的理论指导,是在记忆、理解、运用基础上的评估、反思与创造。现今任何测量方式都与布卢姆的目标分类理论“脐带”相连,并且有解构越来越细、标准越来越严的倾向。测试对象只知树木,不见森林;测试内容陷入碎片化,只是产业生产流水线上的一个个点状知识与技能;测评手段的功利化,只能短时间内满足产业发展的刚性需求。现今社会,生产方式日新月异,新技术、新设备、新工艺和新产品层出不穷,生硬地对社会性的人的培养按产业所需要的知识技能进行切割、分类与重组,不重视人所处生活环境的“生态性”和“社会性”,是目前职业教育学业评价的最大的问题。因此,仅以目标分类理论为学业评价的理论基础已无法适应职业教育的发展,并且对人的评价会出现结构性失衡。
二、COMET测评模型的居“高”不下
源自德国的COMET(KOMET)测评方案采用实证的研究方法,有效地扩展了学业测评维度,不仅对职业能力采用开放性的试题专项测评,而且关注测评者的职业发展,从中级工、高级工、技师和高级技师四个逐次渐深的层次切入;不仅关注具体入微的知识和技能,而且关注行动能力,即完成工作过程的行动能力和处于顶层的设计能力,不仅关注测评的结果,而且关注工作过程结构的不变性和工作因素的可变性,关注信息的获取能力、计划的制订能力、决策时的周到能力、实施的细致能力、控制的决断能力和评价的多元性。测评模型是一个“三四六”空间立体结构。即涵盖“内容结构”“能力级别”“职业行动”三个维度;关注中级工、高级工、技师和高级技师四大培养规格;细化“咨询、决策、计划、实施、检查与评估”六大工作过程步骤。客观地讲,COMET(KOMET)测评方案拓宽了职业测评视野,以开放真实的综合性任务为题源,较为客观地关注了人的职业能力及其发展,重视人的整体性的综合能力,并从心理学角度对职业承诺进行了初步认定。但COMET测评成本倚高,测评过程耗时费力;测评内容“清高”,不涉及社会生活的日常流变;测评“姿态”空高,并没能与基础性学习内容有效沟通,没能反映课堂教学的教师诉求;没能在纸笔测试中化用行动能力模型,没能在中低层次的职业维度划分中量化测试标准,是其主要缺陷之所在。因此,“职业能力与职业认同感测评项目”(COMET)自2008年进入中国职业教育界的视野,喧嚣过一阵子后,就沉寂了下去。
三、SOLO分类测评的“轻”“重”倒置
“可观察学习结果的结构”(SOLO)基于认知发生阶段论,从思维表现力出发,按单一到多元、独立到关联、具体到抽象的思维逻辑,评估测试者完成任务的水平等级,等级从低到高到的五个层次依次为前结构、单点结构、多点结构、关联结构和抽象拓展。这五个层级相互关联,后一层级以前一个或几个层级为基础,逐级递进,实现由“单”到“多”的量的积累,由“点”到“联”结构提升,由“联”到“象”质变飞跃。通过评估测试者在完成任务时的思维特征,以期实现对测试者能力的可视化、可测量化评定。
自然科学和社会科学的各门学科的研究从未超越自然和人类认知的自身局限。神经细胞是人脑中的最基本学习单元,各神经细胞通过神经元的联结实现学习功能,各神经元的联系紧密程度决定了人的学习成效的高低。与此类似,职业能力从本质上讲,也是一种联系。各门职业的具体联系存在于各门学科的具体知识与工作要素间此生彼长的必然性和偶然性联系。必然性联系过多,反映出专业内的职业岗位能力核心要素过于强大;偶然性联系过多,反映出专业间的职业岗位能力迁移能力强。可见,工作任务的性质是其核心要素决定的,核心要素的联系强弱是不同职业分界点。既然联系是职业能力形成的最本质特征,“可观察学习结果的结构”又以“联系”为评价等级评定的枢纽,因此,SOLO分类理论以“联系”为纽带,精准地抓住了职业能力评价的源与流的发生与演变。
以立德树人为旨归的职业教育,不仅仅是技能养成教育,更是一种成才成功教育。人在解决具体问题的过程中,在与生产环境的相互作用中,在与生产方式的相互联系中,会发生量的积累和质的转变。量的积累体现为产品数量的增减和工作速度的快慢。在低水平的测量中,侧重量的积累,具体表现为以对错、精度、多少等可测的“量”来度量。质的转变表现为人与生产方式相互作用的过程中,对原有惯性轨道实施有目的的转向,引导职业生涯和人生价值取向向更高阶段发展,体现为否定之否定,表现为实践创新和业务创新。在高水平的测评中,侧重质的转变,具体表现为工艺创新、程序创新、结构创新等。“可观察学习结果的结构”的测评遵循由量到质的转化规律,强调量的积累是测评的基础,是打基础的阶段;强调质的转变是测评的高级阶段,追求育人高级目标的实现。但SOLO测评进入中国大陆以来,只在中职学校或高中以下的学业评价中有所运用,鲜少进入高职学业评价的视野,其天生不足难以克服。
一是重主观轻客观。SOLO测评把教育目标进行了人为的层次质性描述和设定,与人的认知领域的连续流变没有一对一的映射关系,这就决定了SOLO测评在开放性试题上评价得心应手,而对于客观性试题的撑控则提襟见肘。因此,于教育目标的系统性和完整性而言,SOLO测评存在天然的缺陷。二是重内容轻情感。在面对开放性问题时,面对测试者表现出来的职业情感与职业倾向,SOLO测评会显得手足无措。三是重等级轻对错。为避免传统测试唯对错是瞻的偏颇,SOLO测评不以简单的对和错来评判,而是指向不同思维层次水平的评价,而层次的裁决又掌握在阅卷者手中,这又导致因人而异的主观判断。四是重逻辑轻要点。学业结果的文字表述的逻辑性刚性要求与采点给分的传统评价要求相去甚远。总之,SOLO分类评价法以学生“可观察到的学习结果”逆推学生思维层级与学业发展,而后者的划分又是见仁见智的主观厘定,概念的不清会导致测评结果的模糊不定。那么,当我们以一种“以其昏昏”的层次概念去分类和分析学生的学习结果时,对同一份学习结果就不会产生“使人昭昭”的分类和分析,评价的信度就为人诟病。
四、COMET与SOLO测评方案的比较
经科学的抽象,整体可分解为若干个部分;各部分有机组合可形成一个整体,但整体不是各部分的物理叠加,系统的整体功能也大大超出了各要素的单一功能。要素功能与整体性能也可能呈现正相关或负相关的关系。COMET从系统论的观点出发,重视社会生活的复杂流变,以测评的整体结果统驭课程教学和各门具体学科的学习,是总结性评价中“长成观”发展的高级水平。而各门具体学科所涉及的知识和技能点,如与整体功能呈现负相关的关系,在测评的过程中还应重视形成性评价中“成长观”的中、低水平测试。也即,测试系统的设计,既要重视“长成观”下的结果评价,又要重视“成长观”下的过程评价,二者不可偏废。
综上所述,因为传统的“纸笔测试+技能操作”的二元测评与COMET测评、SOLO分类测评所凭依的生产方式、理论基础不同,因此它们所体现出来的测评特征、测评倾向、能力级别表达、测评试题、测评节点也不同。
为解决工业化大生产所需的大批量劳动力需求,把人作为机器的延伸,是传统测评所依凭的生产方式,其最大的特征是把人的需求简单化。由生产产品逆推学习结果,把学习结果进行解构,分解出量子化的知识点和技能点,学习者按认知规律和技能人才的培养规律进行知识的学习和技能操作训练,最后以纸笔测试和技能操作为手段、以分数为总结为来评价人才培养的好坏优劣。传统测评以其标准化、大范围、客观化、易于推广等优点,为世界各国广为接受。这种测评对职业岗位能力概念及各要素的理解碎片化,以科学主义恣意裁决人类社会和一切生产要素,用形为主义驱动职业教育各门课程的开发,导致各门课程相互分割。课程之外的知识技能淡出的结果是,各门课程只围绕单一技能的重复练习和练习重复,课程体系框架紧盯单一职业资格证书考证通过率与过级率。其测评信度也广受质疑。与传统测评不同的是,COMET测评和SOLO测评都把社会、人和知识技能当作一个整体,都重视学习结果的综合效应和整体效应,强调工作任务中的整体表现,都重视工作任务的开放性,都重视测评能力的分层分类。只不过SOLO测评还研究要素和整体间的相互联系,不仅强调整体,还强调整体的各个要素之间的关联;不仅注重整体结果的质量输出,而且注重过程结果的数量输出。与COMET测评对能力的分类抽象地划分为名义能力、功能性能力、过程性能力、设计能力不同,SOLO测评对能力分层评级更具体、更细致,指向性更明确,与具体知识技能联系更紧密,分为前结构、单点结构、多点结构、关联结构和抽象拓展;测评形式在传统的纸笔答题和技能操作的基础上,增加了问答交流。吸收了COMET测评基于新职业教育理论(就业导向的办学理念、工作过程导向的课程开发模式、行动导向的教学方式),SOLO测评基于皮亚杰的认知发生阶段论,揭示了生命本征体验与职业特征的正相关关系,采用开放性/半开放性的试题,测评效度高,可标准化、规模化测试,适用范围较大。但无论哪一种测评,测量信度有待进一步提高。COMET测评的主要不足还表现在书面问卷为主,无法对实践能力进行验证;与职业院校教学契合点少,特别是中职阶段教育學业水平区分度不高;掌握命题技术的师资不足。SOLO测评因测试方案样本数较少,缺乏大规模推广的实践基础。
五、结论
在世界范围内,作为工业化国家起源最早和最为成功的德国在这方面的研究最不可忽视,德国出版的《能力测评手册》(第二版)归纳汇总了44种国际通用的职业能力分析和测评方法。随着科学主义和人本主义在测评领域话语权的此消彼长,历史上建立的分类标准也从单项职业能力向综合职业能力演变。职业能力测评也从“主观评价”到“客观鉴定”,再到“诊断性测评”向“发展性导向”上升。与“鉴定”把教学过程置身事外不同,“诊断”重点关注测评结果在教学过程中的反馈与改进;与“测量”把人物化相比,“测评”既关注直接测量的因素,又强调非直接测量的因素,并赋予其价值判断;与“诊断”把对测评对象完成既定目标的形塑相比,“发展性导向”强调人的情感因素与职业生涯发展的联系。
COMET职业能力测评方案建立的三维职业能力模型,在德国、中国、南非等多个国家的多个职业领域得到了应用。COMET进入中国的时间不长,仅在一些试点学校的试点专业测评后,因缺少大面积推广的理论灌输和实践耕作,就鲜见踪迹。作为一种跨职业领域的能力测评工具,不能满足具体职业岗位的能力要求,特别是对特殊领域专业知识和技能,更是心力不济;COMET源于心理测量技术的项目反应理论,对职业能力的解释也显牵强附会;采用质性和量化相结合的标准化评分方式也不能满足具体工作情境的要求。作为厘定教学目标和进行考试评价的框架,SOLO分类理论在国际上一些测评项目(如PISA)和英联邦国家有重大影响并广泛采用。SOLO分类理论以基础教育为突破口,进入中国后没有大的作为,在职业教育领域的研究也刚刚起步。有学者提出SOLO分类测评在职业教育评价中有其独特的优势,并取得了一些实验样本,积累了一些实践经验,初步展现SOLO分类理论在教育实践中的价值,期待学业评价的中国方案和中国实践。
参考文献:
[1]吴有昌.马扎诺教育目标分类学与SOLO分类学的比较研究[J].华南师范大学学报(社会科学版),2018(4).
[2][德]费利克斯·劳耐尔,赵志群,吉利.职业能力与职业能力测评 KOMET 理论基础与方案[M].北京:清华大学出版社,2010.
[3]陈泽宇.封闭与开放:职业能力测评之惑[J].广东教育(职教),2016(8).
[基金项目:本文系广东省教育厅2020年中等职业教育教学改革项目:职业技能竞赛推动教学改革研究与实践——以郑敬诒职业技术学校“琢玉工匠班”为例【课题编号GDZZJG2020213】;广州市第九批教育教学改革课题“基于翻转课堂的教学设计”(课题编号: 2017F25)阶段性成果之一。]
責任编辑 朱守锂