为大学和职业成功做准备:美国评估改革与启示
2018-07-23姜朝晖
刘 阳,姜朝晖
(1.北京信息科技大学,北京 100192;2.中国教育科学研究院,北京 100088)
一、内涵更新:为大学学习和职业生涯成功做准备
“大学和职业准备”的潜在意涵逐渐由“为大学录取及入职做准备”转为“为大学学习和职业生涯成功做准备”[1]。康利(David T.Conley)教授在对大学准备的重新定义中指出:大学准备是学生进入大学并获得大学成功,即学生接受常规本科学分课程而不需要参加补救课程时的入学准备水平,其中“成功”被认为是能够顺利完成初级课程,并且具有相应的理解能力和熟练程度来推进更高一级课程的学习。[2]
这一内涵的转化促使教育工作者重新审视自身工作:一方面,高中教育与高等教育的关系更加密切,高中教育工作者具有促进学生更长远发展的责任。高中教育不仅要帮学生获得准入资格,更要培养学生具备大学学习和职业发展所需的“软实力”。另一方面,内涵的丰富要求教育工作者进一步识别并制定更为全面的评估指标,需要研究者重新审视学科知识、标准化测试等传统考核标准在促进学生大学和职业成功中的作用,并不断探索学习方式、行为态度等因素在学生发展中的长远意义。
二、大学和职业准备评估的改革与创新
(一)明确评估的核心要素
美国教育政策改进中心康利(David T.Conley)教授认为,学生大学和职业准备应具有四个核心能力:一是关键的认知策略,即学生进行深入学习和跨学科联系的思维方式。二是关键的内容知识,即学生能够以大学科以及核心概念为基础构建整个学科的知识体系。三是核心学习技能技巧,即学生的自主学习能力,它与学习动机、目标设定、自我管理等学习策略和技巧相关联。四是过渡知识和技能,即学生怀有大学期望,具有选择合适的大学,并能够利用有效资源进行大学申请等。[3]
在新一轮改革中,各州规定的大学和职业准备指标集中在如下几个方面:核心课程知识、批判思维和(或)问题解决能力、社会和情感学习、合作和(或)沟通能力、砂砾品质/自愈能力/韧性、公民素质和(或)社区参与。[4]从上述评估指标的研究可以看出大学和职业准备评估指标的变化趋势是:相对传统的学术评估指标而言,现阶段评估指标越来越复杂,许多除学术知识和技能之外的高阶思维能力均被纳入考核范围,并且成为重点评估对象。
(二)建立测量工具的评估框架
为落实关于学生大学及职业准备评估,美国公立学校责任法案咨询委员会(Public School Accountability Act Advisory Committee)、加州教育政策改善中心(Educational Policy Improvement Center)对现有评估工具进行了重新认定,构建了以技术质量、利益相关者以及系统性为主的评估框架(见表1)。评估工具按框架指标的成熟度分成强、中、弱三级,以展示评估工具的优势和劣势。
表1:大学和就业准备评估工具的评判指标
评估的出发点和目标是多元化的,单一的测试内容不能衡量学生的全部学习价值,也不能满足所有利益相关者的需求。有学者认为高质量的评估系统应该包含五个方面的内容:第一,对高阶认知技能的评估:评估要能够促进高级认知能力发展,能够促进知识的迁移而不是强化机械化的学习和实践。第二,对学生核心能力的有效评估:除学科知识外,评估应在真实情景中考察学生交际能力、合作能力,规划、反思与研究能力以及复杂问题的解决能力等。第三,具有国际化的评估基准:评估结果的比照基准要向教育发达国家看齐,了解其评估现状以及对学生未来表现的期望等。第四,具有教学意义和教育价值:任务设计应本着可教授原则,为教学指导提供依据,而不是单纯地反映学生课外生活或者应试技巧。第五,有效、可靠、公平:评估应具有有效性和可靠性,能够准确反映评估意图和学习者能力。
(三)评估措施的改革创新
近年来,虽然传统的测试备受争议,但是由于发展相对成熟因而仍被采用。目前,许多州和评估组织根据升学和就业准备需求,不断对评估测试进行拓展和完善。
1.SAT改革
2016年3月,SAT进行了新一轮的改革:标准化考试已与教育和实践脱节,许多毕业生并不具备问题解决、有效交流以及复杂关系的处理等必需能力。SAT将致力于提供一个更加优质的、全面的学生准备图景,为此,改革把重心放在知识、技能、理解力等升学和就业准备所必需的能力方面。
为更好地帮助学生进行大学选择及学术准备,SAT跟进了对升学和就业准备基准的调整。新设定的基准分数更能有效预测学生大一学期相关学科课程的成功或失败。与旧基准分数相比,新基准以2015年大一新生春季课程表现为基础,将学生2014年SAT成绩划分为不同的分数基准线和绿、红、黄三类等级。在大一学期,达到SAT准备基准的学生将有75%的可能性获得C及其以上的课程成绩。[5]
2.ACT 改革
近年来,ACT评估改革集中体现在两个方面:第一,满足各州对学生大学和职业准备的要求,扩充大学及职业准备评估框架。研究认为之前的大学和职业准备评估主要集中于学生的核心学术技能,如学生的数学、语言知识能力,但是如果只帮助高风险学生提高核心课程知识和技能,有可能仍旧无法挽救学业失败,因此,ACT期望向学生提供更加全面的发展指标和反馈信息,以便学生能够获得有效干预,进而实现大学和职业成功。新一轮的ACT改革致力于开发一个经过实证检验的扩展框架,这一框架包含了学生大学和职业准备及成功所需要的四个领域的技能:一是基于数学、科学和英语学科核心知识的发展框架;二是综合能力领域,如批判思维能力、协同解决问题的能力、信息和技术能力;三是大学和职业成功所需的行为技能领域,如可靠性、与他人的有效合作、适应能力以及压力管理能力;四是大学和职业成功所需的学习和职业技能领域,包括自我认知能力、价值观以及对于学科和职业认知和规划等。[6]
第二,ACT通过纵向研究,对学生大学和职业准备所需的知识和技能进行调研,将ACT分数与学生课程中的实际表现相对应,并基于此调整ACT的测试指标和内容。达到ACT成绩基准的学生,大学期间相应学科获得B及以上成绩的可能性约有50%,获得C及以上成绩的可能性约70%。这一基准为教师、家庭、学生提供了预测大学成功的信息。
3.基于《州共同课程核心标准》评估的改革
《州共同课程核心标准》颁布后,大学和职业准备评估合作关系组织(Partnership for the Assessment of Readiness for College and Careers ,简称 PARCC)与智能平衡评估联盟(Smarter Balanced Assessment Consortium,简称SBAC)开展了新的测试体系。测试以《州共同课程核心标准》为基础,强调以“证据为中心”了解学生“深度学习”能力,并通过在线测试进行形成性和总结性的评价。例如,PARCC测试通过总结式评估方式分阶段对学生进行评估,总时长约为7-10小时,第一阶段在学期完成75%后施行,第二阶段在学期进行90%后施行。[7]评估于2014-2015学年开始实施,但至2017年,大多数州都重新采用更节省时间的其他测试。
上述评估设计是否有效,仍存在争议。两个组织在一定程度上促进了评估发展,但是评估方式还远不能满足问责制或课堂教学改进的目的。由于《州共同课程核心标准》要求学生能够显现更加复杂的知识和技能,需要更复杂的测量工具,而PARCC和SBAC仅通过几小时的在线测试不可能涵盖《州共同课程核心标准》所涉及的全部标准,特别是问题解决、沟通协作等深层次认知技能。[8]但是,2016年由Thomas B.Fordham研究所和人力资源研究组织(HumRRO)进行的大学和职业准备标准化测试质量评估认为,PARCC和SBAC测试比马萨诸塞综合评估系统(MCAS)和ACT Aspire更能测试学生大学和职业准备所需要的重要内容。[9]
4.任务表现评估的改革
任务表现评估是通过学习活动或者测试来呈现问题,使学生在执行任务时展示自身知识水平、理解能力以及熟练程度。任务表现评估能够更好地挖掘学生在情境中的知识应用能力,是对学生学习效果的有力证明。[10]20世纪90年代,表现评估系统已经朝向更加综合化的评估方式演进。例如,佛蒙特州和肯塔基州,要求学生收集能够全方面展现知识技能的“投资组合(portfolios)”,俄勒冈州创建了基于课堂任务的表现评估等。
除评估自身存在时间管理、教师培训、国家支持及技术障碍外,评估所涉及的有关思考能力、创造性解决问题能力以及信息的综合处理能力等信息较少。因而,部分州对表现评估进行了进一步完善。例如:加利福尼亚州教育政策改进中心开发了“思考准备(think ready)”以及关键认知策略评估,通过任务评估要求学生展示沟通、解释、研究以及精细化处理问题的能力。评估要求教师能够向学生阐释专家和新手思维水平的不同,学生思维能力所处的阶段以及这些信息和大学准备之间的关系等。
5.基于项目评估的改革
基于项目的评估与任务表现评估都具有开放性和挑战性,但是基于项目的评估涉及的步骤更加繁杂,时间也更长,如学术论文写作、重大项目研究等。在基于项目的评估改革方面,最为成功的典范为Summit特许公立学校。Summit特许学校采用基于项目的教学和评估方式,建立了完善的个性化学习平台(Personal Learning Platform)。Summit认为大学准备离不开学科知识、认知能力、成功的习惯以及现实世界的经验四个方面,因此学生在自主选择的项目中获取知识内容、具体技能,并进行合作、实践、创新等高阶思维锻炼。[11]Summit学校采用以项目为依托的能力测评,该系统基于斯坦福评估学习与平等中心(SCALE)的跨学科技能评估准则(Cognitive Skill Rubric)。测评内容划分为 7 个方面、36项认知技能及8个等级,因而能够更加详实地呈现出学生知识、技能的发展程度。学生根据评估结果,通过个性化的学习平台选择适切的学习方案和不同难度的项目任务。[12]
6.元认知评估的发展
元认知技能也被称为“非认知学习技能”或“21世纪技能”,是指学习过程中学生所采用的学习策略、态度以及行为,它能够帮助学习者监控学习活动、调整学习策略、评估学习效果。在21世纪初期,威廉·塞德拉斯克(William E.Sedlacek)质疑SAT和其他标准化测试作为大学准备评估和录取的唯一性,提出了与标准化测试相补充的非认知性评估方法,该评估在学生获取有力支持、目标设定、自我概念、自我评价等方面提供了原则和方法。[13]
目前,加州教育改革办公室尝试将元认知技能评估纳入州高中教育质量问责评估系统,并开展了试点项目。“成为有效的学习者计划”“角色成长卡片(Character Growth Card)”“ 合 作 区 域 倡 议(Collaborating Districts Initiative)”项目将着重考察学生的成长型思维、自我效能、自我管理能力以及社会意识等。评估方式大多采用教师报告及自我报告形式。每一项元认知评估采用两个版本,一个是现有的评估版本,另一个是评估专家进行改进后的评估样本。
三、评估改革中的问题及挑战
(一)内涵界定的模糊
新一轮改革评估中“大学和职业准备”已经向“大学和职业准备及成功”进行延伸,相应的评估指标也已经逐渐覆盖了除学习能力之外的其他方面。但是,“大学和职业准备及成功”的内涵和外延仍需补充和完善。首先,缺乏对“准备”和“成功”之间关系的阐释。相关定义假设被认定为具有“大学准备”的学生能够获得“大学成功”是大概率事件,因而并未对被认定为具有“大学准备”能力而实际上并未获得“大学成功”,以及被视为“不具备大学准备”能力而实际上获得“大学成功”的学生群体进行深入分析,主观上简化了大学和职业准备及成功之间的复杂关系。其次,各州政府、教育机构以及学者对“成功”的内核分析尚不够明确。大学成功是指最终获得本科学位,还是以大学累计绩点为标准,又或是以学生的教育增值为最终指标等仍有待进一步研究;而对于职业成功的界定就更加模糊,是基于工作表现、薪资水平、职位晋升状况、职位任职还是工作满意度等,评判标准众说纷纭。
(二)评估自身的局限性
评估自身的局限性表现在如下三方面:首先,在形成性评价功能的发挥方面:大学和职业准备评估大多集中在高中后两年,因此,许多成长性能力欠缺的学生并不能在短时间内获得充分的补救。应然状态下,大学和职业准备评估应有助于形成强大的形成性评估实践,应该能够更早地帮助教师和学生发现有待强化的能力领域,并及时地采取行动。其次,在评估的准确性方面:许多非认知能力的评估仍以自我报告、李克特量表形式为主,在一些高风险决策中,学生倾向于展示超乎自身实际水平的选项或描述,而这种自我提升的意图常常是一种无意识的“造假”行为,它直接影响着评估的真实性。再次,在评估的个性化方面:大学和职业准备评估的内容、指标、模式依赖于国家和各州的相关规定,而高校在评估中的主动性发挥得较弱。由于高校秉承不同的培养目标和文化理念,因此对学生的大学准备评估应有不同的要求。高校大学准备评估如何在保持与政府评估政策的一致性的同时,形成个性化的评估方案仍值得探讨。
(三)与教育模式的脱节
“基于标准的教学”仍是许多中小学校的教育模式,而这一模式与变革后的学生大学和职业准备评估理念存在较大差异。“基于标准的评估”是指基于既定的知识和技能对学生进行系统的指导、比较、分级,它侧重于根据学生学术技能或内容知识的掌握程度来衡量学习结果。相反,变革后的大学和职业准备评估并不以知识掌握的熟练程度作为评价标准,而是更加注重挖掘学生的非学术潜力和价值,因此新的评估方式与教学模式存在脱节。此外,改革后的评估方式更加灵活,许多任务评估、表现评估、元认知评估等需要投入更多的时间,而“基于标准的教学”强调学生的学术成就,教师和学生在非学术知识技能的培养和评估方面投入的精力和时间有限,并不利于保障评估结果的有效性。
(四)问责评估传统的牵制
大学和职业准备评估的变革迫使教师或者更广泛的教育相关者对学生成功承担责任,评估结果将不能被轻易归因于某一学科教师的教学质量问题,这在一定程度上增加了利益相关者对高中教育人员问责的难度。传统模式下,评估是政府教育问责的重要方式。教育问责通常考察学生对核心学科知识和技能的掌握情况,评估结果通常可以归因于学校和具体教师的教育责任。然而,评估范围和指标的扩展将学生的能力水平提升到教师和部门间的协作层面,学生的综合素质,如批判性思维、协同解决问题的能力、非认知技能等均不能够与单一的课程学习相匹配,评估结果也不能单独作为考察某一学科教师的绩效指标。因此,变革后的评估理念和方式增加了中小学校对教师问责的难度,在一定程度不利于评估的推广。
四、对我国评估改革的启示
(一)强化评估系统的自身完善
任何评估系统都不可避免地存在自身局限性,结合美国大学及职业准备评估经验,建议我国评估系统进一步从拓展评估框架、增强预测效果以及创新评估方式等方面展开。首先,尝试建立从幼儿园至就业(K-Career)之间可持续的配套评估。目前大学和职业准备标准已经包含了学生未来成功所需的核心能力、知识,但是研究者仍将继续探讨有助于学生持续发展的其他重要领域,并尝试建立大学和职业准备评估的广泛框架。这一措施的最终目的是为教育相关者提供更全面的可操作性反馈信息,以促进学生成功。其次,尝试建立中小学学生素养与大学和职业准备之间的关系研究。为确保学生大学学习和就业成功,研究和考试机构尝试建立学生中小学学生素养与大学和职业成功的关系,并且期望学生能够在中小学时期就获得有关未来发展的预测性反馈,以便能够对学生进行早期干预。再次,借助计算机网络和新兴媒体为捕捉学生能力状况提供更加灵活和多样的方法。例如:进一步建立网络评估平台,要求教师和学生及时上传学生在学习成果和能力发展方面的书面、音频或视频材料,以最大程度地减少证据数据的遗失。
(二)建立多层次的支持系统
尝试从国家、地区以及院校三方面为大学和职业准备和成功提供支持。在国家层面:共同开发和完善大学和职业准备标准,为学生未来成功提供必要的保障;以学生成长为基础,制定和实施教师和校长评估与支持体系;完善国家问责系统,帮助识别学校进步和学生成长等一系列促进学生大学和职业准备的支持和干预措施。在省一级层面,呼吁各省根据地域差异和需求,逐步明确有关大学和职业准备的定义、要求以及标准。教育利益相关者协商制定各地的“大学和职业准备”内涵,并至少包括学生语言能力、数学能力、认知策略以及学习技能四个方面。此外,鼓励采用高质量的评估方式,支持更有效地利用数据来确定学生需求并提高学习结果。在院校层面,大学也应积极促进教学和评估的改进。大学根据一年级学生的课程学习情况,制定绩效目标;采用双学位课程和其他加速课程帮助学生取得成功;不断加强对学生个人成长数据的收集,以便指导学校支援策略的完善等。
(三)推进“基于能力的教育”
大学和职业准备及成功在认识和方法上的革新打破了以传统核心课程为基础的标准化教学模式,教育改革需要将更加广泛的、更高水平的深度学习能力纳入教育范畴,从而使学生更有效地为大学和职业成功做准备。为进一步促进教育模式与评估模式之间的衔接,也为进一步促进教育质量的提升 ,近 些 年 基 于 能 力 的 教 育(competency-based education)改革不断发展,其优势在于:首先,基于能力教育的培养目标与大学和就业准备所要求的能力框架相契合,教育的最终结果是使学生获得大学和职业成功所需的必要能力。其次,基于能力的教育以学生需求为出发点,为学生提供不同的早期大学课程、双学分课程以及基于项目和社区的学习活动等,这一个性化的支持、服务模式,能够促进学生按照自己的步调推进学习。最后,基于能力的教育以学生掌握的实际能力而不是学习投入时间作为衡量标准,使评估模式与多元化的大学和职业准备评估趋于一致。
(四)推行以“学生为中心”的评估理念
以“学生为中心”的理念契合、以学生个体和能力发展为重心的大学和职业准备评估模式,是教育相关者不断强化的重要教学和评估思想。传统的学校教育问责通常借助横向比较来评判学习结果,并要求教师对此结果承担责任,因此,传统的问责方式侧重“失败”与“干预”,并不聚焦于学生个体以及学生的教育增值。改革后的大学和职业准备评估并不停留在对学习表现和熟练程度的评估,更加强调识别学生的个体成长和学校进步。以“学生为中心”的评估要求教师以学生及其能力发展为重点评估对象,是对传统的以学科为重心、以教师为中心的评估理念的超越。首先,以“学生为中心”评估理念有助于形成关于学生成长的完整资料,能够更有力地识别学生在个人学术能力、非认知技能、交叉综合能力等方面的优势;其次,对学生的跟踪评估有助于形成以“学生为中心”的评估实践,能够更好地监测和反馈学生信息,有利于教师开展及时补救。再次,以“学生为中心”的评估方式更加灵活和多元化,能够帮助学生在学习目标和学习成果之外,广泛地挖掘大学和职业准备框架内的其他潜力。