APP下载

上海市中小学汉语阅读文本分级标准研究报告

2020-12-30邹一斌

上海课程教学研究 2020年1期
关键词:复杂度分级汉语

◎ 邹一斌

一、研究背景

为深入响应国家课程改革要求,提高语文学科课程建设水平,全面提升上海学生的语文素养,为上海学生适应未来社会生存和全球化竞争打下良好的阅读素养基础,上海市教育委员会教学研究室(以下简称“市教委教研室”)于2013 年12 月正式启动中小学汉语分级阅读标准研制项目,尝试采用实证的方式构建上海市中小学汉语分级阅读标准。截至2016 年7 月完成第一阶段研究任务,形成了《上海市中小学生汉语阅读能力分级标准(暂定稿)》《国内外分级阅读研究与实践状况概览》《分级阅读标准研制中的相关问题概述》《上海市中小学生汉语阅读现状调研报告》《上海市中小学生汉语阅读能力测试说明及样题》《上海市中小学生汉语阅读能力测试报告》等一系列研究成果,并出版了《上海市中小学汉语分级阅读标准研究报告——阅读能力分级》一书。

自2016 年12 月起,项目团队启动开展上海市中小学汉语阅读文本分级标准的研制工作。以第一阶段的研究成果为基础,开展影响汉语阅读文本分级的相关指标研究,提炼关键要素,重在提出影响汉语文本难易度的假设指标,初步形成可观察、可评量的文本分级模型。建设一套线上汉语文本分级系统,选取一批典型文本,参照模型利用系统对典型文本进行量化分级标定。构建相应的阅读学习平台进行数据采集及实证研究,运用相关统计方法标定文本的分级以及分析学生分级阅读数据,不断修正模型,以此形成通用文本分级标准。

将文本分级标准与第一阶段完成的阅读能力分级标准结合,形成完善的阅读分级标准,为上海市中小学生汉语阅读能力测评、中小学语文教材的编制等提供学理依据,也为汉语分级阅读书目的推出提供支持,从而有效推动上海市中小学生的阅读活动,进一步提升学生的阅读素养。

二、研究路径与方法

以“文献梳理—标准假设—测试验证—指标修正”为基本研究路径,采用调查研究、文献研究、测量研究等方法,开展项目研究。

(1)调查研究:采用实地考察等方法,对国内外相关公司利用技术进行语言处理的平台、工具、软件开发等情况开展调研。

(2)文献研究:对国内外相关的技术文献进行梳理分析,寻找利用技术进行文本分级的路径和方法。

(3)测量研究:通过测试题编制与测试,搜集关键指标的相关数据并进行分析。

(一)细化文献梳理,不断完善项目实施方案

在第一阶段所完成的国内外分级阅读文献资料梳理基础上,从量化分析工具和测量指标领域,继续细化相关文献研究。围绕汉语阅读文本分级标准这个研究重点,探索采用信息技术支持汉语文本分级研究的方法和路径,以专家质性研究为前提,以阅读文本自动分级技术为突破点,制订和完善高效率进行文本难易度标定的研究实施方案。

(二)借助专业团队和技术,确立文本分级核心指标

基于第一阶段阅读能力分级研究的成果,继续保留高校专家团队,同时引入上海中文在线文化发展有限公司(以下简称“中文在线”),借助专业公司的技术力量,通过质性研究与量化分析相结合的方式开展阅读文本分级标准的研制。由高校专家团队开展针对阅读文本内容的质性指标研究,构建基于文本语言要素的假设指标。由中文在线运用现有成熟可行的计算和信息处理技术,利用深度神经网络分级模型,对专家团队提出的假设指标进行筛选,确定适用于中小学汉语阅读文本复杂度的量化测度指标。最后由市教委教研室组织协调研究,确立文本分级核心指标。

(三)通过文本分级标注,对文本分级核心指标进行反复验证

由高校团队基于文本分级核心指标,根据原有高中语文课程标准推荐的阅读篇目,组织测试团队进行人工分级标注,对文本分级核心指标进行第一轮验证。在市教委教研室课程教材部和市教育考试院的协助下,由中文在线技术团队对全国各版本高中语文教材和上海过去十五年的高考现代文文本进行计算机分级,对文本分级核心指标进行第二轮验证,并就验证结果进行系统分析。2017 版高中语文课程标准修订版发布后,高校团队再次根据新的课标推荐书目和专家推荐书目组织进行第三轮验证,并将标注文本提供给中文在线进行计算机对比分析,利用深度神经网络实施端到端自动分级。由市教委教研室组织对人工分级和计算机分级情况进行对比分析,找出差异所在,从语言学的角度分析差异存在的原因,提出对计算机自动分级模型的改进建议,形成人机测评对比分析报告。

(四)根据测评验证结果,完善和修正文本分级指标

由市教委教研室组织高校团队和中文在线,借助中文在线相关阅读学习平台,在嘉定区进行大样本测试,获取有效的学生分级阅读数据。将得到的学生分级阅读数据与文本分级标定进行分析和比较,为文本分级核心指标的修正提供实证依据,指导文本分级标准模型的修正。由于本次测试样本量较大,我们也利用这次测试重新检核第一阶段阅读能力分级标准和各个参数分类表内部的对应性,对各个分类参数和维度内部的关联性、相关能力层级划分的适切性、分层关键特征描述的精确度也进行了全面反思。

三、成果的主要内容

(一)形成关于汉语阅读文本难度的理论研究成果

针对分级阅读标准研制中的基本问题,项目组在第一阶段能力分级标准研制过程中开展了细致而深入的文献研究工作,搜集大量原始资料并进行了高质量的梳理和分析,编写了高水平的文献报告。以此为基础,项目组在本阶段关于阅读文本分级标准的研究中,重点围绕“文本难度”(也称“文本难易度”或“文本复杂度”)展开及时而有效的理论研究,理清了近百年来阅读文本难度分级研究的发展历程,开展了影响汉语阅读文本难度因素的相关文献梳理和研究,完成《汉语阅读文本自动分级技术研究综述》和《文献中文本难度分析因素》等报告,提出了分别利用自然语言处理技术和深度学习技术,实施汉语阅读文本自动分级的可行技术路径,为汉语阅读文本分级标准的编制提供了有力的理论支持。

(二)建立量化评估和质性评估相结合的文本分级标准

以中文在线技术团队为主,辅以结合高校专家团队的支持,连续开展了多轮汉语阅读文本的人工测试,初步构建了基于文本语言要素的量化评估指标体系,确立以语句复杂度为核心的指标结构,对复杂度的内涵与外延予以细化,创立自身的操作性定义,提高了整个指标体系的结构化水平。整合和开发线上文本分级系统,根据指标对典型文本进行快速标定。以高校专家团队为主,结合中文在线团队的技术支持,开发了包含主题、结构、语言特点、理解背景和体裁举例5 项指标在内的质性评估指标体系,完成了分级阅读文本难度质性指标的具体描述。

将量化评估指标与质性评估指标相结合,建立阅读文本分级标准,与第一阶段完成的汉语阅读能力分级标准相配套,构成完整的中小学汉语分级阅读标准,实现了文本难度与学生阅读能力的对应,为中小学语文课程、教材和评价提供了重要工具,也为出版机构编制更适合青少年心智特征的读物提供了参照标准。

(三)实践和完善了专家经验与技术验证融合的实证研究路径

市教委教研室组织协调中文在线和华东师范大学语文教育中心,组建包括语言学、文学、心理学、测试评价、信息技术和相关边缘学科在内的研究团队,由高校专家和教研室教研员基于自身专业经验,针对相关典型阅读文本予以标注,并提炼假设指标。由技术团队利用信息处理和分析技术对标注的文本进行深度分析,验证相关指标的合理性和适切性,再反馈专家团队进行修正。如此循环往复,确立了借鉴互联网快速迭代的策略进行实证研究的操作路径。借助这一路径,实施完成了针对阅读文本语言形式的量化指标研究,提炼相关维度,构建文本分析指标模型,参照指标模型对大批量文本分级进行快速标定。运用信息技术工具和平台进行学生阅读数据采集和分析的方案,形成文本的量化分级标准。根据修正后的模型重新进行文本分级标定,再进行学生阅读数据的采集和分析,多轮循环,完善文本的量化分级指标。

(四)尝试运用汉语自动分级技术构建文本分级模型

与以往依托测量为主的实证方式不同,文本分级标准研制采用以大数据为基础的技术路线实现中文文本难度的自动评估,即建立以文本复杂度量化指标为基础的分级自动分级模型,对文本进行自动分级,然后结合专家对质性指标、阅读的读者因数和任务因数的分析,在该级别中完成对中文文本的分级评估。

项目组尝试通过使用机器学习和自然语言处理的前沿方法,提取有效特征——语句复杂度指标,研究该特征对于文本难易度的描述能力,并进行实验验证:首先对大量文本进行人工难易度的标定,然后利用神经网络进行有监督的训练,最终利用训练得出的语言模型对文本难易度进行直接标定。相关实践表明,当前所采用的基于神经网络的语句复杂度评估模型能够较好地提取文本难易度特征,可以进一步确定语句复杂度对于文本的难度等级有着较强的指导性意义。本项目已基本实现以字、词和句子三个维度的难易度测度指标为基础的文本自动分级模型构建,并将它用于中小学汉语阅读文本自动分级。

四、研究成效与反思

(一)从学术和实践层面形成了文本分级标准的系列成果

项目组以文本难度为核心概念,从量化评估和质性评估两个方面入手,通过专家团队和技术团队先后实施了项目预研究、指标研究与分析系统开发研究,形成了《汉语阅读文本自动分级技术研究综述》《文献中文本难度分析因素》《上海“二期课改”语文教材分析报告》《国内语文教材分析报告》等报告,提出了文本分级模型的基本构想。形成了基于文本语言要素的量化分级指标体系,完成了阅读文本分级难度质性指标的具体描述,编制完成了基于人工测试的难易度分级技术分析报告,保证了基于字频、词频和句长的量化分析指标体系的科学性,提高了系统量化分析的精准性,从学术层面为后续文本难度的深入实践打下良好基础。

在实践层面则实施了针对相关指标体系的大样本测试验证。完成针对60 本书的阅读在线调查问卷的审读修订工作,开展阅读能力分级各学段测试题的修订工作,实施了嘉定区小初高三个学段86 所学校(小初高共计52605名学生)的大规模在线测试验证工作,完成了嘉定调研测试的数据梳理及分析,形成研究报告,为阅读文本分级标准的修正提供了大数据支撑。

(二)基于深度学习的自动文本分级技术与阅读研究结合,填补了基础教育研究的空白

项目组通过对文本难度、语句复杂度等关键概念的内涵界定,运用基于深度学习的自动文本分级技术,构造神经网络模型和训练用于解决自然语言处理领域的问题。摄取全国范围内应用最为广泛的四个版本语文课程教材(一至十二年级)作为语料库,利用训练好的最佳语言模型,分别测量四种教材中文本的语句复杂度,提出相关的文本分级指标。然后根据高校专家提供的经典书目60 篇(含课标推荐),再次进行数据采集及分析,对照原有文本分级的指标,对语句复杂度的相关核心指标的权重及关系予以修正。

已经进行的文本测试实验结果表明,本研究所采用基于深度学习的自动文本分级技术所构建的语句复杂度评估模型,对提炼文本难度特征及划分难度等级,其精度和效率都显著提高,在一定程度填补了国内基础教育阅读研究领域的空白。

(三)为语文课程建设的内涵发展提供了重要参考

伴随着《中国学生发展核心素养》的发布、国家高中课程方案的修订完成,2017 年教育部完成并发布新修订的高中各学科课程标准。和原课程标准相比,修订版课程标准构建并确立了各学科学业质量标准,其核心在于学生学习水平的分层标准。但值得注意的是,与其他学科课程标准相比,语文学科却没有呈现核心素养水平划分。一个重要的原因,就在于作为以文本教学为主要呈现方式的语文课程,百年学科发展的知识内容体系始终未能确认。本项目尝试从阅读者的视角,从量化评估和质性评估两个方面建立文本分级标准,客观上也为国家语文课程建设的内涵发展提供了重要参考。

(四)文本分级标准还需在教育实践中得到进一步检验

项目组经过三年的努力,初步建构了汉语阅读文本分级标准。但要真正实现基于中文文本自动分级技术对大批量阅读文本的自动分级,还需有一个逐步推进的漫长过程。目前已经实现以字、词和句子三个维度的难易度测度指标为基础的文本自动分级模型,用于中小学汉语阅读文本自动分级。后续应努力实现将语篇衔接为基础的测度指标引入模型,完善文本量化测度模型,实现更准确的文本自动分级。终极目标是将深度学习技术全面应用于文本自动分级模型,建立与专家人工分级基本一致的文本自动分级系统。

项目组虽然采取专家经验与技术验证融合的研究路径,但相关研究成果的验证范围还需进一步扩大,以提高标准的精度和效度。阅读文本分级标准和已经完成的能力分级标准是一个完整的体系,合成后体系内部的关联性和自洽性还需进一步完善和提高。

猜你喜欢

复杂度分级汉语
学汉语
欢迎订阅4-6年级《新课标 分级阅读》
一类长度为2p2 的二元序列的2-Adic 复杂度研究*
毫米波MIMO系统中一种低复杂度的混合波束成形算法
轻轻松松聊汉语 后海
分级阅读对初中英语教学的启示
Kerr-AdS黑洞的复杂度
非线性电动力学黑洞的复杂度
追剧宅女教汉语
汉语不能成为“乱炖”