人工智能时代的儿童分级阅读研究
2024-11-14王林
儿童分级阅读,简单地讲就是为儿童选择同其阅读能力相适合的阅读材料。这个阅读材料,可以是课文、阅读测试题、儿童图书。儿童阅读材料的选择,尤其是在幼儿园和小学阶段,通常由大人决定。很多大人在为孩子选择阅读材料时,都有一个朴素的疑问:这篇文章或这本书,适合我的孩子阅读吗?确定适合儿童的阅读材料,是分级阅读的现实需求,也是理论出发点。
● 儿童分级阅读研究的范畴
儿童分级阅读的核心是儿童的阅读能力和阅读材料的匹配,主要涉及两方面的内容。第一是儿童的阅读能力。儿童阅读能力包括很多分项,例如,语音意识,解码能力,词汇、文体知识、语言结构、背景知识的掌握情况等。需要注意的是,儿童阅读能力的发展,并不只是和年龄相关,同一年龄的孩子,阅读能力可能相差很大。因此,真正的分级阅读,应该是根据孩子的阅读能力分级,而不是根据年龄分级。第二是文本难度。文本难度由文本的长度、字词难度、语法难度、语义难度等综合构成,直接影响着文本的可读性。在现实生活中,我们也常有这样的困惑:同样的一篇文章,例如冯骥才的《珍珠鸟》,曾经被放在4年级、5年级、7年级、9年级等不同的教材或读本中。那么,从文本难度而言,《珍珠鸟》到底适合哪个年级的学生呢?这就需要进行科学的测定。因此,儿童分级阅读,本质上讲就是阅读的科学化,让不同阅读能力的孩子能读到适合他的文本,这样就不会因为太难而影响理解,或者因为太简单而失去阅读兴趣。
儿童分级阅读研究涉及多个学科的研究,如文学、教育学、心理学、图书馆学等。除了一些文科的研究之外,还尤其需要加入计算机科学、语言学、机器学习等理科领域的研究。分级阅读属于科学研究,本意就是要去除个人或集体的经验判断。在分级阅读中引入科技研究有两大好处:一是可以进行大规模的机器测定,二是去除掉人工经验的不准确。人工智能时代,“大型语料库+神经网络”模型让科学测定文本难度成为可能。
● 儿童分级阅读研究的现实意义
中国的儿童分级阅读是在全民阅读的背景下展开的。近些年来,党和政府非常重视全民阅读,全民阅读已经连续11年写入政府工作报告。党的二十大报告中,也提出了“深化全民阅读活动”。2022年4月,在北京举办的“首届全民阅读大会”上,习近平总书记发来贺信,希望少年儿童“快乐阅读,健康成长”。2023年,教育部、中宣部等八部委印发了《全国青少年学生读书行动实施方案》,在学校掀起了阅读热潮。儿童阅读是全民阅读的基础,书香校园是书香社会的基础。
从全民阅读的角度看,分级阅读是阅读与教育的结合,是阅读研究精细化、精确化的必然要求。2011年,国务院颁布的《中国儿童发展纲要(2011—2020年)》就提出:“推广面向儿童的图书分级制,为不同年龄的儿童提供适合其年龄特点的图书,为儿童家长选择图书提供建议和指导。”当然,我们不能指望所有孩子的阅读都按照大人设计好的步骤一步步进行,这既无可能,也无必要。分级阅读只是提供一个可以参考的依据,在儿童阅读的关键时期,把孩子“扶上马送一程”,而不是做好一个模子,把孩子的阅读摁在模子中。
儿童分级阅读研究,应当把儿童兴趣作为首要考虑因素。也就是说,分级阅读要一切从儿童出发,一切从阅读出发。儿童分级阅读细分了孩子的阅读能力,有助于培养孩子对书籍的热爱,形成“爱读书、读好书、善读书”的良好习惯,针对孩子的年龄特点有计划地提供阅读材料,让孩子感受阅读的快乐,提高他们的阅读能力,使阅读成为他们接受终身教育的最好形式,使不同年龄阶段的孩子充分感受阅读之美,保持高品位的阅读。
在我国,分级阅读已引起学界的广泛关注。因为在这个传媒多元、阅读多元的时代,分级阅读符合时代的需要、公众的需求。未来的分级阅读,至少有三个方面的运用场景:在教材编写中,对课文难度的基本标定;在学校和教研室,对阅读题难度的基本标定;在出版社特别是少儿出版社,对少儿读物难度的基本标定。
● 人工智能时代的儿童分级阅读研究
由于语言的特殊性,中文的分级阅读研究仍有待完善,学界一直希望能有一个分级阅读标准。人工智能的广泛使用,为儿童分级阅读的研究带来新的思路,我们可以采取“大型语料库+神经网络模型”的研究方法推进儿童分级阅读研究。
儿童分级阅读语料库的建设。分级语料库是文本难度自动分级系统的基石。一个大规模的汉语分级语料库,主要包括学校教材语料库、儿童图书语料库、辅助阅读语料三部分。研究机构可以搜集国内多个出版社的中小学语文教材文本,并对文本进行了格式处理和文字核对;配合汉语分级阅读系统的程序实验,去除诗歌和文言文,依据80%:10%:10%的比例划分训练集、开发集和测试集。研究机构还可以通过搜集整理、人工录入等多种方式采集中小学课外辅助读物作为分级语料的补充,包括人教社配套辅助阅读材料、小书房分级阅读书目、中小学语文课外读物等不同类型语料的篇目。
分级词表的研制。面向中小学语文分级阅读,研究机构可以研制现代汉语分级词表。不同于前人主要依靠专家人工评定的方法,新的分级词表研制需要依据大规模语料的统计分析,尽可能地由程序自动处理;构建流程透明化、规范化,总体上可复现;能够快速地构建,便捷地迭代更新。分级词表还应利用自动分词软件对所有文本进行分词和词性标注,进而基于大规模语料库对汉语词语运用情况进行统计分析;词表的收录与分级应依据词语的使用频率,有数可依、有表可查、更新快捷;分级词表还应与义务教育常用词表、对外汉语词表都呈现较大的相关性,用以证明其实用性与科学性。
文本难度分级的专家标注。为文本标注阅读难度等级是一个困难的任务,聘请专家开展阅读难度标注的实验是一项十分必要的工作。标注结果一致性是语料标注的一个非常重要的指标。如果专家之间一致性低,表明人在做出区分时有难度,计算机不容易学习到区别性知识,那么难度分级没有意义,需要对原先的10级做出调整;反之,一致性高,那么人类较容易对文本难度做出一致的划分,表明原先的10级假定是有意义的。
文本难度分级的主要方法。汉语的复杂性大大提高了文本可读性评价的难度,基于神经网络模型来展开汉语文本的难度分级具有较好的可行性。
主流神经网络模型中,卷积神经网络CNN能够抽取局部n-gram特征却无法捕捉长距离依赖关系;循环神经网络RNN可以处理序列结构,但在分类任务上由于关键词的不同位置而影响实验结果。结合两种模型的优点,我们可以提出CNN+LSTM的难度分级模型,特征提取过程从词到短语再到篇章,符合人们在阅读过程中对文章的理解过程。研究机构可以搜集教材语料库作为实验数据,同时人工构建一个汉语文本分级评测语料,基于两个数据集对不同神经网络模型进行详细的实验。
对于儿童图书数据集的难度分级,研究机构可以采用几种不同方法进行实验。一是使用传统的可读性公式,把公式得分作为图书的难度值。二是使用支持向量机模型对图书进行难度分类,使用的特征包括字词句特征、BERT特征和不同类型的LDA主题特征。三是使用神经网络模型对图书进行难度分类,使用CNN和LSTM这两个模型,并尝试在模型中融入支持向量机的字词句特征,来进一步提升分级的准确率。
分级系统网站的开发。构建具有针对性的包含权威语文教材语料的检索系统十分重要,它可以实现以下功能:一是可在教材的现代文中对任意关键词进行精确匹配全文检索以及正则表达式匹配全文检索;二是可在教材的文言文与诗歌中对任意关键词进行精确匹配全文检索;三是可查看任意检索结果的文章详情;四是体裁、总字数、平均句长、最长句长以及包含的新汉语水平考试(HSK)各等级词汇列表;五是可对用户输入或上传的文章及文章片段进行分级;六是可对用户输入或上传的文章及文章片段进行统计分析。
● 结语
中文文本阅读难度的自动分级效果还有提升空间:其一,扩充分级阅读的文本数据,构建更大规模的汉语文本难度分级语料库;其二,在神经网络模型中融入丰富的语言特征和先验知识,进一步提升难度自动分级系统的性能;其三,将文本难度分级与儿童自身的阅读水平相匹配,构建完整的儿童图书分级推荐系统。