基于语言学视角对历史教科书难度定量分析
2014-08-02童艳肆马婷婷
童艳肆++马婷婷
难度的研究一直是学术界讨论的热点问题。自2001年进行课程改革以来,高中历史教科书为了适应学生的需要,进行了不同程度的改革,历史分成了必修和选修,其中四个版本在不同地区使用。但是,在它们得到认同的同时,大多数学生和老师也认为高中历史教科书变得越来越难学了,其实教科书使学生觉得难学的原因是多方面的,本文将选取全国范围内使用范围最广的人民教育出版社出版的历史教课书(简称人教版)必修本为研究对象,从语言学的视角对其进行难度定量分析。历史课是除语文课之外,语言文字最多的科目。文本易读性理论认为影响语言难度的因素为字、词、句三个层面。但笔者对高中历史教科书中汉字统计发现,超出初中学生应掌握的2500个常用汉字的数量几乎很少,这说明汉字在历史教科书中造成的难度不大,那么语言难度影响就集中在词和句这两个方面,下面就从这两方面着手对所选取的研究对象进行难度量化分析。
一、词汇的量化分析
在许多中英文易读性程式中,一般是通过测量词长来反映词汇的难度。其实,词汇长度与词频高低有着一定的相关性,长词一般都不常用,而常用词也就会相应地缩短。因此,本文对词汇难度的测量将以文字工作委员会在2008年发布的《现代汉语常用词表》为测量标准,其测定方法是:将所选取的课文以100字分成几个小段,统计每段中非常用词的个数,再算出他们的平均值。根据教科书的编排特点,再从政治史、文化史和经济史中按古代近代现代这三个时代段中选取3篇课文,共计9篇作为研究对象。
表1词汇难度的测量结果
课文 平均每百字非常用词
《古代手工业的进步》 6
《交通工具和通讯工具的进步》 5.308
《世界经济的全球化趋势》 4.111
《宋明理学》 6.273
《新文化运动》 4.321
《“百家齐放”、“百家争鸣”》 6.5
《秦朝中央集权制度的形成》 7.4
《辛亥革命》 6.692
《新中国的民主政治建设》 4.583
二、句子难度的量化分析
句子是语言的使用单位,是我们传递信息的基本单位,大部分国内外对易读性公式的研究主要与两个因素有关,即语义难度和句法难度。语义难度,通常通过测量词长和词频分布来确定。如何量化句法难度,一直是人们研究的一个重点,它是与易读性相关的一组变量。目前无论英语还是汉语文本难度测定中,使用最广泛的指标就是平均句长,把句子的长短作为确定句法复杂程度的一个指标。一般认为长句的难度要比短句的难度大,因为长句指的是词语多、结构复杂、形体较长的句子,在公文事务语体、科技语体、政论语体中一般多用长句;短句则指的是词语少、结构简单、形体较短的句子,在日常会话语体、文艺语体中一般多用短句。就长句的结构形式来看,一般包括四种情况:一是修饰语较多,二是联合成分较多,三是某一成分结构复杂,四是结构层次较多。短句的表现形式与长句则刚好相反。我们来比较一下这样两个句子:
例(1)辛亥革命是中国近代史上第一次比较完全意义上的伟大反帝反封建的资产阶级民主革命。
例(2)辛亥革命是中国近代史上一次伟大的资产阶级民主革命。它推翻了中国2000多年来的君主专制制度,建立了资产阶级民主共和国。
我们不难比较得出:第一句明显要比第二句结构复杂得多,难度要大得多。这是因为第一句修饰语长,革命前有一个定语是联合短语,内中联合成分较多,自然层次较多。而第二句是由一个单句和一个复句组成的句群。单句内的定语相对来说较少,复句内有两个分句,其实这两个分句的内容都是对前面内容进一步解释和说明,更易于学生理解。
笔者在搜集资料和统计的过程中发现,平均句长也很容易测定,其具体做法就是:先计算出每一篇文章所包含的字数和句子总数,其中句子数以句末逗号、问号、省略号和感叹号为标准,其它均不以完整句子计算。然后用总字数除以总句数,就是一篇文章的平均句长。
表2平均句长统计结果
课文 总字数 句子数 平均句长
《古代手工业的进步》 1300 47 27.660
《交通工具和通讯工具的进步》 1331 42 31.119
《世界经济的全球化趋势》 945 25 37.800
《宋明理学》 1108 35 31.657
《新文化运动》 1293 38 34.027
《“百家齐放”、“百家争鸣”》 971 23 42.217
《秦朝中央集权制度的形成》 1046 37 28.270
《辛亥革命》 1331 45 29.578
《新中国的民主政治建设》 1122 29 38.690
笔者参照张宁志对29篇汉语教材课文语料难度系数的统计方法,即可表示:难度系数=平均句长+平均每百字非常用词数。
表3难度系数统计结果
课文 平均
句长 平均
每百
字非
常用
词数 难度
系数
《古代手工业的进步》 27.660 6 33.660
《交通工具和通讯工具的进步》 31.119 5.308 36.427
《世界经济的全球化趋势》 37.8 4.111 41.911
《宋明理学》 31.657 6.273 37.930
《新文化运动》 34.027 4.321 38.348
《“百家齐放”、“百家争鸣”》 42.217 6.5 48.717
《秦朝中央集权制度的形成》 29.270 7.4 36.670
《辛亥革命》 29.578 6.692 35.270
《新中国的民主政治建设》 38.690 4.583 43.273
从表中我们不难发现人教版高中历史教科书的课文难度系数处在33~49之间,近代史的难度系数比古代史的要高些,特别是现代史的课文难度系数均超过40。同时张志宁在《汉语教材语料难度的定量分析》一文中对中国现代文学作品的原文平均句长进行了统计,如:《白鹿原》为29.59;《芙蓉镇》为27.25;《平凡的世界》是24.33;《子夜》是20.62;《感情的历程》为16.18。然而人教版高中历史教科书的平均句长都要高于它们,而部分著作则是高中语文课程标准中规定课外阅读的作品。因此,历史教科书的难度也应该处在这一位置,其难度不能大于这些文学作品。此次,我们还对另外三个版本的必修普通高中历史教科书中的同类课文难度系数进行了统计,其结果如下图:
通过上表的数据显示,我们对比发现:四种版本的高中历史教科书虽然都依据《普通高中历史课程标准》进行编撰,但是语言难度差异各不相同,而且相同题材的难易差距也非常大。尽管影响教科书的难度因素有很多,然而语言表述问题确实是个不可忽视的重要因素,上面对平均句长和非常用词的定量分析,对控制教科书的难度有一定的借鉴作用,可以供教科书的编撰者参考。
三、影响教科书语言难度的原因分析
上文已经对影响课文语言难度的重要因素进行了量化分析,其结果显示:普通高中历史教科书在其语言表述存在着一定的难度。在对其变量的统计过程中,发现有这样一些原因,主要体现在:
(一)古词语和修饰语过多,造词严重
古词语包括一般所说的文言词和历史词,它们来源于古代汉语。它们虽然在现代汉语中使用,但是在日常生活中使用的频率却不高,如果一篇课文中,文言词语过多,也会给学生的理解带来困惑。如:人教版《宋明理学》一文中,出现的文言词语将近20个,讲二程的理学思想时,“人伦者,天理也”;再讲到王阳明的心学思想时,“心外无物,即心是佛”。本来这一课就很难理解,而编者们还直接地引用原著,学生就更难理解了。
endprint