应用“层次分析法”优化汉语盲文分词连写规则
2015-02-20李纯莲
孙 宇,李纯莲
(长春大学 a.特殊教育研究中心;b.高教研究室,长春 130022)
普通话盲文(包括现行盲文和双拼盲文)采用《汉语盲文分词连写规则》[1](以下简称《规则》)的规范进行书写,该规范于1993年12月审定通过,在中国应用了21个年头,至今未曾修改,为我国的盲人教育作出了巨大的贡献,促进了盲文在国内的普及,进而提高了盲人的文化程度。然而,随着时间的推移,该规范在应用过程中也暴露出了很多问题,给盲文出版者和阅读者造成不少困扰。这些问题的焦点之一就是:按照《规则》进行书写的盲文存在着分词不确定的现象,同一汉语内容因人因时的不同而有不同的分词形式,尤其是在当今信息化时代,使用计算机进行分词处理所导致的“分词乱象”更为明显,即使对计算机分词算法不断改进也会产生如此现象。为此,本文从“结构分层”角度提出了一种优化《规则》的解决方案。
1 普通话盲文的“结构分层”理论
汉语语法[2]指出,从“结构层次”的角度来看,无论是句子、短语或是词组,都有一些共同的特性,即都可以通过结构分层的方法进行分析。也就是说,虽然语法单位从表面上看是线性排列的符号序列①线性排列是指按照时间先后顺序说出或写出的形式。,但实际上语法结构却是有层次性的,这种层次是指句法单位在组合时所反映出来的不同的先后顺序。语法结构的每个层次一般直接包含比它小的两个语法单位,这两个小的语法单位便是直接成分。每一个直接成分又可以包含更小的直接成分。小的语法单位是大语法单位的组成部分,大的语法单位由小的语法单位组合而成,本身又可以成为更大语法单位的组成部分。
汉语盲文是汉语明文的一种拼音表示形式,避开分词连写的规则,其语法结构是相同的。盲文的书写既分词又连写,分词是把一个一个的词划分开来;连写是将一些词连起来写。之所以这么做,主要是为了满足盲文的特殊性,一方面是避免音节结构过于松散;另一方面是便于摸读。
对汉语普通话盲文进行分词连写,就是划分出盲文句子中各个较小的语法单位并予以连写。为了叙述方便,本文把这种分词连写的较小的语法单位定义为“盲文短语”。之所以这样定义,是因为盲文短语是在词语的基础上再加上连写的规则而形成的,它不同于传统意义上的词语和短语。据此,改进《规则》中的盲文短语就可以从分词和连写两个方面来进行研究。盲文短语可大可小,从“连写”的角度来说,一种极端的形式就是不分词,这里不做讨论。
2 用“层次分析法”进行盲文的分词连写
2.1 优化《规则》的总体原则
要优化《规则》,获得合适数量的盲文短语,应当把握以下原则:
2.1.1 尽可能减少汉语盲文分词连写规则的条目
目前使用的分词连写规则条目繁多,不便于记忆和应用。该《规则》的内容大致分为两部分,前一部分主要从词类的角度列出分词连写规则;后一部分主要从词组的角度列出了分词连写规则,这两部分在内容上有重复。作为规则,必须尽可能减少这种重复现象,做到简洁精练,只有这样,才能便于使用和推广。
2.1.2 尽量考虑多用逻辑规则进行盲文的分词连写,减少专业汉语语法的应用
虽然语法知识是盲文分词连写不可或缺的工具,但大多数使用汉语的人所掌握的语法知识不可能同中文专业出身的人士相比,他们对语法的认识都比较粗浅,然而这并不影响他们对汉语的理解。所以,盲文分词连写首先要考虑的是逻辑上是否正确,其次才应该去考虑语法上是否正确。
2.1.3 应允许汉语盲文分词连写具有一定的不确定性
几千年的汉语书写实践都不实行分词连写,它有着很深的社会基础。而汉语盲文分词连写的历史也只有二十几年,其理论不完善可想而知。如同汉语盲文本身那样,盲文阅读中出现错误是不可避免的,即必须允许存在着一定的盲文容错率[3-4],盲文的分词连写也必须允许其有一定的不确定性,只不过这种不确定性应在可控范围内。
本文只研究应用层次分析法[4]来获得普通话盲文句子中盲文短语的方法。
2.2 层次分析法分词的思路
层次分析法,又称“直接成分分析法”,是对句法单位(包括短语和句子)的直接成分进行结构层次分析的方法。由于划分过程中尽可能采用二分,所以层次分析法又称作“二分法”。
改进盲文分词连写规则的一种想法,就是要通过层次分析法的“二分”原则来得到合适的盲文短语。可见,使用层次分析法来划分句子,规则简单明了、可操作性强,它以逻辑上正确作为根本出发点,符合人们的思维习惯。以这样的方式所获得的盲文短语可以作为盲文摸读的基本参考量,因为如此获得的盲文短语的数量相对固定、长度适当,而且最重要的是符合逻辑,便于摸读和理解,具有一定的优越性。
2.3 层次分析法分词的优点
层次分析法基本上是一种二分法,它划分语法单位的基本思路是从整体到局部,每次都是“一分为二”,便于宏观上把握语言内容。如果把从明文到盲文的翻译工作看作是一项工程的话,那么用工程设计的观点来看,这种自“顶”向“下”,逐步求精的结构分层分析方法有助于把握全局,减少翻译的偏差。它最突出的特点是不必拘泥于分词的细节,首要的是必须符合逻辑。
对语法单位每进行一次层次分析,就可以得到下一层次的两个语法单位(当然,并列结构的句法单位划分不限于两个下一层次的结构)。当分析到最底一层时,层次分析法结束。把这种层次分析法用图形表示出来,它就像一棵倒长的“二叉树”。如果采用某种原则,就可以把这些最底层的语法单位确定为盲文短语。所以,这种划分盲文短语的方法既符合逻辑又简单实用,而且涉及到的语法知识相对较少。
2.4 层次分析法基础知识及其应用原则
用层次分析法来分析语法单位,被划分的语法单位之间主要存在着以下五种关系:主谓关系、偏正关系(又分为定中关系和状中关系)、动宾关系(又称为述宾关系)、述补关系(又称中补关系或者后补关系)和联合关系[5]。据相关统计,这五种关系在分析句子和短语的结构时,使用的频率占到了95%以上[6],改进的《规则》中主要应用以上五种关系来划分句子层次,至于其他关系,虽然在划分句子层次时也会用到,但是使用频度相对要少得多,所以在此不再赘述。
应用层次分析法对盲文句子进行分词的原则很简单,即在语法结构划分的层次中低于三个字(含三个字)的,不用再分,该节点直接作为盲文短语;四个字及以上的成语、固定用法、专有名词等则不用分词,此外的非固定结构则继续二分。具体分析时可按如下两个步骤进行:第一步是划分结构层次,第二步是确定结构关系。
划分过程中应注意:①第一步划分非常重要,若第一步划分不当,后面的划分很难归正;②必须逐层划分,直至分析出每个盲文短语;③为避免划分过程中的遗漏,一般采用从左到右、从上到下逐块划分的分析步骤。
需要强调的是,划分时不必过分拘泥于语法关系的细节,只要符合逻辑即可,即使语法上有一些出入,也不会影响对划分后所得盲文的理解。
3 盲文分词实例
下面11个盲文句子应用层次分析法进行分词的过程如下:
例句1:滚滚长江东逝水。
分析过程:①“滚滚长江”和“东逝水”是主谓关系,得到盲文短语“东逝水”;② 滚滚长江虽然四个字,但不是固定结构。又因为“滚滚”和“长江”是偏正结构,于是可以得到盲文短语“滚滚”和“长江”。
该句分词连写为:滚滚 长江 东逝水。
例句2:我是中国人。
分析过程:①“我”和“是中国人”是主谓关系,得到盲文短语“我”;②“是中国人”是动宾关系,得到盲文短语“是”和“中国人”。
该句分词连写为:我是中国人。
例句3:鸡不吃了。
分析过程:“鸡”和“不吃了”是主谓关系,得到盲文短语“鸡”和“不吃了”。
该句分词连写为:鸡 不吃了。
例句4:我们进行社会调查。
分析过程:①“我们”和“进行社会调查”是主谓关系,得到盲文短语“我们”;②“进行”和“社会调查”是动宾关系,得到盲文短语“进行”;③“社会”和“调查”是偏正关系,得到两个盲文短语“社会”和“调查”。
该句分词连写为:我们 进行 社会 调查。
例句5:他去年去了一趟美国。
分析过程:①“他”和“去年去了一趟美国”是主谓关系,得到盲文短语“他”;②“去年”和“去了一趟美国”是偏正关系,得到盲文短语“去年”;③“去了一趟”和“美国”是动宾关系,得到盲文短语“美国”;④ “去了”和“一趟”是述补关系,得到盲文短语“去了”和“一趟”。
该句分词连写为:他 去年 去了 一趟 美国。
例句6:他迅速地从球场东头跑到西头。
分析过程:①“他”和“迅速地从球场东头跑到西头”是主谓关系,得到盲文短语“他”;②“迅速地”和“从操场东头跑到西头”是偏正关系,得到盲文短语“迅速地”;③“从球场东头”和“跑到西头”是偏正关系;④“从”和“球场东头”是介宾关系,得到盲文短语“从”;⑤“球场”和“东头”是偏正关系,得到两个盲文短语“球场”和“东头”;⑥“跑到”和“西头”是“述补”关系,得到两个盲文短语“跑到”和“西头”。
该句分词连写为:他 从 球场 东头 跑到 西头。
例句7:山上、地下、树上都开满了花。
分析过程:①“山上、地下”和“树上都开满了花”有标点符号分隔,因此不必分词,直接得到盲文短语“山上”和“地下”;②“树上”和“都开满了花”是主谓关系得到盲文短语“树上”;③“都”和“开满了花”是偏正关系,得到盲文短语“都”;④“开满了”和“花”是动宾关系,得到两个盲文短语“开满了”和“花”。
该句分词连写为:山上、地下、树上 都 开满了 花。
例句8:这就行了。
分析过程:“这”和“就行了”是主谓关系,得到盲文短语“这”和“就行了”。
该句分词连写为:这 就行了。
例句9:你忙你的去吧。
分析过程:①“你”和“忙你的去吧”是主谓关系,得到盲文短语“你”;②“忙你的”和“去吧”是述补关系,得到盲文短语“忙你的”和“去吧”。这里的语气词“吧”前面的动词是单音节,因此可以不再划分。
该句分词连写为:你 忙你的 去吧。
例句10:有事我会再找你的。
分析过程:①“有事”和“我会找你的”是偏正关系,得到盲文短语“有事”;②“我”和“会找你的”是主谓关系,得到盲文短语“我”;③“会”和“找你的”是动宾关系,得到盲文短语“会”和“找你的”。
该句分词连写为:有事 我 会 找你的。
例句11:你就歇一小会吧。
分析过程:①“你”和“就歇一小会吧”是主谓关系,得到盲文短语“你”;②“就”和“歇一小会吧”是偏正关系,得到盲文短语“就”;③“歇一小会吧” 语气词前是动词短语,因此划分成“歇一小会”和“吧”,得到盲文短语“吧”;④“歇”和“一小会”是述补关系,得到盲文短语“歇”和“一小会”。
该句分词连写为:你 就 歇 一小会 吧。
可见,应用这种分词方法,不仅简化了汉语盲文的分词连写规则,而且规则固定、逻辑清晰,获得的盲文短语相对确定。
4 结语
我国视力残疾人口逐年增多,目前已达1263万人。随着我国教育公平的逐步实现和我国残疾人教育事业的不断发展,将会有越来越多的视障者接受教育,也将有越来越多的教师从事视障教育或习得视障教育的基本技能。盲文是视障教育不可或缺的一种语言,是视障者尤其是盲人进行读写的重要工具,也是视障教育师资队伍所必须熟练掌握的重要内容。然而,我国汉语普通话盲文方案经过二十几年的应用已经表现出很多不足,其中分词连写规则被认为是导致盲文书写不确定性的一个因素。本文将汉语语法的层次分析法应用于盲文分词,简化了分词规则,使优化后的分词规则浅显易懂,易学易用,这将在很大程度上避免现有盲文分词连写中分词不确定现象的发生。
[1]滕伟民,李伟洪. 中国盲文(第2版)[M]. 北京:华夏出版社,2008.
[2]汉语语法教学中常用的析句方法. 道客巴巴文库[DB/OL].(2014-05-01)[2015-01-10]. http://www.doc88.com/p-5837177902285.html.
[3]孙宇,李纯莲,钟经华. 从容错率理论看现行盲文隐性标调[J]. 现代特殊教育,2014(6):12-13.
[4]孙宇,李纯莲. 汉语盲文的拼读容错率及其与拼读效率的关系研究[J]. 长春大学学报,2014(11):1612-1614.
[5]张谊生. 现代汉语[M]. 北京:中国人民大学出版社,2013.
[6]颜红菊. 现代汉语复合词语义结构研究[D]. 北京:首都师范大学,2007.