字频拓扑层级的认知映射研究初探
2019-04-19陈昱王佶旻
陈昱 王佶旻
摘 要:本文探究了汉字音义的拓扑层级结构在认知中的映射状况。设计了两个“听拼音写汉字”实验,实验一为母语者组,实验二为二语者组。每组被试40人,拼音20个。实验结果采用SPSS20进行了统计上的处理和检验,结果显示:第一,母语者听到某个单音节时选用相应汉字的优先顺序与该组同音字的字频相关,其规律為字频越高的汉字,越容易被更多的母语者优先选用。第二,二语者听到某个单音节时,选用相应汉字的优先顺序与同音字字频的相关规律与母语者相同。
关键词:语言测试;同音;拓扑层级性;字频
《现代汉语》(下称《现汉》)对同音字的定义为:“读音完全相同,而字形和字义不同的一组字”。据统计,现代汉语普通话的基本音节形式为410个左右,基本音节为1260个左右,不同的工具书由于标准不同,收录的具体数值亦有所不同。例如,卢偓(2001)曾提到,有一版本的《新华字典》列出的索引中,介绍它所收录的音节形式的总数为416个,其中包括6个特殊音节形式和3个轻声音节。而教育部、国家语言文字工作委员会组织制定的《通用规范汉字表》(2013),则总共收录了汉字8105个。如此多的汉字,对应如此少的音节数量,造成了同音字在现代汉字中十分普遍的现象,如《新华字典》中读“yí”的字有28个,读“yì”的字则高达72个。与拼音文字不同的是,汉字是表意文字,人们因此普遍认为,汉语意义的不同是靠文字的形状来区别,而不是语音。以拼音文字的典型代表英语为例,英语的构词法是加长音节的数量来构成一个单词,而作为表意文字的代表语言汉语,则被认为是单音节语素语言,现代汉语的构词更被专业人士称为有“双音节化的趋势”。学界注意到了语音数量变化在汉语表意中所起到的重要作用,但对语音在作为表达单位时是如何被语言使用者快速定位、提取的研究尚有所欠缺。比如,在一连串的汉语语流中,汉语母语者是如何从众多的同音字中迅速定位符合上下文语境的某一个特定的汉字的?再比如,当一个字的语音被汉语母语者听到,母语者的大脑里首先反映的会是众多同音字的哪一个?为什么会有这种反映?而当该同音字在与其他字构成双音节词语时,母语者是否还会第一反应出该同音字?这种对某个字或某个词更快反映的情况是语言经验性的体现吗?同音词的反应差异是语音组合造成的,还是语音之间存在着某种层级关系?而这种层级关系是由音节数量的不同造成的吗?这些都是值得思考和研究的问题,对探究语言的本质是什么有着重要的意义。
一、拓扑层级性的概念
胡晓研(2010)指出,“语言是一个由底层(下层)和上层构成的层级系统。底层是一套音位和由音位组成的音节,是语言符号的形式部分。上层是音义结合体,即符号和符序列”。艾耶尔(1981)与任仙仙(2010)等也持此观点。施书宇(2010)则认为元语言的层级性包含四个方面:词汇元语言、释义、析义元语言和认知元语言。本文所定义的语音层级性略不同于以上两种,而是指同音字之间优先选用的顺序性,即有些字可能因为未知的认知原因被优先选用,有些字则不那么容易被选用。那些被优先选用的同音字可称为高层级字,类似我们说的甲乙丙丁词汇中的甲级、乙级词;不容易被选用的同音字则称为低层级字,类似我们说的丙级、丁级词。以此类推,高频单个同音字和高频双音节同音词的层级一样,都处于高层级。也就是说,在本研究中,笔者认为具有凝固意义的高频固定短语(如成语)、高频词和可以单独使用的高频字都处于同一个层级,均为高层级;而低频的固定短语、低频词和可以单独使用的低频字处于同一个层级,均为低层级。语言这种分层级的现象就称为拓扑层级性,这种拓扑层级性也会被语言使用者的认知所感知,并以一定的关系映射到认知结构中。为探究这种拓扑层级性在认知结构中的映射状况,笔者试图从单个语音的拓扑层级性出发,通过研究高频单音节汉字与母语者优先使用的汉字之间的关系,来探求语言使用者的认知映射状况。
二、实验一
实验设计一:听拼音写汉字。让母语者听到一个音后写出一个汉字,不能犹豫,要立刻写(为控制听写节奏,语音朗读间隙时间设为2秒),写一个就可以。实验所用汉字共计20个。考虑到实验二需要使用二语学习者的听写数据与实验一进行对比分析,实验所选汉字全部来自北京大学《汉字津梁》第一册(上)、第二册(中)的汉字,该书附录共计汉字579个。而《汉字津梁》里所选汉字又都来自《汉语水平词汇与汉字等级大纲》的甲级、乙级词汇。在挑选时,为避免首字母和汉字笔画数的DIF问题,利用EXCEL进行了汉字筛选处理,处理方法是:第一步,A字母到Z字母随机分层取字,尽量每个首字母下取两个汉字;第二步,将挑选出来的52个汉字按照汉字笔画数从低到高排列,然后利用EXCEL的随机函数,随机取出20个汉字,定义为该同音字的标准正字,而与标准正字同音的则称为同音字,不同音的称为错别字。采用这种筛选法是考虑到:第一,这些汉字已经通过专业的频率排序进行了筛选;第二,二语学习者都学过这些汉字,可以降低因为不会写、不认识而出现与实验一结果完全不同或者无法进行比较的风险。
根据表17可以知道,留学生被试在“听拼音写汉字”这一题上的单项得分与其整个汉字考试的总分呈统计上的显著正相关。也就是说,二语者在听单个拼音写汉字时的得分越高,其整个汉字水平越高。至此,我们通过实验一和实验二得出了以下几个结果:
第一,母语者听到某个单音节时选用相应汉字的优先顺序与该组同音字的字频相关,呈现一定的规律性,即字频越高的汉字,越容易被更多的母语者优先选用,字频越低的汉字,越不易被母语者选用,字频和汉字使用间存在统计上的显著相关。同音字之间的选用因为字频的高低呈现出一定的层级性,字频越高,该字的层级越高,字频越低,该字的层级越低。
第二,二语者听到某个单音节时选用相应汉字的优先顺序与该组同音字的字频相关,呈现一定的规律性,该规律与母语者相同。
第三,二语者听到某个单音节时能写出正字的正确率越高,该二语者的二语能力越高。
四、解释与讨论
本研究通过两个实验组“母语组”和“二语组”,采用“听拼音写汉字”的方式,用计量的方法对汉语语音的层级性进行了探讨。实验发现,汉语中确实存在语音的拓扑层级性,不论是母语者还是二语者,在听到同一个单音节时,优先反映的汉字呈现一定的规律性,而不是杂乱无章或者以汉字笔画多少的順序来反映的。同一语音对应的汉字使用先后顺序与字频高低呈现出统计上的正相关,即使用频率越高的越容易被优先使用,使用频率越低的越不容易被使用。也就是说,语音拓扑层级确实在人脑的认知结构中得到了相应的映射,也呈现出认知的拓扑层级结构。我们根据这个结论,可推知字频和该字的使用优先率之间存在某种函数关系:f(f)∝f(p)(f=frequency,p=priority)。但是这种规律在每组同音字之间不是绝对的,而是一种统计趋向或规律。
因为人脑对声音及其意义的反应和处理往往在1秒之内,这包括第一步:声音在空气中传播速度大约为340米/秒,传播20米还不到100毫秒;第二步:生物电信号的传播过程,即耳膜的振动通过听觉神经传到大脑,约需150毫秒;第三步:生物电信号的分析和发令过程,即从大脑发命令到肌肉开始动作,约为750毫秒。语音信号被如此快速地处理而不影响人类的交流与沟通,这很有可能是由于人的认知上的某种未知原因导致上述规律的存在,从而使得同音字在单用时能被先后地感知和调用。这种先后性就是笔者所说的拓扑层级性。产生拓扑层级性的生物原因也许可以使用ERP的实验方法来进行探求。
在教学上,高频字应先于低频字教给学生这一观点已经成为业界的共识。由于这种关系的存在,本研究中所反映的这种函数关系又一次从一个新的角度,辅证了这一教学观点的正确性与必要性。
五、思考与不足
本研究仍存在一些问题,可能导致上述的结论只适合本实验:
第一,文中实验所选取的被试样本量并不够多,被试背景构成亦不够全面周到,比如没有包括本科学历及以下的母语者,因此可能导致由实验得出的结论有偏向或误导。
第二,文中实验所选取的汉字受测项不够多,因此也可能导致实验的结论有所偏颇。
第三,文中所采用的字频表也可能与其他版本的字频表有出入,从而导致不能得到本研究所能得出的实验结果。
另外,由于现代汉语的双音节化趋势越来越强,如果有些字与其他字组成词语时,该词语的使用频率等于或约等于该同音字单独使用时的使用频率,这样的词里的字是不是不应该单独教学,而应按整词来教?即在教学时应该先教作为整体的词,把这种高频词置于与构成该高频词的首个字的同音高频字同样的高度来加以讲解,采用以词带字的教学法,而不是以字带词,这样是不是可以帮助二语者更好地记忆和理解该高频词?这也是笔者最初关心和想要研究的汉语语音层级性的一个方面。可惜,由于经费、时间及设计上的不足,笔者没能按照最初的设想针对实验中所选的20个字,找出相应的词:即该词的第一个音节与这20个字同音,但字形不同,并且该双音节词的词频约等于单个同音字的字频。所以,作为汉语语音层级性研究,本研究却没能涉及这样的双音节词,使得笔者最初构想的汉语语音层级性的研究打了折扣。
其次,笔者所说的高层级与低层级的区分界限在哪里?如果按照使用频率来划分,该如何划分?语言的层级性只能分为高层级和低层级两个层级吗,还是说可以划分为更多的层级?比如高中低三个层级。多少个层级的划分对语言教学有何切实的帮助和积极的影响?这些都是尚未解决的问题。笔者希望今后能够继续用计量的方法,进行汉语语言层级的相关研究,为进一步揭示语言的音义关系提供证据支撑。
参考文献:
[1]Alfred Jules Ayer. Language, Truth and Logic [M].New York: Dover Publications, 1946.
[2]Adele. Goldberg. Partial productivity of linguistic constructions: Dynamic categorization and statistical preemption[J].Language and Cognition.2016,(Special 3):369-390.
[3]Biyan Yu & Yue Jiang. Probability Distribution of Syntactic Divergences of Determiner his-(adjective)-Noun Structure in English-to-Chinese Translation [J].Glottometrics, 2018,(40):77-90.
[4]Florent Perek, Adele E. Goldberg. Generalizing beyond the input: The functions of the constructions matter[J].Journal of Memory and Language.2015:108-127.
[5]Goldberg, Adele E.; Michaelis, Laura A. One among Many: Anaphoric One and Its Relationship with Numeral One. [J].Cognitive Science.2017,(41):233-258.
[6]Goldberg, Adele E. Subtle Implicit Language Facts Emerge from the Functions of Constructions. [J].Frontiers in Psychology.2016:1-11.
[7]Goldberg, Adele E. The nature of generalization in language.[J].Cognitive Linguistics.2009,(No.1):93-127.
[8]Johnson, Matthew A.1;Turk-Browne, Nicholas B.1;Goldberg, Adele E.1.Neural systems involved in processing novel linguistic constructions and their visual referents.[J].Language, Cognition and Neuroscience.2016,(No.1):129-144.
[9]Loreto, Vittorio1,2,3;Gravino, Pietro1,4;Servedio, Vito D. P.1;Tria, Francesca2.On the Emergence of Syntactic Structures: Quantifying and Modeling Duality of Patterning.[J].Top Cogn Sci. 2016,(No.2):469-480.
[10]Nesset Tore1. Does historical linguistics need the Cognitive Commitment Prosodic change in East Slavic. [J].Cognitive Linguistics.2016,(No.4):573-585.
[11]Yaqin Wanga; Haitao Liuab. The effects of genre on dependency distance and dependency direction. [J].Language Sciences.2017:135-147.
[12]YueTian Yi Zhao; ZiYang Jia;Yong Tang; Jason Jie Xiong; Yi-Cheng Zhang. Quantitative learning strategies based on word networks. [J].Physica A: Statistical Mechanics and its Applications.2018:898-911.
[13]段益民.略論语言单位的层级性预设[J].延安大学学报(社会科学版),2001,(4):87-91.
[14]冯志伟.用计量方法研究语言[J].外语教学与研究,2012,(2):256-269.
[15]胡晓研.语言层级系统问题的再认识[J].东北师大学报(哲学社会科学版),2010,(2):133-137.
[16]黄伯荣,廖序东.现代汉语[M].高等教育出版社,2011.
[17]刘海涛,黄伟.计量语言学的现状、理论与方法[J].浙江大学学报(人文社会科学版),2012,(2):178-192.
[18]刘海涛.计量语言学:语言研究的科学化途径[N].光明日报,2012-02-15(016).
[19]刘宇红.从格语法到框架语义学再到构式语法[J].解放军外国语学院学报,2011,(1):5-9.
[20]刘玉梅.Goldberg认知构式语法的基本观点——反思与前瞻[J].现代外语,2010,(2):202-209.
[21]任仙仙.语言层级性的背离——简评《语言、真理与逻辑》一书[J].四川教育学院学报,2010,(9):74-75.
[22]施书宇.元语言的层级性研究[J].文教资料,2010,(23):34-35.
[23]温金海,张家荣.语言符号象似性的层级性探究[J].南京财经大学学报,2009,(6):77-80.
[24]杨坤.认知构式语法的基本思想及最新发展[J].西南大学学报(社会科学版),2015,(1):153-159.
[25]袁野.构式语法的语言习得观[J].解放军外国语学院学报,2010,(1):35-40.
[26]张娟.国内汉语构式语法研究十年[J].汉语学习,2013,(2):65-77.
[27]朱京津,崔显军.构式语法理论及应用研究综述[J].现代语文(语言研究版),2012,(10):7-12.