叙事视角下泰国留学生口语复杂度计算特征
2020-04-12吴燕侠韦艳英
吴燕侠 韦艳英
摘 要:在口语文本中,词长、词频分布、词汇丰富度和高频词搭配强度的量化特征反映词汇复杂度;平均句长、句型分布情况用于探究语句复杂度。基于叙事视角,在词汇和句法两个维度上分析泰国留学生口语语段文本的复杂度特点。具体表现为:单音节词在总词量中占比例高,高频词搭配强度大,同义词缺乏,词汇丰富度低,反映出泰国留学生口语词汇组合形式单调;叙事性口语,以五字句为主,“是”字句和“有”字句使用频次高;在语段衔接视角上,泰国留学生口语则倾向于使用无定名结构引出话题,话题引入手段缺乏丰富性。
关键词:口语表达;复杂度;计算特征;词汇维度;语句维度
中图分类号:H195.3 文献标识码:A 文章编号:1009 — 2234(2020)10 — 0155 — 03
口语表达是衡量语言运用能力的标准之一,而研究如何提高第二语言学习者口语表达能力成为学界关注的热点。Skehan〔1〕(2009)基于复杂理论视角,分析和探究静态语言环境中第二语言习得和发展水平的有效方法,认为复杂度(complexity)、准确度(accuracy)和流利度(fluency)(简称“CAF”)是衡量语言学习者口语表达能力的重要维度。“复杂度指二语结构和词汇的多样及复杂程度”,从词汇和语法结构运用两个方面体现;通过测量词长和句长,以及词类使用频率来精确表达〔2〕(李茶、隋铭才,2017)。口语语段复杂度测量框架包括词汇测量维度和语句测量维度两方面。其中,词汇测量维度分为词长、词频分布、词汇使用丰富度和高频词搭配强度等四个观察点;语句测量维度则从平均句长和句型分布和两个方面衡量。
1.研究设计
1.1研究对象
以北部湾大学完成中级语言班学习的40名泰国留学生为测试对象,学习汉语的时间平均超过三年,来自泰国不同地区,年龄相仿(在19至21岁之间),男女各20名。
1.2研究步骤
目前常用对话、转述、演讲等形式,反馈语言学习者的口语表达能力。徐子亮〔3〕(2005)认为,复述式与交际式是培养学习者汉语语段表达能力的好方法。本文选取复述式考察方式,具体实施步骤如下:
让泰国留学生观看完无声无字幕动画短片《鹬》①。要求每一位测试者即时用汉语叙述影片中鹬宝宝的活动过程,每位测试者限时5分钟。忽略测试对象在语音上受母语负迁移的影响,通过Audacity 1.3录音,转写采用宽式转写规则,转写成word文本。得到共计8292个汉字,总词数6146个,不同类型汉字297个的封闭型语料库;单音节词类符138个,单音节词形符为4955个;双音节词类符133个,双音节词形符是1151个,没有出现两个音节以上的词语。单音节词占80.6%,双音节词仅占19.4%。
2.词汇测量维度
2.1平均词长分析
在书面语中,文本可读性与平均词长、平均句长成反比〔4〕(刘颖,2014)。平均词长越小,文本中长词越少,可读性越强,反之亦然。在口语文本中,平均词长等于所有音节数与总词数之商。叙事性口语表达中,泰国留学生口语的平均词长约为1.181,较书面语文本的平均词长值小。但是,在叙事角度下,留学生口语文本可读性并不高。例如:
(1)小小孩出去!
(2)那只鸟就向那只螺避难。
(3)它就..打出能仔细盖。
(4)它看见了螺是挖地下挖沙漠。
2.2词频分布
“概率是一种概括,一个概率命题是另外一些命题的一种摘要”〔5〕。高频词是文本中使用最多的词語,受表达内容和说话者表达方式影响。因而,对高频词的考察,可以发现测试对象口语关注点和表达特点。8个高频词在文本中分布率为23.69%,其中,单音节词频次超过100的有:它、找、螺、吃、在、了、是;双音节词频次过百的仅“妈妈”一词。
在现代汉语词类中,实词包括名词、动词、形容词、代词、副词等五种,虚词有数词、量词、介词、助词、连词、拟声词、叹词等七种。而泰国留学生口语表达中,除了没有拟声词外,其他词类频次分布差异较大。频次最高的是动词,1547次,占25.19%,其次是名词、代词,形容词在实词中频次最小,仅81次,仅占1.31%。而虚词中,副词的频次最高,共903次,其次是助词、介词、连词和语气词。
动词使用频次较高的除了“找”和“吃”外,还有“是”、“怕”、“有”、“去”、“看到”、“找到”、“知道”、“过来”等使用频次接近100。在名词中,频次最多的十个词例是:妈妈、螺、海浪、小鸟、现在、鸟、东西、浪、食物、孩子。时间名词和方位名词在泰国留学生口语中使用差异较大。时间名词出现47次,但类型单一,仅“现在”一词频次就40次。仅出现一次的时间名词有“以前”、“以后”。例如:
(1)因为以前.那个水弄到它
(2)跑了以后,跑到妈妈身边
方位名词在口语中只出现29次,常用“上”、“下”、“边”、“ 这里”、“哪里”等词,例如:海边、水下等。
副词主要有程度副词、范围副词、时间副词和否定副词,没有使用语气副词。且每一种类型副词的表达形式有限,例如程度副词“很”频次为98次,范围副词“就”64次,时间副词“就”80次,否定副词“不”97次,其他如“常常、更、从来、马上、忽然”等副词使用频次不超过10次。
在虚词中,连词、助词使用频次高于其他虚词。频率最高的连词有:然后、但是、可是、跟。
2.3高频词搭配强度
平均句长影响词语搭配的强度,即词语互信息值。一个词与另一个词共现频率越大,其互信息越大,说明这两个词的搭配越紧密。高频词之间的互信息值越小,说明词语搭配的形式越不固定,在相距5个词的位置共现的概率越低,而出口语语段复杂度越高。留学生口语中高频词共现集中在“它”与“妈妈”、“找”与“吃”两组词,搭配强度分别为0.8093和1.3376。反映留学生口语中词语组合形式单一,同义表达形式缺乏,语言单位组合与聚合关系不丰富。
2.4词汇丰富度
G.Yule认为不同文本中的高频词和低频词的分布反映出文本的风格特征,提出Yule graph用于描述文本中的词汇丰富度〔4〕(刘颖,2014)。通过高频词与低频词的分布情况,可以探究留学生口语语段中词汇的丰富度的大小。
在叙事视角下,泰国留学生口语中仅出现的1次的词共有115个,其中单音节词有:虾、喂、追、藏、喝、谁、推、床、饱、敲等,共计29个;双音节词有发现、避难、出生、快乐、跑步、生蚝、聪明、幸福、明白、可爱、泡泡、浪漫、可能、家人,共计86个。形容词在最低频次词中出现最多。(词汇丰富度=最低频次词总数/总词数=0.018)
3.语句测量维度
姚艳梅〔6〕(2012)指出,口语复杂度与语句的结构有密切的关系。在运用口语表达时,语句长度和语句类型反映各种语法单位的组合特征,以及话题引入的方式。
3.1平均句长
黄自然〔7〕(2017)基于汉语“小句”理论视角,明确汉语句长切分以书面标点符号为标准。通过统计,泰国留学生口语文本共计720句分句。平均句长是口语文本中所有句子长度之和与句子数的商,约等于8.54。平均句长值越小,文本复杂度越低。留学生口语中1-5字句占主要形式占60%,6-10字句占35.6%,11-15字句很少出现,没有15字以上的句子。当句长数值较大时,留学生口语句子语言成分组合关系单一,且多夹杂着话语标记成分,如“我觉得”、“就是”、“然后”等。例如:
(2)然后它也不知道要怎么走怎么样。那个海那个水是吗。然后它也怕那个海,就是说是水很危险。
(3)就是这个说这样一种鸟啊...就是怎么样怎么样它的生活噢!就是在哪里吃,吃什么咯,是吗?
3.2句型分布
田园诗〔8〕(2017)认为,对于中级汉语口语水平的学生,在词汇教学中应教授口语化的惯用表达式和词语,在语法教学上突出训练连句成篇的语用能力。由于口语内容的限制,在口语表达中重点观察“把”字句、“被”动句、“是”字句、“有”字句、连动句的使用情况。泰国留学生口语较多使用“是”字句和“有”字句,占总句数35%。其次是使用连动句,然而,留学生口语中的连动形式几乎是动词“找”与“吃”共现。口语中,“是”字句和“有”字句的宾语用于指语境中的实体,如鹬、海浪、沙滩等,常用专有名词、代词、“(一)量名”词组表示。“有”字句的宾语主要起领有、存在和列举的作用,具有典型的指称功能。例如:
(4)现在我看到的是一个又一个的浪头。
(5)它们都是妈妈和儿子。
(6)有那个水冲来。
4.讨论
第一,留学生口语平均词长和平均句长值较低,文本可读性不高。
口语中,留学生的口语平均词长为1.2519,平均句长数值为8.5361。在口语叙事文本中,平均词长越小,表明使用的长词越少;然而,平均句长越小,表明使用的长句越少,文本的复杂度越低,但文本可读性并不一定变得越强。例如:
(7)然后,它也看.....那个在那个土,然后它也...看它怎么样,它也弄。
文本可读性与信息传递的准确性、完整性紧密相关,可读性越高,信息传递的准确性与完整性越高。通过上两例口语语段对比,发现在口语中,平均句长数值越小,文本可读性越低。口语文本的可读性性高低,受口语表达中停顿、重复、自我修正等非流利产出因素的影响。
第二,留学生口语中冗余成分多,语用类型和功能单一。
施光亨、刘伟〔10〕(1996)指出,口语表达存在大量的冗余成分、解释性成分、估测性成分、提示性成分,并在动态表述过程中出现自我更正和重复等现象。留学口语中,“是吗”使用频率非常突出,多用于表达估计、猜测语气,起到自我更正的作用。例如:
(8)妈妈给它自己找,是吗?
(9)它也是找那个东西,螺是吗?
如“我觉得”、“就是”、“然后”等。例如:
(10)就是这个说这样一种鸟啊...就是怎么样怎么样它的生活噢!就是在哪里吃,吃什么咯,是吗?
上两例中,“然后”、“就是”仅作为话语标记,用于衔接和组织话题。作为话语标记“然后”在留学生口语出现了71次。
第三,留学生叙事性口语主要用无定名形式作为话题引入手段。
在叙事语段中,话题指谈论的实体,通常由名词短语和表存现义动词结构引入〔11〕(许余龙,2007)。在口语语段中,留学生主要使用“是”字句和“有”字句中无定名宾语结构,引出谈论的实体,推动事件的叙述。但是,口语文本中无定名形式引出话题的例句高达214例,而以“行为动词+着”形式借表示存现语义引出话题的例证仅有两例。例如:
(11)鸟妈妈飞过去,找吃的东西给小鸟吃,小鸟就在这里等着。
(12)然后它就跟着,它就看到了那个螺啊。
5.结语
在对外汉语教学中,口语教学即是研究的热点,同时也是研究的难点。本文在研究范围和数据采集上有一定的局限性,比如语料库容量不够大,又如分析对象仅限于泰国留学生。但是,作为留学生的汉语口语复杂度计算特征具有一定代表性。说明留学生口语呈现出词汇丰富度低,高频词搭配强度高;语句长度较为集中,句型单一,且倾向于指称义句式,多用无定指名结构引出话题。留学生口语表达具有复杂性、动态性、多维性等特征,口语表达能力的提升是一个复杂的过程。
〔参 考 文 献〕
〔1〕Skehan,P.2009.Modelling second language performance :Integrating complexity, accuracy, fluency, and lexis〔J〕.Applied Linguistics 30:510-532.
〔2〕李茶,隋铭才.基于复杂理论的英语学习者口语复杂度、准确度、流利度发展研究〔J〕.外语教学与研究,2017,(03):392-404.
〔3〕徐子亮.汉语作为外语教学的认知理论研究〔M〕.北京:华语教学出版社,2000:368-370.
〔4〕刘颖.统计语言学〔M〕.北京:清华大学出版社,2014:219,230.
〔5〕〔奥〕维特根斯坦(著),贺绍甲(译).逻辑哲学论〔M〕.北京:商务印书馆,2017:67.
〔6〕姚艳梅.任务复杂度、任务难度对口语表达的影响〔J〕.渭南师范学院学报,2012,(08):96-100.
〔7〕黄自然.以“字”为单位的汉语平均句长与句长分布研究〔J〕.齐齐哈尔大学学报:哲学社会科学版,2018,(01):133-138.
〔8〕田园诗.认知语言学在对外汉语词汇教学中的应用〔J〕.现代语文:语言研究版,2017,(12):84-86.
〔9〕王红旗.“是”字句的话语功能〔J〕.语文研究,2010,(03):11-17.
〔10〕施光亨,劉伟.口语表述的即时性及与此相关的口语特点——对一篇讲词的分析〔J〕.世界汉语教学,1996,(04):24-32.
〔11〕许余龙.话题引入与语篇回指——一项基于民间故事语料的英汉对比研究〔J〕.外语教学,2007,(06):1-5.〔责任编辑:杨 赫〕