APP下载

利用Word and Phrase和Antconc分析刘欣的口语

2019-09-10周一凡

校园英语·月末 2019年13期
关键词:刘欣用词语料库

【摘要】今年5月30日,美国Fox Business Network的主播翠西和中国CGTN主播刘欣进行了一场长达16分钟的对话。本文使用两款语料分析工具,Word and Phrase和Antconc来分析对刘欣的口语,主要从其词汇的使用,包括用词丰富度,语言的精炼度和用词准确度探讨,并为英语新闻工作者的口语提升提供建议,从语言层面打开中美平等对话的通道。

【关键词】用词丰富度;语言精练度;用词准确度;Word and Phrase;Antconc

【作者简介】周一凡,河北工业大学外国语学院。

一、引言

美国Fox Business Network主播翠西和中国CGTN主播刘欣展开了一场英语电视对话。此次对话备受世界关注,十分考验中国英语主播的口语功底。总体来说,两位主播都是高水平语言使用者,两人的口语文本具有一定的代表性,能够反映出一些英语新闻的特征,分析刘欣此次对话的词汇使用能够为我国英语学习者和新闻工作者提供一些建议。

二、文本预处理

笔者通过网络获取了两人的对话内容,以txt.格式保存。最终得到翠西的口语文本为1086个单词,刘欣的口语文本为1385个单词。(以下把翠西的口语文本记作Text 1,刘欣的口语文本记作Text 2)

三、工具介绍

Word and phrase是一款由COCA的创建者伯明翰杨大学的Mark Davies制作的网站,能够直观地显示文本的词频分布。网页上的词频范围是基于COCA语料库分布的,该软件共显示3个词频范围:

1-500这个频率范围是指在COCA语料库中按照词语出现频率最多的前500个词语,占文本比重最多,通常是冠词,系动词,助动词,人称代词,介词,疑问代词,连接词等,属于高频词。

501-3000指排名501-3000位的词语,占比较少,但不属于低频词。

3000>指排名位于3000后的词语,被列为低频词。其占比越高,说明文本的简易度越低。

Antconc是由日本早稻田大学劳伦斯·安东尼教授开发的研究和数据辅助学习软件,本文将使用其中三个工具进行研究,Concordance(逐词索引),KWIC(关键词居中索引),和Word List(提供按照词频分布的单词列表)。

四、词汇的使用

1.用词简易度。英语新闻工作者是一个十分特殊的人群,在语言使用时候需要考虑受众,因此用词需要尽量简易。由于此次对话受众广泛,更加需要注重这一点。

根据Word and phrase的对比结果,两人在用词简易度上不相上下,两人都使用了76%的高频词汇,14%的中频词汇和7%的低频词汇,符合用词尽量简易的要求。

2.语言的丰富度和精炼度。类符形符比(TTR)是衡量词汇丰富度的指标之一,通常情况下类符形符比越大,词汇的丰富度越大。形符/标记(Token)指文本的总单词数,Text 1的形符(Token)数为1086,Text 2的形符(Token)数为1385。类符/词形(Type)指文本中词形的出现次数(重复单词只记作1个类符),在Antconc中统计得到Text 1类符(Type)数为422,Text 2类符(Type)数为471。

Text 1的类符形符比为38.85%,大于Text 2的34.01%,这一点说明此次对话中翠西的词汇丰富度比刘欣的高。同时也能进一步说明翠西的口语精炼度比刘欣的高。

我们在上一步得出翠西的口语精炼度比刘欣的高,说明刘欣用词重复率高于翠西。利用Antconc统计发现刘欣在对话中多次使用重复,如I learn English because…,连续使用3次,if条件句总共使用3次,这降低了刘欣口语的精炼度,而在翠西的文本中几乎没有出现语句重复。

3.词语的准确度。

(1)副词的使用。在电视新闻中,副词在语言交际中能使话语者准确地表达话语意思,明确地表明话语者的态度,从而影响人际功能的实现。 在Antconc中以ly*为检索对象检索,得到32条结果,说明两人总共使用了32个副词,Antconc中显示翠西使用15次,刘欣使用17次,两人副词使用频次不相上下。这几个副词分别是actually 5次,basically 5次,really 5次,probably 3次,certainly 2次,totally 2次,absolutely 1次,exactly 1次,simply 1次,considerably 1次,fundamentally 1次,nearly 1次,increasingly 1次,ultimately 1次,effectively 1次,only 1次。

接着,在Word and phrase中分别检索这些副词,得到他们在COCA语料库中的使用分布,发现这些词在口语文本中的使用频次完全高于书面文本(尤其是新聞报刊类文本)。

在COCA语料库中,口语语料中使用最多的几个副词分别是really 14.9599万次,actually 5.7275万次,probably 3.5751万次,certainly 2.9351万次,exactly 2.4969万次,absolutely 2.6997万次和basically 1.7057万次,simply 1.4472万次,nearly 0.829万次,totally 0.7277万次;在报刊中,这些副词的使用频次分别为really 3.805万次,actually 1.1569万次,probably 1.7028万次,certainly 0.6003万次,absolutely 0.3821万次,basically 0.3092万次,simply 1.1236万次,totally 0.322万次,nearly 1.9739万次,其余副词在口语文本和报刊新闻类文本中的出现频次都不高,故不列出。

(2)“普通家庭”的常用英语表达。刘欣在对话中使用ordinary households表示“普通家庭”,利用Word and phrase搜索得到2条结果,说明词用法极少见。

那么“普通家庭”这个概念我们该如何表达?普通的表达有三个ordinary,average,normal,家庭的表达有两个family,household,我们用family和household搭配ordinary,average和normal来检索,最后发现average family的结果是最多的,共322条。

五、结论

综上所述,刘欣口语用词简易度同翠西的不相上下,符合新闻播报的要求,但是其用词丰富度和口语的精炼度比翠西低,中国的英语学习者和新闻工作者需要中国的英语学习者和新闻工作者需要减少重复词语的使用以提高语言的精炼度。此外,文章总结出英语口语中常用的副词有really, actually, probably, certainly, exactly, absolutely, basically, simply和totally等,并指出刘欣在这次对话中的一处语言错误,即“普通家庭”的常用表达为average family,今后使用这些词语的时候都需要多多注意。

六、结束语

在全球化的今天,中国在西方国家取得话语权不仅要通过科学技术的发展,还需要通过语言这一重要的传播媒介,因此,英语主播身上承载的责任极其重大,社会和国家对他们的要求往往比一般人高,因此研究中国英语主播口语中存在的问题十分有必要。本文虽然利用对比分析法研究了刘欣的语言使用情况,但是由于研究样本过于单一,研究中得出的数据不能反映出所有中国人或是中国英语主播的口语问题。另外,由于理论知识和技术手段欠缺,研究只能停留在词汇的层面而无法上升到更加复杂的句子的研究,希望通过理论知识的丰富和软件的学习,搜集更多的语料,建立一个更加合理的语料库,进一步研究得出更加客观可靠的结论,为英语学习者和英语新闻工作者提供更寶贵的建议。

参考文献:

[1]https://mp.weixin.qq.com/s/JCuqiI3LmbJoE0__B8-5VA[OL].

[2]黄昌宁,李涓子.语料库语言学[M].北京:商务印书馆,2001,101-106.

[3]徐珊.中国电视英语新闻节目主持现状及发展研究[D].上海外国语大学,2007.

[4]黄昌宁,李涓子.语料库语言学[M].北京:商务印书馆,108-109: 2001.

[5]董丽丽.基于语料库的中国英语学习者口语中程序副词使用研究[D].兰州交通大学,2014.

猜你喜欢

刘欣用词语料库
清明节与介子推
小年赶集
基于语料库翻译学的广告翻译平行语料库问题研究
相似的内容,灵动的表达
运用语料库辅助高中英语写作
追问文本,捕捉文字背后的声音
The use of Cooperative Language Learning to improve Chinese students’ listening comprehension
语料库与译者培养探索
I Want to Be a Teacher