APP下载

从计量文体学角度分析总统就职演讲

2019-12-05佟玉平汪琳

现代交际 2019年19期
关键词:语料库

佟玉平 汪琳

摘要:计量文体学作为一种新的文体学研究方法,将语言学与计算机技术密切结合,对文章的语言特色进行定量分析,对文章的语言用词方式、语言规律进行描述。总统就职演讲作为一种典型的政治性文体,对其语言规律进行历时性探索可以看出,在美国两百多年的历史里演讲这种文体的语言进化过程。从最开始的探索过程到逐渐意识到演讲对群众的煽动作用,演讲的用词开始形成一个整体的规律。

關键词:计量文体学 总统就职演讲 语料库

中图分类号:H315  文献标识码:A  文章编号:1009—5349(2019)19—0116—02

总统的就职演讲实际上是借用演讲的语言技巧来塑造新总统的良好形象,甚至向观众展示语言背后隐藏的意识形态。目前国内学者对总统就职演讲的研究涉及语法隐喻、人际意义分析、文体分析、中美领导人语言特色分析、话语策略研究,以及系统功能语法框架下的批评话语分析、评价理论分析等多个领域。本文将从文章的用词风格和文体特征这一方向出发,通过计量文体学理论从历时分析的角度对总统就职演讲这一文体进行概括总结。

一、文献综述

计量文体学基于语料库的研究,以计量的方式定量地分析文本,在语料库语言学的基础上对文本进行更深入的统计与分析。Leech和Short早就认为文体学需要统计这种定量分析来获得客观的分析结果,以支撑对语篇文体特征的主观判断。[1]Enkvist也曾认定文体特征具有统计学原理。他认为文体标记在不同文本内出现的密度显著不同,这就是语言文体学被称为定量科学的原因。[2]计量文体学中一项流行的研究是测定文体。它研究不同语篇中的词长、句长等特征以确定其作用。[3]

本文将对美国总统就职演讲这一特殊文体进行计量文体学分析,以一种全新的角度观察总统就职演讲这一文体的历时发展过程,观察随着时间的变化对语言发展的影响。计量文体学、语料库语言学等研究中经常以AntConc,Wordsmith等语料库工具进行分析。本文在分析工具方面大胆创新,将语言学与计算机更深入地结合,用人工智能领域的编程语言python的文本分析功能对总统就职演讲进行计量文体学分析。

二、整个就职演讲语料库的语言特征

首先,使用python中的nltk(自然语言工具包)下载所有的语料库资源。它包含了大量语料库资源,如古登堡语料库、布朗语料库、就职演讲语料库、路透社语料库等,python也有第三方库,科学计算包numpy和scipy可以帮助计算语料库翻译中常用的定量指标。计算完成后,利用统计模块对数据进行均匀性检验、方差分析和卡方分析。描述性统计也可以通过绘图库matplotlib可视化。[4]

总统就职演讲的总形符数是135689;总类符数是9097。这意味着总统就职演讲语料库中有135689个单词和9097个词汇。形符数除以类符数的百分比为13.99%,标准百分比为42.4%。从这个判断来看,词汇密度应该是一般的。在总统就职演讲中共有4191个低频词。如果我们不看上下文,就很难用低频词来理解文本主题。就职演说语料库中最常见的词是3个字母的词。接下来是2个字母的单词,第三个是4个字母的单词,然后是1个字母的单词。超过一半的单词不超过4个字母。最长的单词有17个字母,最短的单词有1个字母。

还可以看出,只有4906个词重复使用,起着重要的语义作用。因此对文本的分析研究实际上是集中在这些重复和经常使用的4906个词上。

三、历时性语言特征

不同的总统在演讲时可能有自己的语言风格和习惯。因此,在总结就职演说语料库整体语言特征的基础上,从不同总统语言习惯的角度分析其语言特征。

使用python编程,可以方便地获取总字符数、单词平均长度、英语单词总数、句子数、平均句子长度、词汇数和单词重复次数等数据。根据单词和句子的因素,获得的数据将重新整合到表1中。

表1可以看出,单词数最多的年份是1841年,而单词数最少的年份是1793年。据统计,在长度上有四个不同的阶段:(1)建国初期,从第一任总统到第四任总统,大部分演讲都是有接近一万的字符数。此时,话题相对有限。例如,华盛顿的第二次演讲只说我来这里向你们宣誓。(2)从第五届到第十六届总统林肯,演讲字数急剧增加,增加了一倍多,有超过5000字的演讲,以第九届总统哈里斯为代表。他的演讲共8464个字。这是从“门罗派”到内战结束的时期。(3)内战后,胡佛第31次大萧条是美国经济发展成为世界强国时期。这一时期的讲话时间较长,但总体上减少了。(4)从第32位罗斯福到现在的特朗普,篇幅大大缩短了。随着时间的变化,总统就职演说越来越多地使用了简短的词语,这似乎与时代的变化是一致的,演说越来越简洁。

从“平均句子长度”和“单词重复次数”两列来看,近百年来,句子越来越短,单词越来越短,词汇重复次数也越来越多,这一点更为明显。

总统的讲话通常是1个小时左右。最长的是1841年威廉哈里森总统的演讲,长达2小时。但是总统演讲的时间越来越短,基本上大约是20分钟。

四、结语

作为一种特殊的政治性演讲,总统就职演讲是一种非常具有代表性的珍贵语料。本文从计量文体学角度出发对总统就职演讲的语言特征进行分析。得到结论为总统就职演讲的词汇密度一般。近百年来,句子越来越短,单词越来越短,词汇重复次数也越来越多。作为一种政治性演讲,其规律性越来越强,在语言使用层面也趋向规律性和简洁性。

参考文献:

[1]McEnery,Tony& Andrew W.CorpusLinguistics.An Introduction[M].Edingburgh:Edingburgh University Press,2006.

[2]桂诗春,宁春岩.语言学研究方法[M].北京:外语教学与研究出版社,2005.

[3]胡壮麟,刘世生.西方文体学辞典[Z].北京:清华大学出版社,2004.

[4]王天奇,管新潮.语料库语言学研究的技术拓展——“Python文本分析:用可实现的方法挖掘数据价值”[J].评外语电化教学,2017(10):177.              责任编辑:赵慧敏

猜你喜欢

语料库
语料库辅助英美文学教学模式初探
可比语料库的建立及翻译教学研究
基于语料库翻译学的广告翻译平行语料库问题研究
护理英语语料库建设探索
如何利用语料库语言学提高英语教学
浅谈语料库分类及用途
近5年语料库应用于外语教学的研究综述
国内外语料库建设研究简述
运用语料库辅助高中英语写作
关于“nothing succeeds without a strong will”的语料库研究