计算机辅助的修辞功能分析
2016-08-01钱多秀DavidKaufer
钱多秀 David Kaufer
[摘要]修辞功能及其分析一向难以从量度上把握,现有研究通常以文学类文本为主,借助主观阅读对文本进行修辞方面的各种分析。本文借助卡内基梅隆大学开发的DocuScope修辞功能分析软件及相关统计分析工具,对美国两任总统的国情咨文(1993—2008)进行了修辞功能17个方面的定量分析,随后进行细致阅读配合该分析。结果发现,两任总统咨文的语言修辞功能不同,产生了不同的后续效果。本研究表明,基于DocuScope内置的修辞词典及其对语言行为类型的界定,通过计算机辅助软件对文本进行修辞方面的统计和分析,具有可信度和可重复性,是一种新思路,也提供了一种新方法,对现有的修辞研究具有明显的推动意义和补充作用。
[关键词]计算机辅助;修辞;分析;国情咨文
[中图分类号〕H0[文献标识码〕A[文章编号〕1008-2689(2016)03-0001-09
引言:修辞分析
西方古典修辞观和现代修辞观都认为,修辞(rhetoric)是有效运用语言、影响受众、消除分歧、取得认同的实践活动和话语艺术[1],其目的就是要影响人们的思想、感情、态度和行为,旨在影响听众接受某种思想,并付诸相应行动[2][3][4]。
修辞分析(rhetoric analysis)与文体分析(stylistic analysis)相辅相成,互有覆盖。一般认为,两者之间的相同之处在于,都是在探讨信息发出者(作者)、信息本身、信息接受者三者之间的关系,关注发出者(作者)对语言成分的选择使用及组织,并观察其效果;两者也都注重分析语言效果的实用性及其教学意义。而两者之间的区别在于前者重点在信息(文本)的形式和内容,而后者的重点在信息所产生的效果和功用,即文本或话语的修辞功能,能够在听众或受众那里引发后续行动。如下文介绍的DocuScope工具,即主要考察各类修辞特色词语所引发的语言行为类型。
就修辞分析,Bitzer[5]认为需要回答五个问题,即所谓的REALM[6]。其中,R(reader)即界定读者的年龄、性别、职业、教育程度、地位等,以确认他们与作者价值观的匹配程度及在接收信息或阅读文本之前所持的观点。E(essay)指理解文本最重要的特色、论点、布局、论据、文体特色等,以考察该文本最具理解难度、最具说服力部分,并了解其原因。A(author)指要了解作者的情况,即作者如何让自己有信服力,展示个人性格的吸引力,如何与读者建立认同感,这么做是否有效。L(limitation)即根据对读者的了解,看看这些读者对作者有什么限制作用?作者的背景知识和经验对其论点论据有什么影响?来自作者本人的性格或价值观的影响?来自文本产生语境(历史、社会、政治、经济等)的影响?M(motivation)即作者的写作或演讲动机。从这几个方面考虑,也能对修辞功能进行比较系统的探讨,但总体来说,主观性较强。
近年来,随着Digital Humanities(数字化人文研究)在美国人文学术领域的逐步开展,利用计算机辅助来进行修辞风格的分析已经取得了一定成果。如Biber[7] 等人利用语料库方法来考察不同人群和不同文本之间在语法、词汇、语言使用、语言学习等方面的具体情况。而Hyland[8]利用计算机辅助考察了8个学术领域的语言,关注多种文体,展示学者如何利用语言来组织和实施学术研究,尤其是那些资深学者所使用的修辞方法和技巧,同时揭示其背后的社会因素和学界的意识形态因素,对研究学术修辞、英语教学、语篇分析等都有启发意义。Hart 等人[9]使用计算机辅助研究了政界人士在演讲和写作时所展现的风格以及这些风格的历时变化。Pennebacker[10]利用计算机辅助对语言如何传递地位、进行欺骗、表现个性及群体意识进行了研究。
人们也一直在进行关于美国总统语言的修辞研究,还有专门的学术刊物,如Presidential Studies Quarterly。Lim[11] 对1789年至2000年间所有美国总统的就职演说和咨文进行了计算机辅助的内容分析,他得出了总统语言修辞风格在5个方面的重要变化,也是5种趋势,即越来越避免认知或评价性词语,并避免使用非常正式的词语(antiintellectual)、越来越抽象(abstract)、越来越具自我意识(assertive)、越来越民主化(democratic)及越来越对话式(conversational)。自我意识强指具行动色彩,表现出自信和力量,而较少出现被动色彩和向权威权势表示服从的暗含意义的词语。该研究认为这体现了美国的自信,具体表现在较多用第一人称和很多can类词语,比如克林顿的就职演说这一点在后来2007年美国总统大选中表现得尤为淋漓尽致,即奥巴马的竞选口号“Yes, we can!”。。相应地,表示模糊和不确定性的词语出现频率也有所下降(如if等)。其自信的原因是美国在国际上的政治、经济、军事等方面的地位。当然,如果过分强调自我,则表明日益缺失的谦卑心理。
近期国内也有一些相关研究,如吴礼权[12]利用计算机辅助对平淡风格和绚烂风格进行统计分析,由此推衍出如要建构两种语言风格时所要遵循的修辞基本原则;张煜和徐世昌[13]利用语料库,对英语专业写作教学的体裁分析法进行了探讨;卢静[14]则对译者风格进行了语料库辅助的历时性研究,并对译者风格产生原因进行历史、文化和社会的解读。这些研究基本上以文学类文本为主,结合计算机辅助方法,具有一定前瞻性、可靠性和参考价值。但国内这个方面的研究相对较少,话题较分散,也较少关注修辞性语言所产生的后续行为效果。因此,本文将在前人研究的基础上,以两任美国总统的国情咨文为例,来说明计算机辅助的修辞效果分析方法和步骤,以期对我国的相关研究有所启发。
一、 研究方法
(一) 语料搜集
1993至2008年期间的前后两任美国总统分别是比尔·克林顿和乔治·W·布什。两人分别发表了8次国情咨文。从美国白宫官方网站下载这些文件并保存为 TXT文档,分别命名为BC-1993至BC-2000和GB2001至GB-2008。
(二) 分析工具介绍
DocuScope修辞功能分析工具由美国卡内基梅隆大学英文系David Kaufer和Suguru Ishizaki合作研发,是一款基于语料的研究修辞效果的工具。主要为统计和分析文本及其组成部分(单词或单词组合)的修辞效果。每一种效果由其细分的功能特色 (即LAT)来命名,以不同颜色标示。研究者可用此工具来考察单篇文本(Single Text Viewer, STV),也可以比较多组文本的修辞效果(Multiple Text Viewer, MTV)。该工具含有超过4千4百万[15] 英语独有修辞效果模式,长度从1个单词到13个单词不等。这些模式被归于145个类型(Language Action Type,LAT),而这些类型又归在45个更高的范畴内,叫做维(dimension),这些维又被归于17个群(cluster)中。
利用该工具进行修辞效果考察时,可以就多篇文本进行(MTV),也可以就单个文本进行(STV),如图1。
DocuScope内置词典对体现话语或文本修辞功能的语言行为类型(LAT)进行了17种界定,并在此基础上,对词典的每一个词条进行LAT界定,主要为academic, assertive, descriptive, directive, elaborative, emotional, future, interactive, narrative, past, persons, privy, public, reasoning, relations, reporting, strategic (如图2和图3),而每一个类型下面,又进一步细分,如在interactive类别下(图2),还可具体分为interactive attention, interactive inquiry, interactive follow up, interactive prior knowledge, interactive second person等子类别;而narrative下(图3),有narrative verbs, narrative time shifts, narrative duration, narrative bio time, narrative background等。这些语言行为类型话语能够在听众那里产生各自的效果。比如Emotional类别的词语,反映了积极和消极两种情绪,后者又分为愤怒、恐惧和悲伤三种。文本如果在此方面得分较高,就说明该文本具有较高的感情色彩,文本所表现的现实受到感情控制的程度高。而Public类别所使用的词语具有较高公共权威性(称谓、司法等)、责任感、正面价值观(公正)、负面价值观(不公正)等。文本如果在此方面得分较高,说明该文本与国家层面事务、议事机构和法庭有关[15]。
该词典自1998年以来,收录内容一直在动态扩大和丰富[15][16][17]。其设计背景是研发者早期在修辞研究方面的理论和应用成果[16]以及后来对于语言展现理论(representation theory)方面的成果[18]。最新的理论框架以及对于该支撑词典的概述在the power of words: unveiling the speaker and writers hidden craft[19]一文中有详细论述,相关研究成果可见Kaufer & Hariman[20]、Kaufer & AlMalki[21]和Ishizaki & Kaufer [22]。利用该词典进行的修辞效果研究可见Kaufer & Ishizaki [17]。该工具也允许研究者以考察修辞效果为思路来自行创建特定领域的词典[23],也可进行具体文本的修辞效果或观察视角的分析[24]。在文学分析方面,该工具已经被证明能够有效分析莎士比亚的作品和其他现代文学作品[25]的修辞功能。
Minitab 17是一款统计分析工具,其Interval Plot(区间图)功能能够将样本分布以图形展示出来,非常直观显示样本的核心倾向性和变化程度。默认的区间图一般展示置信度为95%的均值,对考察和比较群体之间的区别尤为有效。
而AntConc是一款进行语料统计和分析的基础软件参见其官网http://www.laurenceanthony.net/antconc_index.html。,可以生成文本的词汇表(word list)、计算类型标记比(typetoken ratio)、关键词对照(keywords)、检索具体词汇或短语(concordance)等,这些功能能够帮助研究者考察文本主要内容和语言复杂程度,检索具体词语使用的语境。
利用上述三种工具,本文将对所搜集语料进行文本的修辞功能对比分析,并试图描述和总结美国两任总统的语言修辞功能。不持政治立场,完全从文本自带的修辞特色词语出发,以尽量客观的态度和角度来分析。此后配合进行的内容和词语分析,可以揭示总统演讲的语言储备和修辞风格,以及背后体现出来的种种心理。
二、 修辞分析
利用DocuScope的展示单篇语言行为类型的STV功能,发现克林顿2000年咨文中各种语言行为类型及其所涵盖的词语,如表示assertive的(图4)和表示relations的(图5)词语。也可以利用展示多篇文本语言行为类型的MTV功能,来展现所有文本的基本情况(图6)。
将本次语言行为类型分析结果导出后(如图7),在Minitab界面的open worksheet下,导入Cluster.csv文件(图8),进行区间图处理和分析,以非常直观的形式对比两组文本之间在17种语言行为类型上的差异(图9和图10),并随后根据STV和AntConc来探索这些差异在词汇层面上的具体表现。举一例说明如下:
根据区间图以及两组文本17种语言行为类别倾向性得分的简单总和(两种方法结果一致),可以看出,两组文本在assertive, descriptive, emotional, interactive, public, reporting 6个方面表现明显差异,而在academic, directive, elaborative, future, narrative, past, persons, privy, reasoning, relation, strategic等11个方面没有表现出明显差异。下面将对具有明显差异的6个方面分别考察,重点以assertive为例,以试图对两种文本的修辞效果及其手段进行总体判断。
在Assertive方面:克林顿总统的咨文要比布什总统的咨文在总体得分上较高,显示前者具有较高的自我意识。在两组文本中各抽取一例(均为两任总统的最后一次国情咨文,图11和图12):
We must be now, as we were in the beginning, a new nation. At the dawn of the last century, Theodore Roosevelt said, “the one characteristic more essential than any other is foresight . . . it should be the growing nation with a future that takes the long look ahead.” So, tonight, let us take our long look ahead — and set great goals for our nation. To 21st century America, let us pledge these things: Every child will begin school ready to learn and graduate ready to succeed. Every family will be able to succeed at home and at work, and no child will be raised in poverty. We will meet the challenge of the aging of America. We will assure quality, affordable health care, at last, for all Americans. (克林顿2000年咨文片段)
With all these steps, we will help ensure that decisions about your medical care are made in the privacy of your doctors office — not in the halls of Congress. On education, we must trust students to learn if given the chance, and empower parents to demand results from our schools. In neighborhoods across our country, there are boys and girls with dreams — and a decent education is their only hope of achieving them. Six years ago, we came together to pass the No Child Left Behind Act, and today no one can deny its results. Last year, fourth and eighth graders achieved the highest math scores on record. Reading scores are on the rise. African American and Hispanic students posted alltime highs. (布什2008年咨文片段)
上述两个样本,篇幅基本一致,可以看出,克林顿比布什使用了更多表示自信特色的词语。根据STV统计,在8年的国情咨文中,克林顿一共使用了3415 次有assertive语言行为类型的词语(占总篇幅0059),而布什一共使用了2062次(占总篇幅0052)。总体来说,出于美国在各方面领先的国际地位,两位总统均表现自信。在本次小样本中,离任时的克林顿的自信程度更高,对未来的眼光更为正面和积极。
同理,其他5个方面的情况如表1。总体上可以看出,在emotional方面,布什使用了更多能够唤起听众情感的词语,而在其他descriptive, interactive, public, reporting方面,克林顿均使用了较高频次的词语。但考虑到布什咨文的整体篇幅(39471英文单词)要比克林顿咨文的篇幅(58306英文单词)少,布什在情感唤起方面表现更为突出。克林顿使用了总共1146次情感词语,其中正面情感379次,负面情感767次;布什使用了供1296次情感词语,其中正面情感297次,负面情感999次。
这一点可以明显说明,在2001年的9·11事件之后,当时的布什总统需要团结尽可能大范围的听众,来参与和支持美国所引领的反恐战争。这种特定历史背景下的情感唤起作用,尤其是负面情感词语的大量使用,引发听众的情感方面的认同(如恐惧、气愤、对未来的不确定等)[4],能够鼓励听众的高度支持和积极参与,满足了亚里士多德[26]提出的达到修辞效果所需要的两个方面,即logos(主题)和pathos(情感)亚里士多德还提出了第三个方面,即说话者(作者)的ethos(个人品格),非本文探讨范围。,从而起到了应有的修辞效果。
其他方面也是如此,即布什使用了相对较多的描述性、互动性、公共性和报告性词语,能够让听众感觉比较形象,触发他们的交流愿望,使他们有参与国家国际大事的意愿和积极性,整体上使听众有认同感,对咨文中所涉内容也有栩栩如生、感同身受、亲临其境的效果。
为了进一步确认两任总统国情咨文的修辞风格,还可以采用AntConc进行词汇和关键词方面的统计分析,可以看出,克林顿的咨文中(图13),类型标记比 (typetoken ratio)为0.09,而布什的咨文中(图14),类型标记比为0.149 。通过关键词对比(参考对照语料为两组文本总和),可以发现,克林顿的咨文大体上与国内事务和家庭事务有关(图15),高频关键词有work, welfare, children, challenge, community, parents等,而布什的咨文大体与国际事务有关(图16),高频关键词是Iraq, terror, terrorists, Iraqi, Qaeda, freedom, Afghanistan, war等。这从一个侧面反映了两组文本内容上的基本区别,也反映了两任总统在任期内的不同关注点及对听众听完国情咨文后的不同期望。
三、 讨 论
上述利用计算机辅助工具进行的各种分析表明,在内容上,克林顿考虑国内事务较多,而布什考虑国际事务较多;在功能上,两任美国总统的国情咨文在学术性、指导性、说明性、前瞻性、思辨性和战略性等方面,表现比较一致,但在所表现出的自信度、与听众的情感交流程度、需要公众认识及体验国家国际政策的程度、向听众汇报情况的语气等方面表现出不同,即虽然两位总统均高度自信(克林顿更高一些),但由于所处历史环境不同,布什咨文里各类语言行为类型词语及其所引发的行为效果要更为强烈。历史事实也表明,布什总统成功运用政治修辞,在一定时期内快速在民众心理上建立起了反恐战争的合法性和正义性[27],其任期内发动的反恐战争,姑且不论其成功与否,积聚了巨大人气,凝聚了大量人心,确实激发了美国人民参战的高度意愿,短时间之内在世界范围发动了多场以反恐为口号和目标的战争,这是其政治修辞的一个明显效果。
四、 结 语
DocuScope工具经过两位主要研发者历经20年的工作,已经基本成熟,能够处理任何一类文本,也可进行多种文本的对比分析。但定量数据导出之后,对文本的细致阅读是必不可少的。本文的研究表明,在该工具背后标注了修辞特色的大型词典支撑下,对语料进行修辞特色的标注,保证了分析的一致性,有效提高了人文学科进行数字化研究的效度和信度[28],从而避免了以往以主观阅读得出的多为印象式选择性结论[15]。本文希望通过引入这种新型的计算机辅助的修辞分析研究思路及其方法,大力推动修辞学科的研究继续向实证方向发展,对其他相关学科,如语用学研究、英语教学、汉英翻译教学也会有一定启发意义。
[参考文献〕
[1] 陈小慰. 翻译教学中修辞意识的培养 [J]. 外语教学理论与实践, 2012, (3): 86-90.
[2] 刘亚猛. 追求象征的力量: 关于西方修辞思想的思考[M]. 北京: 三联书店, 2004.
[3] Herrick, J. A. The History and Theory of Rhetoric: An Introduction (2nd edn) [M]. Boston: Allyn and Bacon, 2001.
[4] Burke, K. A Grammar of Motives [M]. New York: Prentice Hall, 1945.
[5] Bitzer, L. The rhetorical situation [J]. Philosophy & Rhetoric, 1968, (1): 3.
[6] URL:http://writing.colostate.edu/guides/teaching/co301aman/pop7b13.cfm, 2015/09/28.
[7] Biber, D., Conrad, S. & Reppen, R. Corpus Linguistics: Investigating Language Structure and Use [M]. Cambridge: CUP, 1998.
[8] Hyland, K.Disciplinary Discourses: Social Interactions in Academic Writing [M]. Ann Arbor: University of Michigan Press, 2004.
[9] Hart, R., Childers, J. P.& Lind, C. Political Tone: How Leaders Talk and Why [M]. Chicago: Chicago University Press, 2013.
[10] Pennebacker, J. W. The Secret Life of Pronouns: What Our Words Say about Us [M]. New York: Bloomsbury Press, 2013.
[11] Lim, E. T. Five trends in presidential rhetoric: an analysis of rhetoric from George Washington to Bill Clinton [J]. Presidential Studies Quarterly, 2002: 328-366.
[12] 吴礼权. 平淡风格与绚烂风格的计算统计研究[J]. 云南师范大学学报, 2004, (2): 42-46.
[13] 张煜, 徐世昌. 基于语料库的体裁分析法英语专业写作教学实证研究[J]. 外语界, 2011, (6): 49-55, 78.
[14] 卢静. 历时视阈下的译者风格研究—语料库辅助下的《聊斋志异》英译本调查[J]. 外国语, 2014, (4): 20-31.
[15] Kaufer, D. & ParryGiles, S. J. Refined vs. middling styles in the Lincoln Reminiscence: comparing the rhetoric of formality and familiarity [J].Rhetoric Review, 2014, 33 (4): 344-361.
[16] Kaufer, D. & Butler, B.Rhetoric and the Arts of Design [M]. London/New York: Routledge, 1996.
[17] Kaufer, D. & Ishizaki, S. A corpus study of canned letters: mining the latent rhetorical proficiencies marketed to writers in a hurry and nonwriters [J].IEEE Transactions on Professional Communication, 2006, 49(3): 254-266.
[18] Kaufer, D. & Butler, B.Designing Interactive Worlds with Words: Principles of Writing as Representational Composition [M]. London/New York: Routledge, 2000.
[19] Kaufer, D., Ishizaki, S., Butler, B. & Collins, J. The power of words: unveiling the speaker and writers hidden craft [J]. London/New York: Routledge, 2004.
[20] Kaufer, D. & Hariman, R. A corpus analysis evaluating Harimans theory of political style [J]. Text & Talk, 2008, 28(4): 475-500.
[21] Kaufer, D. & AlMalki, A. M. “First” for women in the kingdom: Arab/West representations of female trendsetters in Saudi Arabia [J]. Journal of Arab and Muslim Media Research, 2009a, 2(2): 113-133.
[22] Ishizaki, S. & Kaufer, D. Computeraided rhetorical analysis [A]. In McCarthy, P. M. & BoonthumDeneche, C. (eds.). Applied Natural Language Processing: Identification, Investigation, and Resolution [C]. Hershey, PA: Information Science Reference, 2012: 276-296.
[23] Kaufer, D. & AlMalki, A. M. The war on terror through ArabAmerican eyes: the ArabAmerican press as a rhetorical counterpublic [J].Rhetoric Review, 2009b, 28(1): 47-65.
[24] AlMalki, A., Kaufer, D., Ishizaki, S. & Dreher, K. Arab Women in Arab News: Old Stereotypes and New Media [M]. New York: Bloomsbury Academic, 2012.
[25] Hope, J. & Witmore, M. The very large textual object: a prosthetic reading of Shakespeare [J]. Early Modern Literary Studies 9.3 / Special Issue 12, 2004, 6: 1-36.
[26] Aristotle. Rhetoric [M]. Translated by Roberts, W. R. New York: Random House, 1954.
[27] 刘文科. 权力运作中的政治修辞——美国“反恐战争” (2001—2008) [M]. 北京: 人民出版社. 2010.
[28] Hindley, M. The rise of machines: NEH and the Digital Humanities—The early years [J].Humanities, 2013, (34): 4.
(责任编辑:高生文)