基于大规模语料库的情感与修辞互动研究*
2019-01-15张永伟顾曰国
张永伟 顾曰国
(中国社会科学院语言研究所,北京 100732)
提 要 情感与修辞互动是我国修辞学永恒的主题之一。本文首先回顾前人分别从作者和读者两个视角研究所形成的两个主流范式。主流范式涉及的语料是文字型的文学作品。研究大众语言中的情感修辞刚刚出现。本文的主旨是提出一个基于大规模语料库研究情感与修辞互动的思路。其研究的对象不是作家个体情感修辞技巧,而是普通话语言群体的情感修辞特点。语料库包括词典库和4亿字左右的《人民日报》文字文本库。文章提出基于语料库的情感与修辞互动研究理论架构;根据“感”和“情”双字情感词重构情感与修辞互动研究的基本概念;统计并举例分析“喜、惊、思、忧、怒、恐、悲”七情的情感言语行为。最后以讨论本文的不足与未来研究方向结束。
一、 引 言
情感研究在我国有很悠久的历史。我国先秦文献《礼记·礼运第九》写道:“何谓人情?喜怒哀惧爱恶欲七者,弗学而能。”这是目前看到最早的记述情感的文字之一。中医一直重视情感研究,中医奠基之作《黄帝内经》(紫图2012)多处论述情志不稳会导致病症。“情志”即通常说的“七情”,分为“喜怒忧思悲恐惊”(王洪图2008:53)。《中医学概论》(2013:134)指出:“宋代陈无则以天人表里立论,把病因分为三大类:…… 情志刺激致病,是病因学的一大组成部分。喜、怒、忧、思、悲、恐、惊等情志变化引发的疾病……”情感甚至是儒学的核心要素。蒙培元(2002: 1-2)指出:
通过对儒学中有关情感的主要内容、性质、地位及其作用的探讨,我们发现,情感是全部儒学理论的基本构成部分,甚至是儒学理论的出发点。通过对情感与意志、欲望、知识,特别是情感与理性的关系问题的探讨,我们发现,所谓意志、欲望、知识等,都与情感有关,而且在很大程度上是由情感需要、情感内容决定的。
正是在上面这个政治、社会、文化的大背景下,情感与修辞产生了千丝万缕的联系,成为中国修辞学史上一个永恒的探索主题。梁启超(1999[1922]:3921)说出了中国文人的主流观点:“天下最神圣的莫过于情感:…… 用情感来激发人,好像磁力吸铁一般,有多大分量的磁,便引多大分量的铁,丝毫容不得躲闪,所以情感这样东西,…… 是人类一切动作的原动力。”因此,梁启超(1999[1922]: 3978)认为与其说杜甫为“诗圣”,倒不如冠杜工部予“情圣”的“徽号”更合适。
《中国修辞学通史》(五卷套,见本文引用文献)为读者提供了大量的历代相关论述,在此无需赘言。本文的主旨是探索一个研究情感与修辞互动关系的新视角和方法,即如何利用大规模语料库对情感与修辞互动所产生的词汇进行实证型的调查与缕析。
以下分 6小节。第2节简要回顾情感与修辞互动关系研究范式,主要包括1)作家—情感—作品三者关系;2)读者—作品—情感三者关系;3)大众—情感—鲜活话语三者的关系。第3节介绍本文构建的文字语料库。第4节讨论情感与修辞互动研究的理论架构。第5节探讨情感与修辞互动基本概念体系:“心”“感”与 “情”。第6节是情感词言语行为分析举例。第7节讨论本文不足以及亟待研究的问题。
二、 情感与修辞:研究范式回顾
本文从《中国修辞学通史》(五卷套)以及其他修辞学史著作(如郑子瑜1995;袁晖2000)缕析出两条主流研究范式:一是从作者的角度看情感与修辞的关系,研究模式为作者心中有真情实感,运用各种修辞技巧把内在的情感外化为文字表述,产生富有高尚情感的作品;二是从读者的角度看情感与修辞的关系,研究模式为读者阅读作品,直觉体验作者的高尚情感,理性分析表达情感的修辞技巧,达到鉴赏作品的效果。为了跟本文讨论的其他模式作对比,下面我们用杜甫的《春望》(节选)演示这两个范式。
图1 情感与修辞互动研究经典范式
无论是哪一个范式,都有不可胜计的优秀作品和理论著作。跟本文主题直接相关的有以下五点,需要特别注意:
1. 文字与情感的关系:情感是独立于文字而存在的。比如,文盲人有情感,但没有文字。文盲人通过声音和其他手段表达情感。换句话说,文字仅仅是表达情感的手段之一。
2. 文字与真实情感的关系:人们常常心中有真情实感,但缺乏有效的文字表达手段。作家超出常人的地方正是在于创造出了有效的文字表达方式。
3. 文字与假情感:人们借用现有的情感表达方式表达心中情感,由于文字与情感是互相独立的,写下情感词语,不等于作者心中真的有跟情感词语对应的情感。杜甫《春望》用了情感词“感”“溅泪”“恨” “惊”。理论上讲,诗人写下这些词不等于相应的情感就会跃然纸上。读者读后觉得杜甫的确有此真情实感,这来自于杜甫的情感修辞技巧。
4. 情感词的功用:上面第3点不等于说情感词对表达情感毫无用处。恰恰相反,它们为人们表达情感提供一个共享交流的平台。作家的情感修辞创新为搭建这个平台做出巨大贡献,比如大量表达情感的比喻、借喻、象征等。
5. 基本义项与情感义项的划分:由于一些词语经常用来表达情感,这些词语被视为本身带有情感义。换句话说,这些词语在原来的词义外还添加了情感义。比如,“老师”“恩师”“大师”,都有“为人师”这个基本义项;它们又都是情感词,使用者用它们表达对听者的尊重(尊重属于对人、正面、社会情感,见下文)。
文学作品,特别是梁启超评说的韵文,其性质就决定了情感的重要性。但是不容忽视的是,大众日常话语里也有情感问题。理由很简单:情感不是作家的专属品,是人人都有的。情感是大众日常生活中不可或缺的组成部分。因此研究情感与修辞互动,自然而然地就要关注大众日常话语中的情感修辞。这方面学者的关注的确远远不够。Gu(2013)、顾曰国(2013)作了一些尝试。大众鲜活话语指人们日常生活中事先无文字准备、随日常事务自然而发的话语,其中自然而发的情感称之为当下情感。Gu(2013)根据国内外相关研究把当下情感分为三层:1)背景情感,2)基本情感,3)社会情感。如表1所示:
层类型值取向内容1背景情感正面对己如精神饱满、底气足、康健、兴致高负面对己如焦虑、疲惫、萎靡不振、无精打采、病态 2基本情感正面对己如幸福、爱负面对己如讨厌、恐惧、悲伤、愤怒3社会情感正面负面 中性对人如热情、尊敬 对己如高傲、得意对人如嫉妒、鄙夷 对己如沮丧、丢人如不卑不亢
表1 当下情感三层运作(详细讨论见Gu 2013: 321-325)
在Gu (2013)和顾曰国(2013)的研究架构里,情感是作为言语行为的一个组成要素考察的。一个现场即席言语行为总是有相伴随的当下情感,其中背景情感是当下情感不可或缺的层面,另外两层(基本情感和社会情感)则可能同时相随,或仅一层相随。具体情况取决于相关的言语行为。一个完美的言语行为在行使过程中,有跟其相配套的思想、情感和体貌特征,形成言、思、情、貌整一。幼儿言语行为里言、思、情、貌整一是其基本特点,而成年人往往由于种种原因,言、思、情、貌不整一,产生四者不协调甚至冲突,从而引发各种言外之意。
上面简要回顾的着重点放在研究思路上,文献梳理甚微。这是出于本文主旨的需要。上文提到过,本文的焦点是试图提供另外一个研究思路——基于大规模语料库情感与修辞互动研究。
三、 本文研究用的两个语料库
为本研究我们构建了两个语料库:一是词典库,包括《现代汉语词典》(第7版)和《现代汉语分类词典》(苏新春2013);另一个是《人民日报》图文数据库,时间跨度为2007—2016年。《人民日报》图文数据库是生语料库,每篇文章为一个HTML格式的电子文本。本文研究不涉及图像,只使用其中的文字部分。以下提到文本语料库如无特别说明均指《人民日报》图文数据库中的文字部分。
《现代汉语词典》(第7版)一共69 866个条目,其中单字词11 166个,多字词58 700个。《现代汉语分类词典》收词76 464个,其中单字词5 835个,双字词 56 373个, 三字词11 558个,四字词8 597个,五字词及以上592个。我们从这两部词典中提取两类数据。第一,查找由“感”和“情”构成的双字词,如“感动”“动感”“情诗”“诗情”。这些双字词用于探讨汉民族对情感现象的初始概念化。第二,查找跟中医七情概念相关的双字词。这里需要作简要说明,中医七情作为中医学概念,其含义跟本文所引用的有所不同。首先,《黄帝内经·素问》在阴阳五行理论的影响下,不认为情志跟人脑相关,而是跟五脏相联系。本文则吸收现代神经医学的观点,即情志的脏器主要是人脑。然而中医认为七情是人人都有的,正常状态的七情是不会致病的,问题出于放纵失控。神经医学证实这是正确的。鉴于这些考虑,我们把七情中的喜和悲作为正负情感概念的两个极点,忧居中,形成一个连续统①(如图2所示)。
图2 七情连续统
跟七情概念相关的双字词用作种子词,据此对文字语料库进行全文检索,以获取七情概念词项在真实语料中的使用情况。要做到这一点,我们需要对文字语料库进行技术处理。做法如下:
1. 数据清洗。《人民日报》对于本文研究来说是生语料库,它的原形格式是HTML,是图文混排的。本文不涉及情感与图像的互动,因此图像要清洗掉。此外,HTML的标签也要清除掉,只保留纯文字文本。这是因为我们要做中文信息处理,只能在纯文字文本下进行。
2. 得到纯文字文本的《人民日报》语料后,我们用LTP(Language Technology Platform)工具对其进行分词、分句处理。经统计,文本语料的规模约4亿字,其中2.4亿为词语形符,139万为词语类符。
3. 经过分词、分句的语料库使得我们能够对上面说的种子词进行整库全文检索。检索结果见表2。表中阿拉伯数字表示该词项在库里出现的次数,0表示《现代汉语词典》第7版有而库里无。
情感概念词汇喜高兴(13382)、快乐(11027)、欢乐(5423)、喜悦(3144)、欣喜(2628)、愉悦(1364)、狂欢(826)、欣然(663)、快活(162)、欢愉(105)、狂喜(91)、喜乐(57)、欢悦(57)、窃喜(38)、喜兴(7)、怡悦(4)、欣忭(1)惊② 惊喜(2825)、惊吓(226)、惊悚(130)、惊惧(23)、惊骇(17)、怔忪(0)思③ 考虑(33060)、思虑(109)、思忖(80)、焦虑(3307)、忧虑(2388)、谋虑(4)忧担心(13580)、担忧(6321)、忧心(469)、忧愁(255)、烦忧(32)、愁闷(5)、忧烦(4)、忧闷(1)、忡忡(1)、忧悒(1)、懆懆(0)、忉忉(0)怒愤怒(1461)、生气(975)、愤慨(582)、发作(581)、气愤(427)、不平(394)、悲愤(230)、恼火(153)、愤懑(147)、愤然(77)、恼怒(54)、发怒(38)、震怒(34)、暴怒(22)、气恼(21)、动怒(19)、冒火(18)、愠怒(7)、狂怒(6)、动气(6)、怫然(0)、挂火(0)、来火(0)、怄人(0)恐恐怖(11770)、可怕(2110)、恐慌(2051)、害怕(1965)、恐惧(1422)、畏惧(513)、惧怕(323)、惊恐(287)、惊慌(207)、惶恐(178)、吓人(156)、吓唬(65)、胆寒(57)、惶惶(41)、发怵(37)、犯怵(16)、打怵(14)、丧胆(3)、畏怯(1)、虩虩(0)、伈伈(0)、肝儿颤(0)、慑于(0)悲悲痛(1398)、痛心(1070)、悲伤(1009)、伤心(662)、悲哀(547)、悲怆(237)、哀伤(192)、悲恸(110)、悲摧(6)、哀戚(2)
表2 七情概念相关的双字词
从表2可以看出,尽管我们把检索范围限制在七情概念相关的词汇上,检索返回的数据仍然是非常大的。仅以喜概念下的“高兴”词条为例,其出现的频次为13 382。换句话说,“高兴”这个情感词在2.4亿词的语料库中被用了1万3千多次。我们想知道它是怎么用的,知道其用法我们就能够从中窥视情感与修辞互动的群体特征之一斑。为了实现这个目的,我们还要对语料库作更进一步的处理:词簇(cluster)与搭配(collocation)。下面作简要说明:
上面提到的整库全文检索,在技术上称之为关键词全文检索(concordance)。为了便于研究情感词的用法,我们把关键词的左右上下文边界定得很宽,左右分达 30个字之多。如图3所示:
图3 “高兴”关键词检索图示
逐条分析1万3千多次“高兴”用例,还是非常花费人工的。进一步作词簇和搭配处理,本质上就是试图利用信息处理技术自动找到规律,以便节省人工。所谓词簇处理,即获取情感词在文本语料库中多词连续的上下文。搭配指获取情感词在双词不连续、有隔断的上下文。关键词检索工具主要借助WordSmith软件(6.0版本)。该软件虽然也提供词簇和搭配统计功能,但存在一些问题,如统计词簇数量不准确,搭配的模式(patterns)视图不包含与单字搭配的结果,跨标点提取统计时结果存在偏差。鉴于此,本项目自主开发了词簇和搭配提取软件,以补充WordSmith的不足。
本文选择词簇的大小为3—5。为保证最大的词簇一定包含中心词,情感中心词的左边和右边最多均只能包含4个词语。本文实现的词簇提取功能与一般软件(如WordSmith)的词簇提取功能最大的不同在于将标点符号作为词语使用的上下文边界,同时词簇中必须包含情感词。前者可以避免从“老汉捋了捋胡子,高兴地说 ……”中提取“胡子高兴地说”;后者可以避免从“我们对此感到由衷地高兴”中提取“感到由衷的”,只能提取“由衷地高兴”“感到由衷地高兴”等。这样处理有利于更准确分析情感词使用的上下文。“高兴”在文本语料库中的词簇信息,如“高兴地说”1 699次;“高兴地看到”495次;“高兴的是”429次等等。
跟词簇提取一样,搭配词语可能出现在情感词左侧或右侧。提取搭配时,只统计在情感词左右两侧最多5个位置的词。如果位置数值过小,则可能漏掉常用搭配,无法全面分析;位置数值过大,高频的搭配可能都是汉语高频词,其他词会因为频次较少被过滤。仍以“高兴”为例,从文本语料中提取和统计得到的“高兴”常用二元搭配,如表3所示:
序号L5L4L3L2L1词R1R2R3R4R5LRL+R1的(265)的(343)的(460)我(669)很(2016)高兴(13382)地(3703)说(1701)了(211)的(159)的(151)很(2080)地(3720)地(3780)2取得(68)我(128)我(292)感到(604)十分(950)的(921)看到(500)记者(210)说(142)嘴(67)的(1513)说(1908)的(2886)3为(56)取得(108)让(146)让(329)非常(925)得(331)是(445)的(115)了(83)了(49)感到(1464)的(1373)很(2102)4我(52)我们(77)感到(140)他(246)感到(712)了(322)高兴(207)着(82)拢(66)在(41)我(1313)了(733)说(1965)……………………………… …………………………………………
表3 “高兴”二元搭配表
说明:从中间“高兴”读起。由中间向左,显示1—5个位置上跟其搭配的词及词频;由中间向右,显示其右侧1—5个位置上跟其搭配的词及词频。每个位置上的搭配词按频次由大到小排列。以第一排为例,“高兴”累计出现13 382次。先看其左边搭配:紧挨左边与其搭配最多的是“很”—很高兴—累计出现2 016次;第2个挨左边与其搭配的是“我”—我□高兴—累计出现669次;其余类推。再看其右边搭配:紧挨右边与其搭配的是“地”—高兴地—累计出现3 703次;第2个挨右边与其搭配的是“说”—高兴□说—累计出现1 701次;其余类推。
四、 情感与修辞互动研究理论架构
无论是作家情感修辞,还是大众生活中的情感修辞,都是针对具体个人使用情感词语的情况。本文要探讨的则不同,旨在分析使用普通话的整个群体,他们集体使用情感词的情况,即探讨情感与修辞互动所呈现出的群体特征。本课题很大,非一篇文章所能涵盖。达4亿字的文本语料库,蕴藏大量的情感与修辞互动的信息。语料库全部处理完毕需要大量的时间,截至本文提交编辑部时语料库处理只完成第一阶段的任务,故本文不得不把研究范围限于以下三个方面:
1. 搭建情感与修辞互动“集体特征研究”的理论架构。
2. 搭建架构时主要依据已经成为普通话正式词汇(限于双字词)的表达方式。为了某个特殊目的临时创作的、尚未被普遍接受的不在本文的研究范围之内。
3. 比喻、借喻、夸张等修辞格表达情感,不在本文研究之列。
关于情感与修辞互动,我们作如下过程假定。人们面对情感现象自然而然地要形成概念,人们做情感修辞即对情感现象进行概念化。在概念化的基础上再做情感词汇化,即根据某语言的词汇规则创造新词语,把概念化的情感用词语符号固定下来。以“恐”为例,人们见到蛇作出本能的害怕反应,这就是一种“恐”的情感现象。对这个现象作思考,把“本能反应”跟“蛇”联系起来,导致概念化。再把“恐本能的情感反应”用汉语词“恐”凝固下来,导致词汇化。同一个概念,可以有多个词语来表达,汉语里“恐”“害怕”“惊吓”“怕”,英语里“fear”“afraid”“fright”等在某些用法上表达的是同一个概念。
根据《礼记》“喜怒哀惧爱恶欲七者,弗学而能”,新生婴儿有天赋的情感。这是争议很大的问题。不过对新生婴儿的直接观察告诉我们,新生婴儿有“感受”体验。出世第一声“哭”是身体感受外部特殊环境作出的反应,是毫无疑问的。数月后会咯咯笑,看护人普遍把“笑”理解为宝宝心里“高兴”“快乐”。看护人看在眼里,乐在心中更不必说。本文接受这样一种理论,即新生婴儿一开始体验的是单纯的刺激感 (sensations),随着身心发育成长,一些基本情感如“喜”“怒”会逐步出现。这时的基本情感还是笼统的,当下的——即情感的发生与情感刺激物在时空间上是同步的、不能分离的。换句话说,幼儿在学说话的过程中自然习得成年人情感词,原来笼统的情感逐步越分越细④。
概念化是动态的,随着人们对现象的认识不断提高和改变而相应变化着。比如我国先哲关于“天”的概念,从西周到春秋战国,天是富有意志的人格神。后来诸子思想兴起,特别到了荀子,“天行有常:不为尧存,不为桀亡”(《荀子·天论》),天成为自然的天。同样,情感概念化也是动态的、变化着的。比如,《黄帝内经》认为情志跟五脏(心、肝、脾、肺、肾)关联,现代人则不再接受这个观念。
跟动态性紧密相连的是概念化的历史性。人们日常生活概念,情感概念,也包括科学概念,都是随着时代的改变而变化着。我们研究情感概念化,有点像考古研究,根据语料库提供的材料去重构情感概念化的蓝图。图4是我们研究的流程图:
图4 情感与修辞互动研究流程图
从语料库中提取的情感词语代表群体情感修辞行为的公共产品。公共的情感词语把情感符号化、外化(即使得内心情感外露呈现),这样群体中的个人用来与他人分享个人的情感体验。至此,这不是本文的终结目标。我们还要借助公共情感词去缕析底层的情感概念化。情感概念化反应的是群体对情感现象的认识水平。用通俗的话说,公共情感词语是现象,抓住情感概念化的运作机制才算把握本质。
那么,概念化是如何形成的呢?Gu (2017) 提出了这样一个过程图(见图5):
图5 情感事件分析操作流程图(Gu, 2017;原图为英文)
下面我们用某大学生情感自述语料演示这个过程:
呃,时间过得好快呀,啊,我都讨厌听到这个闹铃来响啦。它一响就是过了一个小时,好烦呀。一烦,哎呀,还有两三个单元呢,这可怎么办呀,真讨厌!哎呀!哦,不过,淡定、淡定、淡定,我相信你可以的。李某,加油!
(转写自大学生情感研究专门用途多模态语料库)
“闹铃响”和“还有两三个单元作业未做”,为情感触发项,分别触发了两个情感:“讨厌”和“烦恼”。两个触发项分别被“听”和“思”所感知。接着该生对触发项作评价,闹铃响是自己安排的(事件原因分析),作业未完成但应该完成(合理性分析)。自我评价显示,“讨厌”和“烦恼”这两个负面情感的责任在自己,不能怪别人。由此触发情感后续行为动机:讨厌、烦恼无补于事(实用推理)。该生意识此后连续自言自语说出三个“淡定、淡定、淡定”对负面情感实现自我管控。下划线词语都有外化这两个情感的功能。(此样例基于视频的详细分析见张舍茹、顾曰国2018)。
根据图5流程我们拟出情感识别公式如下:
我/们感到 X (即适当的情感词),当图5所示的事件过程发生。
如:我/们感到“愤怒”当日本军舰侵犯我国钓鱼岛。
“当日本军舰侵犯我国钓鱼岛”是简略的说法,可以根据图5所示展开分析。情感词在本文里视为情感事件过程里的概念化亮点。比如“怒发冲冠”,“怒”把触发的情感性质标亮,“发冲冠”把怒时发生的身体变化标亮。
在情感与修辞互动研究流程图(见图4)里,“修辞行为”出现两次:1)情感词语的产生离不开修辞;2)情感概念的产生离不开修辞。第一种情况是修辞学界所公认的;第二种情况则鲜为人知,是本文试图为读者解释的。
五、 情感与修辞互动研究的基本概念:“心”“感”和“情”
上文提到过,本文假设汉民族对情感现象的观察与认识是一个由简单到复杂的发展过程。如果这个假设成立,那么我们有必要寻找关于情感的初始基本概念。初始基本概念还满足我们探讨情感时元语言的需要。至此我们一直用“情感”这个双字词作为讨论的元语言。一旦我们从概念上探索初始更基本的东西,我们就发现“情感”作为初始基本概念的词汇表达方式并不理想。这个问题在其他语言里同样存在。英语里有emotion、 affect、 feeling、 sentiment、 passion等,都含有情感概念,即情感是它们共有的概念意义。有些研究者用emotion作为基本概念词,有的则用affect,还有的用feeling。不少研究者置它们之间的差别不顾,但从神经临床医学的角度研究情感几十年的Damasio则强调emotion 跟 feeling之间的区别,他把feeling视为更基本的东西 (Damasio 1999, 2003)。Wierzbicka (1999:1-5) 指出,的确许多研究者把emotion而不是feeling作为基本概念表达式,这样做容易给跨语言对比研究造成误解。以俄语、德语为例,这两个语言里有跟feeling而没有跟emotion对应的词。换句话说,俄语和德语母语者自述或理解情感时首先想到的是feeling,而不是emotion。Wierzbicka(1999:26)强调情感词汇是因语言而异的。情感词汇化提供一张词语网格(lexical grid),极大地影响人们对情感的认识。
非常有趣的是,重在表意的汉字为我们研究汉民族情感的初始基本概念提供了极大的便利。这是拼音文字无法做到的。由于我们不考虑初文字符号(见饶宗颐1998),甲骨文、帛书、金文成为我们寻求情感初始基本概念的语料。这些语料还做不到全文检索,我们用“心”“感”“情”作为种子词人工查找。
下面是从语料库中提取到的用“感”组建的双字词:
感 +: 感触 感戴 感到 感动 感恩 感发 感奋 感官 感化 感怀
感激 感觉 感慨 感喟 感冒 感铭 感念 感佩 感情 感人 感伤
感受 感叹 感悟 感想 感谢 感性 感言 感召 感知 感应
+ 感: 触感 百感 倍感 传感 动感 恶感 反感 骨感 观感 好感
可感 口感 快感 乐感 灵感 流感 美感 敏感 铭感 偶感 情感
肉感 善感 伤感 深感 实感 视感 手感 水感 随感 通感 同感
痛感 外感 性感 有感 语感 预感 杂感 震感 直感 质感
我们的任务是根据这些双字词重构以感—概念为元素所形成的感—概念体系(人工智能领域称之为感—概念知识本体)。根据词语及其用法缕析概念形成机制,在西方学界属于新兴的认知语义学(cognitive semantics,参见 Dirven, Langacker and Taylor 2003),即用认知科学的方法研究语义问题。实际上,20世纪初西方兴起的分析哲学,特别是语言分析哲学,先于认知语义学用概念分析法取得举世瞩目的成就。Austin提出的言语行为理论以及他的其他一系列论文(Austin 1979)代表了这方面的最高成就。本文重构所采用的正是Austin的日常语言分析法(主要是言语行为分析法)和Grice推崇的概念分析法(conceptual analysis,Grice 1987)。具体步骤包括:1)能否做言语行为?2)能做什么样的言语行为?3)用法对比,分析各词项之间的异同;4)情感事件过程(上文图5所示)综合考察;5)构建概念知识图谱。
图6是我们根据“感”双字词构建的概念知识图谱。
图6 感—概念知识图谱演示
说明:
1. 图6的中心代表感现象。对感现象的认识是从单个主体第一角度出发的,用汉语表达即“我感——”。从“我感”出发,形成概念化分支:
√ 主体对感的意识性;
√ 主体用身体去感,即体感;
√ 主体用心去感,即心感(心感包括心感的行为性和质变性);
√ 主体感的虚实性;
√ 主体感的时间性;
√ 主体感的量化性;
√ 主体感的强度性;
“我感”犹如树干,意识性、体感、心感等(上面下划线的部分)犹如枝干,枝干末梢头上(花括号里)列出语料库里发现的双字词。
2. 无论是“感+”还是“+感”,“感”与其搭配字分析时都是作为概念的表达符号。以“感官”为例,分析时“感”表达一个概念,“官”表达另一个概念。感官—概念=感—概念+官—概念。对于感—概念、官—概念来说,感官—概念是两个概念合成后生成的一个新概念。
3. 什么样的运作机制把感—概念和官—概念编织到一起?本文的假设是:取决于感—概念和官—概念在情感事件流程中所起的作用。比如,当我们把“感官、感应、感觉、感到、感性、感知、感人、善感”放在一起观察分析时,发现它们构成一个连续统,一端是接受情感刺激信号的器官,末端是该器官的最佳状态。连续统合在一起代表一个主体从简单器官反应(感官)到认知加工(善感)的自我意识不断增强的过程。“感”这个汉字因其表意特质为我们作此分析提供了不可多得的线索。这一点我们如果把这个连续统翻译成其他文字,就会看得很清楚。以英文为例,连续统的英文表达可为:sense organs,reaction,feeling,feel,intuitive, cognition,touching,highly sensitive。若单纯从英语角度看,难以构建跟汉语对应的连续统,因为英语这些词语的底层概念化体系跟汉语是不一样的。
现在我们看“情”。语料库里找到的双字词如下:
情+: 情变 情操 情场 情痴 情敌 情窦 情分 情夫 情妇 情感
情歌 情话 情怀 情结 情郎 情侣 情趣 情人 情杀 情诗 情书
情丝 情思 情愫 情调 情网 情味 情绪 情义 情谊 情意 情欲
情缘 情韵 情债 情致 情种
+情: 风情 绝情 民情 前情 真情 知情 爱情 薄情 悲情 表情
别情 陈情 承情 痴情 炽情 传情 纯情 定情 动情 多情 恩情
放情 感情 寡情 含情 豪情 激情 寄情 交情 尽情 旧情 苦情
滥情 离情 恋情 七情 亲情 倾情 全情 群情 燃情 热情 任情
容情 柔情 煽情 深情 声情 盛情 诗情 抒情 私情 送情 陶情
调情 偷情 忘情 微情 温情 无情 乡情 心情 殉情 言情 艳情
移情 幽情 友情 至情 钟情 衷情 恣情 纵情
同样,用上文提到的重构法,我们得到情—概念知识图谱,如图7所示:
图7 情—概念知识图谱
说明:
1. 上面说过,感—概念的树干是“我感——”,而情—概念的树干是“我有情”。这两个概念化的最大区别是,前者是围绕主体的情感行为构建,后者是围绕主体持有的情感心理状态构建。下一节我们将对它们之间的区别作言语行为方面的分析。
2. 感—概念知识图谱跟情—概念知识图谱有相同的分支,如质性、虚实、量化性、强度性,不同的地方更多些。最明显的是观察情现象时,除单体第一角度外,还延伸出人际间的情现象。换句话说,情现象被概念化时是超越单个主体的。双字词——群情、情人、情种、情妇、情夫、情郎——都是指人际间之情才能构建其意义。同样,双字词——送情、调情、偷情、离情、陶情、殉情、钟情、煽情、容情、无情——中的前字概念,只有当情为人际间之情才能操作。在质(类)性方面会出现交叉重叠现象,这是因为个体“情”的分类被扩延到人际间情感主体上了。
3. 分支“物化”指通过主体(人类)之外的物件来承载人类的情感,比如“情歌”,歌—概念其指称的对象是物件,情—概念其指称只能是人(人类或动物有情)。“情歌”指用“歌”去物化人的“情”,“歌”成为人类情的载体。
4. 其余的分支可以不说自明,略去。
六、 情感词言语行为分析举例
现在我们可以探讨七情概念相关情感词汇的用法问题。上面第3节提到过,关于用法的语料数据非常大,本文不可能逐条展开讨论。我们只能集中在以下两个方面举例说明:情感直施和情感报道。为节省空间,每个情感概念仅举一例。
1. 情感直施
用情感词直接做情感言语行为。这样的情感词在经典言语行为里称之为“施事动词”(performative verb),用施事动词说出来的句子为施事句,结构为:我+施事动词 (+其他成分)⑤。这是根据英语特点定义的,汉语里需要作调整。我们用“情感直施”来指称此类现象。如“儿孙们去当兵,我心里高兴!”所谓情感直施,就是在合适的当下环境里,一旦说出“我……高兴”这个话语,我表达“高兴情感”这个行为就完成了。
喜概念类
我觉得在中国是很快乐的。(情感直施构式:我+觉得+情感词)
惊概念类(包括喜惊和怕惊)
我惊喜得差点叫了出来。(情感直施构式:我+情感词+情感结果)
忧概念类
看着这么大的一笔数字,我表示担忧。(情感直施构式:我+表示+情感词)
思概念类
我对女士被迫接受搜身极感忧虑。(情感直施构式:我+情感触发项+感+情感词)
怒概念类
我十分恼火地对他说,我要投诉他们的欺诈行为。(情感直施构式:我+情感词+同步行为+情感触发项)
恐概念类
我的心里对箭毒木还是怀着恐惧。(情感直施构式:我+情感触发项+怀着+情感词)
悲概念类
噩耗传来,我感到非常悲痛。(情感直施构式:情感触发项+我+感+情感词)
2. 情感报道
用情感词来报道我或我们之外的情感状况,如“这让他们很是自豪和快乐”。“他们自豪”“他们快乐”跟“我高兴”的区别在于,前者出自第三方对他人情感状态的观察和推理,后者出自说者自己的叙说。从语用的释知性、真实性、可靠性来说,情感当事人的“我”是最佳的,而第三方的观察和推理结果,可能是误释,或假视为真,是不可靠的。
喜概念类
这让他们很是自豪和快乐。(情感报道构式:情感触发项+让+对象+情感词)
惊概念类(包括喜惊和怕惊)
无法与外界取得联系,群众一片惊慌,情绪很不稳定。(情感报道构式:情感触发项+对象+情感词+其他成分)
忧概念类
犯罪嫌疑人害怕,不敢扎了。(情感报道构式:对象+情感词+其他成分)
思概念类
李冉陷入了焦虑。(情感报道构式:对象+情感词)
怒概念类
网友们的愤怒,在情在理。(情感报道构式:对象+的+情感词)
恐概念类
孙玄毫不畏惧,开着车冲了上去。(情感报道构式:对象+不/无+情感词)
悲概念类
得知噩耗,孙东林悲痛不已。(情感报道构式:情感触发项+对象+情感词)
情感词的用法纷繁复杂,本文无法涵盖。我们把重点放在用法的构式上。选用哪一种构式,正是情感修辞的技巧问题。以惊喜的直施构式为例,除上面列举的外,语料库中还有:
我内心有种不可名状的惊喜。(情感直施构式:我+有+情感词)
我惊喜得不敢相信自己的耳朵。(情感直施构式:我+情感词+情感感知器官)
这里的有轨电车使我惊喜。(情感直施构式:情感触发项+使+我+情感词)
我当时非常紧张和害怕,生怕他出事故。(情感直施构式:我+情感词+情感触发项)
七、 存在问题和将来研究方向
本文的宗旨是提出基于大规模语料库研究情感与修辞互动的理论框架及其分析方法。研究的对象不是某些作家或某些大众的情感修辞,而是说普通话的群体的情感修辞特质。研究过程犹如考古学研究,从千年流传下来的双字词入手构建情感与修辞互动的概念知识图谱。由心—概念作为元素我们构建了两个情感与修辞互动树,树干分别为“我感—”和“我有情”。通过概念化生成树杈和枝叶(=具体词汇)。情感词汇的用法本文仅讨论两种:情感直施和情感报道。用法分析仅限于构式。
本文的不足是多方面的,最明显的有两个:一是同类研究的文献梳理不充分,二是语料库能够提供的大量数据仅使用了很小一部分。亟待研究的包括下面四个方面:第一,对文字语料库在词汇、句子和语篇层面进一步作情感信息人工标注处理;第二,在人工标注的基础上,引进机器深度学习技术进行文本数据挖掘;第三,扩大语料库的采样范围,如包括中医文献语料库、口语语料库、文学语料库等;第四,在多采样、富标签、大数据挖掘的基础上重新考察本文提出的假设、理论框架和分析方法,以求去粗取精、去伪存真。
注释
① 连续统反映心理亢奋的程度。“喜”代表正向亢奋的端头,“悲”负向亢奋的端头。“忧”居中,是因为有“喜中忧”的情况,如孩子高考得第一名,父母大喜,同时也产生担忧,生怕孩子因此骄傲自负。
② 惊引发混合情感时以惊为主。如惊喜,“惊”是主,“喜”是主引发的伴随情感。
③ 思作为中医七情之一指思虑,因考虑某事过度而伤神。本文参照之。
④ 这里我们主要根据James (1992: 24)的心理学理论。
⑤ 相关的英语文献很多。中文介绍可参见顾曰国(1989)。