APP下载

谭力小说与影视的语言互动研究
——基于语料库的计量分析

2021-12-16吴玉容加晓昕

四川文理学院学报 2021年5期
关键词:代词语料库词汇

吴玉容,加晓昕

(1.华中师范大学 语言与语言教育研究中心,湖北 武汉 430079 2.四川文理学院 学报编辑部,四川 达州 635000)

0 引 言

谭力(1955-),笔名雪米莉、沙利文、覃言,重庆云阳人,从小在成都长大,现为国家一级作家.谭力先后出版作品《蓝花豹》《夏季欲望》以及《雪米莉自选集》(四卷)等四十余部.21世纪初以来,创作重心转向影视文学剧本,《女子特警队》等荣获国内各种电视剧专业大奖.影视转型的交接时期,1998年谭力独著长篇小说《夏季欲望》,以电视剧本改编而成的小说《女子特警队》为标志,2000年转战影视文学.

根据谭力代表作创作时间和内容,谭力的创作可分为三个时期:1983-1986年严肃文学时期、1986-1998年雪米莉时期、2000-2016年影视剧本创作时期.关于谭力文学创作的研究主要包括四类.第一类,严肃文学代表作评点.如肖九等人主要针对中篇小说《蓝花豹》的艺术真实、艺术得失、人物形象等进行了文本分析.[1-3]第二类,雪米莉文学研究.如祖丁远等人,主要探讨了雪米莉产生原因、作品内容、通俗特点等.[4-8]第三类,巴蜀作家代表研究.这类研究中谭力多以个体形象出现,仅是巴蜀文学研究的一部分,较笼统粗略.第四类,创作历程研究.如李浪,主要对谭力个人不同创作阶段作品的特征、局限、转变机制进行了研究.[9]

以上成果是关于谭力作品的定性研究,定量研究几乎空白.学界对当代作家转型影视文学后的语言风格变化研究甚少,影视剧本改编为小说时的语言互动亦是更少.本文将从计量风格学的角度,通过定量统计与定性分析相结合的方法,从词汇、句子以及标点符号等层面,系统分析和比较改编自影视剧本的《女子特警队》长篇小说与未经改编的《夏季欲望》的语言风格差异,分析改编小说《女子特警队》与影视剧本语言之间的互动.我们还选取了茅盾文学奖获奖作家的参照作品,进行文本对比,以期把握谭力的语言特色.

1 语 料

本文的观察语料来源于内蒙古人民出版社出版的《夏季欲望》和《女子特警队》,共约54万汉字;参照语料来源于人民文学出版社出版的《许茂和他的女儿们》《钟鼓楼》和《尘埃落定》,共约59万汉字.语料总规模超过113万汉字.我们给文本重新编号,文章后面所有图表编号均与表格1中的文本相对应.我们对文本进行了预处理,祛除了章节号、特殊符号等.再使用jieba汉语分词包对文本进行分词.

表1 语料库作品明细

选择上述参照语料库的原因如下:

(1)参照语料库作品的三位作者都是四川籍:周克芹(1936-1990),四川简阳人;刘心武(1942-),四川安岳;阿来(1959-),四川阿坝州人.孙德喜认为,地域文化精神直接影响到小说叙述焦点的定位与运动、小说话语与叙事视角的选择、言语风格的确定以及语言结构的形成;方言土语不仅丰富了小说的语言资源,而且为小说语言增色许多;作为地理风貌的自然风光进入小说,必然影响着描写这些风光的语言风格的选择.[10]42谭力生于四川,长于四川,和以上三位作家的作品一样都反映了四川特色语言风格.但当代文学理论家莫里斯·布朗肖在《文学空间》中在一定程度上肯定了这样的观点:作家像是自己的笔杆的主人,他能变得有能力牢牢地控制词语,控制他想让词语表达的东西.[11]6所以谭力又与有着不同于其他四川籍作家的语言个性.

(2)三位作者的代表作,即周克芹的《许茂和他的女儿们》、刘心武的《钟鼓楼》、阿来的《尘埃落定》,都是茅盾文学奖获奖作品,基本可以反映当代中国文学作品的价值取向和总体语言风格.对比谭力和茅盾文学奖获得者的作品,可以找出其与当代四川的其他代表作的语言风格的异同,从而找出作家谭力个人的写作风格特点等.

根据语料库,我们统计出了词长、标准型例比(STTR)、单现词(HapaxLegomena)、词汇密度、词性、平均句长、句子情感、标点符号等8个计量特征的数据,并通过交叉表卡方检验(Chi-Square Tests)和卡方拟合优度检验(Chi-Square Goodness-of-Fit Test),对比分析了谭力作品内部的词汇和句子的节奏、词汇丰富度、词汇密度、虚词显化度、口语化、叙事视角、文本可读性、文本离散度、文本情感倾向等,以及与三位四川籍茅盾文学奖获得者的代表作在部分以上特征方面的异同,以把握谭力转型时期的语言风格特点,尤其是改编小说《女子特警队》在语言方面与影视剧本的互动形式.

2 词汇分析

在词汇层面,我们主要通过词数、类符、形符、单现词、实词、虚词、人称代词、语气词等统计数据,归纳音节、词汇丰富度、词汇密度、虚词显化度、口语化、叙事视角等区别性计量特征,来推断谭力的词汇风格在转型时期的变化.部分数据如表格2所示:

表2 语料库作品的词汇层面对比表

词长=字数/词数

句长=字数/句数

标准型例比=类符/形符*10000

单现词比例=单现词/词数

2.1 词长对比

词长是总字数和词数的比值,能反映作者用词的长度.据统计,《夏季欲望》的平均词长(单位:字/词)比《女子特警队》的平均词长小0.01%,差距非常小.这体现了在转型影视初期,谭力的作品平均词长比较稳定,小说版《女子特警队》的平均句长并未因剧本版而受影响.另外,这也说明了在词长方面,谭力在相近创作时期的写作风格相对稳定.

谭力的两部作品与三部茅盾文学奖获奖作品的平均词长都很相近,都接近于1.54字/词,但都略微高于其他三部作品.具体为:B>A>D>C>E.由此推测,谭力的作品双音节词或多音节词稍多.

2.2 标准型例比对比

型例比(Type-Token Ratio,TTR),是类符和形符的比值.类符(type)即不包括重复词语在内的词型(wordform),也就是说相同的词型记为一个.形符(token)即包括重复词语在内的所有词型.比如:“我还想去看看”这句话,包含6个形符,4个类符,型例比是4/6.型例比是衡量文本的词汇丰富度的参数之一,型例比和词汇丰富度成正比.在语料库规模相同的前提下,型例比越大,说明作家使用的词汇越丰富.

王克非,胡显耀也指出,通常一个作者在写作时使用的类符数变化不大,一种语言的词汇量在某个时期也是一定的,所以,形符数随语料库容量的扩大而增加,类符数却不一定会随之增加;型例比会随语料库容量的扩大而减小,因此不同容量的语料库的型例比不能对比.[12]17因此,我们采用了标准型例比(Standard Type-Token Ratio, STTR,归一化为每万词为单位)计算词汇丰富度,如公式(1):

标准型例比(STTR)=类符(type)/形符(token)*10000(1)

根据卡方拟合优度检验结果(p=1.00>0.05)可知,《夏季欲望》的标准型例比没有显著性高于《女子特警队》,即《夏季欲望》的词汇仅略微丰富于《女子特警队》的词汇.这体现了谭力在转型初期词汇丰富度稳定的写作风格.

但是,谭力作品与茅盾文学奖作品相比,二者的标准型例比有显著性差异(p=0.03<0.05),具体区别为:C>E>D>B>A.总体上,谭力作品的词汇丰富度都比茅盾文学奖作品的词汇丰富度低一些,尤其是《夏季欲望》的词汇变化最为逊色.

谭力两部作品的标准型例比整体较低的原因大致如下:

(1)模式化创作影响.李浪指出雪米莉时期的作品呈现“模式化”特点.[9]26而且一个作者在写作时使用的类符数变化不大,可能受此影响,《夏季欲望》的词汇相似度较高.

(2)通俗文学类型影响.吴秉杰说:“通俗文学尽可能采用规范的、群众熟悉的与个性化的语言,它可以使我们立即进入熟悉的人生世界与精神世界.”[13]26作为通俗文学作品,《夏季欲望》同是如此,多选用常用词汇,从而构建群众话语体系.常用词汇使用频率高,重复率高,故《夏季欲望》的词汇相对单一.

(3)影视剧本体裁影响.《女子特警队》改编自影视剧本.周涌把影视剧本的语言分为两种:剧作语言和剧本中的人物语言.[14]169据统计,除句号、逗号外,《女子特警队》的引号和冒号在各标点符号中占比也高.由此可以推断《女子特警队》的人物对话多.口语对话中的词汇偏向生活化,多属于基本词汇.基本词汇的特点之一是全民常用性,故重复率随使用频率的增高而增高.所以,《女子特警队》的词汇变化少.

2.3 单现词对比

单现词(HapaxLegomena)是文本中词频为1的词,即只出现过一次的词,也是反映词汇丰富度的参数之一.文本词汇丰富度和单现词比例呈正比关系.单现词比例是词频为1的词的数量和总词数的比值.

单现词分四类:

(1)A作品使用而B作品未使用的词汇,称为“A作品纯单现词”,一共12194个.

(2)B作品使用而A作品未使用的词汇,称为“B作品纯单现词”,一共8842个.

(3)A作品使用频率为1和B作品使用的频率为1的共有的词汇,即A作品的单现词和B作品的单现词重复的词汇,称为“非纯单现词”,一共7341个.

(4)A作品纯单现词和B作品纯单现词的集合排除“非纯单现词”后的词汇,即“A作品纯单现词”和“B作品纯单现词”的集合,称为“纯单现词”,一共21036个.

词频为2和3的词(类符),也在一定程度上体现了词汇的丰富度,我们称之为“次单现词”.由表格3可见,A作品、B作品的次单现词类符占比分别约为24.93%、23.68%,仅次于单现词占比.二者的次单现词的形符分别是13642个和8489个,分别约占总词数的6.87%和5.79%.

表3 《夏季欲望》《女子特警队》四种类符的词频分布对比表

根据卡方拟合优度检验结果(p=1.00>0.05)可知,《夏季欲望》的单现词比例、次单现词比例只略高于《女子特警队》,二者差距不大.前面已经提及标准型例比数据反映了谭力转型初期的作品词汇丰富度相对稳定,这里单现词和次单现词的比例再一次验证了该结论.

同时前文说到与茅盾文学奖作品相比,谭力作品的词汇丰富度较低.我们又从作品语言本身探讨了原因:根据两部作品的纯单现词数量,我们可以肯定的是,两部作品的词汇丰富度之所以低,不是因为两部作品的低频词(1≤词频≤3)的类符不够多,而是高频词(词频≥4)的形符过多.换而言之,谭力两部作品的低频词类型丰富,按理词汇相似度低而丰富度高,但因高频词类型少却又数量多,使得两部作品的词汇相似度提高,词汇丰富度降低.

2.4 词性对比

在这里,我们把名词、动词、形容词、副词、区别词、状态词、数词、量词等作为实词,将起语法功能的拟声词、介词、连词、助词、语气词、叹词等视作虚词.而代词意义的确定依赖于所代指的名词,不具有稳定的词义,故代词是一种“半虚词”.在对各词类频率和比例的统计中发现,《夏季欲望》中人称代词的使用与《女子特警队》具有显著区别,故将专门讨论.此外,像英语单词或字母词之类的词,我们归入了其他词.

2.4.1实词和虚词对比

总体而言,《夏季欲望》的名词、形容词、状态词、语气词、叹词显著性低于《女子特警队》,而副词、区别词、数词、连词、助词显著性高于《女子特警队》.

实词的作用在于承载语篇信息,而虚词或者说功能词的作用在于连接实词,构建语篇.Ure J.和Stubbs M.提出实词形符与总形符的比例代表了文本的词汇密度(Lexical Density),即文本的信息含量.词汇密度与信息含量具有正倚变关系.文本的信息含量越高,文本的阅读难度越大;否则,相反.经过交叉表卡方检验,《夏季欲望》的名词、形容词、状态词均显著性低于《女子特警队》,则在信息含量方面,《夏季欲望》比《女子特警队》高,阅读难度要更大;《夏季欲望》的辞藻会更华丽,描写也会更生动、具体.原因大致如下:

表4 《夏季欲望》《女子特警队》的词类对比表

(1)实词方面,《女子特警队》的原型为剧本,刘连开指出:“影视的语言直接诉诸人们的视觉与听觉感官, 是具备造型性的语言.”[15]28也就是说,剧作语言以描写性语言为主,主要包括人物、环境、动作、心理等方面的描写.名词往往是形容词、状态词的修饰对象,因此随描写性词类的增加而增加.小说以叙述性语言为主,动词是构成述语的主要成员,副词主要修饰动词,故《夏季欲望》的副词偏多.而《夏季欲望》的描写性语言相对少,则描写性成分偏少,故名词、形容词、状态词较少.

(2)虚词方面,由标点符号占比可知,《女子特警队》对话多,偏口语化.王力认为一般英语重形合(hypotaxis),汉语重意合(parataxis).[16]334-335邢福义、汪国胜指出口语语体“多用单句……即使运用复句,一般也较少使用关联词”,[17]372说明汉语无论书面语还是口语,均重意合(parataxis),但书面语因复句较多,使用关联词相对偏多.故《夏季欲望》的连词、助词显著地较高.邢福义、汪国胜还指出口语体“语气词使用较多”,[18]372故《女子特警队》的语气词、叹词显著性偏高,具体对比如表格5.

表5 《夏季欲望》《女子特警队》的语气词对比表

2.4.2人称代词对比

在写作中,不同的人称表达效果不同.如第一人称代词有利于抒发作者情感,第二人称代词能拉近作者与读者的距离,第三人称代词是全知的“上帝视角”,叙事灵活客观.

在人称代词方面,谭力世纪之交的两部作品具有显著性的差异.《夏季欲望》以第三人称代词为主,占比56.53%.该小说以第三人称代词为叙事视角,使叙事更加冷静客观、灵活多变,而且第三人称代词叙事不受时间、空间、心理、生理的限制,便于叙事.

《女子特警队》三类人称代词分布比较均匀,第一、二、三人称代词的占比分别是35.74%、33.99%、30.27%.另外,《女子特警队》中第一人称代词和第二人称代词的复数形式显著性地高于《夏季欲望》,大致原因有二:

(1)《女子特警队》的主要人物为女子特警队的女兵,女子特警队作为一个集体,女兵们具有强烈的集体意识,流露在语言中则表现为多使用人称代词的复数形式.

(2)谭力写作时更是将女子特警队视作一个整体,作者的观念亦流露于人称代词的使用之中.但是谭力常年生活在四川,故“咱”“咱们”一类北方方言常见的第一人称代词复数形式较少.

表6 《夏季欲望》《女子特警队》人称代词对比表

3 句子分析

在句子层面,我们主要通过平均句长(average sentence length)、句长离散度(sentence length discreteness)、句子情感倾向(affective tendency)等统计数据,归纳文本可读性、文本离散度、文本情感倾向等区别性计量特征,来推断谭力的句子风格在转型时期的变化.句子层面的相关数据如表格7:

表7 语料库作品句子层面对比表

3.1 句长对比

平均句长能够反映文本的可读性,平均句长越长,文本可读性越低;否则,相反.

根据表格7的平均句长,《夏季欲望》的平均句长显著高于《女子特警队》的平均句长,说明《夏季欲望》以长句为主,句子结构复杂或字数多;《女子特警队》以短句为主,句子结构简单或字数少.长句和短句功能不同.长句一般容量丰富,语言集中紧凑,表意生动细腻、周密细致,逻辑性强,体现繁复的语言风格.短句简洁明快、短小精悍,语言简短朴素,接近日常生活口语,生活气息比较浓厚.转型时期,谭力受剧本影响,《女子特警队》的平均句长明显简短化.

语料库五部作品的平均句长大小顺序为:A>D>B>C>E.可见,谭力作品的平均句长均偏长,语言相对繁复,文本复杂化.即文本可读性则偏低,加大了读者的阅读难度.

一般说来,一个文本的句长离散度与句长重复度(句长的变化程度越小)是反倚变关系.所以,句长离散度小则句长变化不大,文本的节奏相对来说就比较平稳,而韵律感强,比如唐诗中的绝句和律诗.反之,句长离散度大则句长变化大,文本节奏相对来说就跌宕起伏,给人一种错落起伏的阅读体验.根据表格7的句长离散度一列,《夏季欲望》的句长离散度显著高于《女子特警队》的句长离散度.说明《夏季欲望》比《女子特警队》文本节奏变化大.

五部作品的句长离散度大小顺序为:D>A>C>B>E.与茅盾文学奖作品相比,谭力作品的句长离散度居中,整体没有明显的韵律感或跌宕之处.

3.2 情感倾向对比

本文通过“情感词字典”分析和加权句子的情感元素,从而实现文本的情感倾向分析.情感词字典包括积极、消极和中性三种情感倾向的词.

根据表格8和交叉表卡方检验结果(p<0.001<0.05)可知,两部作品中呈现积极、消极、中性情感倾向的句数有显著性差异.具体而言,《女子特警队》与《夏季欲望》相比,前者的消极句数显著高于后者,而积极和中性句数显著低于后者.首先,《女子特警队》的电视剧由中央电视台中国电视剧制作中心和武警总部电视艺术中心联合拍摄,在思想上宣扬主流意识形态,故而改编自剧本的小说整体上呈现积极情感倾向.其次,《女子特警队》的剧作语言仍然有所保留,剧作语言一般为比较客观的叙述描写,以便文字大都能转换成画面,产生可视化效果,因此其占比较《夏季欲望》的中性情感语言多.最后,《夏季欲望》讲述的文化气氛低迷的小县城里,夏季的男女灵魂躁动不安的故事.男主人公余长文因孤高自傲而爱情、事业不得志,女主人公梅佳丽为实现梦想前往省城孤身奋斗,却遭遇诸多挫折.故而文本主要呈现消极倾向.

茅盾文学奖作品均消极句子最多,积极句子处于第二,中性句子最少.《夏季欲望》在情感倾向分布上与其相似,大部分句子都表现出积极或消极的强烈情感倾向,且消极句子占主体,只有《女子特警队》与之不同,积极句子占比明显高于其他作品.

表8 语料库作品情感倾向对比表

4 标点符号分析

标点符号是书面语中不可缺少的部分,用来表示停顿、语气以及词语的性质.句号主要表示陈述句末尾的停顿,有时也表语气舒缓的祈使句末尾的停顿.问号表示疑问句末尾的停顿.叹号表示感叹句末尾的停顿,或语气强烈的祈使句和反问句末尾的停顿.冒号表示提示性话语或总括性话语之后的停顿.引号主要标明行文中直接引用的话语,有时标明需要着重论述的对象或具有特殊含义的词语.破折号除了标明行文中解释说明的语句,还可表示声音的延长等.省略号标明行文中省略了的话,也可表示说话的断断续续.

表9 语料库作品部分标点符号占比对比表

根据交叉表卡方检验结果(p<0.001<0.05)可知,谭力两部作品的句号、问号、叹号、冒号、引号、省略号存在显著差异,其中冒号差异最显著.具体而言,《女子特警队》与《夏季欲望》相比,前者的冒号、叹号、省略号显著地高于后者,而句号、问号、引号显著地低于后者.二者的破折号使用没有差别.由此推测,《女子特警队》的对话次数丰富,句子语气强烈.观察其文本,省略号和破折号多出现于对话之中,谭力偏爱以此表示话音的延长和说话的不连贯.《夏季欲望》中的陈述句比较多,这是由其小说体裁的叙事要求所决定的.《夏季欲望》问号和引号的使用有显著性差异,但显著性不强,说明该文本也有一定量的对话,且疑问句较多.

表10 部分标点符号*谭力两部作品交叉表

结 语

通过对113万字作品语料库的统计分析,从词长、标准型例比、单现词、词性、句长、情感倾向、标点符号等七个角度,分析谭力影视转型时期的小说写作风格,我们发现以下异同:

(1)词长方面,谭力的小说都接近于1.54字/词,双音节词或多音节词稍多,故都略微高于茅盾文学奖作品.

(2)词汇丰富度方面,谭力的小说词汇丰富度都低于茅盾文学奖作品的词汇丰富度,尤其是《夏季欲望》的词汇丰富度最为逊色,但与《女子特警队》相比无显著差异.这可能受“雪米莉”时期的模式化创作、通俗文学类型和影视剧本体裁影响.并且,两部作品的词汇丰富度之所以低,不是因为两部作品的低频词的类符不够多,而是高频词的形符过多,导致词汇重复率增加,用词稍显单一.

(3)词性方面,由词类占比可推测出,《夏季欲望》的文本连贯性强,但词汇密度较高,辞藻可能更华丽,使可读性偏低.《女子特警队》对话多,偏口语化.

(4)人称代词使用方面,《夏季欲望》多使用第三人称代词,叙事更加客观方便.《女子特警队》中第一人称代词和第二人称代词复数形式显著性偏高,是女兵们的强烈集体意识的流露.

(5)句长方面,转型时期,与《夏季欲望》相比,《女子特警队》的平均句长明显简短化,向口语的句长接近,文本节奏显著变小.与茅盾文学奖作品相比,谭力作品的平均句长都偏长,降低了文本的可读性;句长离散度居中,整体没有明显的韵律感或跌宕之处.

(6)文本情感倾向方面,与《夏季欲望》文本呈现消极倾向相反,《女子特警队》文本呈现积极倾向,以宣扬主旋律.

(7)标点符号方面,由部分标点符号的占比可推出,《女子特警队》多对话,且句子语气强烈,偏爱用破折号、省略号分别表示话音的延长和说话的不连贯.《夏季欲望》也有一定量的对话,且疑问句较多.此外,其陈述句也较多,这是由其小说体裁的叙事要求所决定的.

总体而言,谭力在转型时期,其小说与影视的语言在词性、人称代词、句长、文本情感倾向、某些标点符号上互动性较强.具体来说,改编版小说《女子特警队》受影视语言作用大,仍遗留影视剧本语言的口语化特点,但受小说体裁的限制,亦有一部分书面语的特点.

猜你喜欢

代词语料库词汇
本刊可直接用缩写的常用词汇
代词(一)
代词(二)
一些常用词汇可直接用缩写
《语料库翻译文体学》评介
本刊可直接用缩写的常用词汇
这样将代词考分收入囊中
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
本刊一些常用词汇可直接用缩写