APP下载

历史的轨迹:中国现当代文学研究七十年的实证分析
——以论题词词频的统计为中心

2019-11-26赵普光

文艺研究 2019年9期
关键词:论题词频文学

丁 帆 赵普光

小 引

1949年至今,中华人民共和国走过了七十年的历程。1949年以来的中国现当代文学研究,亦已七十载。在这个基本统一定型的社会形态中发生了多次社会转型,且每一次转型都给中国现当代文学研究带来了不同程度的影响。七十年来的整个当代中国,大致十年左右会有一个具有标志性的转折发生,从而使文学研究的状貌和主潮也随之流转。所以,按照大致十年左右为一段进行观察,依然不失为一种通观七十年来文学研究流变的方法和思路。

但应该看到,当代中国社会的每次转型对现当代文学研究的影响,更多是停留在人们的直接感受和后设想象等感性层面。所以,很多研究在表述历次转型时,往往流于笼统、大而无当的描述和感慨。而对历史和现象的判断,如果没有科学的定量研究做基础,那么就有可能是武断的,无法完全避免人们的质询和怀疑。历史上的诸多转折在多大程度上使中国现当代文学研究开始新的转型,这些影响和转型具体又是如何表现的?其实在以往的研究中并没有多少人真正通过具体、系统的数据来坐实和呈现。

七十年来的中国现当代文学研究的成果可谓汗牛充栋,面对大量的文献、复杂的过程,回顾这段历史并对七十年来的研究历程做一个相对客观的勾勒,其实是极其困难的。仅靠阅读有限的研究成果,进行以点带面的检视,必然会挂一漏万,而如果严格遵循“竭泽而渔”的文献阅读原则,篇篇细读回顾,则又是不现实的。如何对七十年来的研究历程和趋向做出有着坚实依据的宏观勾勒和判断?这是需要面对的问题。

正是基于这些考量,我们认为选取一个有效的视角、依靠数据统计的方法,回顾中国现当代文学研究七十年来的曲折过程,描画出扎实可信、有据可依的演变轨迹,不失为一个可行的方案。事实上,通过数据统计的实证研究是我们近几年对中国现当代文学研究现状进行考察和把握的一个重要手段。我们希望借助这一手段,通过基于大量研究论文的整理统计,得出具体的数据,勾勒发展曲线,以期呈现中国现当代文学研究发展过程中有哪些变化和转折,并在数据实证的基础上进而分析这一转型背后的若干问题,从而建立起数量与特征之间稳定、可信的关系。

一、统计分析的思路和方法

确定了这一研究目标,那么,如何将文学研究论文的数据统计与文学研究状况趋势及特征进行关联,即如何将文学研究文献的量(数据)与质(特征)进行关联是必须要考虑的问题。为了兼顾数据统计的客观性要求,我们发现某一历史时段研究文献的话题出现的热度(频率)与这一时期文学研究的趋势、特点存在密切的关联。因此,在掌握大量研究文献的基础上,统计出论题词的频次,是观察和分析不同历史阶段文学研究的特征、状况的有效途径。

在使用统计这一研究手段时,必须首先明白其有效性与有限性。在严格意义上,统计方法使用的有效性,往往受到几个条件的影响和限制,包括选择的统计对象(样本)的普遍性与代表性、统计对象分类方案的合理性、数据变化的分析方法等。对此,有必要分别做出说明。

(一)统计对象:论题词词频

第一,本统计工作采样的基础:1949—2018年在国内期刊、报纸等媒介发表的中国现当代文学研究方面的单篇文章。第二,本研究统计的对象:论题词词频。所谓论题词词频,即从1949—2018年发表的中国现当代文学研究方面的单篇文章中提取具有较高频率的论题词进行统计,得出其出现的频次,由此考察某一论题的热度。第三,论题词的选择与提炼:我们根据某一时段集中出现的论题来提炼,尽可能保留原初的词语表述方法。为了便于操作,适当加以归类和调整,比如有关文学史观、文学史格局等方面的研究,我们会根据论文的主要倾向进行提炼;乡土文学及相关文学类型研究,我们将乡土、农村等相关内容的研究进行合并处理。

(二)分类方案:七个时段的切分

第一,为了呈现1949—2018年论题词词频的历史变化并兼顾可操作性,本研究以1979年为界划分为两大历史时期,即1949—1978年为第一期,1979—2018年为第二期。第二,在第一期中,按照大致十年为一段,分为1949—1958年、1959—1968年、1969—1978年三个时段。在第二期中,大致分为1979—1989年、1990—1999年、2000—2009年、2010—2018年四个时段。总共是七个时段。第三,分别搜集、整理出每个时段大多数的论文文献,然后从中提取出现频率较高的论题词。

(三)数据比较方法:共时与历时

第一,共时性的统计。对七个时段分别计数,选取比例较高的论题词。通过论题词的热度,直观呈现不同时期的热点和特征。第二,历时性的统计。将论题词在每个时段出现的不同频次进行纵向的排列整理,可见出不同时段某论题的升沉、显隐,由此可客观呈现热点、特征、领域及问题的历时性变化。

二、1949—1978年论题词词频统计

由于1949—1978年专门发表中国现当代文学研究论文的刊物,与20世纪80年代后相比并不算多,本时段的统计所涉及的论文多从文学研究和创作的刊物中筛选而出,同时也包含了发表在综合性报刊上的重要文章。

需要说明的是,本时期很多文章并非现在一般意义的论文,但为了表述方便,都以论文视之。这三十年间,中国现当代文学相关论文整体上产量不高,但呈现出逢批判运动即爆发式增长的特点。第一个十年中大型批判运动最多,因此该时段论文数量也最多。第三个十年由于涉及“文革”,部分年份资料空白,论文数量最少。根据实际操作,论题词做了适当归并,如“右派”含“反右”,“新人”含“英雄”“英雄人物”,“工农兵”含“工”“农”“兵”,“群众”含“大众”,“深入生活”含“反映生活”,“民歌”含“新诗形式”,“人情”含“人性”。统计表中所录论题词为出现频率较高的词汇。部分文学史上的重要词汇出现频率不高,人工统计的局限与误差是一个原因,更与研究本身的滞后性特征有关。另外,由于本次统计以十年为单位,部分横跨不同时段节点的论题词,如“民歌”“人性论”等,其出现频率会被分摊到两个十年中,因此统计结果中的频率亦不甚高。

(一)1949—1958年论题词统计

我们搜集了此时段内的有关中国现当代文学研究的文章共3071篇,基本涵盖了这一时期出现的大多数论文,具有可行的文献统计依据。从上述文章中,提取出相关论题词,根据出现的频率,列出出现频率较高、占比较大的论题词,具体情况如下。

表1.1 1949—1958年论题词词频统计

为更直观地观察这一时段论题词的词频情况,我们根据上述数据做了下面的词云图。

图1.1 1949—1958年论题词词云图

从表1.1和图1.1可以看到如下特点和问题。第一,前三个论题词出现的频率较高,尤其是“批判” 一词,达到了20%以上。“胡风”“右派”也在10%左右。可见20世纪50年代中国现当代文学研究讨论话题的集中度极高。再考虑到“胡风”一词主要出现在批判胡风的那几年中,“右派/ 反右” 主要出现在1957—1958年,即使在较短的时间内使用,也有如此高的频率和比例,足见话题的集中度达到了惊人的程度,这也说明研究论题、论域的单一。即使是在基数不大的3071篇中,“批判”一词竟在707篇里出现。而且与“胡风”“右派”“民歌” 等只是短时间内大量出现的方式不同,这个词在整个十年间持续出现过,非常稳定。这说明群众运动式的讨论、批判是整个50年代现当代文学研究的主要面向。第二,这个时段的相关文章仅搜集到3071篇,虽然或有遗漏,但也涵盖了绝大多数论文。这个基数不大(与1978年以后相比),说明作为一个学科,中国现当代文学研究在50年代还未能真正形成。

(二)1959—1968年论题词统计

我们搜集了这一时段内的有关中国现当代文学研究的文章共1564篇。该不完全统计基本上涵盖了这一时期的大多数文章,具有可行的文献统计依据。论题词具体出现频率和所占比例如下。

表1.2 1959—1968年论题词词频统计

根据上述数据做了下面的词云图。

图1.2 1959—1968年论题词词云图

由上图可看出以下几个特点:第一,“人情”“民歌”等是较短时期里突然且集中出现的论题词。第二,“新人”已经跃居了频次的第一位,而“批判”的频次依然很高。第三,“毛泽东思想”开始大量出现在有关中国现当代文学的研究文献中。

(三)1969—1978年论题词统计

我们搜集了这时段内的有关中国现当代文学研究的文章共763篇,基本上涵盖了这一时期的大多数文章,具有可行的文献统计依据。论题词具体的出现频率和所占比例如下。

表1.3 1969—1978年论题词词频统计

根据上述数据做了下面的词云图。

图1.3 1969—1978年论题词词云图

上图可见:第一,“批判”又一次居于首位。第二,“文革”“样板戏”等是此前二十年里没有的,“鲁迅”在前二十年里出现次数并不多,不是较为热门的论题词,而20世纪70年代却开始大量出现。第三,文章基数大幅度下降。第四,“解放思想”“四人帮” 等是在“文革”结束之后开始频繁出现的,较为持续、稳定地还是“批判”“英雄”“毛泽东思想”“阶级斗争”等。

数据其实是会说话的。上述三组图表,如果结合起来纵向观察,颇有些问题和启发值得进一步讨论。三组图表直观地呈现出前三十年间中国现当代文学研究的宏观趋势,其背后的原因引人思考。首先,统计表明,三个十年中每个阶段的研究最突出的特点是,论题词词频的集中度非常高。虽然在不同的时段中,频度最高的论题词略有更替,频度稍有升降,但总体上都是居高不下的。比如“批判”这一论题词,最高竟达惊人的23.02%。这一数据呈现的不仅是话题的集中度,而且表明在不同的时段里,研究的面目、声调和论调的趋同。这种趋同体现在论题词词性本身的指向性上。这个指向性或体现为论题词隐含的立场,或体现为论题词概念的确定性。关于隐含的立场,如“批判”,类似的词还有“战斗”“斗争”等,指向鲜明、直接。经常与这些论题词搭配的是“必须”“坚决”“应当”“彻底”等副词①,“揭露”“揭批”“粉碎”“捍卫”“保卫”等动词②,这就更强化了态度的绝对、情感的强烈、语气的无可置疑。关于概念的确定性,如“资产阶级”“右派”“文化大革命”“现实主义”等,都有着具体、明确的意义,不能随意阐释、争论。

第二,高频度论题词在三个十年中,频度升降比较剧烈。我们将具有共性的论题词进行纵向排列,可以在下表中发现各个论题词的词频在三个时期的比重的变化。

表2.1 1949—1978年共性论题词词频变化

阶级性 2.05%中间人物 1.73%革命现实主义与革命浪漫主义 1.60%四人帮 9.31%鲁迅 6.95%阶级斗争 6.03%样板戏 5.00%“文化大革命” 3.53%批林批孔 3.01%解放思想 2.36%

从上表可见,三个十年间提炼的论题词,唯一一个贯穿始终的是“批判”,其他高频度词呈阶段性的消长。而且不少论题词会在某几年(甚至更短的时间里)突然出现,又突然消失。比如“民歌”一词,虽然统计中由于技术原因将该词分置于20世纪50年代和60年代中,但实际搜集统计时,我们看到这一论题词主要集中地出现于1958年,此后又迅速地消失。周扬在1958年初发表的《新民歌开拓了诗歌的新道路》(载《红旗》1958年第1期)一文,为集中出现的发端,尤其是《人民日报》社论《大规模地搜集民歌》(载《人民日报》1958年4月14日)更是将此热潮推向了高峰。

“批判”大致稳定,其他论题词则有明显的消长,这一数据表明了一个现象:三十年中文章的具体批判对象会因时而异,但其主调则保持稳定。比如,相继出现 “武训”“胡风”“红楼梦”“反右”“四人帮”等高频词,短时间后又相对减少或消失。但是“批判”“揭露”等类似表达则大致延续了整个前三十年。这说明在这一时期,相继出现多个不同的集中论题,尽管论题不同,但是整体的话语风格、基调保持不变。即批判是一成不变的,变的只是批判的对象。例如,虽然1958年“民歌”这个论题词突然大量涌现,但该词背后的思路、观念还是在延续此前的命题,并没有太大变化。前文提到的《大规模地搜集民歌》一文,固然是在提倡搜集、研究和创作民歌,而关于重视民歌的原因,文章明确指出:“这是一个出诗的时代,我们需要用钻探机深入地挖掘诗歌的大地,使民谣、山歌、民间叙事诗等等像原油一样喷射出来。我们既要把它们忠实地记录下来,选择印行,也要加以整理和研究,并且供给诗歌工作者们作为充实自己、丰富自己的养料。诗人们只有到群众中去,和群众相结合,拜群众为老师,向群众自己创造的诗歌学习,才能够创造出为群众服务的作品来。”③其实早在新中国成立之初,胡乔木、周扬等人已经分别发表文章强调这个问题,如前者的《文艺工作者为什么要改造思想?》(载《文艺报》1951年第4期),后者的《整顿文艺思想,改进领导工作——十一月二十四日在北京文艺界整风学习动员大会上的讲演》(载《人民文学》1952年第1期)。如果再往上溯,则应追至毛泽东《在延安文艺座谈会上的讲话》。可见这一文艺创作思路是一以贯之的。

第三,论题词的趋势、突变与社会历史的转折存在共振。应该注意到,中国现当代文学研究中相继出现而又相继消失的“武训”“胡风”“红楼梦”“反右”“批林批孔”以及“四人帮”等词,如果验之于当代中国前三十年的历史,我们会发现每个论题词的集中出现都与其背后的历史变动、社会转折相关。比如 “样板戏” 在1968年和1974年前后出现频率较高,这不是偶然的④。所以,这一数据显示出的问题,既耐人寻味,也令人扼腕:文学及文学研究自律与他律的悖论呈现得如此显豁。这种共振还体现在另一个数据上。我们清楚地看到,在这三个十年中,所搜集到的中国现当代文学研究文章的数量分别为:3071篇、1564篇、763篇。很明显,相关研究文章的数量呈现出越来越少的趋势。文献数量的减少是研究热度、研究深度以及研究力度等呈下降态势的最显性的表现。联系1949—1978年中国社会思潮的起伏,研究文献数量逐步下降的趋势也是社会历史演变的某种投影和反映。

三、1979—2018年论题词词频统计

1979年以来相关数据的统计,主要以中国知网搜集期刊论文为基础,并适当参照纸质刊物。最后统计基数为:1979—1989年2690篇,1990—1999年5691篇,2000—2009年27311篇,2010—2018年35568篇。

一些论题词的范围及选取原则需要补充说明。20世纪八九十年代热门的新写实、寻根文学、先锋文学等并未单独列出,统一归入了“思潮流派”一项;“文学史观” 一项中主要包含对中国现当代文学史观、文学格局、方法等的总体研究以及当时讨论较多的重写文学史和文学史起点、分期等问题。其他如学科教学研究和具体文学史著作的评论等未进入统计。归并的具体情况如下:“西方”含“世界”“域外”“外国”等,“传统”含“古典”“民族”“本土”“传承”等,“文学史观”含“史观”“格局”“起点”“断代” 等,“乡土”含“农民”“农村”“乡村”等,“市场”含“商品”“市场经济”“商业”“消费主义”等,“政治”含“体制”“制度”等,“都市”含“城市”“都会”等,“民间”含“平民”“市井”“市民”等,“文化自觉”含“文化认同” 等,“媒体”含“媒介”“传播”等,“性别”含“女性文学”“女权”“女权主义”等。但“现代”只含“现代化”,而“现代性”“后现代”“反现代”则并举,不宜互相包含。当一些论文同时论及传统与现代、传统与西方、现实主义与现代主义等论题词时,根据原文的侧重分别统计。在统计过程中还会发现,这一时期对台港澳(尤其是台湾)文学、“五四”文学以及散文等关注很多,鉴于分类标准的相对统一,这些话题并没有在结果中列出。另外,一些低于1%的论题词只选取了部分重要的列出。

(一)1978—1989年论题词统计

据不完全统计,我们搜集了这一时段有关中国现当代文学研究的文章共2690篇,基本上涵盖了这一时期的大多数文章,具有可行的文献统计依据。论题词具体出现频率和所占比例见下表。

表1.4 1979—1989年论题词词频统计

知识分子 23 0.86%当代性 23 0.86%形式 18 0.67%都市 15 0.56%价值观 15 0.56%浪漫主义 11 0.41%政治 7 0.26%现代性 7 0.26%通俗文学 7 0.26%后现代 6 0.22%市场 5 0.19%文体 4 0.15%

根据上述数据做了下面的词云图。

图1.4 1979—1989年论题词词云图

上面图表显出与此前不同的特点和趋向,亦有值得深究的话题。第一,与20世纪70年代相比,这个时段里最突出、最明显的数据有两个特点:一是文章基数呈爆发式增长,二是论题词空前丰富多样。特别是后者尤其值得注意,论题词的丰富、多元,在话题的时空纬度上大幅度扩展。反映在数据上,即论题词的频次和比例相对分散,论题词频度相对优势不再如此前那么突出。比如,不再出现如“批判”“胡风”“反右”等集中的论题词。需要说明的是,80年代出现的论题词远远比表1.4所举的25种更多、更丰富,只不过因为考虑到很多论题词所占比重过小,未全部列出,或做适当归并。我们可以看到,一些新的话题,如“市场”“通俗文学”等,虽然频次不高,但却是某类研究的苗头,比重将在后来的三十年中逐渐增加。文献基数和论题词多样的数据特点表明,大致从1979年开始,中国现当代文学研究的范围大大扩展,论题词涉及的问题开始多元,层次也日趋丰富。

第二,中国现当代文学研究开始了学理化、学术性的自觉推进。如果比照此前三十年间的论题词,我们会明显发现,大量新出现的论题词有一个共同的特点:意识形态和情感色彩弱化,不再像此前的论题词那样意识形态明确,政治立场和情绪态度鲜明,更强调学理性、学术性。在这个意义上,这一阶段的数据表明中国现当代文学研究真正开始了学理化、学术性的进程。需要补充的是,在整理过程中,数据不能很好呈现但却很重要的一点是,与此前不同,1979年之后的文章,逐渐开始接近论文的体例,这也是学理化、客观化倾向的体现。

第三,如果将这些论题词之间的频度再做细致对比,我们会发现不同的论题词频度的背后折射出80年代中国现当代文学研究的某些特点。1.“西方” 这类论题词的频次是最高的,说明这一时期学界对中国现当代文学与域外文学、文化关系的思考开始有了自觉意识,并且体现出一定的持续性和普遍性。关涉这一论题的诸多论文关注的具体问题纷繁各异,开启了多种研究可能,有宏观方向的论述,也有具体而微的切入,有涉及哲学文化思潮影响的,也有侧重文学思潮梳理的。这一现象充分表明改革开放后,中国现当代文学对域外思潮敏锐感知、大胆借鉴的研究态势。如果我们联系这一时期的具体论文就会发现,关涉西方、海外、世界、域外等话题的文献与此前相比,几乎可以说呈井喷式增长的态势。虽然“‘五四’以后对外国文学的翻译和介绍涉及的国家、时代和文学体裁,都是非常广泛的,因而新文学所受到的影响也是复杂的和多元的”⑤,这样的判断本来不过是一个事实和常识,但在此期间被重提确有其重要意义。大门的打开,自然会涌入新鲜的质素,从而激发对历史的重新认识,于是文学与文学史的重写也就成为必然。应该指出的是,这种打开并不是一蹴而就,乍暖乍寒的曲折反复几乎伴随着整个80年代的文学研究。2.“传统”的频次位列第三,这也是此前未有的。这些均表明从这一时期开始,现当代文学与传统文化、西方文化的关系,逐渐为学者重视和正视。比如,在这一过程中,乐黛云的《世界文化对话中的中国现代保守主义》(载《中国文化》1989年创刊号)就试图在中西文化对话中对保守、激进的悖论与复杂性有所发明。在这一时期,很多论文显示出在新与旧、中与西的双重纬度中重新思考的努力。事实上,也只有从更高的层面和更大的格局来观照,才能重新发现传统与中国现当代文学的诸多面向。

(二)1990—1999年论题词统计

我们搜集到这一时段有关中国现当代文学研究的文章共5691篇,总体基数在继续增长,是20世纪80年代的两倍多。这一基数基本上涵盖了这一时期的大多数文章,具有可行的文献统计依据。本时段论题词具体出现频率和所占比例见下表。

表1.5 1990—1999年论题词词频统计

根据上述数据做了下面的词云图。

图1.5 1990—1999年论题词词云图

上图可见如下特点与趋势。第一,作为研究领域和思路的“思潮流派”,从20世纪80年代大量出现并居第二位,到本时段则跃居首位。“思潮流派”词频持续上升,表明研究领域和思路出现新变化,反映了80年代开始出现的研究热点,继续保持热度并有不断升温的趋势。不同的思潮流派,意味着不同的文学风格,而风格之不同又基于各异的文学观念。文学思潮流派的丰富与否,表征着文学创作多元、繁荣的程度。学界从80年代开始重视对文学思潮流派的研究,至90年代达到高点,这一现象隐含着对不同文学风格、文学观念的客观评价,表征着文学及文学研究开放、包容的可贵空间。这一时期,现当代文学史上影响较大的社团、思潮、流派等,几乎都已经有了较为深入的研究。这其中,有专论某一个或一类社团流派的⑥,有纵向梳理思潮变迁的⑦,有细究某一文体中的流派的⑧,也有宏观对比、论述流派的⑨,还有一些转瞬即逝或长期尘封的社团流派在这一时期被发掘、呈现出来。

第二,除“思潮流派”词频上升外,其他论题词词频的排序也有所变动。尤其引人注意的是,“传统”的频次开始超过“西方”等论题词。这一数据的变化,直观地说明在20世纪90年代,现当代文学与传统文化的关系更受研究者的重视,与此前相比,学界逐渐正视传统文化对现当代文学无形或有形的笼罩⑩。这当然与思想淡出、学问凸显的时代风习相关,也与保守复古思潮在90年代的出现有关⑪。当然,应该看到,热衷于传统并不意味着所有学者都盲目地泥古,其中相当的研究隐含着对当时琐屑、沉闷的日常生活的拒斥与警惕⑫。

第三,统观上述数据,还可以看到一个明显的现象,即虽然一些论题词所占基数的比例有所下降,但频次的绝对值却有较大幅度上升。这说明在基数空前增长的前提下,大致上每种论题词所涉及的研究领域都在进一步深化。这一点在对21世纪以来中国现当代文学研究的统计中表现得更为突出。研究的日趋丰富和精耕细作,当然会带来重复与泡沫化的问题,不过这或许可以视为学术推进的代价。

第四,一些在20世纪80年代开始出现的论题词,在这一时段呈现大幅度增加的态势。比如,“后现代”频次上升尤其明显,由80年代的个位数(6次),增加了近二十倍(108次)。“后现代”论题词的突增,一方面与社会现实的触发有关,一方面也与理论话语的刺激有关,很多著述流于纯粹的话语操练。具体文献显示,确实有不少学者面对刚刚萌生的消费文化,迫不及待地欢呼后现代主义社会的到来,并仓促地用后现代主义理论试验一番。应该看到,当代中国的文化现实依然是在前现代、现代主义、后现代主义互渗的差序格局之下。在用后现代主义理论话语演练时,学者应该正视这一理论的有限性与有效性同时存在。“后现代”之外,“现代”“都市”等词的出现频率也提高显著,这是文学研究视角更新以及研究及时反映社会变动的体现。数据还显示,这一时期还出现了一些此前鲜有提及的论题词,表明学术领域和方向在不断拓展,这也是学术研究更趋丰富多样的证明。比如,与80年代相比,“全球化”是一个新的论题词,而“民间”(包括“平民”“市井”)等相关话题在90年代也被逐渐提及并有增长趋势。

(三)2000—2009年论题词统计

我们搜集了这一时段内中国现当代文学研究文章共27311篇,基本上涵盖了这一时期的大多数文献,具有可行的统计依据。21世纪以来的研究论文文献统计基数,除期刊论文之外,也兼顾硕、博士学位论文。统计显示,总体基数比此前翻了约四倍,论文生产呈爆炸式增长。基数空前增加,会给论题词频次比例的呈现带来一定影响。论题词具体出现频率和所占比例见下表。

表1.6 2000—2009年论题词词频统计

文学史观 531 1.94%全球化 495 1.80%都市 348 1.27%乡土 347 1.27%思潮流派 336 1.23%语言 325 1.19%后现代 275 1.01%西方 213 0.78%知识分子 183 0.67%现代主义 163 0.60%现实主义 128 0.47%现代 122 0.45%传媒 111 0.41%网络文学 105 0.38%政治 95 0.35%文化自觉 81 0.30%市场 69 0.25%浪漫主义 68 0.25%生态 68 0.25%地域写作 65 0.24%反现代 37 0.14%科幻 36 0.13%自由主义 35 0.13%新世纪 34 0.12%新时期 21 0.08%

根据上述数据做了下面的词云图。

图1.6 2000—2009年论题词词云图

上述图表呈现出一些与此前不一样的新特点。第一,“现代性”出现的频率达一千多次,平均每年百余次,取代了20世纪90年代的“思潮流派”而跃居第一。而“思潮流派”已大大落后,被多个论题词超越。这一数据变化,表明21世纪第一个十年间,研究的热点已经再次发生了转换。“现代性”相对而言成为最有影响的研究热点,而“思潮流派”作为研究思路和领域在逐渐回落,被多个新的领域挤压。

其次,“传统”依然居高不下,从频次的绝对值来说,比20世纪八九十年代有了更大的发展,似乎可以说明中国现当代文学研究的复古思路又在进一步凸显。但应该看到,与一些单向度地突出和强调中国现当代文学与传统关系的视角不同,在很多时候,研究文献中的“传统”与“现代”往往是连用在一起的,这显示出研究者试图探究二者复杂关系的努力与用心。类似例子很多,仅举其一。如有学者在论及废名诗学理论与创作实践时即指出:“废名的诗歌观念承袭了周作人的‘文艺复兴’的文学观念,是以‘现代’眼光重释和取舍‘传统’,打破了‘传统’ 与‘现代’非此即彼的割裂关系。”⑬

第三,20世纪与八九十年代词频排序相比,在这一时段里,“西方”一词则在比例上下降最为明显,从所占比例由80年代的7.29%降至0.78%,这与“传统” 一词居高不下,形成了鲜明而有趣的对照。文学研究的潮流既是整个社会文化思潮动向的组成部分,又是后者的反映,论题词的升降变化,是社会文化思潮变动转向的表征。从“西方”一词词频的下滑,可以看出有关中国现当代文学与域外文化关系的研究在21世纪最初十年间的某种趋向。

第四,一些新的论题词开始出现,显示文学研究的某种新动向或预兆。比如,“网络文学”“科幻”“反现代”“生态”开始出现。前两种论题词,表征着新的文学类型研究的出现和扩展。“反现代”则可以视为对现代性的一种反向思考,这其实也是现代性深化的反映⑭。另外,“自由主义”作为一种文学思潮的出现,也值得注意。在此前,比如80年代,人们更多的是使用“自由化”等相关词,而作为一种文学思潮,“自由主义”在21世纪第一个十年中出现,是引人深思的现象。

(四)2010—2018年论题词统计

我们搜集了这一时段内的有关中国现当代文学研究的文章共35568篇,基本上涵盖了这一时期大多数的文章,具有可行的文献统计依据。论题词具体出现频率和所占比例见下表。

表1.7 2010—2018年论题词词频统计

根据上述数据做了下面的词云图。

图1.7 2010—2018年论题词词云图

从以上图表可以看到,除总体基数的进一步大幅度增长外,还有一些值得注意的特点。第一,仅从数据显示来看,我们会发现论题词“现代性”继续领跑榜单,而“传统”则依然屈居第二。这当然反映了“现代性”词频的优势地位,但排名有时候在一定程度上会把具体的文献关系夸大。其实在这一时期,与“现代性”和“传统”两个论题词有关的文献的绝对数量,在绝对值上的差距正在大大缩小(前者为1598篇,后者为1582篇)。如果再考虑到人工统计的误差,它们在数据上的差距几乎可以忽略。虽然21世纪第二个十年还未结束,但可以预期的是,“传统”一词的热度还会持续上升,最终很可能跃居首位,而且这种状况或许会持续相当长的时间,这与近十年来整个社会的文化思潮状况密切相关。

第二,论题词“文学史观”的位置进一步上升,这透露出一个信息:更多的学者开始回应和思考中国现当代文学这一学科如何拓展的焦虑。可以说,几乎没有任何学科能如中国现当代文学这样对本学科的合法性和研究领域极度焦虑。由于不同的文学史观涉及文学史断代、分期、作家作品现象的重新发现乃至整个文学史的重写,所以随着时间推移,研究的焦虑会越来越凸显。于是,如何重构文学史就成了中国现当代文学研究无法回避的问题,对文学史观的格外关注也必然会持续下去。

第三,“网络文学”“媒介”等论题词的绝对值并没有如我们想象的那样明显提高。可见,尽管网络文学不断发展并受到来自作协等官方机构的关注,但作为学理化研究的对象,它并没有如预想的那么受到关注。这一反差透露出一个现象:文坛、作协确实越来越重视网络文学,市场和资本也同样对网络文学极为青睐,但与表面的热闹相反,相关的学术研究则明显沉寂。这种冷热对比,或许并不表明学者对网络文学的冷漠,而是因为既有的研究方法、范式无法面对网络文学这一新的文学形态。

值得一提的是,一些论题词词频的绝对值明显上升,表明中国现当代文学研究的新趋势。比如,“科幻”的绝对值就有明显增长。但是,从相对值上看,“科幻”在这一系列论题词中所占的比例还很有限,这似乎表明科幻文学的发展和研究不能过于乐观。此外,“文化自觉”有着明显的上升,这背后投射出的时代氛围,颇值得玩味。还有,从绝对值上看,“乡土”也有明显的提升。如果联系前面三个十年,那么我们会发现不温不火的“乡土”一直是1979年以来非常重要的论题词。具体到研究文献的重心和角度,随着20世纪90年代以来城市化进程的推进,移动流转人口的剧增等变化,乡土文学研究在不断地调整和回应⑮。

(五)1979年以来共性论题词词频的变化

我们将前述1979年以来的每个时段论题词再进行纵向的整理,选取贯穿于整个四十年来研究共有的论题词进行排列,得出表2.2。可见,在四十年中,这些论题词词频的比例有升有降。这些变化背后或可看出某些信息和意味来。

总体上,大多数论题词的词频比例在四个十年中呈下降趋势,但词频的绝对值几乎都在上升。这一数据反差,首先是由于统计基数(也就是发文量)四十年来的大幅度增加导致的。词频的绝对值飙升,说明现当代文学研究的文献数量渐次增长,也表明研究队伍越来越庞大。每个论题在各个时段的词频比例在相对下降,说明论题词的集中度逐渐弱化,这意味着四十年间研究的话题渐趋多元、丰富。

在比例次第下降的诸多论题词中,降幅较为明显的是“西方”。这表明随着时段的推移,研究者关注中国现当代文学的重点发生了明显变化。中间稍有波折而总体趋势却在上升的是“传统”,如果考虑到2010—2018年基数最大这个因素的话,“传统”这个话题可以说在21世纪的第二个十年空前地热闹起来。把1979年之前的三十年合在一起来与之后的四个十年作一对比,这个趋势就更加明显。这表明“复古”是21世纪以来,尤其是第二个十年中最突出的现象。而如果对这些从传统角度来研究中国现当代文学,或者说探究中国现当代文学与传统文化关系的文献做更细致的观察,我们会发现研究者的观念、切入角度和研究思路并不一致。在学界未对传统做出系统清理的情况下,出现大量跟风和应景式的文献就不奇怪了。

贯穿于整个四个十年的论题词,其数据统计变化呈现研究的热度趋向。比如“乡土”,其绝对值在明显上升,而相对值则略有下降,但总体较为稳定,说明这个领域一直是非常重要的话题,没有特别热或特别冷的情况。相似的,“语言”一词也不温不火。这当然与中国现当代文学研究中语言问题不容忽视有关,而更为重要的原因在于,语言与价值中立的形式研究关系较为密切。相比而言,“现代”“现代主义”等话题的比例起伏较为明显,尤其是在21世纪第二个十年表现最为惨淡,跌幅非常大。这一统计结果令人吃惊,难道步入21世纪的第二个十年,我们已经“现代”到了不需要谈“现代”的程度?

表2.2 1979年以来共性论题词词频变化

四、论题词的比较分析

(一)统计文章基数的变化

七十年来的中国现当代文学研究中,文章基数变化很大:1949—1958年搜集到3071篇,1959—1968年搜集到1564篇,1969—1978年搜集到763篇,1979—1989年搜集到2690篇,1990—1999年搜集到5691篇,2000—2009年搜集到27311篇,2010—2018年搜集到35568篇。具体每个时段基数的变化见下图。

图2.1 七个时段文章基数变化图

从上图可以看出,中国现当代文学研究文章的基数在1949—1978年间逐渐减少,而在1969—1978年间触底之后,从1979年开始迅速反弹,每十年会出现数倍的增长。根据对具体文献的观察,文献数量增长的同时,其专业化、学术化程度亦迅速增强。

(二)高频论题词的数量变化与论题词集中度的趋势

数量之外,论题词的散点分布情况更能显示文献的存在状态和特点。这可以从论题词的集中程度来观察,也就是说,相较于文献基数,论题词集中度更具有统计学价值。事实上,论题词的集中度以1979年为界发生了极大变化。为说明这个问题,我们采用了高频词和集中度两种路径来分别统计。

第一,高频词,即每个时期出现频次较高的论题词。高频词数量的多少,在很大程度上可以直观反映出话题是否多元。我们从每个十年中选取了出现频次超过50次的高频词进行统计,以直观体现高频词数量变化趋势。请看下图。

图2.2 高频词数量变化曲线

可以看出,每个时期高频词的数量变化情况是:1959—1978年这二十年间高频词数量很低,尤其是1959—1968年高频词数量处于谷底(超过50次的高频词只有三个)。而从1979年开始,超过50次的高频词的数量迅速上升。这一数据曲线,直观地说明70年代末以后论题词在逐年迅速增多,这也更进一步表明从这个时期开始,中国现当代文学研究的论题、论域逐渐丰富、多元。

第二,图2.2显示的频次在50次以上的高频论题词的增加,表明研究论题的日趋增多。然而,要更准确地证明1979年之后研究论域、话题的去垄断化程度,有必要采用新的观察角度。为此,我们引入了经济学研究领域中的市场集中度(CR4)的方法⑯来进行呈现。具体做法是,分别将七个十年中词频位居前四的论题词的百分比相加,这个百分比之和表示每个十年位居前四的论题词所占该时段的份额(比例)。由此,1949—2018年论题词集中度(CR4)就呈现出如下图所示的曲线。

图2.3 七个十年CR4曲线

可见,位居前四的超高频词所占比重越大,说明其在该时段所有论题中的份额越大,亦即该时段的论题越集中,反之,比例越低,说明论题越分散。由该曲线可以看出,1949—1978年话题集中,尤其是1949—1958年、1969—1978年两个时段的比值最大,借用经济学的划分类型,这两个时段的论题集中度属于典型的“寡占型”,而1979年之后论题越来越分散,其集中度属于“竞争型”的状态⑰。这表明1979年之后的中国现当代文学研究在领域、方法、观念、理路、风格以及观点等方面多元展开。当然,这并不必然意味着不存在某些主导性的力量和倾向。

(三)1978年之前与1978年之后论题词词频风格的变化

图2.1、图2.2、图2.3分别从三个侧面描述了1949年以来中国现当代文学研究的轨迹。从总体看,1979年是一个临界点,从这一年开始,数据呈现出稳步上升或下降的趋势。在此前和此后的两个大时期内,论题词词频的变化程度非常显著。首先,1979年之前和之后的论题词几乎截然不同,前三十年出现频次较高的论题词,在1979年之后消失了。反之,1979年以来的大部分高频论题词,在1979年之前则没有出现。这说明1979年前后的中国现当代文学研究有着极为不同的形态。第二,以1979年为界,前后两个时段的论题词分别有着明显的连续性,主要的话题虽然所占比例有所变化,但在相应的时段内都是持续存在的。这表明,1979年之前的文章在问题、思路和风格等方面具有相对统一性,而1979年之后的研究成果亦具备了自己的特征。所以,多种数据显示的变化趋势都指向了一个事实:七八十年代之交的重大社会转型对于文学有着巨大、深刻的影响,再次证明改革开放不仅是当代中国社会巨大转变的开始,也是中国现当代文学史及相关研究极为重要的转捩点。

余 论

本文可以视为我们近年来持续进行的实证性、客观化写作的新尝试。我们基于数据统计的实证方法来为中国现当代文学研究七十年来的发展轨迹做出勾勒和描画,并首次引入了经济学中的相关研究方法,使得七十年演进形态能够得到更加立体、直观的呈现。基于客观数据、直观轨迹,我们对数据所隐含的一些突出问题进行了适当的分析,希望以点带面地引发相应的思考。事实上,数据不会说话,然而数据又最能“说话”,数字和图表所蕴含的信息和话题,远不止我们在文章中所提及和分析的那些,还有更多富于启发性的问题可以从这些数据和图表中挖掘。数据和图表只是“远读”(distant reading)⑱的凝练和提取,而支撑这些数据和图表的,其实是背后的文学(研究)历史事实。要真正对这些有血有肉的历史事实有切肤的感知把握,则需要 “细读”(close reading)的体察。要言之,我们进行实证性客观化写作的一个期待,不过是想通过这些数据的客观呈现,保存一些史料以及线索而已。若能如此,则足矣。

① 参见毛泽东《应当重视电影〈武训传〉的讨论》,载《人民日报》1951年5月20日;周扬《我们必须战斗》,载《人民日报》1954年12月10日;甘泉《必须坚持工农兵方向》,载《文艺报》1952年第7期;《批判胡风的资产阶级唯心论文艺思想》,载《文艺报》1955年第3期;萧殷《民歌应当是新诗发展的基础》,载《诗刊》1958年第11期;赵晨晖《必须批判“无冲突论”》,载《朝霞》1974年第4期。② 参见《保卫社会主义文艺事业,深入开展文艺界反右派斗争!》,载《处女地》1957年第10期;《粉碎丁玲、陈企霞、冯雪峰反党集团,保卫党对文学事业的领导》,载《人民文学》1957年第9期;李准、南丁、克西《剥去右派分子栾星的外衣》,载《奔流》1957年第8期。

③ 《大规模地搜集民歌》,载《人民日报》1958年4月14日。

④ 《人民日报》在1968年9月26日发表文章《工农兵英雄的壮丽颂歌——赞革命样板戏》。1974年5月23日,《人民日报》推出报道《在毛主席的无产阶级文艺路线指引下,我国革命样板戏进一步普及和发展》。

⑤ 王瑶:《现代文学中的民族传统和外来影响》,载《昆明师院学报》1979年第1期。

⑥ 如文学研究会、创造社、京派、海派、新月社等都有大量的专门著述推出。

⑦ 参见丁帆、何言宏《论二十年来小说潮流的演进》,载《文学评论》1998年第5期;陈晓明《现代中国文学思潮流变论》,载《学术研究》1998年第3期。

⑧ 钱理群:《中国现代的堂吉诃德和哈姆雷特——论七月诗派和九叶诗派诗人》,载《文艺争鸣》1993年第1期。

⑨ 陈思和:《九十年代文化思潮片论》,载《华东师范大学学报》1998年第5期。

⑩ 越来越多的人意识到,“传统并没有消失,作为过去与现在的媒介,它在现代社会的建构中也被不断地建构和重新建构着”(郭于华:《生活在后传统之中》,载《读书》1997年第6期)。具体到文学研究,也有很多学者延续这一思路。比如,在文体方面,有学者谈及现代散文对传统神韵的延续:“经过一番解构、挑选、转化、重建,六朝文作为重要的传统资源,正滋养着现代中国散文。”(陈平原:《现代中国的“魏晋风度”与“六朝散文”》,载《中国文化》第15、16期合刊,1997年)在文化变迁方面,有学者论及新文学变革中“汲古求新”的文化模式:“文学的变革,不是‘断裂’,而是对此前传统文学再阐释。这种再阐释即对原文化形态的策略性误读。为了变革当前的文学,而从传统中寻找符合需要的资源,对其进行‘再阐释’的现象,本文称之为‘汲古求新’的文学变革模式。这种模式常表现为两种方式:一是‘隔代遗传’,即越过离当前变革最近的一段历史,上溯到更早的历史传统中的资源和根据,以反抗和否定当前要变革的现实;一是‘同情弱者’,即寻求传统中处于弱势和边缘地位的资源,以抗拒和否定当前正统的文学势力。‘五四’ 新文学的变革往往遵循着这样的模式……具有普遍性的这种文化模式,也表明任何革命都不是彻底的断裂,而是永远处在‘藕断丝连’的过程之中。”(赵普光:《在永恒的过程中——论“五四”新文学变革的文化模式》,载《江苏社会科学》2015年第3期。)

⑪ 海外现代新儒家的著作也是在这个时期开始被较多地介绍到国内。

⑫ 比如有学者这样评述汪曾祺身上的传统审美的复活:“从作家与现实的关系看,汪曾祺所持的是‘边缘化’立场;同时汪曾祺还以他的创造让我们重温了审美化的人生之魅力,他以文人的情致雅趣关怀去掉了日常生活的粗鄙,代之以诗意和书卷气。”(王尧:《“最后一个中国古典抒情诗人”——再论汪曾祺散文》,载《苏州大学学报》1998年第1期。)

⑬ 张洁宇:《论废名诗歌观念的“传统”与“现代”》,载《南京师大学报》2008年第1期。

⑭ 如有学者论及沈从文时提出这样的问题:“沈从文存在的意义,除了审美以外,他选择中国传统文化另一种资源(老子)而建立的与欧洲浪漫主义暗合的自然哲学精神,对以工具理性为特征的中国的现代性选择,应当是一种补充和丰富。或许应当说,沈从文选择的是另一种现代性?”(杨联芬:《沈从文的“反现代性”》,载《中国现代文学研究丛刊》2003年第2期。)

⑮ 参见丁帆等《中国乡土小说的世纪转型研究》,人民出版社2013年版。

⑯ 市场集中度是经济学研究常用的指标,即通过某几个企业在行业内所占的份额之和,衡量企业垄断程度。“根据传统经济学的定义,行业的竞争或垄断程度可以用产业的市场集中度,即一家或几家最大的企业所占据的市场份额来衡量。在具体应用中,最大4家企业占行业的份额(CR4),或者最大8家企业占行业的份额(CR8)是最为常用的判定指标。市场集中度越高,说明市场的垄断性程度越高。”(张维迎:《经济学原理》,西北大学出版社2015年版,第260页。)

⑰ 借用经济学的分类方法。经济学家贝恩(Bain)在产业组织理论的实证研究中,依据前四位和前八位厂商的市场集中度指标,做过更细致的类型划分:寡占Ⅰ型:85%≤CR4;寡占Ⅱ型:75%≤CR4<85%;寡占Ⅲ型:50%≤CR4<75%;寡占Ⅳ型:35%≤CR4<50%;寡占Ⅴ型:30%≤CR4<35%;竞争型:CR4<30%(参见苏东水《产业经济学》,高等教育出版社2000年版,第124页)。

⑱“远读”的概念,直接来自于美国学者、斯坦福大学文学实验室的创始人弗兰克·莫莱蒂(Franco Moretti)的论文集《远读》(Distant Reading, London: Verso Books, 2013)的书名。作为大数据时代文学研究方法的“远读”,大致指不依靠传统的精耕细作式的深度阅读文本,而基于数据统计对文学进行宏观的分析,通过海量文献数据的统计呈现出文学(研究)的某种样态和趋势,从而发现细读方法无法看到的整体特征和演变过程。这种方法更适合文学社会学的研究理路。对“远读”的方法,莫莱蒂曾在接受采访时说:“通过聚合和分析大量数据来理解文学,而不是研读特定的文本。”(Katheryn Schulz,“What is distant reading?” New York Times, 2011-06-24) 事实上,莫莱蒂自己最接近这一研究方法的典型实践是他进行的一项对7000部小说标题的研究。他曾通过电子数据库检索,对英国1740—1850年间发表的7000部小说的标题进行统计,发现小说标题的长度存在由长到短的演变趋势,并就这一变化背后的原因做出分析。近几年,国内学者也开始对“远读”概念多有讨论(参见向帆、何依朗《“远读”的原意:基于〈远读〉的引文和原文的观察》,载《图书馆论坛》2018年第11期)。这一方法确实契合了新兴的大数据技术,挑战了原有的研究方法,给文学研究带来新的启发,但同时也不可避免地以牺牲细节阅读为代价。是故,“远读”给文学研究提供新启示的同时,不能也绝对不会代替传统的细读。

猜你喜欢

论题词频文学
由一个简单结论联想到的数论题
我们需要文学
用二进制解一道高中数学联赛数论题
一道东南赛题与2020年高中联赛数论题的渊源
关于一道数论题的思考
“太虚幻境”的文学溯源
词汇习得中的词频效应研究
汉语阅读中词频与注视时间、跳读的关系
词频,一部隐秘的历史
我与文学三十年