定量分析方法在中国古代文学教学与研究中的应用
2021-12-18袁鹤溦
袁鹤溦
(东北师范大学文学院,长春 130022)
马克思曾指出:“一种科学只有用了数学方法才能得到完善”。人文科学与社会科学的研究也是如此,通过数学的方法对研究样本进行分析处理后,更能得出相对完善的理论与结果,使这一领域的研究与教学得到长足发展[1]。文学中的定量分析方法是把文学问题数量化,用数学方法对文学现象进行描述,或者以数学方法作为工具分析教育现象,或是把文学研究的结果用数据加以表示,也可以是综合运用以上几种方式对文学进行研究探讨。互联网的飞速发展,数字化技术与教育教学密切结合,运用定量分析法能够促使中国古代文学在研究与教学中取得重大进展与突破。
1 定量分析法的运用
1.1 定量分析法与定性分析法的区别
定量分析,以前是分析化学的专业术语,也称为量化分析。其要点在于“运用系统工程的科学方法,理清错综复杂的问题中的脉络,提取要素,理清要素之间的逻辑和数量关系;确定量化原则;建立相应的数学模型;使用有效的算法得出符合需求的合理结论”[2]。而在社会科学研究中经常使用定性分析方法,通过历史研究、文献研究、观察研究、逻辑分析、内容分析、实地研究等方法来解决问题、得出结论[3]。二者的区别在于方法论、研究范式等方面的不同,定性分析以人文主义的方法论,用语言文字进行全方“上薄拜神教,下防拜物教”为文化特点,强调礼乐教化,讲究人文教育,反对武力、权力压制,提倡以人为本,因此中国人的思维也体现出整体关联的特点,是一种动态平衡的、随机性的思维方式;即在一切可变因素中,采取非孤立的方式解决问题[4]。因此,中国人对问题思考与研究的方法通常是利用动态分析、整体关联的人文思维,常常是一种定性分析,强调现象分析时的主观性、独特性,在直觉、亲身体验、主观判断思考的影响下对作家作品、历史事件进行具体的说明与解释。
1.2 定量分析法在古代文学研究中的典型应用
华罗庚[5]说:“量贯穿于一切科学之中,所以数学的运用就是要渗透到一切科学之中”。随着近代中国科学实证主义的兴起,数学语言和数量分析的理性主义方法论开始引入中国文学研究,但受到一些学者的质疑,他们认为数量分析违背中国文学的特点,不能考虑作者和读者在作品创作和接受中的主观性、随机性和不确定性。
1980年6月中国学者陈炳藻[6]在美国威斯康星大学举行的首届《红楼梦》国际研讨会上介绍了他的文章,即《从词汇上的统计论<红楼梦>的作者问题》,使定量分析方法在文学界受到重视。在这篇文章中,他利用信息技术高速发展的产物——数据库,运用最新的检索手段,统计了《红楼梦》前八十回和后四十回的词汇使用情况,对比之下发现两部分使用词汇的相关度为78.57%,最终以《红楼梦》为曹雪芹一人所作为结论获得了学术界的广泛关注。
在他的研究中,定量分析法的具体表现是他按章回的顺序将该作品分为A、B、C三组,分别是1~40回、41~80回、81~120回组,同时为使数据更具有说服力,还搭配D组《英雄儿女传》证明相关度的可靠性,按词类将占《红楼梦》8%的字数抽出分为虚词、副词、形容词、名词、动词等,最终发现前八十回与后四十回词汇使用的相关度达到22次,占78.57%,而前八十回与《英雄儿女传》相关度只有9次,占32.14%,证明了这种方法的有效性[7]。
此后,定量分析方法的研究并没有止步于此,也没有止步于《红楼梦》。在唐宋诗词研究领域,许多学者通过定量分析取得了丰硕的成果。
例如,1983年,罗忼烈[8]在《论宋词选文的标准与格律》一文中指出,宋词界“大人物”与“名人”的区别,是以“古今名词谁选文最多”为标准。因此,统计数据,采用定量分析的方法,列出了二十四个词的领域。其中南北宋各一半,以调查《花庵词选》《草堂诗余》《阳春白雪》《词综》《词选》《宋词三百首》《艺蘅馆词选》《历代词选集评》《唐宋名家词选》《唐宋词简释》中分别选录南北宋二十四家词数为例,给出了数据说明;1984年,张三夕[9]发表《作家作品研究中的数量分析——唐代诗人总数考实》针对多年来流行的“唐代有二千三百多个诗人作了近五万首诗歌”说法进行考辩,主要以《全唐诗》为定量分析法的数据统计依托,最终统计出唐代诗人总数为三百多人更为准确、妥当;从1994年开始,王兆鹏和刘尊明[10]以定量分析的方法对宋词进行长达十多年的研究,《历史的选择:宋代词人历史地位的定量分析》这篇文章是二人展开研究的重要标志。受到罗忼烈先生的启发,在这篇文章中两位学者以《全宋词》《唐宋词百科大辞典》中的杨成凯《典籍·别集》《词话丛编》等词选为依托,从存词、版本、品评、研究文献、历代词选、当代词选的篇数对宋代29位代表词人做出统计后排列名次,数据扎实完整,具有说服力,并且对数据展开详实的说明与分析,针对“宋代词人三百家”“词人地位与词作数量的关系”“十大词人的历史地位”“词评家与词选家的异同”“古今变异与本世纪词学研究的走向”等问题作出建立在数据与整体关照基础上的准确分析,进一步完善了定量分析法在古代文学研究中的应用,成功挖掘出定量分析作为社会科学研究方法的学术价值[11]。1996年两位学者再次创作《简谈宋词繁荣昌盛的“量化”标志》一文,将定量化分析的应用更加普遍化,不仅用于宋词作家作品数据的横向对比,而且用于唐宋词词调、词作创作数据的纵向对比,将唐宋两代的词别集创作数量、个体词人创作产量作对比可以发现“宋词别集总量是唐五代词别集的12.5倍”,作为晚唐词人中创作最盛者之一的温庭筠,其创作量为66首词,而辛弃疾词作量是他的9.5倍[12]。
随着信息技术的发展,在这篇文章中还用到了南京师范大学编制的《全宋词》电脑检索系统,从统计出的数据来看,宋人自创的词调约有700余首,且使用频率最高的26调中以小令为主。尚永亮先后发表了《唐五代诗作者之地域分布与北南变化的定量分析》《唐知名诗人之层级分布与代群发展的定量分析》《开天、元和两大诗人群交往诗创作及其变化的定量分析》等文章,提出“代群”这一概念,即不同年代创作群体,对唐宋词作数量、代群变化做出统计,以最直观的数据图表呈现出创作群体的地域分布、层级变化、交往诗创作等内容,将前人模糊化结论变为具体化理论,是定量分析到定性分析转变的典型应用[13-15]。
2 定量分析法在中国古代文学教学与研究中的机遇与挑战
2.1 定量分析法应用于古代文学中的必要性
实际上,古代文学研究偏重定性分析研究方法的原因与中国人根深蒂固的思维方式有很大联系,这一思维方式在先秦时期就已开始形成。《周易》中提到“书不尽言,言不尽意”“圣人立象以尽意,设卦以尽情伪”,旨在通过卦象的推演把握变幻莫测的世界,“象”成为“意”与“言”转换的重要桥梁[16]。老庄一派强调“道”,而“道”这一概念则是包罗万象、不可直接言说的哲学概念,需要以间接的方式展示它的意指关系,所以庄子提出“言者所以在意,得意而忘言”的贵意论。在魏晋时期,深受庄子“得意忘言”思想影响的王弼进一步发扬了这种贵意理念,以老庄阐释儒学,弥补汉代经学考证训诂流弊,汤用彤[17]表示:“汉代经学依于文句,故朴实说理,而不免拘泥。”因此,在魏晋玄学与“言不尽意”思想的双重影响下,中国古代思想开始整体偏向贵意论,出现了隋唐时期关于心性的讨论、宋明理学的讨论,总结这一阶段的学术研究基本是“重感觉而轻证据”的[18]。
清代自康、雍以来,皇帝都提倡宋学,但民间以江浙为中心,反宋学气势日盛,标出“汉学”名目与之抗衡,可谓是“汉学”的全胜,梁启超在《近三百年学术史》中指出“凡当主权者喜欢干涉人民思想的时代,学者的聪明才力,只有全部用去注释古典”[19]。所以乾嘉学派将考据之风重新推向高潮,开始重视证据的利用与提出,包括近代学者的研究仍然处在一种定性分析的研究中,这种研究建立在一定数量的文献资料上,结论不具有普遍性、准确性,这一阶段则是“重证据而轻数据”[20]。
在互联网的飞速发展下,数据库建设日益完善,打破传统的重“意”、重感觉的主观思维方式是古代文学学术研究寻求新突破的必要途径,以定量分析方法为手段将赋予该领域教学与研究新的高度。
2.2 优势分析
定量分析法有利于在古代文学研究与教学中减轻强制阐释的“主观预设”。20世纪当代西方文论在中国备受推崇,学术界一度陷入对中国古代文学、文论的怀疑之中。受西化思维冲击,20世纪30年代曾出现全盘西化论,如1933年陈序经的《中国文化的出路》。实际上,当代西方文论也不是十全十美,用其诠释中国古代文学带来一定的新角度、新层面、新视野的同时,也带来了一些致命伤害,正如2014年张江[21]提到的“强制阐释是当代西方文论的基本特征和根本缺陷之一”。所谓强制阐释是指“背离文本话语,消解文学指征,以前在立场和模式,对文本和文学作符合论者主观意图和结论的阐释”。在现今古代文学的教学与研究中,强制阐释是一种很常见的现象,最为明显且突出的就是对强制阐释核心因素的表现——“主观预设”的多次出现。主观预设,即研究者首先抛出既定理论展开的一切论述,有针对性地搜集一切有关资料,最终得出的结论都是为了证明先前抛出的理论。比如宋词中二元对立的派别划分,在当代教学中常常把宋词单纯地划分为“豪放”“婉约”两类派别,学生站在这种二元对立的视角下对宋词展开片面分析,在预设中孤立的论证。而实际上,作为一位成熟的词人、诗人,其作品的创作一定是风格多变的,不能主观划分。因此,面对强制阐释中的主观预设问题,以定量分析法为工具来进行教学和研究,用数据说话,以数据库依托,对作者作品创作风格作出统计、纵向横向对比等,可是研究与教学更具有说服力。
定量分析有助于提高学生对古代文献研究和教学中存在问题的认识,提高师生应用信息技术的能力,提高教学效率[22]。以定量分析方法呈现出某一朝代作家作品创作风格、研究热点的数据统计,利用多媒体课堂教学展示给学生,不仅灵活、直观,而且简明扼要的数据相比单调、晦涩的结论提示更能激发学生兴趣。学生站在不同的角度,在已有的知识储备下思考、总结数据。学生可以在课前或课后使用定量分析来收集和分析数据,锻炼了其信息整合能力,也使教师教学负担得到缓解,师生共同在古代文学的教学与研究中进步。
2.3 劣势分析
定量分析法也并非十全十美,古代文学的研究与教学离不开理性数据分析,更离不开主观的定性分析。正如前文提到的那样,定量分析法有利于“减轻”强制阐释的“主观预设”,它并没有避免主观预设的出现,因为数学方法向文学研究的转移本身就有很多不确定因素。定量分析在文学研究中的应用,恰恰是张江批评的“前模式”,也属于主观预设中的重点之一,也就是说在场外数理方法的征用下“强制模式更为突出”[23]。古代文学研究和教学中应适当运用定量分析方法,因为文学是社会生活、人类内心的反映,是鲜活而炙热的,冰冷的数据分析不能代替思想分析。学者郭豫适[24]指出:“计算机毕竟是一种机器,它没有感情和生命,在涉及文学研究的感情活动和美学欣赏时,它就无能为力了”。
所以,在今后的古代文学研究与教学中要避免过度依赖定量分析方法,从文学系统整体性特点出发,根据研究实际的需要,从命题到建模,到搜集数据、得出结论,这一系列过程中要以严密逻辑为基础,利用中国人文主义的传统动态思维方式,进行全面分析。
3 定量分析法应用建议
3.1 学校层面
定量分析的应用是建立在强大数据库的基础上的。高校应努力承担丰富学生数据统计资源平台的任务。高校评估数据库的建立、引进和整合是一项重大工程。2006年10月完成的中国古代图书馆是北京大学的重要研究项目,国家重点项目的高校古籍研究委员会和电子出版物的15个国家重点项目,收集了1万种图书、1.25万个版本、20万卷、17亿字的全文,市场价格是一百万元人民币[25]。在高校采购初期是有一定难度的,参照国家教育部之前实施的“古籍再造”进入校园计划,高校可以采用国家投资与校内专家整理各类数据库相结合,将各类数据统一到一个平台。建立强大完备的古籍数据库是为高校教师与学生提供良好学术环境、获得研究与教学新视野的重要条件。
3.2 教师层面
随着定量分析法在社会科学研究领域的广泛应用,也出现了许多问题。由于不同研究者掌握的文献有限,对相关资料的搜集、数据的统计也就会有一定缺失,而在处理数据上,不同的学者选取比重也是不同的,甚至有些时候会出现数据造假,这些都是造成研究结果不可信的重要原因,所以定量分析的应用还有待完善与观察。高校教师作为学生学术研究的引导者,需要把握数据收集的难度,引导学生合理运用定量分析,形成以定性分析为主、定量分析为辅的教学研究方法。
3.3 学生层面
大学生作为实现中华民族伟大复兴重要力量之一,在学术研究中要有责任感,脚踏实地做学问,以严谨的态度搜集资料与数据,树立自主意识,在古代文学文献资料的查阅中形成探究意识与探索热情。更重要的是正确看待定量分析法的利用,不能过度依赖,数据列出后要积极思考数值差距背后的文学问题,进行动态而又冷静的定性分析。就像尚永亮提到的“人们常说,不怕做不到,就怕想不到。实际上,数据库建构之有无特点、能否成功,很大程度上就是要敢想、善想、会想,要既出入意外,又在人意中,以奇兵制胜”[15]。运用定量分析方法于古代文学的研究之中,要有强烈的问题意识。
大数据时代,定量分析方法广泛应用于各类社会科学领域中,而中国古代文学作为继承和弘扬中国悠久传统历史文化的关键载体,以科学主义的眼光对其进行充分挖掘是十分有必要的。定量分析方法在古代文学教学与研究中的应用是该课程在高校中与时俱进的典型现象,在教师的耐心引导下,在学生踏实严谨的研究中,在两种角色的共同努力下,定量分析法在中国古代文学的研究与教学中一定会有着长足发展。