多源数据参照的古典诗歌立体远读法初探
——以乾隆四万余首御制诗为例
2023-01-16何盈学
李 斌 何盈学 高 策
(南京师范大学 文学院,江苏 南京 210097;华东师范大学 国际汉语文化学院,上海 200062;清华大学 人文学院,北京 100084)
一、引言
近年来,将数字人文的“远读法”(distant reading)应用于古典诗歌的研究,成为文学领域的新探索。“远读”是相对于“细读”(close reading)的文学研究理论,在无预设的情况下通过量化的方法,对庞大的文本体系中的类别因素和形式元素作出解释(1)戴安德,姜文涛,赵薇.数字人文作为一种方法:西方研究现状及展望[J].山东社会科学,2016(11),第26-33页。,从宏观视野分析全局,从而把握细读其中一小部分文本无法获得的整体特征。此种方法在大规模文献的分析方面具有优长,不过在实际研究中却往往拘泥于对研究对象自身文本的数据统计,缺乏有效的多源数据对比分析。如果能避免孤立、平面的统计,将研究对象与其他相互关联或形成对比的数据文本进行参照,透过量化分析得出作品在立体空间中的价值定位,实现“立体远读法”,则有望更好地发挥远读法的功用,与传统“细读”方法有效互补。
探索“立体远读法”,需要寻找合适的古典诗歌文本作为案例。一方面,需要研究对象规模庞大,能够发挥此方法的优长;另一方面,需要有同样适合远读分析的多源数据文本作为参照。由此观之,清代乾隆皇帝的御制诗是颇为契合这两方面需求的典型案例。
清高宗乾隆帝(1711-1799)是历史上最多产的诗人,传世诗文集共收录其诗作44038首(2)关于清高宗御制诗的数量问题,前人众说纷纭。对《乐善堂全集》(收录清高宗即位前诗作)进行逐篇统计;对于《御制诗初集》《二集》至《五集》以及收录他归政后作品的《御制诗余集》,核对诸版本每卷前标注的诗歌数量,若各版本有差异则逐篇计数;最终加总得到此数。( 高策.清高宗御制诗文创作流布及政治功用研究[D]. 北京:北京大学, 2020,第11-14页),被时人赞誉堪比《全唐诗》的规模。这些作品系年清晰、记录详实、注释丰富,生动地再现了十八世纪中国几乎全部重大的事件,具有与档案、官书比较毫不逊色的价值(3)戴逸.我国最多产的一位诗人——乾隆帝[J].吉林大学社会科学学报,1985(5),第41-48页。。如此体量的诗作,对使用传统“细读”方式的研究者提出了巨大挑战,以致学者难以对其全面阅读、整体分析。这样的阅读困境,恰可借由适合处理大规模文献的远读法加以解决。除此之外,不论是与乾隆御制诗相关的《清实录》、起居注等史料文献,还是在诗歌规模方面能与之有效参照的《全唐诗》,皆有颇为成熟的数据库和研究成果可以实现多源数据参照的立体远读法。
有鉴于此,本文旨在使用远读法,将乾隆御制诗与多源文本加以参照,以期对其诗歌创作的风格与频率做出整体分析,突破研究疑难。
二、研究现状
(一)乾隆御制诗的整理与研究
1.缺少全文整理的数据库
由于乾隆御制诗体量庞大,想要对其充分研究,就需要高质量而且便于利用的整理成果。考察已有成果,学界先后有多种乾隆诗全集影印出版,所据有武英殿刻本(4)1976年台湾“国立故宫博物院”《清高宗御制诗文全集》、2000年海南出版社《故宫珍本丛刊》(第549至570册)、2010年上海古籍出版社《清代诗文集汇编》(第323至331册)。文渊阁、文津阁、文澜阁《四库全书》本(5)1986年台湾商务印书馆影印《文渊阁四库全书》本,2006商务印书馆影印《文津阁四库全书》本、杭州出版社影印《文澜阁四库全书》本,2005年吉林出版集团有限责任公司影印《钦定四库全书荟要》本。,光绪五年(1879)铅印本(6)1993年人民大学出版社《清高宗乾隆御制诗文全集》影印光绪五年铅印本(2013年再版)。等;虽有个别点校整理的选本(7)(清)乾隆.御制圆明园诗[M].天津:天津古籍出版社,2011;孙丕任,卜维义.乾隆诗选[M].沈阳:春风文艺出版社,1987。,却未有全集整理本出版。以上成果查考利用耗时耗力、效率不高,阅读使用多有不便。
在数字化整理方面,爱如生“四库系列数据库”中收录文渊阁《四库全书》本《御制乐善堂全集定本》《御制诗初集》至《五集》《御制诗余集》,其中包含了绝大部分乾隆诗。然而没有公开电子文本,无法满足使用数字人文方法进行探索的需求。
2.定量分析不足
学界对乾隆诗的研究已经取得了一定的成果,通过CNKI知网检索,计有硕、博士学位论文十余篇,期刊、会议论文逾二百篇。
从研究类型来看,主要有三方面。其一,文献学角度的考察,如朱赛虹揭示清帝御制诗文的编纂情况及文献价值(8)朱赛虹.清代御制诗文说略[J].紫禁城,1998(3),第45-46页。朱赛虹.清代御制诗文概析[J].北京图书馆馆刊,1999(2),第89-90页。,为研究打下基础。其二,文学角度的评析。学者在分类概括乾隆诗歌主题的基础上,对其艺术价值进行赏鉴,多指出其诗歌“格调不高”“诗味不足”“陈词滥调”等缺点;也有部分认可其创作优点者,如陈圣争指出其部分作品“大气”“清灵”(9)陈圣争.乾隆帝文学与文学思想及文化政策研究[D].上海:复旦大学,2014,第132-156页。。其三,从历史学角度挖掘乾隆诗的史料价值,以诗证史,在清代政治、军事、宗教、民族、建筑、艺术等研究中取得了不少成果。此类研究的代表有刘冬对御制水利诗的研究(10)刘冬.清高宗御制水利诗与乾隆治水[D].北京:北京大学,2003.,以及崔岩基于御制纪事咏史诗,考察乾隆朝经筵活动、《四库全书》编纂、“十全武功”的战事细节、乾隆朝与少数民族的交流等情况(11)崔岩.清高宗御制纪事咏史诗研究[D].天津:南开大学,2006.。
由于乾隆诗的体量与传统细读方式的特点,相关研究多为对乾隆诗歌个别专题的研究,如南巡诗、水利诗、咏史诗、题画诗、元旦诗、西域诗、和唐人诗等等;而对乾隆诗进行整体研究的成果数量很少。这些研究虽也有独特价值,然所得结论细碎零散,难以展示乾隆诗的全貌。在为数不多的整体研究的论文中,学者集中在对乾隆诗的整体价值做出判断,普遍认为其艺术水平低,但史学价值高。需要注意的是,这种判断是基于阅读“印象”的定性分析,而罕见扎实论证的定量分析(12)陈圣争从版本、数据分析上介绍御制诗文集的概貌,进而探析御制诗在不同时期的数量及其成因。(陈圣争.乾隆帝文学与文学思想及文化政策研究[D].上海:复旦大学,2014, 第21-57页)。
(二)远读法在古典诗歌研究中的应用现状
“远读”概念是斯坦福大学“文学实验室”(Literary Lab)的创始人之一Franco Moretti提出的、相对于“细读”(close reading)的文学研究理论,旨在无预设的情况下对数据进行分析后得到结论。近年来,远读方法逐步应用于古典诗歌研究,为传统文史研究注入新的活力。早期的研究多为学者自行构建数字化诗词语料库后,探索以计算方法分析大量古诗词文本的方法,如刘岩斌等(1997)介绍了开发的《全宋词》检索系统,为后续研究提供了丰富的经验参考(13)刘岩斌,俞士汶,孙钦善.古诗研究的计算机支持环境的实现[J].中文信息学报,1997(01),第27-36页。。王兆鹏和刘尊明自上世纪末起不断探索以定量方式研究词学的方式(14)王兆鹏.新世纪以来词学研究的进展与瞻望[J].学术研究,2015(06),第143-151+2页。,通过统计分析宋代词人的地位、唐诗宋词经典名篇以及古诗词诗人的朝代、籍贯、作品数量和词牌分布等(15)刘尊明,王兆鹏. 唐宋词的定量分析[M]. 北京: 北京大学出版社,2012.,并加以文学研究的分析,进一步激发了“远读”在古诗词研究领域的活力。
随着数字化资源的丰富与计算技术的成熟,对于古诗词的“远读”研究更加多元化,主要体现在可视化和算法模型构建两方面。GIS的引入使学者得以“从空间维度全面立体地研究文学史的发展变化”(16)王兆鹏. 利用GIS技术提升中国古代文学研究的数字化水平[A].第三届中国古籍数字化国际学术研讨会论文集[C]. 北京:五洲传播出版社,2011,第12-16页。,如罗凤珠等(2013)结合作者生平、作品内容和地理环境关系,构建了李白、杜甫、韩愈三位诗人一生行吟之地图,展现了文字与空间并重的文学研究方式(17)罗凤珠,郑锦全,范毅军,白璧玲,廖泫铭,邱筱榆,林宜娴.唐代诗人行吟地图建构:李白、杜甫、韩愈[A].第四届中国古籍数字化国际学术研讨会论文集[C]. 北京:五洲传播出版社,2013,第173-175页。。而构建算法模型的对象主要为诗词文本自动分类和文本解读,如胡韧奋等(2015)(18)胡韧奋,诸雨辰.唐诗题材自动分类研究[J].北京大学学报(自然科学版),2015,51(02),第262-268页。基于朴素贝叶斯和支持向量机算法构造文本分类器,对唐诗进行自动分类,推动了古诗词文本自动分类的进步;张卫(2021)等(19)张卫,王昊,邓三鸿,张宝隆.面向数字人文的古诗文本情感术语抽取与应用研究[J].中国图书馆学报,2021,47(04),第113-131页。基于字标注的机器学习、深度学习模型和CRFs算法,面向古诗及其鉴赏实现大规模人文情感术语的自动化抽取与分析,为古诗领域情感词典的构建与情感分析奠定了基础。这一时期,在“远读”研究方法上取得了多方位的发展。
回顾以往的研究,早期由于缺乏数字化的古诗词资源,可供计量分析的文本有限,学者对古诗词的“远读”存在局限性。而在计算方法发展成熟后,许多研究关注于拓展研究方法,而对研究对象本身的分析仍基于单一文本内部,较少参照多源数据。因此,未来可以在现有研究方法的基础上,更多地关注研究对象本身,引入多源数据对文本进行更全面、客观和深入的解读。
鉴于上述研究现状,本文拟利用“立体远读法”,也就是将乾隆御制诗与多源文本加以参照,以期对其诗歌创作的风格与频率做出整体分析。
三、数据来源与整理
(一)乾隆御制诗全文数据库的建设
第一,选择底本。乾隆御制诗基本收录在其诗文全集中。传世诗集有《御制诗初集》至《五集》,收其在位六十年间所作诗篇;《御制诗余集》录太上皇时期的作品。至于皇子时期的诗作,经收集、筛选,编成《乐善堂全集》四十卷;后又删订为《乐善堂全集定本》三十卷。这些诗集的传世版本有武英殿刻本、《四库全书荟要》本、《四库全书》本及光绪五年(1879)铅印本等。虽然武英殿刻本成书早于《四库全书》本,却缺乏建立数据库的电子文本基础。而日本京都大学汉籍库(Kanseki Repository)提供了御制诗文集“文渊阁《四库全书》本”的电子文本,收录《御制乐善堂全集定本》《御制诗初集》至《五集》《御制诗余集》,基本覆盖了乾隆传世诗作,因此本文以之为基础,构建乾隆御制诗全文数据库。
第二,文本结构化。所据文本格式混乱,诗题、诗序、正文、诗注、按语等内容糅杂,故需要手动标记,再利用正则表达式实现结构化整理。从而将御制诗依诗集编刊时间及卷次顺序进行编号,并将每首诗所在卷次、诗歌体裁、创作时间、诗题、诗序、正文、注释、按语等进行区分、标记,得到初步数据库。
第三,诗歌正文的清洗与标点。所据文本正文中夹杂大量随文注释,如注音“(平/声)”“(叶/)”,又如释义,乾隆四十一年(1776)所作《恭侍皇太后观灯喜而成什》“习习东风傍晚停(是日有风/至晚而静)”“扶携母子百五十(旬有圣母八旬有五予六/六合百五十一岁云)”(20)该诗收入《御制诗四集》卷三四。;而本次研究中诗歌正文是重点,故将随文注释替换删除。为阅读之便,还对乾隆诗歌中的五七言诗加以标点。
通过上述步骤,初步建立起乾隆御制诗全文数据库。其中包含的字段及说明如表1,并以《盘山十六景》为例展示具体诗作的字段情况。
表1 乾隆御制诗全文数据库字段说明表及示例
(二)其他多源文本数据
本文与乾隆御制诗形成对比或构成关联的多源文本数据有《全唐诗》、清代历朝起居注合集、《清实录》以及中国第一历史档案馆的清代档案数据。
《全唐诗》可以与乾隆诗构成有效对比,本文对《全唐诗》语料库进行了数据清洗,删除了随文注释,仅保留诗歌正文。清代各种历史文献则可以构成乾隆诗研究的关联数据。其中,《清实录》、清代历朝起居注合集的数字化资源与文本检索功能来自于北京书同文数字化技术有限公司;历史档案的数字化资源来自于中国第一历史档案馆,其中记录了乾隆每日处理的政务条目。
各语料名称、来源及数目如表2所示。
表2 多源参照文本的数据情况
四、创作风格:乾隆诗如何陈词滥调——以数据统计修正阅读印象
(一)阅读印象:乾隆御制诗“陈词滥调”
长期以来,学者对乾隆御制诗的文学水平多有批评。早在二十世纪五十年代,周作人即撰《乾隆的恶诗》(21)刊登于1950年7月23日的《亦报》(周作人. 周作人文选[M]. 广州:广州出版社,1995,第308页)。;此后钱钟书在《谈艺录》《管锥编》中也有一些文字谈及御制诗“七律对仗多纠绕堆叠”(22)钱钟书.谈艺录[M].北京:中华书局,1987,第191页。“兼酸与腐”(23)钱钟书.谈艺录[M].北京:中华书局,1987,第78页。等拙劣之处。以上多为学者的阅读感受。至八、九十年代,学界开始对乾隆诗的价值进行整体评判。戴逸所论较有代表性,认为其诗文学价值不高,如说教意味太浓、不加锤炼以致诗味不足、无真性情、语义晦涩等;同时肯定其史料价值。此说法影响颇大,基本构成了学界的共识。
在种种批评声音中,“陈词滥调”是较为重要的一种。如史礼心指出“有些诗为了遵照旧制程式,规定体裁、字数,依样填写,充斥着陈词滥调,读了令人味同嚼蜡”(24)史礼心.“十全老人”“十全”诗——清高宗乾隆的诗歌创作[J].民族文学研究,2005(04),第29-32页。。陈圣争则对此作了更为细致的分析,认为陈词滥调是乾隆御制诗遭人非议的原因之一,具体表现在:词汇反复使用,“如‘较晴量雨’这一词汇,在御制诗中出现了近三十来次”;诗句重复,如反复生硬地将王维《过香积寺》“安禅制毒龙”一句融入自己诗中;句式一再套用;一叠再叠的叠韵诗等(25)陈圣争. 乾隆帝文学与文学思想及文化政策研究[D]. 上海:复旦大学, 2014,第182-183页。。
虽然上述判断成为学界的总体共识,然而需要警惕的是,其所依凭的是学者的“阅读印象”,而非全面的客观分析。正如有学者诚恳谈道:
在四万四千多首诗中,很难一一从艺术上来剖析哪首有艺术价值、哪首没有艺术价值,哪些诗写得很烂,哪些诗写得还行等等,足以不敢妄说上面的评价是否是在通读御制诗集后的总体感觉还是在翻看不少或一部分御制诗后形成的一种观念。(26)陈圣争. 乾隆帝文学与文学思想及文化政策研究[D]. 上海:复旦大学, 2014,第132页。
也就是说,当读者指出乾隆诗“陈词滥调”时,所谈的是一种阅读感受。此种感受自然有其合理之处,而我们需要追问的是,其源于乾隆诗怎样的特质?
“陈词滥调”的字面意思是“陈旧的言辞,空泛的论调”(27)曹亚男.陈词滥调与形容词——当前文学写作中形容词滥用的症状考察[D].上海:上海大学,2009,第4页。,在文学领域使用时,则指向一种由于文学作品词语、修辞、句式、情节等“高度重复”给读者造成的不良体验。具体到乾隆诗,学者多指出其词汇、诗句、句式的“高度重复”。然而这样的“发现”是否符合实际?乾隆诗的词汇、诗句、句式是否“高度重复”?
想要客观认知这一点,不但需要对乾隆诗的重复情况进行统计,还应与体量相当的诗歌数据库进行对比。乾隆帝在晚年总结自己的诗作时指出自己所作诗歌数量与《全唐诗》相当,“予以望九之年所积篇什几与全唐一代诗人篇什相埒,可不谓艺林佳话乎?”(28)御制文余集[M].清代诗文集汇编.上海:上海古籍出版社,2010,第300册,第701-702页。(本文所引清高宗诗文皆出此版本)。这为研究提供了一个极好的参照视角,透过与《全唐诗》的比较,可以对乾隆诗的“重复”情况有更好的把握。
(二)数据统计:乾隆诗与全唐诗对比
全唐诗共57208首,与乾隆御制诗体量相当,因此本文选取了全唐诗与乾隆御制诗进行对比研究,分析其“重复”情况。
1.统计方法
第一,字符层面,本文以全部诗作为基础查找重复出现的字符串,包括二字组、三字组、四字组和五字组。
第二,句子层面,由于可标注标点的诗作范围有限,因此本文以已标点的五言和七言诗为基础,查找重复出现的五言和七言诗句。
第三,诗篇层面,本文以五言和七言诗中的绝句和律诗(仅八句标准式)为基础,通过计算统计相似诗获取重复出现的句式。将五言绝句、五言律诗、七言绝句和七言律诗分为五言和七言两组,基于字符串编辑距离算法进行相似度计算,统计每一首诗的所有相似诗,一首目标诗作和一首相似诗构成一对相似诗。
相似诗句(相同句式)的判断,主要依靠重复出现的汉字。考虑到相似字数过少时难以认定重复句式,因此计算时设定字符串编辑距离下限为4,即成为相似诗的两首诗至少有四处在诗句的相同部位有相同的字,如两首诗在第一句的第四个字都是“雲”。又由计算得到乾隆御制诗的五言诗上限为11,七言诗上限为13,因而将相同上限值运用于全唐诗以方便对比。本文将相似诗中相同的位置保留,其它位置用“@”替代,由此得到相似诗中部分或全部重复的句子,即句式相同的相似诗句,表3为乾隆御制诗中某一目标诗作的全部相似诗。
表3 乾隆御制诗相似诗示例
2.统计结果
上述统计结果如表4所示,各重复项示例如表5。根据重复项的类型与语料总数之比计算各部分相对数量,可以见出,字符层面,全唐诗中重复出现的二字组、三字组、四字组和五字组的字数之和与诗作总字数的型占比为22704.2%(总字型为8687字)、例占比为249%(总字例为2868532字),高于乾隆诗中11256.6%(总字型为9271字)和205.3%(总字例为2159491字);句子层面,全唐诗中重复出现的五言和七言诗句总数与诗作总句数的型占比为3%(总句型为386938句)、例占比为5.8%(总句例为402941句),远高于乾隆诗的0.3%(总句型为304648句)和0.7%(总句例为306076句);诗篇层面,全唐诗中相似诗的对数占诗作总首数的128.7%,乾隆御制诗中相似诗的对数是诗作总首数的76.6%,该项参与计算的语料总首数分别为37832首和25753首。因此,乾隆御制诗中重复字符串、诗句和句式的相对数量均明显低于全唐诗。
表4 乾隆御制诗和全唐诗字符串、句子和诗篇重复情况对比
表5 乾隆御制诗和全唐诗字符串、句子、诗篇重复项示例
(三)结果讨论:乾隆诗如何陈词滥调
通过与体量相当的全唐诗进行比较,可以见出,乾隆诗在词汇、诗句以及整首诗的重复度方面皆低于全唐诗。可见,乾隆诗带给读者的“陈词滥调”之感,并非源于“过度重复”。
特别需要说明的是,上述结论并不是要否认读者的“阅读印象”,更无意说明乾隆诗比全唐诗的艺术水平要高。而是要厘清读者形成不良阅读体验的来源。
进一步地,乾隆诗给人的“陈词滥调”之感,或有两种成因。第一,反复出现的叠韵诗,导致重复之感。例如,他和元稹《生春》二十首并用其韵,先后作《生秋诗用元微之生春诗韵》《生春二十首用元微之韵》《生夏二十首仍用元微之生春诗韵》《生冬二十首仍用元微之生春诗韵》。此过程中,他追求春、夏、秋、冬四季之完备,反复叠元稹诗韵,重复“何处生……早”的句式达100遍,并得意地提出“廿首三番叠,四时一气融。殊胜元刺史,株守小梅丛”(29)《御制诗四集》卷八《生冬二十首仍用元微之生春诗韵》,第324册,第670页。。
第二,大量“依例吟咏”的同主题诗作。乾隆帝作诗具有强烈的政治功用,这些作品会出现在特殊的时间、场合。而在他漫长的执政岁月中,逐渐形成了某种“惯例”,成为“依例吟咏”的作品。如节日诗作,从乾隆九年(1744)开始直到嘉庆四年(1799),乾隆帝每年元旦都要创作一首以“某某元旦”为题的七言律诗;而在乾隆二十年(1755)至嘉庆三年(1798)之间,他每年还要多写两首以“元旦试笔”为题的七律。又如祭祀相关诗篇,《御制诗四集》卷三三《正月八日诣斋宫作》诗注曰“自己卯年(1759)冬至始,每岁祈谷、常雩、南郊三大祀所有诣斋宫及礼成诗皆书于册,陈之案头,每至辄披览一过”。复如览各地总督、巡抚奏报雨雪所作纪事、志怀诗篇,共计八百余首。乾隆五十三年(1788),清高宗在批复山东巡抚长麟奏报雨雪情形的奏折中说“朕廑念民依,凡遇督抚奏报雨雪情形,俱有诗章志慰”。这种反复出现的同主题诗作,哪怕其中的字词重复未必很高,也会给带来不良的阅读体验。
总之,通过与全唐诗的比较,可以发现,乾隆诗给人的“陈词滥调”之感,并非源自于其词汇、语句的高度重复;更有可能来自于反复叠韵之作或大量同主题作品。
五、创作频率:乾隆创作低谷期溯因——以多源文本参照印证
(一)现象:乾隆四十二年的创作低谷
诗人作诗大都有其高峰期和低谷期,其作诗频率或与个人身体、生活、境遇有关,或与社会政治、经济情况等有关,是值得挖掘的现象。尤其对于帝王诗人乾隆帝而言,其作诗频率更能折射出国家层面的历史事件。
考察乾隆诗作,除即位前的作品外,皆系年清晰,为统计提供了便利。而其即位前的作品,一则多有删汰,二则系年模糊,故暂不做计算。乾隆元年至三年的诗作,目前缺乏明确系年信息,,故将每年的诗歌创作数量设置为三年的平均值,即20首。统计结果如图 1所示:
从图中可以看出,乾隆的诗作数量总体呈倒U型分布,平均每年作诗676.9首。即位初期作诗频率较低,随后逐年上升,在乾隆二十七到乾隆四十一年时形成了一个高峰期,平均每年作诗992.8首,在乾隆三十七年时达到最高峰,共作诗1067首,即平均每天作诗2.92首。乾隆四十二年诗作数量骤降为292首,形成明显的低谷期。在乾隆四十三年到四十九年维持一个短高峰期后,诗作数量随着年份逐年下降。
这种作诗频率的整体变化与乾隆的执政情况息息相关(30)高策.清高宗御制诗文创作流布及政治功用研究[D].北京: 北京大学, 2020,第22-24页。。第一,执政初期,政务日多,无暇作诗,常感慨“剩有忧怀批奏牍,那余逸兴赋诗篇”(31)御制诗初集[M].清代诗文集汇编,第319册,第90页。;同时,诗歌的政治功用尚不突出,“依例吟咏”之作尚未形成惯例。第二,随着临政时间的增长,高宗诗歌承担起越来越多的政治功用,大量作品成为“定例”而需要周期性创作。与此同时,诗歌创作的流程也日益成熟,在文臣的辅助下,高宗作诗越来越快(32)高策.清高宗御制诗文创作流布及政治功用研究[D].北京: 北京大学, 2020,第38-53页。,甚至曾在游览香山的五天时间里,“得诗凡六十七首”(33)御制诗五集[M].清代诗文集汇编,第327册,第460页。,达到了创作量的高峰期。第三,当执政满六十年时,高宗归政成为太上皇,开始有意识地减少诗歌创作,嘉庆元年(1795)即提出“既为太上吟应简”(34)御制诗余集[M].清代诗文集汇编,第329册,第485页。,“归政后一切承祭、视朝、经筵、阅武耕耤、行师诸典均为子皇帝之事”,因此“例成之作可以大简于昔矣”(35)御制诗余集[M].清代诗文集汇编,第329册,第485页。。创作减少的另一个原因在于白莲教起义,清军战事受挫,于是他多次表达“近因盼望捷报,心绪焦劳,吟兴为之稍减”(36)御制诗余集[M].清代诗文集汇编,第329册,第671页。,“近日盼捷萦怀,吟兴稍减”(37)御制诗余集[M].清代诗文集汇编,第329册,第682页。。
在对乾隆作诗频率的整体变化情况作出分析后,还有一个非常值得关注的现象:乾隆四十二年,其作诗频率大幅下降,此后两年才逐步恢复。其中原因究竟为何?
(二)溯因:多源文本的参照印证
乾隆四十二年诗作数量骤降,有明显的数据异常。戴逸、陈圣争也发现了此现象,并提出了一个假设“一个很大的缘由可能是乾隆帝因其母亲孝圣皇太后的去世而心情不振,影响诗兴”(38)陈圣争. 乾隆帝文学与文学思想及文化政策研究[D]. 上海:复旦大学, 2014, 第56页。,不过未加论证分析。想要明确溯因,既要考虑多种影响诗歌创作频率的可能原因,亦要与其他史料关联参照分析。
1.假设一:政务繁忙,无暇作诗
如上文所述,乾隆诗歌创作与政务情况关联甚密,故首先要考虑此方面因素,即乾隆四十二年前后,国家发生战争等重要事件,致使乾隆帝无暇作诗。本文抽取历史档案中政务时间包含“乾隆”的条目,统计了乾隆历年处理政务的数量(如图 1),发现乾隆四十二年恰处于政务处理的低谷期,很难说由于政务繁忙致使没有闲暇创作诗歌。
进一步考虑对于国家事务极为重要的战争情况。乾隆在其撰写的《十全记》中记述了一生的“十全武功”,即他为了加强国家的统一,十次派兵平定边疆叛乱的重要军事行动,他对此颇为自豪。其中大小金川之役发生在乾隆三十六年至乾隆四十一年,此战最终获胜,对此乾隆在诗作中表达了他的喜悦,作《将军阿桂奏攻克噶喇依贼巢红旗报捷喜成凯歌十首》《于郊台迎劳将军阿桂凯旋将士等成凯歌十首》《弆藏所获金川军器于紫光阁并志以诗》等诗篇,可见乾隆对大小金川之役的胜利感到满意,并无明显的负面情绪,而乾隆四十二年没有重要的战争。在对乾隆四十二年的政务情况进行分析后,本文发现这一年的政务相对轻松,不会影响作诗的时间和兴致,因此可以基本排除政务繁忙使其无暇作诗的可能性。
2.假设二:身体衰弱,无力作诗
在基本排除政务繁忙的影响后,还应考虑乾隆皇帝因身体衰弱而无力作诗,或许也正因如此,其处理政务的数量也较少。考察乾隆帝的身体逐渐衰老的过程,他从乾隆二十年(1755)45岁以后,左耳听力下降,乾隆四十年65岁以后,左眼视力下降。不过在乾隆四十五年(1780)以后,身体衰退迹象更加明显,出现了失眠、健忘等情况,如其自述“昨日之事,今日辄忘;早间所行,晚或不省”。由此观之,乾隆四十五年后的身体状况较乾隆四十二年更差;然而,从图 1中可以发现乾隆四十六年、四十七年的诗作数量反而高于乾隆四十二年至四十五年。因此,乾隆帝因身体衰弱而无力作诗的可能性亦难有论据支撑。
3.假设三:母后亡逝,无心作诗
通过上述分析,政务、身体以外的原因需要被考虑。联系史事,本文推测乾隆四十二年崇庆皇太后的崩逝对乾隆造成了巨大的打击,使其无心作诗。为了验证这一推论,同样需要将御制诗与多源史料对照分析。
首先,乾隆帝对皇太后极为孝顺,侍奉皇太后成为其日常生活的重要组成。他对母亲礼敬有加,日常问安颇为频繁。在《清实录·大清高宗纯皇帝实录》中查询“皇太后”,得到4939条结果,其中86条为皇太后逝世之后的记录,其余均为皇太后在世时的记录,多数记录了乾隆皇帝每日给皇太后请安。而在《清代历朝起居注合集·清高宗》中关于“皇太后”的结果共4127条(39)缺失三十四年六月至四十四年正月之间的起居注。,多数结果亦是问安。不仅如此,每逢皇太后诞辰,皆要大事庆贺,甚至比皇帝的诞辰庆典更要盛大隆重(40)戴逸.乾隆帝及其时代 插图本[M]. 北京:中国人民大学出版社, 2008,第50页。。
第二,乾隆御制诗与皇太后具有密切的关系。据皇太后遗诰所言:“至凡遇万寿大典,必躬自起舞,以申爱敬,每当宫廷侍宴,必亲制诗画,以博欣愉。(41)清实录[M].北京:中华书局,1985,第21册,第235页。”为了验证这一现象,下文择取“皇太后”和其常居住的正宫名称“慈宁”为标志性字符串,分别统计它们在御制诗题目与正文中出现的频次,得到如图 2的统计结果。
一方面,御制诗题中“皇太后”的频次变化明显,在乾隆四十二年前有403处,之后变为0处。考察这些诗歌,主要为乾隆帝侍奉母后而作,具体包括日常请安、节日请安或侍宴、出游之诗等。最后一首出现“皇太后”的诗歌题为《圣母皇太后奄弃藐躬,攀号莫及,痛摧肺腑,虽擗踊不足申哀,神魂悲恋,末由稍释,倚庐苫块之中,竟夕不能成寐,因占挽词,腹稿口授廷臣缮录,用展哀愫》,为乾隆四十二年之作,题目中饱含丧母之痛,此后诗题不复出现“皇太后”。另一方面,乾隆诗作中常以“慈宁”代指皇太后,这一字符串在乾隆四十二年之前出115次,之后共出现9次。
由上述史料记载和量化统计可见,侍奉皇太后成为乾隆诗歌创作的重要内容;基于乾隆四十二年的前后对照,可见其崩逝对乾隆诗的主题与内容产生了重大影响。
第三,皇太后的逝世对乾隆心情影响极大。细读乾隆四十二年的御制诗,如《安佑宫瞻礼》一诗云“匍匐瞻神御,告哀徒抢呼。怙无犹赖恃,双痛孰怜孤。尊养皆虚矣,遭逢有是乎。毁称不灭性,勤政敢疏吾”,表达了他在皇太后逝世后的哀伤和无父无母的孤独心境。《清实录》中也记载了皇太后崩逝后乾隆的反应:“……大行皇太后大殓……上哀恸深切。水浆不御。群臣环跪。恳上节哀。上悲不自胜……王公大臣恳请还宫。上不允。朝夕诣梓宫前供奠。……”可见皇太后的逝世对乾隆来说是切肤之痛,失去生母令他悲伤不已。
综合上述史料记载与统计分析,崇庆皇太后是乾隆皇帝日常生活以及诗歌创作中不可或缺的重要组成,而在皇太后逝世时乾隆帝心情大受影响,于是合理推知这成为乾隆四十二年其作诗频率陷入低谷和无心处理政务的重要理由。前文对政务繁忙、身体衰弱两种理由可能性的分析,也对这一结论起到佐证作用。
六、结论
本文提出多源数据参照的立体远读法,将乾隆御制诗与《全唐诗》《起居注》《清实录》等文本对比关联,以期突破乾隆诗体量过大、难以全面阅读的研究困境。以建立的乾隆诗全文数据库为基础,研究从乾隆帝诗歌创作风格和创作频率两方面展开。在创作风格方面,乾隆诗长期给人“陈词滥调”的阅读印象,这并非因为乾隆诗歌字、句的高度重复,因为比较发现,乾隆诗在字符、句子、诗篇多层面重复率明显低于《全唐诗》;而长期的阅读印象或来自其乾隆诗中存在的大量同主题诗作或反复出现的叠韵诗。在创作频率方面,通过统计乾隆帝每年作诗的数量,发现其创作于乾隆四十二年呈现低谷期;关联其他史料的记载,发现这一现象更有可能源自乾隆四十二年皇太后的崩逝,而非政务繁忙和身体衰弱所致。上述研究得以避免对单一文本数据、孤立的统计分析,而能将研究对象与更多来源的文本数据加以对比、关联,在立体空间中得出更为确切的结论,或以数据统计修正阅读印象,或用多源文本实现参照印证,不失为对远读方法的一种探索。
本研究仍有较为广阔的探索空间。一方面,乾隆诗数据库仍存在异体字、生僻字、收诗不全等有待完善之处。另一方面,除了陈词滥调和创作低估,具有极高史料价值的御制诗仍有许多值得探究的谜题,可以在与数字人文研究的碰撞中得到解答。