中国古典文学经典传播的定量分析——论王兆鹏等著《宋词排行榜》的四维空间
2015-03-19苗贵松
中国古典文学经典传播的定量分析——论王兆鹏等著《宋词排行榜》的四维空间
苗贵松1,2
(1.常州工学院,江苏常州213002;2.武汉大学文学院,湖北武汉430072)
摘要:用量化方法研究古典文学由来已久,王兆鹏等著《宋词排行榜》以其公开发表的学术论文和所指导博硕士学位论文为基础,将当代读者和“互联网页”纳入分析范围,其价值有计量历史学、文学文献学、文艺鉴赏学和网络传播学的四维空间,是回应国民阅读转型的学术关怀,既有信度和高度,又不失温度。但因研究方法与数据采集等限制,对于揭示宋词名篇在不同时代的嬗变过程和定量研究的学理基础尚需给予更多阐释。
关键词:宋代文学;定量分析;宋词;《宋词排行榜》;经典传播
收稿日期:2014-09-01
作者简介:苗贵松(1969—),男,常州工学院副教授,武汉大学访问学者。
基金项目:国家社会科学基金重大项目(12&ZD154)
中图分类号:I206.2
文献标志码:A
文章编号:1673-0887(2015)03-0037-05
一
定量是以数字化符号为基础的测量,日常表现为数量多少、具体的统计数字、范围衡量、时间长度等。把定量分析作为一种分析问题的基础思维方式始于伽利略。用量化方法研究古典文学由来已久,但一般是简单统计。1913年,王国维《宋元戏曲考》(初版为《宋元戏曲史》)作元杂剧取材宋金本剧目表和元杂剧家里居表[1],将乾嘉严密实证与西方逻辑推演相结合。20世纪30年代以后,文体学研究领域中定量分析开始流行,进而成为当代西方文体学主要研究方法之一。1954年,瑞典汉学家高本汉在《在中国文法上的新探》中以词语统计分析考察《红楼梦》后四十回作者。1959年,唐圭璋先生《宋词四考》出版,其两宋词人占籍考,将867人按省分列(浙江216、江西153、福建110、江苏86、河南68、安徽46、四川60、河北34、山东31、湖北17、陕西14、山西7、广东6、广西2)[2],占宋代1 490多位词人的58%,观一代词风及一地词风之盛胜过千言,开定量研究词学风气之先。1981年,美国威斯康星大学陈炳藻《从词汇上的统计论〈红楼梦〉作者的问题》论文,首次借助计算机进行《红楼梦》研究。1983年,华东师范大学陈大康开始对《红楼梦》的字、词、句作全面的统计分析。1987年,复旦大学统计运筹系李贤平采用计算机科学模式识别和统计学探索性数据分析相结合的方法,将其虚字使用频率绘成图形,发表《〈红楼梦〉成书新说》。1990年,唐门肖鹏、王兆鹏博士学位论文继承师学,肖著《群体的选择:唐宋人选词与词选通论》(凤凰出版社2009年版修订版为《群体的选择:唐宋人词选与词人群通论》),绘制不同时代词文化圈重叠情况示意图、十国两宋词人群SWOT坐标图、清代太湖词人群地域分布图等,是为新著《宋词通史》的前奏;王著《宋南渡词人群体研究》(台湾文津出版社,1992年版)创制宋词分期表、南渡词人群体唱和篇什统计表、南渡词人群使用题序统计表,为20年后《宋词排行榜》埋下了伏笔。1997年,姚鹤鸣《文艺数量化研究之回顾与探讨》,可谓20世纪文学定量分析的总结。
二
王兆鹏先生师承词学大师唐圭璋,早年在文献考据、诠释批评和理论建构方面的贡献学界共知。近年又致力于文学传播和数字化研究,《宋词排行榜》就是在其学术研究基础上(所有数据均来源于《文学评论》《文学遗产》等学术期刊公开发表的论文与所指导的硕博学位论文),运用定量分析方法研究中国古典文学经典影响力传播的学术普及著作,是《唐诗排行榜》姊妹篇。
实际上,王兆鹏教授用定量统计的方法研究唐宋文学,已有20年的历史。1995年7月,《文学遗产》发表其《历史的选择:宋代词人历史地位的定量分析》(与同门刘尊明教授合作),就用现存词作的篇数,现存宋词别集的版本种数,宋代词人在历代词话中被品评的次数,历代词选中宋词入选篇数,宋代词人在20世纪被研究、评论的论著篇(种)数和当代词选中宋词篇数6个方面的数据,遴选出宋代词人综合影响力前十名:辛弃疾、苏轼、周邦彦(与苏轼并列第2名)、姜夔、秦观、柳永、欧阳修、吴文英、李清照、晏几道和贺铸[3],在中国知网已被引91次、下载1 107次,学界关注度可见一斑。20年间,王兆鹏教授以独立或第一作者身份在《文学评论》《文学遗产》《文艺研究》等学术期刊发表和出版量化相关论文著作25种①,指导相关选题博硕士学位论文13篇②,已经形成唐宋文学经典传播的定量研究体系。
宋词排行榜的主要数据来源,主要有5个方面:一是选取宋元明清以来有代表性的词选107种,计算各首词作的入选率;二是以词人姓名、词调和首句为关键词,检索互联网中谷歌和百度所链接的关于宋词的网页数目;三是根据吴熊和先生主编《唐宋词汇评·两宋卷》,统计历代宋词的评点资料;四是20世纪宋词研究和赏析的单篇论文,篇目来源于自行研制的《20世纪词学研究论著目录数据库》;五是依据《全宋词》《全金元词》《全明词》《全明词补编》《全清词·顺康卷》,统计历代追和宋人词作的篇数[4]。考虑到学术普及和出书成本等因素,《宋词排行榜》没有展开,只给出苏轼《念奴娇》(大江东去)、岳飞《满江红》(怒发冲冠)、李清照《声声慢》(寻寻觅觅)、苏轼《水调歌头》(明月几时有)、柳永《雨霖铃》(寒蝉凄切)、辛弃疾《永遇乐》(千古江山)、姜夔《扬州慢》(淮左名都)、陆游《钗头凤》(红酥手)、辛弃疾《摸鱼儿》(更能消)、姜夔《暗香》(旧时月色)等一百首总榜单。
三
以往的宋词接受研究多以民国及以前的文献为中心,当代读者未纳入分析范围。在某种意义上说,一切历史都是当代史,一切排行榜也应是当代榜。截至2014年6月,我国网民规模达6.32亿,互联网普及率为46.9%[5]。《宋词排行榜》将“互联网页”的虚拟空间纳入古典文学经典传播的量化指标范围,是回应信息时代国民阅读转型的学术关怀,既有信度、效度、厚度和高度,又不失温度。因为走出书斋,使学术研究有益民生,贡献社会,是人文研究之本。
第十一次全国国民阅读调查结果显示,34%的网民更倾向于数字化方式的阅读[6]。如果不考虑阅读方式的变化,那么宋词还是宋元的、明清的、民国的或20世纪的宋词;如果将“互联网页”纳入统计范围,读者尤其是青少年读者就会大量缺席。那么,当代宋词经典影响力的传播就会缺少说服力。
作为当代传播经典的一种策略和试验,“排行榜”是不同作品在接受史上受关注的程度进行统计分析排行,而不是根据作品艺术的优劣好坏来评比[7]。通观全书,其价值富有四维学术空间。
(一)计量历史学空间
定量研究方法科学。经统计学家的认可,《宋词排行榜》将所设定的“历代选本入选次数”、“历代评点次数”、“唱和次数”、“当代文章研究篇数”、“互联网链接文章篇数”5组数据进行标准化处理后,再加权求和,代入公式,计算机会自动计算出每首作品的综合分值。较大限度排除个人主观印象,是每首作品关注度历时性空间的总体观照,并不妨碍每人心中都有自己的经典。笔者以为,之所以有时“排行榜”会使人觉得不可思议,是因为理性和感性有时是一对矛盾结合体,以理性给予感性的指导,譬如作者提出宋词“精品率”的计量历史学概念,就是学术价值的一个体现。
(二)文学文献学空间
定位研究文学属性。“深描”的同时,还需“细写”,以彰显作家作品的独特性。譬如同为豪放名作,百首名篇的收官之作、张孝祥《六州歌头》(长淮望断)的痛快淋漓,与他是雄姿英发的状元词人、帅臣词人而又英年早逝的身份一致,赤壁词(大江东去)的“高蹈沉厚”是与苏轼的文坛巨擘身份融合的。文献空间是文学传播之基,“不仅仅是审美,而且是在和他们对话,在体验他们的人生,品味他们的或悲或喜、或忧或愁的情感,这也正是文学与哲学、历史的差别之所在”[8]。
(三)文艺鉴赏学空间
定性研究转变思维。一些社会学定量研究论文重点在数据获取和分析方法,最后均为“讨论”(定性),所占篇幅大都不到四分之一,这是其学科属性决定的。人文学科尤其是文学研究,定性是主体,定量终究是应用的工具。因此,《宋词排行榜》隐藏计算过程,凸显定性分析。如第一名苏轼《念奴娇》(大江东去),用四分之三篇幅解析五大读者群,证明可谓实至名归。文艺鉴赏学空间让读者既知其然,亦知其所以然,改变思维,举一反三,由此理解后面99首乃至千首万首,进而养成独立分析能力。
(四)网络传播学空间
学术普及契合时代。二万多首宋词,究竟哪些是经典?哪些是名篇?按理说,能够流传至今的,都应该是名篇。但即使研究专家也未必都能将《全宋词》每首翻遍细究,更别说普通读者了。诚如杨海明先生所言,和专业学者把唐宋词当作“学问”和“学术”不同,普通读者的读词称得上是一种“低成本而高收益”的文化消费活动[9]。如宋词选本、鉴赏辞典、网络书写,可谓宋词经典大众传播的三驾马车。
作为一代文学的代表,宋词之美毋庸置疑,《宋词排行榜》将网络时代的虚拟空间引入古典文学作品的研究赏析中,表明古典文学研究完全可用严谨的学术方式传播中华优秀传统文化,为“美丽中国”的文学实践贡献学者的社会担当。
四
《宋词排行榜》出版后,因其运用统计与定量分析的研究方法引发了较大反响(包括《唐诗排行榜》),支持和反对者分别以傅璇琮与秦毅两人为代表。傅璇琮先生盛赞著作无论在理论拓展还是实践创新方面,都具有开创性意义[10]。秦毅先生则对研究方式大加批评,对其“选本、互联网页、评点、研究论文、唱和”5个指标的“50%、10%、20%、15%、5%”的权重计算方案提出质疑[11]。可证伪才是真正学术的特征,只不过定量分析的反对者,学理的分析似乎还不够。
为繁荣学术,《社会科学》杂志刊发了一组文章,推动讨论深化。张三夕等人指出,由于古代文学研究对象的特殊性,对不可确定的变量则应当避免使用计量分析法[12]。白寅等人则对《唐诗排行榜》和《宋词排行榜》计算模型提出改进建议:确立文献类型重要性的梯度,权重系数不但要设立文献类型系数、文献时代系数,还应当设立单篇文献影响系数[13]。王兆鹏教授撰文回应:文学排行榜评价指标的权重设置,最理想的状态是客观赋权法和主观赋权法相结合[14]。争鸣无疑对学术的健康发展是有益的。
每种研究方法都不是尽善尽美的,“统计方法与传统的考证方法,是相辅相成的。统计方法的优点是纵览全局,利于发现大块的构造。对于局部结构,它就无能为力,精雕细刻的工作还得让位于考证方法”[15]。数理统计专家李贤平教授27年前如是说。古典文学界也可大致分为侧重文献整理和侧重文学阐释两大群体,虽本是同根生,争鸣却一直不断。如果没有古代文学千年的研究积累和大规模古籍数据库的开发,当代古典文学的定量研究就会是无源之水与无本之木。文献学和文艺学应互为表里,定性描述与定量分析需相辅相成。而复杂性科学的研究范式,将为古典文学的现代研究指出新的路向。
毋庸讳言,尽管著作者有深厚的学术基础,尽管著作者看重的是数据背后所蕴含的作品在历代流传接受的变化过程,但限于定量方法本身的局限③、数据时限、学术普及和出版成本的考虑,用统计分析的方法来评估唐宋诗词的影响力,还是一种尝试,其缺失也是显而易见的。譬如《全清词·雍乾卷》(南京大学出版社,2012年5月版)和新世纪词学研究论著目录数据库,则憾未应用,而这些数据对某些名篇指标恐怕会是颠覆性的。影响力是一个动态的过程,《宋词排行榜》揭示了宋词经典在不同时代的流变过程,一百名家名篇地位在历代的浮沉情况,具体到某一位词人、某一个名篇是何时得到关注?怎样成为经典?又怎样消失在人们的视线之中?读者还要了解不同时代人们心中的宋词经典有何不同,以此透析各时代的社会心理、审美观念和诗学风貌的差异,诸方面还比较粗略。
另外,还需对定量研究的学理基础给予更多阐释。这里可借鉴三个理论范式:为人们理解微小作用导致社会突然变化的机理开拓道路的“突变理论”;即使该系统的初始状态是详尽了解的,也会迅速进入无法精确预知状态的“混沌理论”;以及表明在大量个体各自按照不多的几条简单规则相互作用时,如何从中产生出秩序与稳定的“复杂性理论”[16]。当然,这对一本考虑出版成本和大众读者的学术普及著作有些求全责备了。
教育部长江学者、特聘教授尚永亮先生认为,一种好的、行之有效的方法,本身应有完备的理论支撑,它诉之于学术的,不只是一种解决问题的工具,更应是一种理念、一种观察问题的视角,只有这样,它才能从形而下的“器”,升格为形而上的“道”[17]。中国古典文学经典传播的定量研究④,应该得鱼忘筌,舍器而为道。
致谢:感谢武汉大学数学与统计学院访问学者、武汉商学院雷文平副教授提供20世纪80年代数理统计学家定量研究古典文学相关文献的线索。
注释:
①除《历史的选择──宋代词人历史地位的定量分析》外,王兆鹏先生量化研究论著尚有:《昌盛与萧条——本世纪词学研究格局中的清词研究》(《鄂州大学学报》,1995年第1期),《文学史研究应注重计量分析》(《中国诗学第4辑》,1995年12月),《简谈宋词繁荣昌盛的“量化”标志》(《古典文学知识》,1996年第5期),《〈文学遗产〉复刊以来论文和作者队伍的统计分析》(《文学遗产纪念文集》,文化艺术出版社,1998年版),《“名作”与“和作”》(《学林漫录》第14集,中华书局,1999年版),《宋词作品量的统计分析》(《光明日报》,2001年11月28日),《1997—1999年宋代文学研究论著及作者队伍的定量分析》(《培训与研究:湖北教育学院学报》,2002年第3期),《宋代文学研究现状的定量分析(《光明日报》,2002年10月9日),《宋词作者的统计分析》(《文艺研究》,2003年第6期),《三大功能:对未来数字化古籍的期待》(《中国社会科学院院报》,2007年9月18日),《寻找经典——唐诗百首名篇的定量分析》(《文学遗产》,2008年第2期),《宋词经典名篇的定量考察》(《文学遗产》,2008年第6期),《影响的追寻——宋词名篇的计量分析》(2008年词学国际学术研讨会论文集,后发表于《国学学刊》2009年第1期,又以《宋词影响的追寻与计量》为题,发表在郭莲花、林春美合编《江湖家园与中文文学:第五届马来西亚汉学国际学术研讨会论文集》,博特拉大学现代语文暨传播学院,2010年),《定量分析在唐宋词史研究中的运用》(《江西师范大学学报(哲学社会科学版)》,2010年第1期),《20世纪词学研究成果量的阶段性变化及其原因》(《学术研究》,2010年第6期),《从20世纪词学论著影响力的排名看CSSCI评价体系的局限性》(《国学学刊》,2011年第1期),《新世纪以来词学研究的宏观走势》(《文学与文化》,2011年第3期),《唐诗排行榜》(中华书局,2011年版),《宋词排行榜》(中华书局,2012年版),《建设中国文学数字化地图平台的构想》(《文学遗产》,2012年第2期),《谈文学排行榜的评价指标与权重设置——以唐诗宋词为中心》(《社会科学》,2013年第2期),《利用GIS技术提升中国古代文学研究的数字化水平》(《第三届中国古籍数字化国际学术研讨会论文集》,五洲传播出版社,2013年版),《百年来李清照、辛弃疾研究成果量的时段变化》(《徐州工程学院学报(社会科学版)》,2013年第4期),《20世纪下半叶韩国唐代文学研究成果的量化考察》(《贵州社会科学》,2014年第8期)。
②王兆鹏教授近十年指导的50篇研究生论文中,以统计与定量分析为研究方法的有13篇:刘学《1901—1992年词学研究论著的定量分析》(2003届硕士论文)、刘俊丽《宋诗作者队伍的定量分析》(2004届硕士论文)、孙凯云《寻找经典——唐诗名篇定量分析》(2005届硕士论文)、周静情《经典的选择——宋词名篇百首的定量分析》(2005届硕士论文)、郁玉英《宋词经典及其经典化研究》(2008届博士论文)、邵大为《唐诗三百名篇的定量分析》(2009届硕士论文)、邓建《宋代文学选本研究——基于“选学”立场的返观与重构》(2009届博士论文)、彭晓菊《杜诗历史人物研究》(2009届硕士论文)、冯美蓉《近十年来词学研究论著的定量分析》(2011届硕士论文)、王世立《唐诗经典的确立与嬗变》(2012届博士论文)、王骞《宋诗经典及其经典化研究》(2012届博士论文)、郑栋辉《宋文作者队伍的定量分析》(2013届硕士论文)、杨华《南宋文官年表》(2013届硕士论文)。
③宾夕法尼亚州立大学蒙特阿尔托分校奇拉·汉曼指出,人文社会科学对量化研究的过度重视会使研究者忽视人文社会科学的价值取向,而人文社会科学的真正价值在于启蒙。见张小溪:《美国人文社会科学定量化趋势明显,莫让“科学”蒙蔽人文精神》,《中国社会科学报》,2013年11月1日,第A3版。
④中国古典文学的定量研究,除上面提到的研究文献外,黄一农《e者据时代的新曹学研究》(《中国社会科学》,2011年第2期)、陈友冰《李贺鬼神诗的定量分析》(《文学评论》,2004年第1期)、尚永亮《数据库、计量分析与古代文学研究的现代化进程》(《文学评论》,2007年第6期)、郁玉英《姜夔词史经典地位的历史嬗变》(《文学评论》,2012年第5期)、刘尊明《本世纪东坡词研究的定量分析——词学研究定量分析之一》(《文学遗产》,1999年第6期)、杨镰《元诗文献研究》(《文学遗产》,2002年第1期)、尚永亮《唐知名诗人之层级分布与代群发展的定量分析》(《文学遗产》,2003年第6期)、郑永晓《古籍数字化与古典文学研究的未来》(《文学遗产》,2005年第5期)、谢桃坊《词谱检论》(《文学遗产》,2008年第1期)、左东岭《中国古代文学研究转型期的技术化倾向及其缺失》(《文学遗产》,2008年第1期)、郑永晓《技术与心智的互补——建立在计算机检索基础之上的古典文学研究》(《文学遗产》,2009年第1期)、李铎《从检索到分析——计算机知识服务的时代》(《文学遗产》,2009年第1期)、罗凤珠《引信息的“信”入文学的“心”——谈情感、计算和语义研究在文史领域的应用》(《文学遗产》,2009年第1期)、张三夕《作家作品研究中的数量分析——唐代诗人总数考实》(《徐州师范学院学报(哲学社会科学版)》,1984年第2期)、蒋寅《从〈河岳英灵集〉到〈中兴间气集〉——关于大历诗风演变的定量分析与假说》(《广西师范大学学报(哲学社会科学版)》,1984年第4期)、王友胜《清人编撰的三部宋诗总集述评》(《湘潭师范学院学报(社会科学版)》,1998年第4期)、戴伟华《唐代文学研究中的文人排序及其意义》(《扬州大学学报(人文社会科学版)》,1999年第1期)、(日)清水凯夫《从全部收录作品的统计看〈文选〉的基本特征》(《长春范学院学报》,1999年第1期)、周明初《二十五年来明代文学研究的一个样本分析》(《南京师范大学文学院学报》,2003年第1期)、李炳海《中国古代文学的定量、定性与定位研究》(《人文杂志》,2004年第4期)、陈文新《数字化时代的中国古代小说研究》(《东南大学学报(哲学社会科学版)》,2005年第3期)、唐磊《试论古代文学研究中计量方法的应用》(《中国社会科学院研究生院学报》,2006年第2期)、鲁小俊《〈中国文学编年史〉抽样分析》(《武汉大学学报(人文科学版)》,2007年第2期)、林玫仪《韵律资料库对词学研究之助益》(《清华大学学报(哲学社会科学版)》,2007年第6期)、黄鸣奋《数字化语境中的我国古典文论》(《厦门大学学报(哲学社会科学版)》,2008年第5期)、周文业《〈水浒传〉版本数字化及应用》(《水浒争鸣(第十一辑)》,2009年)、吴光正《明清小说的现代整理与数字化》(《文史知识》,2010年第4期)、连心达《寻根游语,疏凿词源——詹安泰文学批评与“文本分析”》(《中山大学学报(社会科学版)》,2011年第6期)、陈才智《〈唐诗排行榜〉平议》(《中国诗歌研究动态》,2012年第2期)、李金松《古文唐“瘦”宋“肥”论——以朱东润〈中国历代文学作品选〉与姚鼐〈古文辞类纂〉为对象的考察》(《文学与文化》,2013年第1期),以及许伯卿、黄大宏、邓百意、张敏、程建虎、王伟伟、宋娟、尚雪红、赵忠敏诸博士学位论文,都为后学必读文献。
[参考文献]
[1]王国维.宋元戏曲史[M].上海:商务印书馆,1915:86-97.
[2]唐圭璋.宋词四考[M].南京:江苏文艺出版社,1959:1.
[3]王兆鹏,刘尊明.历史的选择:宋代词人历史地位的定量分析[J].文学遗产,1995(4):47-54.
[4]王兆鹏,郁玉英,郭红欣.宋词排行榜·前言[M].北京:中华书局,2012.
[5]中国互联网络信息中心.第34次中国互联网络发展状况统计报告[EB/OL].(2014-07-21)[2014-07-31].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/t20140721 _47437.htm.
[6]中国新闻出版研究院.第十一次全国国民调查结果公布[N].光明日报,2014-04-22(01).
[7]王洪波.“排行榜,是我们传播经典的一种策略和试验”:王兆鹏回应《唐诗排行榜》引发的争议[N].中华读书报,2011-11-23(09).
[8]朱万曙.古代文学研究中的“科学主义”[J].文学遗产,2014(1):148-150.
[9]杨海明.沐浴“真、善、美”阳光雨露的心灵旅游:试论普通读者对唐宋词的阅读欣赏活动[C]//张高评.宋代文学之会通与流变:近世文学国际学术研讨会论文集.台北:新文丰出版有限公司,2007:294-314.
[10]傅璇琮.唐诗有了排行榜之后:读《唐诗排行榜》[N].光明日报,2012-02-05(05).
[11]秦毅.唐诗宋词排行榜比的是什么[N].中国文化报,2012-02-21(02).
[12]张三夕,张世敏.古代文学研究中计量分析的应用与限度:由唐诗宋词排行榜引起的思考[J].社会科学,2013(2):172-177.
[13]白寅,杨雨.试论文学作品历史影响力测度模型的构建:兼与王兆鹏先生商榷“唐诗、宋词排行榜”的计算模型[J].社会科学,2013(2):178-187.
[14]王兆鹏.谈文学排行榜的评价指标与权重设置:以唐诗宋词为中心[J].社会科学,2013(2):164-171.
[15]李贤平.《红楼梦》成书新说[J].复旦学报:社会科学版,1987(5):3-16.
[16]杨敏.数据成为社科加速发展的关键[N].中国社会科学报,2014-02-17(A3).
[17]尚永亮.E考据与文史研究随想[N].人民政协报,2014-02-17(09).
责任编辑:庄亚华