大数据背景下古代文学研究的新策略
——以“小李杜”诗词研究为例
2016-03-18张启慧
王 舒 张启慧
大数据背景下古代文学研究的新策略
——以“小李杜”诗词研究为例
王 舒 张启慧
(东北师范大学人文学院,吉林 长春 ,130117)
[摘要]大数据作为一种新概念、新技术已然运用到社会生活的各个领域。古代文学研究一直以来因为时间的延展、资源的庞大而面临深入研究、创新性研究的困难。本文试图将大数据与古代文学研究相结合,探索出一条新世纪古代文学研究的新道路。
[关键词]大数据;小李杜;全数据模式;相关关系
大数据的应用为社会带来了根本性改变,它可以在多个领域上进行更快更大规模的数据处理,以此来得到我们想要的信息和结果。我国历史悠久,有着深厚的文化底蕴。中国古代文学历史发展脉络久远,积淀了大量的文学作品、资料等多种文学信息。由于时间跨度长,历史深厚,在研究上也有着一些阻碍,很多问题难以获得解决突破。大数据作为一种新观念和新方法,我们应该积极将其利用到古代文学的研究中,寻找古代文学研究的新视角和新方向。
1 大数据与古代文学研究的内在关联性
大数据作为新的概念应用于社会,我们应该对其有基本的认知。“2008年9月《自然》杂志刊发《Big Data: Science in the Petahyte Era》一文,将大数据作为一种全新的理念正式推出,使其超越于数据在“量”上的单方面描述,指向了在海量数据的基础上所衍生出来的对待数据的全新的态度、理念与处理方法。”[1]也就是说,大数据从表面上理解,即指大量的数据,但它并不只是指庞大的数量,还包括对数据的利用,以及对其分析的方法和技术等等。大数据所带来的改变会涉及到每个大领域上,更重要的是还会体现在每一个独立的个体信息上,这些独立的个体信息会让我们获得与之前大为不同的认知和体验。可以说,大数据时代的来临带来了社会的大变革,也为我们带来了认识世界的新的观念和探索方法。
我国是一个文明古国,有着上千年的悠久历史,文化也在这个过程中慢慢累积,形成了一个巨大的文学宝库。古代文学发展的时间跨度大,资料多样,不仅包括文学作品,还包括很多相关的艺术审美,历史背景,社会现实等等多个方面。“古代文学研究中需要综合考察社会经济文化背景、作家、作品、文学创作、接受、批评等多方面因素,这些因素在具体研究过程中,都可以称之为变量。”[2]大数据就是这些所有量的集合,并且这些数据也会随着古代文学的研究发展而进行实时更新,为我们提供最新和最客观的数据资料。我们不必再费时费力地对各种繁杂的信息进行搜集整理,大数据会为我们做好这项工作。这样不仅会提升我们文学研究工作的效率,还便于我们对古代文学基本的文学信息和研究情况有一个全方面的了解。
古代文学的文学艺术价值就好比是等待人们开发的巨型宝藏,大数据就是挖掘的工具,大数据会为古代文学的研究提供新的方法和视角。就目前来说,很多对于古代文学的研究都是从宏观角度去进行研究论述,而从细微方面的论述研究又过于分散独立,没有一个很好而又完整的体系。很多研究都是基于固有的研究理论或成果来进行“为什么”式的追问论述,无法摆脱固有思想的阻碍进行角度创新。笔者认为对于古代文学的研究可以从作家的个人角度切入,进行深度的研究和解析,形成一个完整的脉络体系。高中甫说:“一部作家的接受史,它一方面能更全面更深刻地去认识作家,同时也反映了不同时代的审美情趣,鉴赏能力,期待视野,社会思潮以及某些意识形态上的发展和变化。”[3]从作家本体出发,对其作品和所处时代等多个方面进行研究,可以对当时文学的审美倾向和文人们的艺术水平,以及社会的价值取向等多个问题有一个进一步的整体感知。我们在立足作家个体的基础上进行详细的个体剖析,用多数据型的立体思维来思考问题,解析当时的大环境。数据的客观庞大会为古代文学的研究带来充足的论据和可信度。
2 全数据分析模式在古代文学研究中的应用
大数据时代是一个一切都可以量化的时代,关于古代文学方面的文献材料等多方面资源都可以被数据化,成为庞大数据库中的部分存在。全数据分析模式是基于所有样本数据而言,与传统的随机分析法相对。全数据分析模式抛弃了随机性的样本研究,而是贯彻样本即是总体的整体观念,强调充分利用每一个数据,并将每个数据集结成一个整体,重在对整体的分析研究。全数据分析模式不仅重视对事情的整体感知,有一个宏观的掌控,更强调基于全数据实现信息的细节化,提高认知的精确度。可以说,“全数据模式是一种理想的研究方法,它既可以保证资料占有的全面性,又可以避免资料的片面性带来的误区。”[4]
全数据分析模式的优势在于它能在所有数据的基础上,为研究者提供研究依据和考量,并且能够毫无遗漏地反映该研究问题的方方面面。傅漩琼先生在《唐诗有了排行榜之后……》一文中说到:“依据数据为基础的研究,其研究结果是否科学可信,在很大程度上取决于数据采样的全面与否和具体分析过程的科学与否。”[5]全数据分析模式重在一个“全”字。比如关于“小李杜”的信息,数据化的相关信息资源都会被大数据搜集成一个数据总集供我们分析研究。这就解决了数据采样全面的问题。而具体分析过程的科学与否则在于我们能否对信息进行有效利用。利用全数据分析模式,我们可以对小李杜进行全面性的对比研究。二人并称为“小李杜”必有其中的原因。李商隐和杜牧作为晚唐的杰出诗人,都有着很高的文学成就和文坛地位,在文学创作上也是不分伯仲,但两人的文学理念却存在个体认知上的差异性。这些问题都具有很高的研究价值。通过数据整合,我们可以从宏观的角度出发对李商隐和杜牧两个人的文学创作有一个整体的认知,比较二者的异同优劣。在所有资料的基础上实现研究的精确性,并将之前笼统的大概念加之细节化。
对于小李杜的争论颇多,对于二人的并称说法有着很多不同的见解和认识。基于这种理论的差异性,我们可以利用全数据分析模式对这些研究进行统计分析。数据会反映每个观点的比例,从比例中看出各个观点达到什么样的认知程度。我们也会在数据分析中发现各个观点之间具体的不同点和矛盾所在。大数据讲究的是事实,而不是个人的主观意愿。因此,我们在全数据分析模式下可以看出当下对于古代文学研究的普遍性认知,在这种认知下,我们可以实现怎样的观点创新。我们可以基于全部资料的基础上,对“小李杜”进行全方位的研究,无论是诗歌领域还是骈文领域都要给予关注,还可以从宏观视角上对两个人进行深度的个体剖析。将两个人分开研究分析后,我们会得到完整而又立体的李商隐和杜牧的形象,再对得到的信息进行整合,抛开传统意义上的研究成果,以全新的立体视角来进行两人的对比分析。这种全视角的立体思维会让我们看到平时无法注意到,甚至是没办法去想到的信息。我们可以利用这种全新的思维模式找到古代文学研究的新的切入点,在全数据的基础上实现认知上的全面提升。
李商隐和杜牧两个人的文学创作的发展动因复杂,我们应该综合多种因素进行分析。我们可以利用全数据分析模式在我们的研究中构建一个立体的“小李杜”时代。我们可以将两个人的成长环境、个人经历、个性品行及其艺术追求等等多方面的信息进行整合,模拟构建出一个他们生活的时代。李商隐和杜牧虽然都处于晚唐时期,处在差不多相同的社会大环境下,但是由于自身的个体经历不同,导致他们的文学创作存在着差异性。在存在差异性的同时,二人又同受杜甫的影响,但两个人对杜甫的吸收和继承却不尽相同。我们通过对这些数据进行立体式的整体分析可以清楚地掌握他们的发展脉络,并能够清晰地了解每个方面对他们的影响程度。我们可以基于大数据对两个人的发展变化和创作走向有一个整体把握,然后将对“小李杜”的研究朝向更细节化的方面发展。
3 数据的相关关系分析法在古代文学研究中的应用
数据的相关关系分析法是基于对相关联的数据的应用,对问题进行分析研究的方法。数据的相关关系追求现象结果的认知,重在预测事情的发展。数据的相关关系强调事情“是什么”,而不是“为什么”,与我们现在追求因果关系的观念正好相反,可谓是反其道而行之。笔者认为正是因为数据的相关关系分析法有这样的思维转变,才会为我们的古代文学的研究带来新的研究角度,开拓新的视野。这种逆向思维可以让我们不再局限于原有的文献资料和已成形的研究结果之中,而是会为古代文学的研究开拓新的天地,征服更广阔的领域。大数据不追求因果而是让数据发声,这种客观认知会让我们避免在研究上产生偏差。笔者可以通过搜集与研究相关联的各种数据,在联系中分析问题,预测结果。我们对大数据相关性利用重在预测,同样,建立在此基础之上的预测也是大数据的核心。
从相关关系中,我们可以更好地看到文化继承与接受的发展情况,并对此有更深刻的认知。李商隐和杜牧都对杜甫的文学创作理念都有所继承和发展,但对于杜甫的继承两个人又有不同的选择。两个人在同受杜甫的影响下,李商隐又融合了李贺的创作艺术形成了自己独特的诗风,想象丰富,注重艺术审美;而杜牧则又受到韩愈等人的影响形成自己雄壮沉郁的诗风,关注现实,注重文学的思想性。两个人在这种继承和自我吸收融合中形成了自己独特的创作风格,发展了诗文创作,并且也影响了后代诗人的文学创作和发展。由于信息的独立分散,在对于“小李杜”的研究上很难全面兼顾到这些纷繁复杂的关联,而且也很难形成一个完整的体系。这时可以利用“大数据对于数据化的研究成果的搜集、整理具有的绝对优势,深入文本将所有与之相关的资料抽调出来。”[4]193我们可以先对这些抽调出来的相关资料进行分析。然后在理解资料的基础上,我们利用数据的相关关系分析法将数据进行串联,整合成一个合理完整的体系。
古代文学研究的一大阻碍就是由于历史过于久远,很多事情无法找到原始记录,只能靠我们的猜测和推敲。因为诸多问题长时间无法解决就导致很多相关的文学研究无法进行下去,很大程度上影响了古代文学的研究进程。这种因为时间的跨度太大和历史信息记载的残缺造成很多文学信息难以追溯的问题,我们可以利用数据的相关关系分析法来解决,在合理的分析研究中进行有效的推理和估测。我们可以通过对相关数据的搜集整合,形成一个庞大的数据网络。在这种关系的延伸中我们可以获得更多的可利用信息,而且在这种信息辐射中,我们常常会发掘到平时无法寻找到的关联信息。这样的数据网络会将数据间所有的联系客观具体地显现出来,我们可以通过这些信息去研究探索它们的内在关联,找出事情的关键要点。这不仅有利于我们对事情的整体构建有一个深刻的认知,还有利于我们的思维延伸。数据是我们研究的依据,数据的相关关系不仅会告诉我们古代文学之前的发展轨迹,还会告诉我们古代文学未来的研究走向。
4 结 语
大数据时代就是一个变革时代。哈佛大学社会学教授加里·金说:“大数据这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”[6]在文学量化的进程上,古代文学研究的形式与方法有必要与时俱进,不仅要更新我们的文学研究理念,还要积极引进和发展新技术来推动古代文学的研究进程。古代文学因为其独特深厚的文学艺术价值成为文学界里璀璨的瑰宝,我们应该重视对它的研究,挖掘古代文学的潜在价值,开拓广阔前景。
参考文献:
[1]宋学清,刘雨.大数据:信息技术与信息管理的一次变革[J].情报科学,2014(9):15.
[2]张三夕,张世敏.古代文学研究中计量分析的应用与限度——由唐诗宋词排行榜引起的思考[J].社会科学,2013(2):176.
[3]高中甫.《歌德接受史》“引言”,转引自陈文忠《中国古典诗歌接受史研究》前言[M].合肥:安徽大学出版社,1998:7.
[4]丁莉,宋学清.大数据对新世纪文学批评的影响[J].作家,2015(2):192.
[5]傅漩琼.唐诗有了排行榜之后……[N].光明日报,2012-02-05(5).
[6]“大数据”出现的背景及定义[EB/OL]. http://www.edu.cn/bigdate_12674/20140729/ t20140729_1157277.shtml,2014-07-29.
New Approach to Ancient Literature in the Context of Big Data—— Taking "Little Li Du" as an Example
Wang Shu Zhang Qi-hui
(School of Humanities, Northeast Normal University, Changchun, Jilin 130117)
Abstract:As a new concept and new technology, big data has been used in many fields of our social life. It is very difficult to study the ancient literature deeply and creatively because the history has been very long and the sources are in rich. This paper tries to combine big data with the study of ancient literature, and figure out a new way to study the ancient literature in the new century.
Keywords:big data; “little Li Du”; full-data schema; interrelation
中图分类号:G642
文献标识码:A
文章编号:1674-3083(2016)02-0069-04
收稿日期:2016-01-15
作者简介:王舒(1978-),女,辽宁锦州人,东北师范大学人文学院讲师,古代文学博士,研究方向:唐宋诗词。张启慧(1995-),女,辽宁凤城人,东北师范大学人文学院本科生,研究方向:古代文学。