毛泽东读书生活研究的数字化论析
2012-09-01刘正妙湘潭大学毛泽东思想研究中心湖南湘潭411105
●刘正妙(湘潭大学 毛泽东思想研究中心,湖南 湘潭 411105)
毛泽东的读书生活,是毛泽东生活中重要的一部分,不少研究者就毛泽东的读书生活进行了较为深入的研究。但是,尚有一个重要的不足,那就是数字化研究方法在毛泽东读书生活研究领域中运用相当缺乏。因此,我们在这里重点要探讨的就是要运用数字化的方法研究毛泽东的读书生活,或者说,在信息化和数字化的浪潮下,我们应在毛泽东读书生活研究中大力提倡和应用数字化的研究方法。
1 运用数字化方法研究毛泽东的读书生活
毛泽东读书生活研究的数字化有着两方面的含义。一是指将有高度价值的有关毛泽东读书生活的图像、文本、音频、视频和科学数据等进行收集,“组织规范性的加工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速横向跨库连接的电子存取服务。同时还包括知识产权、存取权限、数据安全管理等”。[1]二是指在研究毛泽东读书生活时要合理的运用诸多数字化的工具和方法。在工具方面,比如有效合理的利用社会科学统计软件包SPS S软件、O FFIC E办公软件等;在方法层面,统计、归纳、分类、图标、解析等“数理化”手段都可以大量采用。数字化的研究工具和方法,要求研究者超越单向探讨路径,在立体空间之维中去多角度多方位的解读毛泽东的读书生活,同时也要突破单纯的文本研究方法和表述方法,要突破静态的或无声的方法。总之,毛泽东读书生活研究的数字化,就是要尽可能把数据处理的各种手段和方法用之于毛泽东读书生活研究之中。
根据我们对毛泽东读书生活研究数字化的定义,运用数字化的方法研究毛泽东的读书生活有着两方面的重要意义:一是有利于保护毛泽东读书生活的有关资料。毛泽东读书过程中的有些照片、书籍和录音,在实际使用中的寿命是有限的。通过对其数字化,使用光盘或磁盘进行储存,通过计算机浏览,可以减少对原始资料使用频率,进而延长其寿命。另外,数字化后的毛泽东读书生活的相关资料,形式多样,不易质变,便于存贮、流通,另外还可以再生,重复利用。二是可以让研究者快速的最大限度的利用数字化资料进行研究。我们研究毛泽东的读书生活,不仅要研究他读书用过的物品、读书的住址、读书的方式等,也要研究他阅读过的大量书籍。这个工程是巨大的。以毛泽东读过的书籍为例,仅已经统计和登记过的就有10万册之多,这还不算革命年代遗失的书籍。如果我们用传统的阅读方法查阅我们研究需要的资料,效果必然是事倍功半,而且一些有重要学术价值的资料和信息可能会被我们忽略和遗漏。更为重要的是,毛泽东阅读过的这些书籍,多为珍藏档案,一般的研究者要获得这些资料是非常困难的。通过将毛泽东读书生活相关资料数字化,并建立快速索引,研究者就可以获得较为全面、准确的一手材料。另外,在数字化的过程中,建立专门的毛泽东读书生活资料信息网,集中毛泽东读书留下的有形的和无形的遗产,方便研究者统一交流和共享,互补有无。这使得研究者们比以往任何时候都更容易和方便地发现和获得大量有价值的、富有启发性的信息资源。
在研究毛泽东读书生活的过程中,用数字化的方法分析毛泽东的读书生活,一是可以使我们的研究更为客观公正。客观公正是学术研究的生命线。要做到客观公正,关键是要用客观事实说话,尽量减少人的主观喜好对研究的影响。运用数字化的方法研究毛泽东的读书生活,更多的运用数据而非个人喜好来进行论证,正好可以将个人主观喜好挤压到有限的空间,使研究的客观公正在一定程度上能够得到保障。二是可以使我们的研究更为精确。目前,大多数研究者对毛泽东读书生活的研究都比较注重定性的分析,喜欢做出大概的、模糊的、宏观的论述,对于数字化方法没有引起足够的重视,或者有意回避。这些都一定程度上影响了研究毛泽东的读书生活的准确性。利用数字化的方法,特别是利用一些办公自动化软件,处理毛泽东读书生活中的有关数据,进而在输出结果上进行分析,可以大大提高我们研究的准确性。三是使我们的研究更具规范性和直观性。在研究毛泽东读书生活中采用统一的、严格的、准确的数字化研究软件和数字化技术,把很多复杂的难以阐述清楚的问题,用一个符号、一个数学模型和一个图表就能表达出来,给人一种更严谨、更直观的认识。
2 建立毛泽东读书生活数字图书馆
建立毛泽东读书生活数字图书馆,也就是要建立毛泽东读书生活信息资源数据库。目前,不少综合性研究数据库,如《超星数字图书馆》《读秀》《中国期刊全文数据库》《万方数据库资源系统数字化期刊》和《维普中文科技期刊数据库》等,都收集了一些毛泽东读书生活的相关信息资料。这些数据库所收集的有关毛泽东读书生活的信息资料,大多数为研究者的论著。这些论著,有些对毛泽东的读书生活进行了专门研究。在“中国知网”,我们以“毛泽东读书”为篇名进行检索,也查询到106篇专门研究毛泽东生活的论文。另外,这些数据库收集的不少论著,虽然没有专门对毛泽东的读书生活进行研究,但有所涉猎,这些综合型数据库收集的信息可谓海量。所有这些,为我们构建毛泽东读书生活数字图书馆打下了较好的基础。
毛泽东生前读书过程中,使用过许多读书工具,如眼镜、放大镜、书箱、文房四宝等,阅读过许多书籍,并在不少书籍上做过大量批注,留下不少读书笔记,在和他人一起研读书籍的过程中发表过不少谈话,留下了许多录音和图片等。一直以来,毛泽东读书生活的这些遗物,为研究毛泽东的读书生活提供了丰富的一手资料。以上综合型数据库,虽然收集了不少有关毛泽东读书生活的信息资料,但对于研究者来说,大多数是二手文献。一手研究资料的难于获得,经常困扰和限制着研究者对毛泽东读书生活的研究。
我们认为,建立毛泽东阅读过的书籍数据库可以包括以下几个分系统:毛泽东阅读过的马克思主义著作数据库、毛泽东阅读过的历史书籍数据库、毛泽东阅读过的军事书籍数据库、毛泽东阅读过的诗词书籍数据库等。我们也可以按照毛泽东读书的时期来建立数据库,如建立早年、中年和晚年阅读过的书籍数据库。
目前,有毛泽东文物保管单位和部门、毛泽东研究单位和部门,开始着手将毛泽东读书生活有关资料数字化。“然而,因为此项工作还处于初始阶段,问题林林总总”。[2]如,因为资金、技术和人才的缺乏,一些单位和部门仅仅将一些简单的信息资料数字化。在其数据库中,研究者仅能浏览几张毛泽东读书时的几张照片。有些单位和部门,将毛泽东读书生活资料转化为数字资料后,不将其上传至所建数据库,仅仅用于单位和部门内部展出。总而言之,一些最具研究价值的信息资料数字化程度远远不够,毛泽东读书生活资料数据库的建设还处于刚起步阶段,我们还任重而道远。
毛泽东读书生活数字图书馆,是“一个网络环境下数字化的信息资源的一种新的服务与技术体系结构,属于以先进的通信技术为基础的信息服务的范畴,是众多分布式的数字化资源,基于广域网环境的计算机信息资源系统的联合体”。[3]建立毛泽东读书生活数字图书馆,需利用网络系统,将各种研究毛泽东读书生活的数据库链接起来,建立网络数据库,即WE B数据库。如果我们不建立网络数据库,一个个有关毛泽东读书生活的数据库,就成为研究者难以到达的孤岛,不利于研究者从茫茫网络资源的海洋中,查询能够满足自己研究需要的、有价值的信息资料。
毛泽东读书生活数字图书馆有着如下特征:(1)信息资源数字化。传统图书馆的基础是纸质书刊文献资料等,而数字图书馆的基础则是数字化的信息资源。这些数字化资源以文本、图像、音频、视频、超链接、多媒体等类型,海量存储于毛泽东读书生活数字图书馆中。(2)信息资源检索智能化。毛泽东读书生活数字图书馆的智能检索,是借以一系列的搜索引擎、交互工具得以实现的。它能够让研究者从各数据库中获得自己所需的最有价值的信息资源。(3)分布式管理。毛泽东读书生活数字图书馆,由多个处在不同地域、使用不同技术平台和检索方式数据库系统构成,它们具有很强的独立性。因此,每个系统都有着自己独特的管理方式和运行方式,只要它们遵行统一的访问协议即可。(4)提供数字化资源的开放性。用户从数字图书馆获得信息资源不受时间、地点、学历、国籍、民族、性别和年龄等的限制,只要能够上网,遵循数字图书馆的服务协议,便能不受限制的从数字图书馆获得自己所需的数字化资源。(5)服务个性化。数字图书馆的服务模式是以用户为中心的。满足用户对数字资源的需求是数字图书馆的主要价值取向。并且,数字图书馆还能根据用户提供和预设的个人信息向其提供服务。
3 运用数字化的方法对毛泽东的读书生活进行解析
3.1 数字化检索方法的优点
数字化检索方法是研究毛泽东读书生活的有力推手,它能给我们研究毛泽东的读书生活提供一个良好的平台。数字化检索是一种现代化的检索手段,与传统的手工检索相比,它有着自己独特的作用和优点,这主要体现在它检索过程中的“快”“全”“广”“准”。不过,许多用户在利用数字化方法检索毛泽东读书生活的相关数据时,他们注意得最多的是检索过程中的“准”。具体来说,一个良好的检索系统应具有以下优点:
(1)基本检索,较为直观,仅为用户提供一个简单的检索输入框,按照检索项的分类检索。一般只需输入一个关键词,对于该检索词相关的信息均显示在搜索结果里面,其中包括众多领域,结果范围大,信息量多,精确度差,适合于检索经验较少者使用。
(2)高级检索,又称为复杂检索。这种检索方法一般适合于用户在目标资源非常明确的情况下使用。它设置的一系列检索条件可以按需组合。如我们在检索项中,可以把关键词、篇名、摘要、作者、刊名、参考文献等通过逻辑关系的“并且”“或者”“结果中包含”对各个检索项进行逻辑组配。例如我们要研究毛泽东在延安时期读过的哲学书籍,便可以在检索项中输入“1935年至1948年”“毛泽东哲学书籍”,选择“并且”的逻辑关系来进行检索。高级检索对检索需求的表达功能更强。因为,通过设定一些列的条件,将检索范围缩小到一定程度,提高了检索的效率和检索结果的精确度。
总之,智能化检索系统,可以有效的组织检索结果,大量减少不必要的信息冗余,去粗取精,又能使各种来源的信息组合成一个有机的整体,使用户更为完整、准确、及时的获得简洁、明了的实用信息。超出了基于关键词和相似度的信息检索的范畴,是数字化研究毛泽东读书生活的必然趋势。
3.2 数字化统计方法
统计研究毛泽东读书生活的相关论著,是我们研究毛泽东读书生活的一项重要工作。我们可以把研究毛泽东读书生活方面的论著录入统一的数据库,然后进行数据分析和统计,包括年代、研究主题、论著部(篇)数、作者等方面进行统计,通过柱状图等多种图表形式来及时了解研究毛泽东读书生活研究领域的动态、热点、难点和发展趋势。例如,我们要研究五六十年代毛泽东读社会主义政治经济学,我们就要统计研究相关问题的期刊论文、硕博论文和书籍。第一步,我们在各数据库收集论著。在“清华期刊数据库”“维普中文科技期刊”和“超星数字图书馆”中,以“毛泽东政治经济学”“毛泽东苏联政治经济学教科书”“毛泽东读书”和“毛泽东社会主义经济学问题”等为关键词、篇名(题名)进行检索,共计获得334篇论文和图书64种。第二步,对收集到的论著进行筛选,除去不符合记录和重复的数据信息。在以上收集到的信息资料中,有些论著是相互重复的,有些是与主题无关的。如检索到论文《杰克·格雷:毛泽东与中国发展的政治经济学》就与毛泽东读社会主义政治经济学无甚关系,《毛泽东评阅红楼梦》也无毛泽东读社会主义政治经济学的内容,因此需筛选掉。通过筛选后,与毛泽东读政治经济学的论著紧密相关的还剩论文28篇,著作8本。第三步,我们以研究主题、作者、年代等对论著进行分类统计,得出如下数据:学界研究毛泽东读社会主义政治经济学,侧重于对其经济学思想和哲学思想两方面内容的研究,有论文20篇,占总论文数的71.4%;主要研究者有胡绳、林克、梁柱、石仲泉、蒋学模、胡为雄、倪大齐和范贤超等;这些论文中,7篇是近两年来发表的,占总论文数的25%,九十年代以前没有人对其进行研究;研究者发表的论文中,25篇载于核心期刊,占总论文数的89.2%;收集到的28篇论文中,没有硕博论文;研究毛泽东读社会主义政治经济学的著作,涉及到毛泽东读社会主义政治经济学的6部,专门对其进行研究的有2部。这些数据,我们可以采用OFFIC E办公软件来生成柱形图、条形图、饼形图或面积图等来直观表达。如,我们可以采用柱形图来统计相关主题分布:
当然,将数字化统计方法应用于毛泽东读书生活留下的批注、笔记和谈话等,我们也可以从统计数据中分析、整理,从而获得研究毛泽东读书生活研究新方法、新资料,发现新问题,新观点。例如,我们将数字化统计方法应用于研究《毛泽东读社会主义政治经济学批注和谈话》,可以发现“阶级”“矛盾”“商品”“公社”“建设”“所有制”“工业”“农业”“规律”“革命”和“农民”等词,是出现频次很高的词,分别为569次、190次、238次,142次、163次、252次、359次、233次、281次、411次和201次。我们可以采用曲线图来进行统计:
从曲线中,我们不难发现毛泽东在读社会主义政治经济学时,最关心的是社会主义经济建设问题,特别是社会主义建设中的工业问题。甚至,我们能够管窥到,毛泽东想利用阶级斗争的方法来促进社会主义经济建设的思想。通过运用数字化图表分析,能够使我们轻松、快捷地归纳和总结信息,找出研究的重点。
数字化研究毛泽东的方法还很多,我们在此不再一一罗列。数字化技术在今天迅猛的发展,但是数字化研究方法在毛泽东读书研究领域的应用还显得极为贫乏,甚至是盲点,创新毛泽东读书生活研究方法,特别是将数字化研究方法引入到毛泽东读书生活研究领域中势在必行。唯有如此,我们才不至于走进研究毛泽东读书生活的死胡同,也唯有如此,我们才能将毛泽东读书生活中最有价值的东西揭示出来,为我们今天的学习政党建设和两个文明建设提供有益借鉴。
[1] 侯俊芳,何雅丽.档案馆数字化的现状和未来展望[J].档案学通讯,2000(4):29-31.
[2] 陈微.对我国图书馆古籍管理数字化的三点认识[J].图书馆论坛,2008,(3):61-64.
[3] 曲建峰,等.基于网格的数字图书馆服务模式探讨[J].现代图书情报技术,2006(2):10-14.