统计分析法与文献计量法在档案学研究中的应用分析
2017-04-21陈忠海董一超
陈忠海+董一超
摘要:档案学研究中的统计分析法与文献计量法既相互联系,又存在差异。本文从方法体系、研究对象、适用范围、实施步骤以及两种研究方法在档案学研究中的实际应用等方面对二者进行比较,发现两者的方法体系既相互交叉,又不尽相同。统计分析法的研究对象、适用范围和应用覆盖面都更为广泛,两者的总体研究流程类似,但在具体实施步骤上却有所区别。此外,在实际应用中,文献计量法可单独使用,而统计分析法就需要与其他研究方法协同应用。
关键词:档案学统计分析法文献计量法
Abstract: Statistical analysis method and biblio? metric method are interrelated and discrepant in ar? chives science research. This paper compares the two methods from five aspects: methods system, re? search subjects, application scope, implementation steps and the practical application of the two meth? ods in archives science research, and then find that there are some intersections and differences be? tween the two methods of the methods system. The research subjects and the application scope of statis? tical analysis method are more widely used than the bibliometric method. The two methods have similar process of research, but they also have some differ? ent parts on the measures of the specific implemen? tation. Besides, the bibliometric method can be used alone in practical applications, and statistical analysis method needs to be coordinated applied with the oth? er research methods.
Keywords: Archival science; Statistical analysis method; Bibliometric method
一、引言
統计分析法指通过对研究对象的规模、速度、范围、程度等数量关系的分析研究,认识和揭示事物间的相互关系、变化规律和发展趋势,借以达到对事物的正确解释和预测的一种研究方法。[1]统计分析法最早起源于社会经济领域,19世纪随着统计学与数学融合的趋势不断发展,欧洲大学开设一门新的学科“统计分析科学”,这门课程的诞生是现代统计科学逐步兴起的标志。此后,统计学家不断地充实和发展统计学理论和方法,尝试开拓新的统计学研究领域。其中,现代统计学代表人物之一的比利时统计学家莱博·阿道夫·奎特莱(Lambert Adol? phe Quetelet)认为统计分析科学是可以用于研究任何一种科学的一般研究方法,他尝试将统计分析科学应用到工程技术科学、自然科学以及社会科学等领域并取得了成功。[2]至此,统计分析方法作为一种能够揭示客观事物的数量特征及其内在发展规律的一般研究方法,被广泛应用于各个学科和实践领域的研究当中。
文献计量法是指利用数学和统计学等方法对任何与文献有关的媒介及其相关特征进行定量研究的一种科学的研究方法。国内外图书情报学学者普遍认为文献计量法的研究始于20世纪初。1917年,文献学家科尔(F.T. Cole)教授和伊尔斯(N.B.Eales)馆长两人合作,对欧洲各国解剖学论文进行定量研究,标志着文献计量法的初步形成。[3]文献计量法以此为起点,经历了从无到有、由少到多的发展过程,得到了国内外各个学科领域学者们的重视。经过数十年的发展,图书情报学界对文献计量法相关理论及其三定律的研究不断深入,文献计量法的方法论体系不断得到补充并日益完善,其应用的范围也从初始的图书情报领域扩展至医学、生物学、社会学、经济学以及科学学等相关领域。
从上述两种方法的起源和定义上来看,在一定条件下,统计分析法与文献计量法在应用目的、研究性质等方面上是类似的。由于划分标准的不同,不少学者经常混淆两者之间的关系,例如有的学者认为统计分析法应归属于文献计量法,有的学者则认为文献计量法是统计分析法的一部分,甚至还有学者将统计分析法等同于文献计量法。我们认为,二者既有联系,又有区别,文献计量法可以作为一种研究方法独立使用,而统计分析法则需要与其他的研究方法配合应用。为了进一步区分两种研究方法,提高研究工作的效率和成果的可靠性,本文将从方法体系、研究对象、适用范围、实施步骤以及两种研究方法在档案学研究中的实际应用状况等方面分析两者的共性和差异,以便为档案学研究者更好地具体运用两种研究方法提供借鉴和参考。
二、两种研究方法在档案学研究中的应用调查与分析
(一)两种研究方法的比较
1.方法体系。统计分析法的基本内容来源于统计学,以统计学和概率论原理为基础,统计分析法的方法体系,若按照研究手段划分,则有聚类分析、回归分析、因子分析、相关分析等;[4]文献计量法的显著特点之一就是利用数学、统计学方法和系统学方法对文献进行定量分析,在统计结果的基础上建立数学模型。文献计量法根据研究手段可划分为文献统计分析法、数学模型分析法、系统分析法、网络分析法、矩阵分析法等。[5]
由此可知,二者的方法体系存在交叉部分,但又不完全相同。首先,当研究对象是文献本身及其外部特征时,统计分析法可以看做是文献计量法的组成部分,这里的统计分析法特指文献统计分析法;其次,当研究对象扩展到各种与数量相关的事物时,有学者认为对文献进行计量分析是统计分析法的组成部分,但这种认识却忽略了数学方法和系统方法在文献计量研究中应用的事实,因而不能简单地将文献计量法归属到统计分析法当中。
2.研究对象。统计分析法和文献计量法都属于定量研究方法。统计分析法并没有特定的研究对象,其研究的并非是个体的“量”,而是现象总体的数量特征与规律性。文献计量法的研究对象主要是各类科技文献,尤其是各类科技文献或文献用户的各种外部特征,如摘要、关键词、书目、引文以及用户信息等。从研究对象的范围来看,两者有共同的研究对象——文献及其外部特征,但与仅以各类文献外部特征为主要研究对象的文献计量法相比,统计分析法的研究范围更为广泛,既包括各类文献的外部特征,也包括文本所展示的隐含或潜在的信息内容,资源类型涵盖多样,可以是文本,也可以是声音、影像或是任意能产生数量关系的社会行为,可以说哪里有数据,哪里就有统计分析。
3.适用范围。统计分析法起源于经济学领域,目前已经形成了一套能够揭示数据内在规律性的方法体系,具有广泛的实用价值,已经成为图书情报学、经济学、政治学、社会学、历史学、医学等众多学科数据收集和研究的基本方法之一。如在历史学研究中,应用统计分析方法不仅可以为研究者提供新的研究思路,而且使历史学研究更为精确。[6]文献计量法作为图书情报学领域独特的研究方法,以布拉德福定律、洛卡特定律以及齐普夫定律等为基础,在图书情报学领域得到了充分的應用,常被用来作为学术评价、核心期刊选定、设计图书情报系统、总结学术热点或推断学科研究趋势等的工具。由于文献计量法的研究对象主要是科学文献,因而该方法对各门学科均适用,文献计量法的应用领域也逐渐扩大到自然科学和其他社会科学领域。
由上述可知,两种研究方法的应用领域都相当广泛,但二者侧重点不同。统计分析法作为一种定量分析工具,具有广泛的适用性,是自然科学和社会科学的一般研究方法。文献计量法虽被应用到许多科学研究领域,但每个经典定律都有其特定的适用范围,如洛卡特定律是由化学、物理两门学科的文献统计推出的,当其应用到其他学科时就必须进行修正。[7]比较而言,文献计量法在图书情报学领域的应用更为广泛和深入,而统计分析法更容易被多个学科领域接受和应用。
4.实施步骤。统计分析法在其形成和发展的过程中,逐渐确立了较为完整的应用实施步骤。笔者通过阅读多篇应用统计分析法的论文,认为其应用过程可以总结为以下几个步骤:选定研究对象和目标,然后根据研究目的选择指标变量,收集、整理统计数据,接着选择适当统计方法对样本数据进行统计计算,建立统计模型并进行检验和修改,最后利用统计模型进一步研究问题,从而得出研究对象的一些规律性的结论。目前,各学科领域学者对应用文献计量法进行研究的实施步骤逐步达成共识,其具体的实施步骤为:确定研究的目的,选择某种文献的外部特征作为分析单元,然后收集样本文献,针对分析单元进行统计分析,最后根据统计结果建立数学模型以揭示研究对象所包含的规律性内容和特征。
通过上述两种研究方法的实施步骤的比较可知,当研究对象是文献及其外部特征时,统计分析法和文献计量法的总体研究流程大致相同,首先都需要确定研究对象和目的,选择分析单元,随后收集一定的样本文献,并对其进行加工处理使之有序化,然后手工或利用统计软件对分析单元进行统计,最后建立模型获得研究对象的规律性结论。二者的区别在于具体的分析步骤上。在实际应用中,文献计量法通常会在统计分析法的分析步骤的基础上,进一步应用数学模型法或系统方法。
(二)两种研究方法的实际应用调查与分析
由上述分析可知,统计分析法和文献计量法在自然科学和社会科学领域均得到了广泛的应用。为了进一步解读两种方法,笔者调查统计分析法和文献计量法在档案学研究领域的具体应用状况,选取典型案例进行解读,进而揭示两种方法在档案学研究实际应用中的共性和差异。
1.统计分析法
(1)统计分析法在档案学研究领域的应用状况
笔者以中国知网的“中国期刊全文数据库”作为数据来源,首先,以SU=(统计分析法+统计+统计分析)*档案学-文献计量为检索式,获得175条记录,通过逐一筛选得到117篇应用统计分析法的档案学研究论文。其应用领域分布及所占比例,详见表1。
表1应用统计分析法的档案学样本论文研究领域分布及占比
由表1可知,统计分析法在档案学领域中的应用总体上呈现增长的趋势,2006-2015年是统计分析法应用迅速发展的阶段。此外,数据显示,统计分析法应用研究的论文数量是纯理论研究论文的近10倍。这表明档案学研究者在对统计分析法理论分析层面有了深入了解的基础上,将其作为一种实用的研究方法更多地应用于档案学领域的专业研究。
(2)应用案例
案例一:此案例选自丁牧羊、王鹤淇发表在《档案学通讯》2015年第6期的《<周礼>文档名词再研究》[8]一文。该文以《周礼》中的文档名词为研究对象,利用统计分析法研究《周礼》中通用与专有名词、单音词与双音词等具体问题。该研究以《周礼》为研究样本,先是采用内容分析法对《周礼》中的文档名词进行仔细区分,划分类别,再利用统计分析法分门别类的整理和编码文档名词,最后结合文档名词的使用展开深入研究,得出结论。
案例二:此案例选自李倢、胡燕发表在《档案学研究》2015年第4期的《影响公众档案利用行为的个体特征因素分析——基于苏州市居民的调查》[9]一文。该文通过调查苏州近600名普通公众的档案利用行为现状,具体分析了个体特征因素对公众档案利用行为的影响。作者以苏州市民的档案利用行为为研究对象,具体采用了问卷调查法和统计分析法。首先,划分调查区域,按照职业发放和回收调查问卷;其次,根据回收问卷的反馈信息,对样本个体的年龄、性别、文化程度、职业状况、档案利用内容、方式、心理、行为等进行量化统计;最后,利用SPSS统计软件进行方差分析,归纳得出结论。
2.文献计量法
(1)文献计量法在档案学研究领域的应用状况
笔者以中国知网的“中国期刊全文数据库”作为数据来源,以SU=(文献计量法+文献计量+文献计量学)*档案学为检索式,共得到100条记录,经过筛选得到75篇应用文献计量法的档案学研究论文。其年度分布及所占比例,详见表2。
由表2可知,1990-2015年档案学领域应用文献计量法研究的论文数量总体上呈现不断上升的趋势,自2010年开始论文数量增长速度加快,在2014-2015年达到高峰。由此可见,档案学由图书情报领域引入文献计量法进行研究的时间较早,但研究的兴起和扩大却是近几年的事情。
对选取的75篇应用文献计量法的论文进行逐篇排查,发现其中有3篇是纯理论研究,有72篇实际应用了文献计量法。本文以72篇实际应用文献计量法的档案学论文为样本,通过查看每一篇论文的题名、摘要、关键词以及全文,得到每篇论文的研究内容和应用的文献计量学具体研究方法,建立二者之间的对应关系,统计每种文献计量学具体研究方法在不同类别研究主题中的应用频次,结果详见表3。
由表3可知,文献计量法应用到档案学研究领域时,可大致分为4种具体方法和9种研究主题,其中文献统计分析法的应用领域最为广泛,涵盖了8种研究主题。而学术整体进展和学科某主题研究进展所应用的研究方法最为全面,均应用了4种文献计量法具体研究方法。表3的数据反映出档案学研究者对文献计量法的应用尚处于起步阶段,研究内容较为单一,更多的是应用文献计量法对档案学或档案学某个研究主题的研究历程进行概括和归纳。此外,对研究主题的分析也不够深入,作者大多采用的是文献计量法方法体系中较为简单的四种研究方法,缺乏数学模型的构建。
(2)应用案例
案例三:选取中国科学院文献情报中心硕士研究生毛天宇发表在《档案与建设》2015第9期的《我国科技档案研究的发展现状与研究特征——基于国内档案学核心期刊的文献计量分析》[10]一文。该文为考察国内科技档案研究而对档案学核心期刊中科技档案主题研究的1553篇论文进行了文献计量分析。作者以年度、发文期刊、著者、机构、关键词作为文献计量的指标,数据来源基于中国期刊全文数据库,检索时间不加限定;具体的分析方法是利用SATI、Excel和NoteExpress软件对数据进行处理和统计,运用普莱斯定律判定核心作者群,并采用词频分析法探讨论文的研究特征和趋势;该研究从样本论文的年度分布、期刊分布、核心作者群、研究特征等方面进行了计量分析。
通过以上对两种研究方法在档案学领域实际应用状况和应用案例的描述,我们可以得出以下几点结论:1.在实际应用中,文献计量法可以作为一种研究方法独立使用,而统计分析法则需要与其他的研究方法配合应用;2.相较于文献计量法,统计分析法在档案学领域的应用更为广泛,其研究对象可以是档案文献,也可以是机构、人员或档案利用行为;3.两者应用软件有所差别,统计分析法常用软件有Excel和SPSS,而文献计量法常用的软件有SPSS、SATI、UCINET和Pajek、CiteSpace、Netdraw以及VOSviewer等。
三、小结
从以上分析结果来看,统计分析法和文献计量法作为各具特色的研究方法,两者之间既有联系,又在方法体系、研究对象、适用范围、实施步骤和实际应用等方面存在一定的差异之处。它们之间的关系具体体现在以下几个方面:1.两者研究目的相似。两种方法都是通过对研究对象的各类特征进行组合和统计,从而揭示其变化发展的规律;2.两者的方法体系相互交叉,却不尽相同;3.两者有共同的研究对象——文献及文献外部特征,但统计分析法的研究对象的范围更为广泛;4.两者应用领域都相当广泛,但统计分析法的应用覆盖面更广;5.两者的总体研究流程类似,但具体实施步骤上有所区别;6.在实际应用中,相较于文献计量法可单独应用的特点,统计分析法更像一种定量分析工具,需要与其他研究方法协同应用。
注释及参考文献:
[1]百度百科.统计分析法[EB/OL].[2015-03-02]. http://baike.baidu.com/view/1397463.htm.
[2]肖彦花.统计学理论与方法[M].长沙:国防科技大学出版社,2005:4-5.
[3]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:2.
[4]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2012:5.
[5]邱均平.文献计量学[M].北京:科学技术文献出版社,1988:20.
[6]袁山.统计分析工具在历史研究中的应用[J].中国青年政治学院学报,2002(4):88-93.
[7]邱均平,王曰芬等.文献计量内容分析法[M].北京:国家图书馆出版社,2008:157-158.
[8]丁牧羊,王鶴淇.《周礼》文档名词再研究[J].档案学通讯,2015(6):32-39.
[9]李倢,胡燕.影响公众档案利用行为的个体特征因素分析——基于苏州市居民的调查[J].档案学研究,2015(4):94-100.
[10]毛天宇.我国科技档案研究的发展现状与研究特征——基于国内档案学核心期刊的文献计量分析[J].档案与建设,2015(9):8-12.
作者单位:郑州大学信息管理学院