基于文献计量分析的学术出版领域学位论文研究
2020-01-15王维嘉张志强
王维嘉 张志强
学位论文发表状况被认为是衡量一个学科发展水平和科技产出的重要指标。[1]全面梳理以学术出版为主题的学位论文,对于掌握该领域的研究动态十分必要;通过文献计量手段对学术出版领域学位论文进行定量分析,有助于把握该领域研究的发展趋势。在出版学的若干分支中,对学术出版进行系统化、专门性研究相对较少,本研究通过文献计量方法对学术出版领域学位论文进行定量和定性分析,以期发现该领域的研究动态、发展趋势,以及尚存的研究空间。
一、研究背景与设计
考虑到不同数据库的特点,尤其是收录来源(国家和地区、语种等)不一,为确保检索结果尽可能全面,本研究将定量分析分为两个部分,均以学术出版领域博士/硕士学位论文为目标进行检索。
一是通过ProQuest 公司的学位论文平台,调查全球范围内学术出版领域各语种博士/硕士学位论文情况。ProQuest 公司有两个专门收录学位论文的数据库产品,分别为PQDD(ProQuest Digital Dissertations) 和 PQDT(ProQuest Dissertations & Theses)。从深入把握一个学科进展情况的角度考虑,PQDD收录的精选博士/硕士学位论文全文显然更具学术价值,但是由于对学术出版领域的专门研究偏少,在PQDD 中进行初步检索检得的论文不足50 篇,缺乏定量分析的数据支撑,加之文献计量研究不需要对每篇论文全文进行处理,故收录有200 多万篇博士/硕士论文摘要和索引的PQDT 更能保证研究的宏观视野。因此,本研究基于PQDT 展开。
二是通过CNKI 中国知网的学位论文平台,调查国内学术出版领域研究情况,同时对标国际,找准国内当前研究所处的阶段和可能的研究方向。考虑到国内电子文献资源的另外两大数据库——维普以海量的中文期刊数据资源为主,万方虽然收录了20 世纪80年代以来我国博士/硕士学位论文全文,但主要面向自然科学——均不适合作为学术出版领域学位论文的检索平台,故本研究选取CNKI 中国知网的中国博士学位论文全文数据库(CDFD)和中国优秀硕士学位论文全文数据库(CMFD)进行检索。
二、基于PQDT 的定量分析
经过调试,本研究选定PQDT 数据库的人文与社科分册(The Humanities and Social Sciences Collection)和科学与工程分册(The Sciences and Engineering Collection), 检 索题名字段同时包含“学术”以及“出版”“出版物”“出版机构”“图书”“专著”“期刊”“连续出版物”和“同行评审”(检索式:TI[academic OR scholar*]AND TI[publish*OR publication* OR press OR book* OR monograph* OR journal* OR periodical* OR peer review])的论文,检得245 篇;经过人工筛选、排除重复后实际检得241 篇论文。其中,博士学位论文176 篇、硕士学位论文65 篇,博士学位论文超过了2/3,说明学术出版领域的研究在理论深度和系统性方面已有一定进展。
1.论文的年代分布
241 篇论文的年代分布情况见表1。其中,最早收录的一篇是1944 年从芝加哥大学获得的图书馆学博士学位论文。实际上,20 世纪40 年代收录的三篇论文都来自芝加哥大学,这与芝加哥大学在图书馆学领域研究的领先地位相符合。除20 世纪70 年代到80 年代有过微小的减量外,学术出版领域学位论文数量一直在稳步增长,2000—2009 年的论文数量是 1980—1989 年的 3 倍。
表1 论文年代分布统计
由于2010—2019 年时间段的统计数据尚未满十年,且论文收录存在滞后情况,导致数据出现下降,但按趋势预计,2010—2019年的数据会超过2000—2009 年。同时也应注意到,论文增长的实际幅度可能并没有表1中数据显示得这么明显,因为PQDT 收录学位论文的机构数量在不断增加,新增机构早年收录的论文可能不全。但总体上,还是可以判断出自20 世纪80 年代以来,学术出版领域论文增幅明显,说明随着出版学学术研究水平的提升,学术出版的研究热度也在增加,未来还将有较为广阔的研究前景。
2.论文的国家分布
表2 是根据授予学位的国家进行统计的论文量。学术出版领域大部分博士/硕士学位论文来自美国,比重超过2/3,其他国家占比相对较小。特别值得注意的是,来自中国的博士/硕士学位论文以34 篇、占比14.11%名列第二,超过了现代学术和出版学研究起步较早且有着重要地位的英国,说明我国在学术出版领域已经取得一定成果。
表2 论文国家分布统计
某一国家、地区学术出版领域的学位论文数量,首先体现了该国家、地区的学术出版研究水平,其次体现研究参与的热门程度。对于学术出版这样一个以出版活动为研究对象的应用型社会科学领域,学术出版学位论文情况是学术出版活动发展程度的表征。收录了1000 多所高校博士/硕士学位论文的PQDT 检索结果虽不能覆盖全球,但足以代表不同国家、地区的研究情况。排名前3 位的美国、中国、英国,分别是学术出版学位论文最早出现、目前博士/硕士研究生人数最多、现代出版业起步最早的三个国家。本研究得出的数据与其学术出版发展水平和研究参与度是相符的。然而,学术出版领域学位论文只集中于7 个国家,学术图书出版发展程度较高的法国、德国未有贡献,需引起关注。一方面,这与法国、德国注重思辨式研究而应用研究相对较少有关;另一方面,对照PQDT 收录高校列表可以发现,法国、德国高校偏少。学术研究底蕴深厚、人文社科发展领先的法国、德国高校因为与PQDT合作少而未能将成果予以展示,给我们以重要启示:在坚定走中国特色哲学社会科学研究道路的同时,也要主动对接国际化平台,才能占据学术全球化进程中的优势位置。
3.论文的语种分布
表3 为按语种统计的论文量。统计结果与表2 基本一致,英语语系国家是学术出版领域研究主力,但是非英语语系国家(主要是中国)的研究力量也在不断增强。对比表2 和表3 还可以发现,收录的中国博士/硕士学位论文有34 篇,用中文写作的论文为33 篇,说明在中国大学中也出现了全英文写作的学位论文,这是高等教育和学术研究国际化一个非常重要的指标。但是,这篇题为A Discourse-Analysis Approach to Translating Academic Abstracts in Journals的学位论文[2],于2006 年在广东外国语大学申请了文学硕士,虽然主题是关于学术期刊的,切入点却是摘要翻译,不能代表学术出版研究的主流方向。
表3 论文语种分布统计
4.论文的机构分布
241 篇检得论文分布在142 所机构(均为大学),这个分布面是相当广的,论文的机构集中度不高,平均每所1.73 篇。表4 统计了总量排名前8 位的机构论文数量,这8家机构的论文量占总量的21.14%,即排名前1/20 的机构贡献了总量1/5 的论文,这一数值说明学术出版领域未形成机构垄断。排名前8 位的机构中,除了我国武汉大学以7 篇并列第二外,其余均为美国高校,一方面体现了美国学术出版的研究力量和综合实力较强,另一方面也体现了武汉大学在我国学术出版领域的领先地位。
表4 论文数量前8 位的机构(大学)
5.论文的主题词分布
表5 为按主题词统计的学位论文情况。表中的主题词计数指在241 篇学位论文中每个主题词出现的次数,但因旨在分析主题词出现的频次,而每篇论文可能有不止一个主题词,每个主题词在每篇论文中至多出现一次,所以占比的计算并未以主题词出现次数除以总频次,而是除以论文总数得出。
表5 出现频次前6 位主题词统计
主题词分析是能够间接揭示研究对象内部特征的一种文献计量研究方法。由于PQDT 数据库导出的信息中单篇论文的主题词并不一定唯一(241 篇论文导出记录中共提炼出主题词100 个,总频次439 次),所以未对所有主题词进行研究,而是选取出现频次排名前6 位的主题词。出现频次最高的主题词是“图书馆学”,与出现频次并列第五的“信息系统”一同代表了图书情报档案学的研究,加起来占比达到31.53%;排名第二的“高等教育”和并列第五的“学校管理”代表了教育学研究,合计占比24.06%;排名第三的“大众传播”和第四的“新闻学”代表了新闻传播学研究,共占比14.11%。可见图书情报档案学、教育学和新闻传播学是学术出版领域三大热门学科,加起来覆盖了近70%的博士/硕士学位论文,其他相关学科则主要集中于文学和语言学两大学科。
三、基于CNKI 的定量分析
经过初步检索,发现如以主题字段进行检索,检得结果将有大量实际研究对象为学术史的干扰文献,故检索题名字段包含“学术”以及“出版”“图书”“专著”“著作”“译著”“丛书”“集刊”“辑刊”“期刊”“综述”或“书评”[检索式:TI =学术 AND(TI =出版 OR TI =图书 OR TI =专著 OR TI =著作 OR TI =译著 OR TI =丛书 OR TI =集刊 OR TI = 辑刊OR TI =期刊 OR TI=综述 OR TI =书评)]的论文,检得276 篇。单看目标文献的数量,基于CNKI 的检索结果(276 篇)超过了基于PQDT 的检索结果(241 篇)。但是,比较一下两个平台的收录论文数量,中国博士学位论文全文数据库收文量约30 万篇,中国优秀硕士学位论文全文数据库收文量约300万篇,比PQDT 的200 万余篇收文量大得多,如果对目标文献的占比量进行计算,两者占比大约分别是十万分之八和万分之一,即我国在学术出版领域学位论文占有率偏低,存在进一步提升的空间。
1.论文的年代分布
表6 是知网收录的学位论文中学术出版领域论文的年度统计(2018 年数据不完全,故未列出)。尽管现行学位制度自1981 年起实施,但知网收录的学位论文从1984 年开始且早期论文收录不全。首篇学术出版领域学位论文收于2000 年,说明我国学术出版领域的研究起步偏晚(比芝加哥大学的首篇学位论文晚了56 年)。但是,我国学术出版领域学位论文增量明显,在不到20 年的时间,2017 年的论文量已达 31 篇,2000—2009 年合计77 篇,2010—2017 年已有182 篇,远远超出同期国际学术出版领域的学位论文数量,并有进一步增长的势头。
表6 论文年代分布统计
2.论文的机构分布
基于CNKI 的检索结果在来源国家(中国)和语种(汉语)上非常一致,因而定量分析直接进入机构研究,详见表7。276 篇检得论文来源包括36 个机构(同样均为大学),相比较PQDT 的来源机构,分布面是比较狭窄的,说明授予学位的机构集中度较高,平均每所机构贡献了7.7 篇论文,是PQDT 平均水平的4.5 倍。由此可看出,我国研究生教育和学术出版领域的专门研究起步较晚,发展程度还不高,能够并且愿意从事相关教学研究的高校并不多,一流高校尤其是C9 高校的重视程度有限,如浙江大学虽然排名并列第六,但其体量极大,对比该校每年授予的博士/硕士学位数量,学术出版主题的学位论文占有率其实并不高。
表7 论文数量前10 位的我国机构(大学)
3.论文的层次分布
在研究层次方面,相比较PQDT 所收录的博士、硕士学位论文比例接近3:1 的分布情况,我国学术出版领域博士、硕士学位授予比例之低是触目惊心的。尽管这与我国一段时间以来的博士、硕士授权学科专业点管理制度有密切关联,在试点自主动态调整后可能会有所改善,但在数据面前必须承认我国学术出版领域的学位论文研究层次明显偏低,获得博士学位的研究者仅占6%(博士学位论文17 篇,硕士学位论文259 篇),说明我国学术出版领域的学术水平还较低,理论深度和原创价值不足,甚至可能尚未形成完整的研究体系,这些都亟待进一步完善。
4.论文的学科分布
在学科分布方面,我国学术出版领域学位论文分布多达20 个学科,绝大多数集中于语言学、新闻传播学、图书情报档案学3 个学科,详见表8。由此可见,我国学术出版领域学位论文来源学科之广与学科分布集中程度之高形成鲜明对比。授予学位数量排在前三位的语言学、新闻传播学和图书情报档案学论文数量之和约占全部检得论文的4/5,其他学科所占比重极小。与PQDT 检得论文结果相比,图书情报档案学和新闻传播学均为主要来源学科。
表8 我国学术出版领域学位论文所属学科前3 位
从内容看,语言学的104 篇论文多为学术出版物翻译实践报告或译介研究,偏离了学术出版这一概念的内涵,不能代表学术出版领域的研究成果,因而图书情报档案学与新闻传播学才是真正支撑起学术出版领域的来源学科。总体上,图书情报档案学科的研究明显集中于学术期刊尤其是学术期刊引用、评价研究,新闻传播学科的研究则对不同学术出版形式都有所涉猎,较多围绕出版模式与出版产业。
5.论文的主题词分布
鉴于上文已经论证了能够代表学术出版领域研究成果的学位论文主要来自图书情报档案学和新闻传播学两大学科,此处将明显属于语言学术语的关键词和“学术出版”这一总体概念用词予以过滤,统计出能够代表学术出版领域研究热点的前10 位关键词,见表9。
“学术期刊”“科技期刊”“学术期刊论文”“影响因子”等直接与期刊相关的论文多达110 篇,加上其他关键词中与期刊研究相重叠的,不难发现期刊研究占比接近一半成为绝对热点。“出版发行”以43 篇的数量排在第二位,以发行学见长、在检得论文来源机构中排名靠前的武汉大学功不可没。“开放存取”作为一种新兴出版方式,也可视作“出版模式”之一,故关于“出版模式”的研究以34 篇的数量跻身前三。
通过热点关键词,可以看到关于学术书评、学术论文、学术图书等方面的研究,也积累了一定成果。但是,考虑到不同形式出版物的常见程度和生产数量,关于学术图书的研究稍显欠缺。虽然已有多篇学位论文进行研究,但是相较学术期刊、学术书评、学术论文等随着我国现代学科建立和学术研究恢复方才发展起来的出版物形式,学术图书的成果数量和影响力都是远远胜出的,在学术发展史乃至人类社会进程中都有着不可忽视的作用,然而以学术图书为关键词的学位论文数量却不如其他,说明在学术图书这一主题研究上还可以挖掘出新的增长点。
四、归纳与研判
经过对学术出版领域博士/硕士学位论文分别进行基于PQDT 和CNKI 的定量研究,以及对来自不同学科、不同层次学位论文抽样浏览的定性研究,本文梳理归纳了学术出版领域学位论文的研究现状与特点。
1.研究起步较早,近年来增长明显
从世界范围看,第一篇学术出版领域学位论文出现于1944 年,此后40 年基本保持增长但总体增幅不大,从20 世纪90 年代开始论文数量增长明显且有继续增长的趋势。这与出版学本身的发展趋势是一致的,同时,也是因为随着知识经济的兴起,对学术研究的重视程度增加,而学术出版作为学术研究的成果体现方式之一,在学术领域和出版行业中的地位都在提高。就我国而言,近年来增长明显的特点表现得尤为突出。虽然我国学术出版领域研究起步晚,根据CNKI 检索结果,至2000 年才出现首篇学位论文,但是2017 年一年的论文量就有31 篇,累计总量达到276 篇;PQDT 中收录的最早一篇由中国授予学位的学术出版领域论文出现于2001年,17 年论文收录量达到34 篇,居世界第二,充分体现了中国近年来在学术出版领域研究发展迅速。
表9 我国学术出版领域学位论文热点关键词统计
2.学科分布较集中,交叉程度国际国内呈现差异特征
从PQDT 检索结果看,图书情报档案学、教育学和新闻传播学三大热门学科的论文总数占到近70%,其中相当一部分有多个主题词标记,这种学科交叉既出现在热门学科内部,如图书馆学与大众传播、信息科学与教育学的交叉,也有热门学科与相对冷门学科之间的交叉,如大众传播与文学、图书馆学与文学的交叉,还有相对冷门学科间的相互交叉,如社会学与历史学、心理学与语言学的交叉,说明学术出版作为一个新兴的出版门类还有很多细分研究方向可以挖掘,且通过交叉研究可以得到更进一步发展。从CNKI检索结果看,我国语言学研究最热门,但多为某一学术出版物的翻译实践报告或译介研究,并非出版学研究,不能体现学术出版领域的研究状态;图书情报档案学、新闻传播学同属热门学科,但交叉程度明显偏低,基本都在学科内部进行研究。
3.来源机构均为高校,优势学科高校表现一般
PQDT 中241 篇检得论文分布在142 个世界各国机构,CNKI 中276 篇检得论文分布在我国36 个机构,均为大学。从机构分布数据看,学术出版领域学位论文在世界范围内的分布广泛性远超国内,相比之下,我国学术出版领域学位论文来源机构集中度要高很多。但是,如果考虑到图书情报档案学和新闻传播学在我国的授权学科点数量与分布情况,以2017 年底公布的全国第四轮学科评估的统计口径为参考依据,图书情报档案学一级学科有博士授权学科点的高校为11 所,新闻传播一级学科有博士授权学科点的高校为17 所,说明这两个学科都比较“小众”,即便算上有硕士授权学科点的高校也不会太多,尤其是图书情报档案学一级学科,即使加上部分有硕士授权学科点的高校,第四轮学科评估的参评高校也只有39 所。而我国学术出版领域学位论文来源机构达到36 家,覆盖了大部分有相关专业的高校。
不容乐观的是我国学术出版领域学位论文中优势学科的论文贡献量。同样选取全国第四轮学科评估结果作为参照,图书情报档案学学科评估结果为A+的有武汉大学和南京大学,这两所高校的论文数量分别为8 篇和7 篇,占比之和约5%,评估为A-的高校中国人民大学的论文量为0,说明优势学科的产出比例很低。新闻传播学科评估结果为A+的有中国人民大学和中国传媒大学,两所高校均无关于学术出版研究的学位论文,在评估结果为A 的高校中,复旦大学的论文贡献量也为0。虽然不排除非优势学科高校也能产出优秀学位论文的可能性,但从优势学科高校论文贡献量看,我国学术出版领域的论文质量总体上不是特别乐观。
4.研究方法多样,定性研究与定量研究共存
研究方法多样既体现在不同学科的研究方法丰富了学术出版领域学位论文的研究方法,也体现在单篇论文运用了多种研究方法。通过对PQDT 中的200 余篇论文摘要,以及CNKI 中的100 余篇非语言学学科论文浏览发现,运用最广泛的是调查研究法。几乎所有的社会学科,包括图书馆学、新闻传播学、教育学、社会学、工商管理学等,都使用了这一方法,而且大多综合运用了定性和定量研究的方法,如调查问卷、个别访谈等。同时,数据分析法的运用也比较广泛,尤其是在图书馆学、信息科学中,不少论文运用了较深入的统计方法。此外,引文分析法、模型分析法、传记法、文献法和其他研究方法也有应用,其中传记法和文献法多运用于人文学科尤其是文学学科的论文。国际、国内学术出版领域的研究方法都体现了这一特点,但是国内由于学科相对集中,故方法的丰富性稍低些,图书情报档案学学科侧重定量研究,其他学科则更侧重定性研究,各个学科的学位论文理论深度还有待提高。
五、几点建议
综上,学术出版是年轻的出版学科中的一个新兴领域,虽然已经积累了一定数量的学位论文,但理论框架、学术体系甚至研究对象的概念和范围仍然存在研究空间。本文基于上述分析归纳尝试对学术出版领域作进一步研究,尤其是如何挖掘我国的研究潜力,提出以下建议。
1.明晰学术出版概念,逐渐形成完善的研究体系
虽然PQDT 和CNKI 中收录的相关学位论文都已经超过200 篇,但如果对这些论文的内容稍作分析,便会发现真正围绕学术出版的研究很少。究其原因,很重要的一点是“学术出版”这一概念迄今尚未形成一致性意见,而研究对象基本概念的不明确导致这一领域无法形成学术性的研究体系,以至于目前学术出版领域的学位论文最多的是围绕学术期刊评价指标和影响因子展开研究,但对于学术图书这一学术出版的重要组成部分研究较少。从纯学术价值看,国内学术出版领域的研究尚未全面起步,亟待明晰概念和分类,巩固理论支撑和方法论训练后建构完善的学术研究体系。
2.加大优势学科投入,提升研究成果的质量
纵观世界范围内的学术出版领域学位论文来源机构,以图书情报档案学为强势学科的芝加哥大学为例,论文贡献量虽未遥遥领先,但也是位居榜首。相比之下,我国图书情报档案学A+的高校却不在论文贡献量的前列,这是需要引起重视的。但是,考虑到我国学术出版主题学位论文的主要来源机构分布较集中的现状,在现行高等教育和高校科研模式下,尤其是受学科门类设置和学位授予制度的影响,反而让其具备了“集中力量办大事”的发展潜质。A+学科的学术水平和研究力量可保证质与量的同步增长。如果能够在一段时期内加大对学术出版领域内优势学科高校的投入,如武汉大学、南京大学等图书情报档案学评估结果为A+且已经在该领域取得一定成就的高校,定能使我国学术出版领域的研究进一步快速增长。
3.丰富多样性研究方法,鼓励交叉学科研究
相较学术出版领域的国际研究现状,学科交叉少、研究方法单一是我国研究现状中比较明显的弱势。出版学与实际应用、业务工作密切相关,被作为一项专门学科看待的时间并不长,理论基础和研究范式都比较薄弱,需要借助其他学科的研究方法和专业内容予以支撑。从长期发展看,要想有持续不断的学术创新,学术出版领域的研究需要与其他学科不断交叉,在交叉中萌生新的增长点,同时引入其他学科的研究方法,以成熟的方法论指导研究推向深入。
4.扩大国际合作与交流,促进研究成果“走出去”
CNKI 作为国内最完整的学位论文收录平台,检得论文276 篇,而PQDT 作为全世界收录学位论文范围最广的数据库,在检得的论文中由中国授予学位的论文仅34 篇。两者之间的悬殊说明从中国获得学位的论文,大部分未被PQDT 收录,可见虽然相比法国、德国高校,我国在学术全球化中已经比较主动,但程度还明显不足。语种障碍是客观原因之一,但是PQDT 所收录的学位论文覆盖英语、汉语、布尔语、阿拉伯语、西班牙语等多种语言,可见语种并不构成限制条件,主要原因还在于国内文科学者的国际化意识不够强,学术成果与国际学术规范要求尚有偏差,国际学术合作与交流不够。改革开放以后,中国现代学术在重建的过程中,大量引进、借鉴了国外学者的研究成果,40 年后的今天当是我们变被动为主动,促进原创性学术成果“走出去”的时刻,中华学术外译等项目已经进行了较好尝试,学位论文这样规范性的学术成果理应更适合推向国际,各级主管部门也应为中国学术成果的对外输出创造条件、提供支持。