APP下载

我国高校数字图书馆研究现状与趋势
——基于硕博士学位论文的统计分析

2017-08-07王克平苏艳丽

关键词:博士学位学位论文

王克平,苏艳丽

(山东理工大学 科技信息研究所,山东 淄博 255000)

我国高校数字图书馆研究现状与趋势
——基于硕博士学位论文的统计分析

王克平,苏艳丽

(山东理工大学 科技信息研究所,山东 淄博 255000)

以硕博士学位论文为数据源,利用社会科学统计软件,结合文献计量学相关理论,研究发现:我国高校数字图书馆研究近几年呈现下降趋势,相关研究集中在图书情报与档案管理、计算机科学与技术等学科;吉林大学、湘潭大学等重点大学成为主要研究机构;有关高校数字图书馆研究主题热点为数字资源建设、数字图书馆技术、信息服务。实践中可以从加强跨学科交流、加大宣传力度、开展产学研结合等多种培养模式入手,以促进高校数字图书馆的发展。

高校数字图书馆;学位论文;统计分析

数字图书馆(Digital Library) 是以数字形式存储和处理信息的新型图书馆,通过计算机技术进行图书馆各种信息资源的采集、数字化加工处理、信息的存储和管理、信息的发布和服务、信息利用与挖掘等处理工作,向读者提供智能检索和下载服务,实施知识的增值和快速传播,代表了图书馆发展的必然趋势[1]327-331。硕士、博士学位论文是高等学校专业人才培养方案的重要组成部分,是高校研究生教育实现培养目标最重要的教学环节,反映了学生综合知识水平、实践应用能力及相关科研成果[2]218-223。

基于“高校数字图书馆”的相关学位论文,采用社会科学统计方法,认识我国高校数字图书馆的研究现状并预测发展趋势,对高校数字图书馆的发展具有指导意义。

一、研究方法

在对比中国知网、维普、万方等数据库的基础上,本文选取CNKI的硕博士学位论文数据库作为数据源,以保证数据的完整、质量高和新颖性①参见中国知网“博硕士学位论文”,网址链接为:http://epub.cnki.net/kns/brief/result.aspx?dbPrefix=CDMD.。为了尽量全面收集国内关于高校数字图书馆研究的硕博士学位论文,本文选取“高校数字图书馆”“大学数字图书馆”作为检索词,词间逻辑关系为“或”;检索字段选择能反映文献主题内容的主题、题名和关键词字段,字段间逻辑关系为“或”;检索时间范围为2001—2014年;匹配模式均为模糊匹配。对CNKI的硕博士学位论文数据库进行高级检索,共获得508篇学位论文,其中包括20篇博士学位论文,488篇硕士学位论文。

借助CNKI及E-study工具导出学位论文的作者、篇名、时间、机构等相关题录信息,采用统计软件SPSS22.0及文献题录信息统计分析工具SATI3.2进一步分析。

二、数据分析

(一)学位论文年代分布

通过年代分布可以了解我国数字图书馆近几年的发展趋势,包括起始研究、研究的峰值和转折点等。通过CNKI及E-study工具可以直接导出硕博士学位论文每年的论文数,使用SPSS对数据进行整理并绘制分布图如图1所示,从图形来看,硕博士研究生从2001年开始进行我国高校数字图书馆的研究,随着关注热度的增加相应的学位论文数呈现递增的趋势,直至2012年达到峰值,自2013年开始呈现下降趋势;国内博士研究生对高校数字图书馆的研究与硕士研究生相比相对较少,且多年来未有较大变化,说明博士研究生学位论文在高校数字图书馆方面关注较少。由于博士学位论文数量较少,以下内容采用总体学位论文数据进行研究分析。

图1 高校数字图书馆学位论文数量与年代关系分布图

(二)学位论文学科分布

依据《授予博士、硕士学位和培养研究生的学科、专业目录》①参见《授予博士、硕士学位和培养研究生的学科、专业目录》(1997年颁布),网址链接为:http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_834/201005/xxgk_88437.html.和CNKI对508篇文献的学科分类,使用SPSS工具绘制得到统计结果如图2所示。从图2可以看出高校数字图书馆方向硕博士学位论文主要分布于图书馆情报与档案管理、计算机科学与技术、信息与通信工程、教育学、法学、新闻传播学、应用经济学、中医学和基础医学等学科领域。图情学科与数字图书馆关系最密切,也是研究高校数字图书馆的重要领域;数字图书馆的发展离不开技术的支撑,计算机科学与技术、信息与通信工程等学科为数字图书馆的发展提供了技术支持和保障。随着公共数字文化建设进程的推进,版权问题越来越突出,数字图书馆在公共数字文化建设中占有举足轻重的地位,遇到的版权侵权问题具有较强的代表性[3]27-33。图书馆作为科研工作者获取知识的重要渠道,在信息化的时代背景下,教育学、新闻传播学、应用经济学等领域也改变了往日获取、传播信息的渠道,加强了对数字图书馆的利用,因此法学学科硕博士学位论文从法律和版权角度对数字图书馆做了有效界定、管理和研究,这也使法学在数字图书馆的研究中占有较高比重。同时很多院校的医学院有诊断治疗和科研人员项目申报、选题、结项等方面的教学科研需要,从而开发了专门的医学数字图书馆,使得中医学、基础医学等医学学科在数字图书馆研究中占有一席之地。

图2 高校数字图书馆学位论文学科分布

(三)研究机构分布

由于每个研究单位有研究的侧重点,通过统计数字图书馆的研究机构,可以了解该领域的主要研究机构,后续研究中可集中精力关注主要研究机构的研究成果。使用SPSS按照发文数量大小绘制机构分布条形图,并截取发文篇数大于7的机构分布如图3所示。从所有研究机构发表硕博士学位论文的统计数据来看,占比14.75%的共有18家培养单位,发表学位论文数占全部学位论文的50.20%.这种论文产出关系体现了情报学中“二八”定律[4]5-8。

图3 学位论文研究机构分布图(发文篇数大于7)

二八定律是最省力的法则,可以集中力量把时间、精力、金钱等花在刀刃上,即最受关注的20%上[5]68-69。从图3可以看出,发文量较多的机构几乎全部为“211工程”及“985工程”院校,其中吉林大学、湘潭大学、南京农业大学、电子科技大学、黑龙江大学发文量最多,由此可知综合实力较强的211、985院校在数字图书馆研究上也具备相当大的优势。根据“二八定律”, 若研究人员在

研究高校数字图书馆过程中计划进行实证研究,用20%的院校作为研究对象,就基本可以达到概括高校数字图书馆研究现状的目的,这将在很大程度上节约人力物力,帮助研究人员更加高效地开展研究工作。

(四)学位论文研究主题分布

聚类分析,能把关系密切的主题聚集在一起形成类团,表达某一领域分支的组成[6]118-120。本文采用SPSS22.0关键词聚类的方法,在众多硕博士学位论文中归纳出高校数字图书馆的研究主题,为高校数字图书馆准确界定研究范围,并为下一步分析其研究热点奠定了研究基础。

SATI是一种文献题录信息统计分析工具,可以抽取题录信息中的多项指标,如关键词、作者、机构、文献来源、年份等,然后通过统计频次,生成共现矩阵、相似矩阵等[7]7-12。本文使用SATI工具获取高频关键词相似矩阵如图4所示。

图4 基于高频关键词的相似矩阵

将相似矩阵导入SPSS进行“分析—分类—系统聚类”分析,结果25个高频关键词被分成六类:第一类关键词可概括为数字化,第二类关键词可概括为数字资源,第三类关键词可概括为图书馆技术,第四类关键词可概括为数字资源建设,第五类关键词可概括为信息服务,第六类关键词可概括为数据挖掘。与前述人工合并结果比较,两者基本一致,从而较为准确地得出高校数字图书馆领域的研究热点为数字资源、信息服务领域和图书馆技术。

图5 多维尺度分析图

多维尺度分析图把反应变量之间相似程度的坐标在平面上排列出来,通过观察哪些散点比较接近,将变量进行分类,并寻找散点之间相关性的合理解释[8]288。将相似矩阵导入SPSS进行“分析—度量—多维尺度(ALSCAL)”分析,得到多维尺度分析图,如图5所示。从图5中可以看出,第一象限集中的信息服务、知识服务等关键词,可概括为信息服务类;同样第二、三、四象限可依次概括为图书馆技术、数字资源和数字化大类。

通过SPSS系统聚类分析和多维尺度分析结果可知,两种分析方法得到的有关高校数字图书馆研究热点的结果类似。经过归纳可知,现在高校数字图书馆的研究主题为数字资源的建设、有关数字图书馆技术的提升以及信息服务。

(五)学位论文研究热点分布

一篇文献的关键词是文章核心内容的浓缩和提炼,如果某一关键词在其所在领域的文献中反复出现,则可反映出该关键词或主题词所表征的研究主题是该领域的研究热点[9]163-171。基于此,本文选用学位论文的关键词来研究高校数字图书馆的研究热点。在本研究采用的508篇硕博士学位论文中,经过同义合并,保留关键词1335个,词频数最高的关键词“数字图书馆”“高校图书馆”“图书馆”(共计229频次)与本文研究题目一致,不能表征研究热点,对此类关键词进行剔除处理。由于在本次研究中,频次大于7的18个关键词(称为高频关键词)分布较为集中,能较好地反映研究内容;而频次小于7的关键词分布离散,不能清晰地说明硕博士学位论文关于高校数字图书馆的研究热点。故绘制高频关键词及其词频对应关系如表1所示。

通过对比表1中的关键词可以发现:频次为30的“信息服务”、频次为19的“个性化服务”、 频次为14的“数字参考咨询”等虽然在研究中有不同的侧重点,但总体研究都基本围绕“图书馆服务”开展;类似同义词词汇在低频关键词中也有出现。笔者分析,这一方面是由于部分作者对“数据”“信息”“知识”“情报”等概念化词汇认识不清;另一方面是由于不同词汇确实表征不同的核心概念,很多作者为了更清晰地描述,斟酌选择了不同词汇造成的。而“数字参考咨询”作为图书馆服务的一部分,也被列入此类。

如上文所述,“图书馆服务”成为硕博士在完成有关高校数字图书馆的学位论文时研究的最大热点,不同作者从“信息”“知识”等方面展开研究,体现了当今社会以用户为核心的服务模式,这不仅是服务行业的重要认知,图书馆作为服务部门,更应该加强以用户为核心的理念,积极探索新方法新思路,以在“互联网+”的时代背景下保持和增强其吸引力。

以“数字资源”“数据挖掘”“信息资源”为关键词的研究关注了图书馆资源的获取,主要分析了在保证提供传统纸质资源的同时,对电子图书、数据库等资源的获取和使用。较多论文从技术层面研究资源的组织建设等,鲜有研究关注这些数字资源的使用情况,尤其是很多高校花重金购入数据库,以方便在校生查询获取较多学习资源,但实际上这些数据库的利用率较低,许多本科生只有在撰写学士学位论文时才开始使用;硕博士研究生中,文科类专业利用率相对较高,许多工科专业仍不重视数据库的使用,总体利用率较低。针对这种现象,笔者认为,一方面,研究人员应多关注数字资源的利用情况,提供研究成果供高校和学生反思;另一方面,高校应加大对各种数据库的宣传和指导使用,可以考虑在课程作业中加入相关要求,以提高数字资源的利用率。

表1 高频关键词词频表(频次大于7)

以“XML”“关联规则”“元数据”“J2EE”为关键词的研究关注了计算机技术在高校数字图书馆建设中的重要作用,主要论述了资源组织、整合、建设、推广等方面的技术支撑。XML和J2EE等技术体现了当下计算机技术研究和应用的热点。笔者在研究中发现,高校数字图书馆的建设固然以计算机技术为支撑,但技术应以理论为基础,理论通过技术发展,很多学科如管理学、传播学、社会学的理论已较为完善,研究人员可以通过借鉴不同学科的理论来发展和完善高校数字图书馆的理论,采用理论与技术结合的方式推动高校数字图书馆的研究。

三、结论与建议

本研究以硕博士学位论文为数据来源,以社会科学统计分析软件为研究工具,结合文献计量学相关理论基础,对“我国高校数字图书馆”现状进行梳理,并借助关键词聚类分析了研究热点,从多个角度展示了研究特点,并揭示了一些现象。

我国高校数字图书馆的研究自受到关注以来,整体上研究数量呈现增长趋势,而且参与高校数字图书馆研究的学科日益增多,研究范围逐渐增大。其中, 图书馆情报与档案管理、计算机科学与技术、信息与通信工程三个一级学科的学位论文数量居多,图书馆情报与档案管理仍是高校数字图书馆研究的主要学科,而图书馆情报与档案管理、计算机科学与技术两个学科在全部有关高校数字图书馆的学位论文研究中占据了较大比重,一方面肯定了其作用,另一方面也促使后来者从这两个学科入手对高校数字图书馆进行深入研究。吉林大学、湘潭大学、南京农业大学、电子科技大学、黑龙江大学等五家单位已成为高校数字图书馆的主要研究机构。研究热点相对突出,数字资源、信息服务和数据挖掘等技术成为高校数字图书馆的主要研究热点和方向。数字资源的建设、有关数字图书馆技术的提升以及信息服务成为高校数字图书馆的研究主题。

虽然总体看来我国高校数字图书馆硕博士学位论文数量增长较快,但自2013年以来呈现出下降趋势,这说明有关高校数字图书馆的研究进入到一个成熟阶段,接下来可根据前文所述从相关研究热点如数字图书馆技术和信息服务等领域寻求突破,以取得更新的研究成果。有关高校数字图书馆的研究广泛分布于多种学科,跨学科之间的学术、技术交流可以相互促进。同时,目前参与高校数字图书馆研究的均为高等院校,这在一定程度上限制了该项研究的进步,各研究单位可以考虑与研究院所及各大公立图书馆合作,例如采用产学研联合培养研究生模式等,在不同研究模式的结合中寻找突破。

[1]王元.高校数字图书馆信息安全保障研究[J].图书情报工作,2010,(S2).

[2]唐琳.从硕士、博士学位论文看北京大学人文地理学研究热点和发展趋势[J].图书情报工作,2013,(S2).

[3]韦景竹,董宝蕾.图书馆版权侵权案例研究[J].图书馆论坛,2015,(11).

[4]李荫涛.情报学的权威法则浅论[J].情报理论与实践,1992,(6).

[5]徐志彬.基于长尾理论效应构建图书馆新型信息服务模式[J].内蒙古科技与经济,2012,(16).

[6]钟伟金,李佳,杨兴菊.共词分析法研究(三)——共词聚类分析法的原理与特点[J].情报杂志,2008,(7).

[7]赵蓉英,李飞.基于社会网络分析方法的国内外信息计量比较研究[J].情报科学,2013,(2).

[8]杜强,贾丽艳,严先锋.SPSS统计分析从入门到精通:第2版[M].北京:人民邮电出版社,2014.

[9]马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,(2).

(责任编辑 李逢超)

2017-02-23

国家社科基金项目“复杂动态环境下产业集群创新中的群体知识协同行为与机制研究”(13CGL012);山东理工大学青年教师发展支持计划项目“科技型小微企业技术创新风险管理中竞争情报保障研究”(SDLG4052)。

王克平,男,山东淄博人,山东理工大学科技信息研究所副研究馆员、硕士生导师,情报学博士;苏艳丽,女,山东菏泽人,山东理工大学科技信息研究所研究生。

G350

A

1672-0040(2017)04-0083-05

猜你喜欢

博士学位学位论文
『博士后』是一种学位吗?
如何写好硕士博士学位论文
博士学位论文摘要
俄罗斯儿童教育:超80%入园率与供不应求的学位
博士学位论文摘要
国内ERP研究现状——基于学位论文的统计分析
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文