基于共词分析的我国机构知识库研究范式
2015-02-22黄丽霞
黄丽霞 魏 巍
(黑龙江大学信息管理学院,黑龙江 哈尔滨 150080)
基于共词分析的我国机构知识库研究范式
黄丽霞 魏 巍
(黑龙江大学信息管理学院,黑龙江 哈尔滨 150080)
利用对高频关键词进行共词分析的方法,运用SPSS软件,通过因子分析、聚类分析和多维尺度分析等角度,对我国机构知识库的研究范式做出归纳总结,得出了3大类研究范式,分别为理论导向研究范式、技术系统导向研究范式和实践应用导向研究范式。针对范式研究内容,分析出我国机构知识库发展过程中存在的问题,并提出了相应的建议。
机构知识库 共词分析 问题 建议
20世纪90年代末以来,开放存取运动逐渐兴起,机构知识库应运而生并不断发展。机构知识库(Institutional Reposi⁃tory,简称IR),也可称作机构库、机构仓储、机构资源库、机构存储库、机构存储、机构典藏库、机构典藏等[1],是指对机构内知识产品进行收集、存储与管理的一系列服务机制[2]。我国最早的关于机构知识库的研究是吴建中教授的《图书馆VS机构库——图书馆战略发展的再思考》一文[3],此后学者们陆续展开深入研究。笔者的研究目的在于归纳总结出我国机构知识库研究范式,结合范式内容分析出我国机构知识库发展过程中存在的问题,并提出相应建议,以促进机构知识库的可持续发展。
1 研究方法及数据
利用CNKI数据库进行数据统计,在高级检索中限定范围为“期刊”“博硕士论文”,期刊的来源类别为“SCI来源期刊、EI来源期刊、核心期刊以及CSSCI”,检索式“主题=机构知识库(机构库、机构仓储、机构资源库、机构存储库、机构存储、机构典藏库、机构典藏)”,不限时间,共检索出1166篇文献。最后得出相关文献828篇、原始关键词1663个。
将关键词进行单复数、同义词的处理后,共得到关键词1590个,选择词频不小于6次的高频关键词(如表1)进行共词分析。将这些关键词两两组合,统计在828篇文献中同时出现的次数,形成62×62的共词矩阵(见表2)。为了便于分析,再将其转化为相关矩阵(见表3)和相异矩阵(见表4)。
表1 我国机构知识库研究论文高频关键词
续表
表2 我国机构知识库研究论文高频关键词共词矩阵(部分)
表3 我国机构知识库研究论文高频关键词相关矩阵(部分)
表4 我国机构知识库研究论文高频关键词相异矩阵(部分)
2 高频关键词的共词分析
2.1 因子分析
对相异矩阵进行因子分析后,共提取出14个成分。成分1包括学科知识库、开放存取仓储、科研人员、中国科学院、开放存取期刊、自存储和学术图书馆;成分2包括资源建设、质量控制、长期保存、元数据和资源整合;成分3包括学术出版、开放存取资源、图书馆学情报学和学术交流;成分4包括互操作、开源软件、DSpace、数字保存和数字图书馆;成分5包括美国、信息服务、高校图书馆和中国;成分6包括知识共享、机构知识库、开放存取、知识库、政策、日本、著作权;成分7包括发展策略、学术机构知识库和现状;成分8包括信息资源、学科馆员和虚拟研究环境;成分9包括资源共享和虚拟研究环境;成分10包括高校机构知识库、服务模式、知识产权和著作权;成分11包括知识服务、知识管理、数据库和定量分析;成分12包括机构知识库联盟、台湾和高校;成分13包括内容建设、发展趋势、策略;成分14包括信息资源建设和高校文库。
2.2 聚类分析
对相异矩阵进行聚类分析后,可以将关键词归为8类。第1类机构知识库与图书馆范畴,包括图书馆、科学数据、高校、台湾、机构知识库联盟、OCLC、资源共享和图书馆联盟;第2类对知识管理、知识服务的影响范畴,包括学科服务、Web 2.0、信息资源建设、高校文库、学科馆员、虚拟研究环境、知识服务、知识管理、信息资源、数据库和定量分析;第3类对学术交流的影响范畴,包括日本、知识共享、学术交流、图书馆学情报学、学术出版、开放存取资源、信息服务、美国和高校图书馆;第4类发展现状与对策范畴,包括策略、现状、版权、学术机构知识库、发展策略、知识产权、高校机构知识库、服务模式、中国、开放存取期刊、内容建设和发展趋势;第5类政策范畴,包括学术图书馆、著作权、政策、自存储和开放存取;第6类技术范畴,包括数字资源、数字保存、数字图书馆、开源软件、互操作、机构知识库、知识库和DSpace;第7类建设范畴,包括资源整合、质量控制、长期保存、资源建设和元数据;第8类开放存取仓储范畴,包括中国科学院、科研人员、学科知识库和开放存取仓储。
2.3 多维尺度分析
为了使分析结果更加显著,因此对于关键词的相异矩阵进行了二维尺度分析,得到相应的可视化结果,如图1所示。
图1 我国机构知识库高频关键词多维尺度分析
通过多维尺度分析可视化图可知,关键词可以分为4个部分。第一部分主要涵盖机构知识库的建设、技术系统和政策问题,包括DSpace、机构知识库、数字资源、资源建设、策略、互操作、元数据、开源软件、政策、科研人员、自存储、数字图书馆、长期保存、质量控制和开放存取;第二部分主要涵盖机构知识库与图书馆、机构知识库对学术交流、知识管理和信息服务的影响问题,包括数字保存、高校、资源共享、资源整合、图书馆、知识库、数据库、虚拟研究环境、学术交流、科学数据、政策、知识共享、信息服务、知识管理和学科馆员;第三部分主要涵盖机构知识库的内容建设问题,包括高校文库、内容建设、图书馆学情报学、Web2.0、高校图书馆、服务模式、定量分析、美国、日本、OCLC、机构知识库联盟、信息资源建设、信息资源、知识服务和学科服务;第四部分主要涵盖机构知识库的发展现状、趋势、策略与版权问题,包括学术图书馆、图书馆联盟、学科知识库、学术机构知识库、高校机构知识库、中国科学院、开放存取仓储、开放存取资源、开放存取期刊、学术出版、版权、知识产权、著作权、中国、台湾、现状、发展趋势和发展策略。
3 机构知识库研究范式归纳
基于前文因子分析、聚类分析和多维尺度可视化分析图可知,我国机构知识库研究范式大致可以分为理论导向研究、技术系统导向研究和实践应用导向研究3类。
3.1 理论导向研究
理论研究是进行实践应用的基础,我国关于机构知识库的理论研究多是从机构知识库的相关概念,如含义、特征和功能等,现状、问题、发展策略以及发展趋势等方面进行论述。
3.2 技术系统导向研究
技术系统研究是机构知识库发展的物质基础,我国关于机构知识库技术系统的研究主要集中于对知识库系统、工具和资源等方面,如关于开源软件DSpace的研究较为广泛,一直是机构知识库研究领域的热点问题。
3.3 实践应用导向研究
实践应用研究主要是集中于图书馆学情报学领域。主要包括资源建设、开放存取、资源整合、学术出版等方面,以达到知识共享、学术交流、知识管理和知识服务的目的。主要包括以下4个方面的研究。
3.3.1 机构知识库政策相关研究
机构知识库政策相关研究主要包括对于构建政策体系的研究,涉及机构知识库的建设、管理等各个阶段;研究层面涵盖国家的宏观政策、机构所隶属单位的管理政策以及机构实施单位的具体政策等多个层次。
3.3.2 机构知识库的建设相关研究
机构知识库建设相关研究主要包括资源建设、长期保存、质量控制、版权等内容。主要是从建设的政策、模式、责任、规范以及资金支持等方面进行研究。
3.3.3 机构知识库与图书馆相关研究
图书馆与机构知识库有许多相似之处。图书馆界倡导的理念是信息资源的共建共享,机构知识库要实现的目的是资源的高度开放、共享,促进学术交流,所以两者可以相互学习、借鉴,共同发展[4]。其中,基于高校学术资源丰富多样的优势,高校及其图书馆是重要的研究组成部分。
3.3.4 机构知识库的作用相关研究
机构知识库的作用研究主要包括机构知识库对于学术交流、知识共享、知识管理和知识服务等方面的影响。机构知识库为用户提供了一个及时获取学术成果的系统平台,拓展了知识管理与知识服务的渠道,丰富了学术交流的内容,为实现知识共享创造良好的环境。
4 我国机构知识库发展中存在的问题
4.1 关于机构知识库的认知存在差异
学界对于机构知识库的含义还没有统一的定义,因此人们对于机构知识库的内涵、功能以及重要性的认识不足,使得我国对于开放获取没有形成普遍认知,参与积极性不高,不能充分发挥机构知识库的作用。
4.2 系统软件功能单一
当前我国大部分机构知识库都使用DSpace软件构建,直接采用默认设置,或只简单对其进行本地化的处理,很少自主研发专用的软件,也较少开发软件的新功能,因此,我国机构知识库系统软件功能还不够完善。一般只提供一些基础功能,如资源的提交、检索、浏览和基本统计数据等,而一些个性化服务以及与其他系统的集成与跨库检索等功能都较少得到实现[5]。
4.3 政策体系不健全
机构知识库涉及的政策主要包括政府的宏观政策、机构知识库隶属机构的政策以及机构知识库建设过程中的具体政策。宏观政策对机构知识库的发展具有指导意义,机构知识库隶属机构的政策注重于资源建设、考核机制等,机构知识库建设实施中还需要制定一系列具体的政策。政策对于机构知识库的发展有着深远的影响,我国机构知识库的宏观政策相对而言发展还比较滞后,并且实施效果不够显著;虽然一些机构制定了政策机制,但在机构知识库建设过程中缺少具体政策的及时补充。因此,我国急需机构知识库政策体系的构建。
4.4 机构知识库资源比较短缺
资源是机构知识库的重要构成要素。我国机构知识库在资源建设方面主要存在以下问题:大部分机构知识库资源数量比较短缺,只有小部分机构知识库的资源比较充足;资源类型比较单一,机构知识库中的资源应包括已经出版的和未出版的资源。但我国大部分机构知识库收录的未出版资源比较少,大部分收录的都是已出版的文献。并且收录的资源多以文献为主,视频、图片等多媒体资源所占的比例比较小;资源更新不及时,我国大部分机构知识库对于提交资源没有强制的要求,因此资源的更新不够及时,这对于机构知识库的可持续发展具有重要影响。
4.5 质量控制不到位
因为机构知识库开放性的特点,以及审批制度没有发表传统论文那么严格的标准,有专家组成的评审机构对投稿的文章进行审阅,然后决定是否可以发表;机构知识库中提交资源只须通过系统的基本审核,即可入库供用户浏览、检索和利用,致使收录的资源质量得不到有效的控制。
4.6 版权保护程度不足
机构知识库中的版权问题主要是指资源收集过程中和使用过程中所涉及的版权问题。资源收集过程中主要涉及版权许可的问题,因为收录到机构知识库中的部分资源是已经在期刊上发表了的文章,所以会涉及出版商版权许可的问题。国外许多出版商已经同意作者可以存储已发表的文献,但还有一些出版商表示反对。而在资源使用过程中,因为机构知识库中的许多资源是未发表的,其版权属于作者本人所有。但用户可以在机构知识库内自由地浏览和下载文献,对资源版权保护不够到位,致使作者提交的积极性不高[6]。
4.7 高校图书馆在机构知识库建设中的作用发挥不充分
机构知识库的构建主体应该由图书馆担任,尤其是科研力量雄厚、学术资源充足的高校及其图书馆。但在我国机构知识库构建过程中,没有充分发挥高校及其图书馆的作用,这必然会影响机构知识库的建设状况。
5 完善我国机构知识库的建议
5.1 增强各界对机构知识库的认知
学界应该加强关于机构知识库的学术交流,形成关于机构知识库的内涵、作用等方面的共同认知,这样才能明确机构知识库的建设方向。同时还应该加强对于机构知识库的宣传,争取国家及机构管理层面等各方面的支持,还可以促进科研人员积极参与到机构知识库构建过程中,促进机构知识库的可持续发展。
5.2 完善机构知识库系统功能
我国机构知识库所采用的系统软件等都比较单一,致使功能也比较基础、单一。因此,我国机构知识库应该根据自身的特点自主开发系统软件,更好地保证机构知识库的建设与利用;我国机构知识库还可以积极利用已经研发出的各类系统软件,根据自身的特点完善其功能,开展个性化服务,满足用户需求。
5.3 加强机构知识库政策体系的建设
机构知识库的发展需要形成完整的政策体系。国家应制定相应的宏观政策,为机构知识库的发展明确方向以及提供政策、资金等方面的支持,以保证机构知识库的建设质量与长期发展;机构知识库所隶属的机构应该制定相关政策机制保证机构知识库的建设与发展,吸引更多科研人员参与到机构知识库的建设当中;负责机构知识库建设的部门需要制定机构知识库实施过程中的具体政策,这些政策应注重解决机构知识库中的具体问题,可以保证机构知识库的正常运行与顺利发展。
5.4 加强机构知识库的资源建设
大部分机构知识库都是自存储系统,由作者自己提交资源。因此,应该积极制定各项激励机制鼓励研究人员提交其科研成果。同时,还应该主动地寻求各种资源获取渠道。而就资源构成问题,应该在收录已发表资源的同时,注意收录未发表的资源;在收录文献的同时,注意收录视频、图片等多媒体资源。还应该保证机构知识库中的资源及时更新,保证资源不断丰富。
5.5 加强机构知识库资源质量的控制
当前机构知识库中收录资源的限制较低,因此应该采取一定的措施对资源质量进行控制,摒弃没有学术价值的资源。可以在提交资源后,由资源的提交者、机构知识库管理人员和用户共同对其内容质量进行定期测评,对有质量问题的资源提出相应的修改意见并作出修改,提升机构知识库中的资源质量。
5.6 加强机构知识库的版权管理
机构知识库的版权管理应该涉及收集和使用两个部分。在资源收集过程中,必须向版权人获取复制权、网络传播权等部分版权;如果版权已归出版商或者其他机构所有,提供者就需要重新考虑文献的版权转让问题,获取在机构知识库中存档的权利;机构知识库应该制定机构与资源提供者、资源获取者之间的协议,保证版权的保护[7]。
5.7 充分发挥高校图书馆的作用
成功的机构知识库离不开图书馆,尤其是高校图书馆。因此,应该充分发挥高校图书馆在机构知识库建设过程中的主导作用。国家可以制定鼓励高校建设机构知识库的政策,促使更多的高校图书馆积极参与到机构知识库的构建当中,提高机构知识库的建设水平。
6 结语
通过分析研究,归纳总结出我国机构知识库研究范式。针对范式中的内容,分析了机构知识库发展过程中存在的问题,并且提出了相应的建议。相信随着机构知识库的不断深入发展,会有更多相关研究成果产生,机构知识库发展中存在的问题会逐一得到解决,实现可持续发展。
[1]杨红岗,杨林.基于社会网络分析的国内外机构知识库比较研究[J].新世纪图书馆,2013(9):53-57.
[2]常唯.数字学术环境中的机构知识库探析[J].图书情报工作,2006(7):46-50.
[3]肖明,袁浩.国内机构知识库的文献计量学分析[J].情报杂志,2009(12):9-11.
[4]吴群.基于开放存取的机构知识库与图书馆信息资源共享[J].现代情报,2011(6):50-52.
[5]吴高,万文绢.我国机构知识库管理服务问题与策略分析[J].图书馆,2013(6):83-85.
[6]刘瑛.我国机构知识库建设中存在的问题及对策研究[J].黑龙江史志,2012(19):72-73.
[7]薛青林.国内机构知识库建设的问题和对策[J].图书馆建设,2009(5):17-21.
黄丽霞女,1967年生,教授。研究方向:信息服务与用户研究。
魏 巍女,1990年生,硕士研究生在读。研究方向:信息服务与用户研究。
G250
2015-04-08;责编:张欣。)