E-Research环境下学术机构知识库的构建研究
2023-08-28朱坚冰
朱坚冰 王 琲 刘 江 刘 飞
E-Research环境下学术机构知识库的构建研究
朱坚冰1王 琲2刘 江3刘 飞4
(1.新疆医科大学语言文化学院,新疆 乌鲁木齐 830017;2.新疆维吾尔自治区人民医院,新疆 乌鲁木齐 830001;3.克拉玛依市克拉玛依区迎宾街道办事处,新疆 克拉玛依 834000;4.新疆医科大学图书馆,新疆 乌鲁木齐 830017)
文章分析了E-Research环境下学术机构知识库的构建必要性,从资源建设模式、服务模式两方面介绍了E-Research环境下学术机构知识库构建模式,并给出了E-Research环境下学术机构知识库的构建方案,该方案主要包括前期设计、运行设计和后期维护设计,最后提出了E-Research环境下学术机构知识库构建的策略。
E-Research环境;学术机构知识库;资源建设模式
引言
英国早在2000 年就已经形成了E-science 的观念,即无论在什么样的科学范围内都能够进行跨区域协作,而且这种行为有可能形成下一代的基础设备[1]。其中心观念是运用先进的网络技术将全世界的计算机联系起来,在进行资源共享的同时形成一个虚拟的超级大脑,真正做到全球共享。伴随E-science 的持续改革进步,这一观念的作用已经不单单局限于计算机技术,很多科学被这种新颖的形式吸引而加入其中,由此E-Research诞生了。E-Research无论在理论方面,还是在实践中都得到了跨越性的进步,在科学研究的各个方面、各个环节都有着不可忽视的帮助作用。
学术机构知识库(Institutional Repository,IR)的产生大大提高了研究者的研究效率,在学术资源方面有着极大的容纳空间,在这里可以随心所欲地进行学术相关的交流。对于实现学术成果共享,提升科研机构的影响力具有重要意义,通过这样的方式也加大了学术研究机构在行业间的竞争力度[2]。由此可见,计算机信息技术的作用就是将大量的数据进行采集、整理、存储,并为相关工作人员提供方便的使用途径,为学术研究做出了不可磨灭的贡献。不仅如此,计算机信息技术还能够对采集、存储的信息进行分类、标签,真正实现免费开放式的环境,使需要资料的人得到帮助。在这样的技术支持下,图书馆也面临着新挑战。
1 E-Research环境下学术机构知识库的构建必要性
1.1 虚拟研究环境为学术机构知识库的构建提供资源
虚拟研究环境(Virtual Research Environment,VRE)是在E-Research的支持下形成的一个多功能组合的、具有多种服务的载体。它致力于使全世界研究者能够得到一个真正实现全球共享、安全开放的数字化研究平台。计算机技术的先进发展已经可以虚拟出一个平台进行全世界跨区的协作,不同地区的研究者能够在区域差异中共享研究资源[3]。在这个平台上,也可以经VRE寻求各种帮助,突破区域的限制。在这样的环境优势下,建立面向特定研究主题的虚拟组织(Virtual Organization,VO),便于研究人员专心投入到研究中,确保在限制时间内得到研究成果,结束任务。
学术机构知识库是一个能够抓取并且存储很多关于大学的研究信息等转化为大数据的集中体,这是一个汇集了非常多的相关资源的平台。在这里,研究者不仅能够免费获得想要的学习资源,自由地进行学术方面的交流,还能够真正体现其自身存在的价值,并在业内树立起一定的权威。
1.2 网格技术为学术机构知识库的构建提供技术支持
网格(Grid)技术在创新道路上的发展是瞩目的,网络将世界各地的计算机紧密相连,无论何时何地发生了什么,都能在第一时间进行实时信息的共享。万维网的出现是人类网络技术更进一步的发展,在之前的基础上又增加了超文本和多媒体技术。所有的计算机被网络联系起来形成一个巨大的网,真正意义上实现了资源共享的创造性举措。
E-Research 是一种新的环境。它的出现将网络上所有的资源相互连接,在逻辑方向上实现了数据交互及集中存储。研究者可以在这样的环境中,找到自己想要的信息资源并下载存储,还能够自由地上传自己的研究成果。这样的环境已经打破了很多限制因素,使一切变得更方便快捷。
机构知识库的形成则依赖于网络技术,这种数字化逻辑化的存储方式将更加便利于扩展存储空间。它能够采集、整理并长时间存储在对应的平台中,这些信息资源也将被整理划分、标签,按照相关协议,允许有权限的人免费下载或存档。
2 E-Research环境下学术机构知识库构建模式研究
机构知识库在建立初始就应该对所要投入的资金、相关机构给出的政策扶持、是否有技术人才加入、管理层次是否合理分明这些方面有一个预先估计。其资源方面的来源是由机构知识库的运行基础和服务作为保障的,在这样的先行条件下,将会更有利于机构知识库的长久发展。
2.1 资源建设模式
E-Research在资源建设模式中所要进行的抉择和体制的制定将会影响到日后运行的很多环节,其中包括资源在采集时是否能够有足够的优势进行连续的采集。机构知识库资源建设模式如图1所示[4]。
(1)自下而上的自存储模式。这种模式能够自己进行资料的存档,相关的研究者会把研究结果存储在资源环境中的某个软件内,使用者能够对这个知识库中的内容进行下载或是提交动作。这样的模式一般对于存储比较开放的、支持被采用的内容。
(2)自上而下的强制性自存储模式。其重点是能够为一些权威较高的部门制定强制性的存储服务,结合自身的特点能够对资源进行大量的吸收。这样的模式得在高层管理人员的了解并支持这种模式,对这种模式出台相关条例规定等条件下,才有可能得到实际运用。
(3)协议性代存储模式。这种模式是内部人员和研究者双方得到共识并决定采用相关的协议,研究者的一切研究内容都将经由内部人员之手上传,所有内容的格式、从内容的整理到发布都不予以自由支配。还有一种解决方法则是内部人员自行判断,进而对需要的资源进行采集存储。
图1 机构知识库资源建设模式
2.2 服务模式
E-Research 为研究者带来了全新的研究体验,图书馆目前采取的管理方法及未来规划都将受到这种模式的影响,在完善改革的道路上也会走得更加长远。在这样的服务模式下,对于科学知识方面的研究将会打破传统的局限性,在更多的领域方面进行合作,而地域早已不能成为限制因素。图书馆也将采取这样的改革,在还不健全的构想中,将要面临的挑战将会更加困难。E-Research在不同的知识层面都进行了信息资源的实时共享,图书馆在这样的条件下,各方面都将在共享的基础上得到很大的进步。同时,必然会产生一些新的技术来维持发展。在E-Research 环境下,操作将会变得更简单快捷,这样的方式将会调动更多的相关人员参与到研究过程中,相互之间建立起更进一步的合作关系,学术机构知识库联盟合作模式构建[4]如图2所示。
图2 机构知识库联盟合作模式构建
3 E-Research环境下学术机构知识库模型构建
3.1 初期方案设计
必须在E-Research制定建立机构知识库程序之前进行组织内部的市场调查。涵盖的主题有:使用机构知识库的认识和参与机构知识库的建设,工作机构发表学术著作和存储系统,学院里学生和老师的人力资源的数字化存储,计算机网络和网络设备资源的情况等。通过实际案例和有效问卷收集的数理统计进行分析,建立了有关机构知识库典型的调查图表和柱状图。常见问题是解答样本不够,在解答样本足够的情况下才能得到能反映了客观现实。确定合适的服务,机构知识库的制度创新成本模式,建立制度安排资源库,编制机构知识库的政策文件,选择相应的制度平台的软件资源库都是这个机构的主要工作。
3.2 实施运行设计
创建学术组织信息库的队伍在选取了适合的软件、硬件还有E-Research之后,最先要做的是衡量对其影响最大的主要流程,也就是内容选取、搜集以及归纳等。其次就是要尽量让内容丰富多彩,比如文字、视频、音频、课件、PPT、图片等,需要实现顾客的多种要求,最后资料的种类也需要更加丰富多彩。除去会议记录、期刊、论文还有图书内容之外,还包含技术以及工作资料、预印本以及后印本、年度报告以及研究报告、学校各系以及学生发表的文章等[5]。
用户的范围是比较的广的,可以说是提交文献资料的人,也可以说是利用上述知识库进行检索的人。因此,我们可以得出这样一个结论,学术库本身的价值非常的大,可以很好的提高客户的满意度,为客户带来便利,使得文献的下载也变得容易多了。所以上述的优点可以进一步丰富该知识库的内容,提高知识库的使用效率,同时还能回答诸如该知识库是否具有实际效益、能否提供增值服务等[6]。
3.3 后期维护设计
服务与监管机构的学术资料库正处于维护阶段,仓储机构的学术顾问团应建立以响应用户或相关技术问题发表,当提交的内容和系统符合遇到的技术问题版权及知识产权法的问题[7],反馈学术机构知识库执行应该仔细地搜索用户信息和使用习惯,观察并研究影响知识分布的因素,如知识的源泉,而对信息使用者的行为进行研究,访问策略服务是必要的,以改善服务,提高机构的学术运用率,及时调整和更新知识库的数据。
4 E-Research环境下学术机构知识库构建策略
4.1 VRE开放共享科学模式
从目前存在的实际情况来看,不开放的图书馆知识交流环境对建设学术信息机构库有着直接性的影响,而且在E-Research的发展历程中,图书馆要想占据一席之地,必须要在VRE共享和开放的科学研究模式基础上,数字型转化现有的纸质文献,同时购买已有的电子信息资源,在网上对显性和隐形的信息进行挖掘、整理并汇集在一起,形成图书馆本身的机构信息库,以奠定在学术信息交流中的中心基础。建设机构信息库,对缓解图书馆“期刊危机”极为有利,使图书馆对期刊出版商的依赖有所减少,自身的自主能力得以增强,覆盖的信息资源得到丰富和扩充,服务水平得到显著提高,对信息资源的共享起到促进作用。
从图书馆的发展现状中可以看出,现在已经有了相当成熟的硬件条件,有了较强的资源组织和利用能力,这也就意味着图书馆有可能成为机构信息库的领导者。在建设的机构信息库中,其中包含有丰富类型的灰色文献[8],创造了有利条件对图书馆信息资源进行统筹,在信息服务能力的提升过程中起到促进作用。在机构信息库的建设进程中,图书馆有参与的责任,同时在信息资源共享方面发挥自己的作用。图书馆可以作为宣传工具,把机构信息库建设的内容和意义普及在用户的培训和教育过程中,号召高校师生以及用户群积极响应机构信息库的建设,在机构信息库中加入科研人员的研究成员,把机构信息库的影响扩大开来。同时,图书馆应该把与学术机构的合作重视起来,鼓励、协助并参与到机构信息库的创建中去。
4.2 扩展资源采集渠道
机构信息库在E-Research环境下从两个方面选取内容资源[9],其内容一方面源自互联网或者是其他一些向公众开放的信息库中的开放存取资源;另一方面源自于信息库组成成员的学术科研成果。在采集信息资源时,机构信息库应充分考虑了三个方面的因素,分别为面向公众以及来自于互联网的开放存取资源的质量及其丰富程度、机构库组织成员的学术科研成果以及实际需求,并依据具体情况对资源来源比例进行合理的分配。
开放存取资源包括灰色、后印本以及预印本文献。一般机构信息库在E-Research环境下,采集资源过程中灰色文献有更重要的意义。首先灰色文献一般不是通过正式渠道获取的,因此具有较大的边际效用,对于一些特定领域来说,其价值表现得更为突出;其次是灰色文献多不是正规渠道出版的,未来能正式出版的可能性也较小,所以不需要考虑知识产权方面的争议,对信息资源的长期保存较为有利,但是灰色文献通常较难获取,需要工作人员进行全方位的资源搜索,通过各种途径获取信息资源,而且获取的资源通常具有不同的载体和文件格式,需要科学地分类和标引来管理信息资源,便于用户和读者的使用。
在网络上通过E-Research技术可以匹配用户请求以及相应的网络资源,提供给用户最适合的可用资源,这是资源环境构建的核心所在。为了资源共享的实现以及网格资源使用机制的建立,在每个网格的节点上需要运行一个管理软件,对网格上松散的资源进行联系和管理,值得注意的是,该软件要对标准接口进行定义,信息资源只要能符合网格定义的标准接口即可完成网格的接入,完成资源共享。
4.3 规避知识产权风险
在机构信息库的建设和使用过程中,高校图书馆要注意不可避免的知识产权问题,该问题在机构信息库的发展过程中也是起到制约性的重要问题之一。机构信息库在E-Research下选择的软件包括三种,分别为商业软件、公有领域软件以及开源软件。从机构信息库的国外建设经验来看,我国高校图书馆机构可以首选开源软件完成机构信息库的建设。但是我国目前在机构信息库可用的开源软件方面几乎还是一片空白,采用的多为国外发展较为成熟的Fedora等软件,这下载、升级的免费性以及可重新分发是这些软件共有的特点,同时对于最新的OAI数据收割协议还要执行严格的规定。高校图书馆在使用这些软件的过程中,要把软件制定的商标标注在机构信息库网站首页的明显位置,这些商标代表着软件所有权,该标志直接指向该软件所有者的网站;如果机构库使用的软件是已有的软件或者是委托通过购买等方式开发使用的,要首先解决知识产权问题,签订相关具有法律效力的协议,以免产生纠纷。
为了推进资源开放存取的发展,使得机构信息库的内容更加丰富,要采用相应措施协调好国家、机构以及个人三者之间的关系。从国家的角度而言,要完善科学信息方面的法律制度,把更宽松和自由的研究、互动以及共享空间提供给研究机构和学者;从机构信息库单位的角度而言,在采集信息资源时要签署知识产权相关协议,规避知识产权风险,而且还可以清晰明了地标明机构信息库以及知识提供者双方的权利和义务,把各种潜在的问题扼杀在摇篮中;从个人的角度而言,把自己的学术研究成果积极地提交到机构信息库中,并注意版权许可协议的签署。
4.4 嵌入知识服务新理念
学科服务工作在E-Research环境下有效地与科学研究过程进行融合,在融入知识创造过程中也包括图书馆提供的知识服务。其目标是把知识创造过程中的一些非核心工作承担起来,在科研人员知识创造过程中起到有效的协助作用。
首先要协助科研人员把在各处分散的显性知识及时地记录和保存下来,完成知识长期保存的功能;同时,还要充分利用E-Research提供的各类工具,对科研人员脑海中存在的隐形知识进行模拟和仿真表达,并在E-Research环境中知识交流平台的基础上营造一个科研人员交流和互动的环境,加强宣传公开存取等模式,鼓励隐性知识的共享、存储以及积累。目前主要有两种方式可以提供知识,分别为知识的直接提供和间接提供。前者是充分了解科研人员需求,整理和分析相关信息资源,对知识进行挖掘和提取;后者是分解和链接原始的信息资源,形成知识单元,再把知识单元及相应的组装工具提供给用户。
5 结束语
图书馆的信息资源为科研过程保驾护航,但是E-Research使原有的服务方式和研究环境都得到了进一步的发展,并在构建学术机构信息库的过程中带来了机遇和挑战。机构知识库是开放获取交流模式实现的手段之一,同时还提供了一个平台促进机构知识成果更好地传播。机构知识库应当联盟化,以此扩大数据量,并提高数据的应用价值。机构知识库联盟也应积极与政府等相关部门沟通,制定相关的激励政策和支持,实现机构知识库的可持续发展。
[1]刘颖,黄传慧. E-Research环境下嵌入式学科服务研究[J]. 图书馆学研究,2014(6): 67-71.
[2]孙薇. E-Research环境下机构知识库学术信息资源的质量控制研究[J]. 图书馆学刊,2016,38(2): 30-32.
[3]杨金明. E-Research与图书馆建设: 以哥伦比亚大学CDRS为例[J]. 电子世界,2013(1): 114-115.
[4]侯丽慧. 我国机构知识库模式构建研究[D]. 长春: 东北师范大学,2010.
[5]石方. 基于学术机构知识库构建模式的探讨[J]. 中国科技信息,2011(5): 35-40.
[6]范亚芳. 机构知识库学术信息资源组织方法研究[J]. 现代情报,2007(2): 102-108.
[7]郭淑艳,王东艳. 机构知识库构建研究[J]. 图书馆学研究,2007(11): 53-57.
[8]周晓兰. 区域机构知识库的构建研究[J]. 新世纪图书馆,2010(6): 21-25.
[9]王丹. 国内机构知识库构建研究[J]. 大学图书情报学刊,2010(10): 10-13.
Research on the Construction of Academic Institution Knowledge Base in E-Research Environment
The paper analyzes the necessity of constructing academic institution knowledge bases in the E-Research environment, and introduces the construction mode of academic institution knowledge bases in the E-Research environment from two aspects: resource construction mode and service mode. The construction scheme of academic institution knowledge base under E-Research environment is given, which mainly includes preliminary design, operation design and later maintenance design. Finally, the paper puts forward the strategy of constructing the knowledge base of academic institutions under the E-Research environment.
E-Research environment; academic institution knowledge base; resource construction mode
G25
A
1008-1151(2023)07-0014-04
2022-10-12
新疆维吾尔自治区社科基金项目“哈萨克族系谱的数字化研究”(2016Btq087);2022年汉语国际推广中亚基地建设项目“‘一带一路’倡议下格鲁吉亚孔子学院(课堂)发展现状、对策及趋势研究”。
朱坚冰,男,新疆医科大学语言文化学院副院长,讲师,研究方向为教育管理。
刘飞,男,新疆医科大学图书馆技术部主任,研究馆员,研究方向为数字图书馆。