基于资源挖掘的大型科研院所重点学科信息服务研究
2009-01-11唐迪
唐 迪
〔摘 要〕以本单位为例,分析了大型科研院所的信息服务体系的现状,并根据现存体系的不足提出了针对重点学科的信息资源建设。阐述了重点学科信息服务研究的目的和必要性,并提出了以资源挖掘为主的实现手段。
〔关键词〕重点学科;信息服务;资源挖掘
〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2009)11-0060-02
Research on Major Subjects Information Service Based
on Resource Mining in Large-scale Research InstitutesTang Di
(Science and Technology Information Center of China Academy of Engineering Phyiscis,Mianyang 621900,China)
〔Abstract〕Taking China academy of engineering phyiscis for example,this paper analysed the information service system conditions,put forward the information resource building method of major subjects according to the defect of existing system.discussed the purpose and necessity of major subjects information service,and put forward the method by resource mining.
〔Keywords〕major subjects;information service;resource mining
目前我国的大型科研院所都建立了自己的科技信息保障单位和以资源为主体的信息服务体系。以我单位为例,经过多年的努力,已逐步形成基本满足我院需求的纸本资源和数字资源共同发展的资源体系。在数字资源的建设中,由于各种数据库是由不同数据库商提供且是整库引进,各库资源存在分类方式的差别和内容上的少量交叉重复。另外,馆藏纸本中英文期刊与数据库收录内容也存在少量交叉重复。鉴于数据库检索方便和纸本刊阅读便利的特点,电子资源和纸本资源的少量交叉重复是符合信息资源建设规律的,但如何充分发挥两种资源尤其是数字资源的优势,在满足科研院所普遍信息需求的基础上,着重加强重点学科的信息资源建设,是我们研究的出发点。
1 研究目的
随着网络技术、数据库技术的不断发展,网上免费信息已经成为人们获取信息资源的一大途径,如何系统、有效地发现、获取并利用这些无序的网络资源,涉及到网络资源发现与采集的相关技术。在科技信息资源方面,各大数据库提供商、出版社等信息资源提供者为更广范围地吸引用户,普遍开展了网络数据库题录、文摘等信息的免费检索服务,只有在用户要求获取全文时才对用户进行合法身份的验证;另外,许多高校、科研机构等也在网上免费提供自己的研究成果和科技信息,这些都为网络资源挖掘的开展提供了丰富的数据来源。
我们旨在研究互联网公开数据及可链接数据库的采集技术和服务手段,并以我院各学科的信息需求为实践对象,将网上无序、易变、但有价值的资源以学科库、专题库的方式挖掘到本地,丰富我院科技信息资源,同时揭示挖掘资源和引进资源间的关联关系,形成“文摘库——全文库——纸本刊”三类资源互为补充的资源服务格局,不但弥补整库引进所带来的库与库之间、电子资源和纸本资源之间的交叉重复问题,节约了建设经费,而且从学科角度深化了信息资源服务,使得信息资源服务逐步朝着更专(专业)、精(精细)、新(新颖)的方向发展。
2 研究的必要性
数据库整库引进代价很大,需要大量的经费支持,并且非常占用存储的空间。数据库收录了多种期刊,但对于用户来说,并不是每一种刊都用的上。目前基于关键词检索的技术,往往导致用户从库中检索出成百上千篇的全文,虽然其中不乏有用的,但用户往往在检索结果中还没找到有用的资源就已经没有耐心再找下去。所以数据库整库检索的服务方式对单一用户来说显得没有针对性。
用户对信息资源的需求具有稳定性和持续性,对单一用户或一个科研方向的用户团体来讲,他们需要的只是涵盖本专业方向的学科库、专题库,而不是包罗万象的综合数据库。
我院科技信息资源以引进资源为主,目前只有少量自建资源,为形成各种符合我院科研生产实际需要的专题库,有必要在学科分类的基础上,充分挖掘利用信息港的本地化资源和互联网中免费的题录信息资源,形成以用户需求为中心的更有针对性的专题库。
目前,我院电子资源的服务方式以数据库为单元,但尚未从学科分类角度提供资源的统一访问入口,专题库的建立可以使用户获得一个以学科、专业为引导的资源检索方向。
目前我们在资源建设中尚未建立纸本期刊与电子期刊间的关联。通过专业文摘库的服务方式,使用户在该库中检索出自己想要的资源后再发出全文请求,可以把纸本期刊、本地化电子期刊和网络信息资源中收费期刊的使用更好的结合起来。
对于网络中的链接资源,其题录信息一般是免费的,我们实现题录信息的本地化后,可以为用户提供一个获取全文的渠道。用户提交全文请求后我们去调用全文,同样能满足用户的需求。
3 实施步骤
下面以我院为例,谈谈大型科研院所重点学科的信息服务的具体实施步骤。
3.1 确定用户对象
参考中图法、科图法、各大数据库现行分类法,对我院现有科技信息资源进行学科分类,以某一学科A为例,结合我院各科研所的研究方向,对该学科的资源以所为单位进行重点用户对象排序。
3.2 完善学科资源列表
采用各种形式与重点用户进行充分交流,明确A学科的资源构成。采用比较分析法研究A学科资源建设的不足,将A学科尽可能全的资源(包括我院已有的和与其它机构比较尚欠缺的资源)形成A学科尽可能完备的资源列表,就资源列表与该学科重点用户进行沟通,以便对资源列表进行增删。
3.3 建立文摘题录数据库
在确定某学科的资源列表后,下一步是建立文摘题录数据库,先查找本地资源中已有的文摘题录,如果不全,再从网上相关站点挖掘下载,根据资源列表将重点学科的文摘题录数据库尽量完善。
3.3.1 确定网络挖掘范围
参考国内外大学和研究机构建立的数字图书馆,研究其A学科中所包括的资源,重点是期刊论文、会议论文、博硕论文、科技报告等,与我院现有的A学科资源进行比较,找出我院在A学科中缺乏的资源,确定网络挖掘范围。
3.3.2 网站分析与内容挖掘
对A学科中缺乏的资源开展网络搜索,重点搜索对象包括数据库提供商、出版社,以及重点用户推荐网站,并由人工干预选择。在网站搜索的基础上,对符合条件的网站做分析,确定内容挖掘方式,将文摘题录信息下载到本地。对挖掘到的资源进行数据清理,完善文摘题录数据库。
3.4 全文的获取
3.4.1 挖掘到的全文
根据挖掘资源的不同类型做不同的使用。当挖掘到的资源为文摘题录时,用于完善文摘题录数据库;当挖掘到的资源是全文时,直接将其分类在A学科类目的全文库中为用户所使用。
3.4.2 馆际全文合作
根据挖掘到的题录、文摘类信息,寻求相应全文资源丰富的单位,与之开展合作,拓展全文资源的获取途径。
3.5 服务形式
将A学科的文摘题录数据库公布到科技信息服务网站上,并建设全文调用系统。当科研人员在检索文摘题录数据库后,若需要某篇全文则可在网上发送全文请求,系统首先自动检索本地数字全文资源(包括挖掘资源),如果本地资源中有全文就直接呈现全文;如果本地数字资源中没有全文,而只有相应的馆藏纸本资源,则提示用户进行馆藏原文请求;如无相应的馆藏纸本资源,则提示用户进行馆际原文请求。
3.6 学科全文库的建设
通过上述过程,我们可以实现A学科的全文服务。将调用频率高的本地全文、挖掘全文和馆际调用全文建设成为A学科的专业学科数据库,我们的重点学科信息服务将初具雏形。这样,既避免了盲目引进数据库而导致的本地数据量爆炸式增长,又能够缩小检索范围,使科研人员对资源的检索更加准确,还能够更大程度的满足用户对全文的需求。
4 结 论
建立一套以用户需求为导向的数据发现、采集、建库的资源挖掘方法,充分挖掘网络信息资源,扩大科技信息资源获取途径,深化学科化信息资源服务,实现以需求为导向、以本地资源、挖掘到的网络资源和馆际合作调用资源为基础,灵活地为科研人员提供专业化、精细化、个性化的学科信息服务,将有利于改善资源获取环境,提升对大型科研院所的信息服务能力。
参考文献
[1]严浪.从加强学科建设谈高校图书馆数字化信息服务[J].图书馆论坛,2008,(3):136-138.
[2]吴新年,陈永平.关于学科化信息服务的思考与建议[J].情报科学,2007,(12):1833-1837.
[3]王翠萍,张妍妍.学科信息门户的个性化服务调查研究[J].图书馆学研究,2008,(7):59-63.
[4]张春辉,李健康.网络资源开发的若干关键技术与途径研究进展[J].图书馆论坛,2004,(5):167-169.
[5]徐刘靖,刘细文.国外网络灰色文献开发利用模式及服务方式研究[J].图书情报知识,2006,(1):78-80.