广西机构自建数据库的现状与分析
2014-08-08冯广珍
[摘要] 为了解广西机构自建数据库的现状,对广西部分百强企业及省级以上的科研院所、公共图书馆和高校图书馆进行了调查。结果显示:广西机构自建数据库存在重复建设、用户对自建数据库的易获取程度不理想、数据库内容更新速度慢等问题。为合理利用广西机构自建数据库的人力、物力和财力,提高广西机构自建数据库的利用率,文章从多方合作建库、逐步开放自建数据库的访问权限等方面提出了相应的建议。
[关键词] 自建数据库;信息机构;资源共享
1引言
建设广西机构自建数据库是通过对分散在相关机构的原始信息资源进行搜集、整理、加工、使用,使原始信息获得升值的一个过程。而对广西机构自建数据库的调查,目的在于了解和掌握广西区内各企事业单位自建数据库的基本情况,促进区内各信息机构的信息资源共建共享,更好地为中外各界信息用户提供全面、便捷的信息服务,为广西经济发展起到助推的作用。自建数据库目前还没有明确的定义,通常把政府机关、企事业单位等机构针对本机构的性质自行搜集整理的相关信息资源而建立的,可在一定范围内共享的数据库理解为自建数据库。它既能在一定程度上满足机构内人员或机构服务受众在工作、生活及学习上的信息需求,有些甚至能支持领导决策,又可彰显本机构的信息特色。因此,有些自建数据库也可称为特色数据库。它可以是专家成果库、产品库、文献知识库,也可以是其他内容或类型的信息集成库,无论平台是购买还是自建,只要里面的数据和内容是由本机构人员组织建设,都可视为自建数据库[1]。随着信息技术和通信技术的飞速发展,数字化建设已成为许多国家、地区、城市以及机构的重要工作之一,而一个地区自建数据库的多少也成为衡量获取该地区信息量多少的重要指标。因此,加强广西自建数据库建设,整合各机构的信息资源,进行资源共建共享,更好地发挥广西各信息机构的作用,对促进广西的经济发展有着重要的意义。
2广西机构自建数据库的现状
为了解广西机构自建数据库的现状,课题组采用了发放调查表、网站查询、电话询问、文献查阅等方式,对广西的相关机构进行了抽样调查。调查对象主要包括广西区内高校图书馆、公共图书馆、部分百强企业及省级以上的科研院所,共计111家单位。其中,广西百强企业以2011年度“广西壮族自治区工业和信息化委员会门户网站” 上公布的为准;省级以上研究院所的界定,则是根据“万方数据知识服务平台”中的机构检索结果而划定。调查内容涉及自建数据库的建设情况、数据库的用户范围、用户对自建数据库的易获取程度、合作共享意愿等方面,这些内容可以反映广西各机构自建数据库的基本情况。
2.1 调查结果
通过抽样对广西各类机构自建数据库的情况进行了调查。抽样的选择原则是尽可能确保所选样本具有代表性。因此,所调查的企业及科研院所都是广西百强企业及省级以上的科研院所;而公共图书馆均为地级市以上的公共图书馆;高校图书馆则主要是南宁、桂林、柳州三地的高校图书馆及各地市的本科院校图书馆。具体各类机构自建数据库的情况如下:
(1)对48家企业及科研院所进行了调查,其中41家有自建数据库,共计50个数据库,7家没有自建数据库。
(2)对12家公共图书馆进行了调查,其中7家建有自建数据库,已建成76个库(不包括馆藏书目数据库),另有1个自建数据库正在建,5家没有自建数据库。
(3)对51家高校图书馆进行了调查,其中29家有自建数据库,已建成87个库(不包括馆藏书目数据库),另有3个自建数据库正在建,22家没有自建数据库。
调查结果的统计数据见下表。表1广西机构自建数据库的调查结果
序号调查内容选项数量(个)比例(%)1是否有自建数据库(A)是7769.37(B)否3430.632数据库的类型(A)专家(或教师)成果库3733.33(B)专业(行业)数据库4641.44(C)其他2825.233数据库的学科类别(A)理工科类2724.32(B)文科类2522.52(C)医学类65.41(D)农学类2522.52(E)综合2825.234数据库的用户范围(A)本单位内IP地址限制使用6861.26(B)协议单位人员通过密码可登录使用2018.02(C)无范围限制,单位内外的用户均可使用2320.725用户对自建数据库的易获取程度(A)在单位网站主页即可进入数据库2623.42(B)需二次链接进入数据库5145.95(C)三次以上链接进入数据库109.01(D)其他2421.626数据库是否具有检索功能(A)是9585.59(B)否1614.417数据库的文件全文格式(A)PDF4036.03(B)HTML1917.12(C)其他格式5246.858如果全文是其他格式,
是否需下载安装专用阅读器(A)是5448.64(B)否5751.359数据库是否有使用帮助(A)是5549.54(B)否5650.4610数据库内容更新频率(A)日更新2522.52(B) 周更新76.31(C)月更新1210.81(D)年更新98.11(E)不定期5852.2511是否愿意与区内其他单位
建立合作共享关系(A)愿意5751.35(B)不愿意1917.12(C)其他3531.532.2 结果分析
从网站查询、电话询问及问卷等调查的结果,可以得到广西机构自建数据库的基本现状。
2.2.1 自建的数据库比较多。从查询调查结果看,包括在建的数据库,调查对象共有217个自建数据库,其中企业及科研院所自建数据库50个,公共图书馆77个,高校图书馆90个。从单馆建设数据库的数量来看,7个公共图书馆自建了77个数据库,每个图书馆平均自建11个数据库,而广西壮族自治区桂林图书馆自建了38个数据库,为各馆自建数据库之首。
另外,企业及科研院所自建数据库的机构比较多。在查询的48家机构中,有41家有自建数据库,而从问卷调查来看,近70%调查样本有自建数据库。但是,从各机构所建数据库的内容来看,内容交叉、重复比较多。如随书光盘(统计中有13家高校图书馆建有随书光盘数据库)、民族民俗资源库等。
2.2.2 数据库的易用性。从表1可看出,61.26%的机构自建的数据库只允许本机构IP地址范围内的用户使用,只有20.72%允许所有用户使用,还有18.02%需要根据协议,通过密码才能使用,可见数据库的使用范围非常小。而用户使用数据库时,只有23.42%的机构自建的数据库能够直接进入,其他机构自建的数据库都至少通过两次以上的链接才能进入。虽然85.59%的机构自建的数据库具有检索功能,并且49.54%具有使用帮助功能,但是4685%的文档是其他格式(指PDF、HTML之外的格式),而48.64%为其他格式的数据库需下载安装专用的阅读器,这也给用户的使用带来不便。另外,一些高校图书馆加入了CALIS, 一些公共图书馆也加入了全国文化资源共享的建设,这些机构自建数据库时,大都依托各自所参加的系统平台。而没有加入这些组织的机构,自建数据库所使用的平台就很杂乱了,从而使各机构自建的数据库格式各不相同。
总之,用户使用自建数据库不方便,数据格式各异影响数据库利用、数据交换、联网、资源的共享等。自建数据库是为了展现本地、本机构的独特资源, 如果不能被更多的用户利用, 显然违背了自建数据库建设的目的。
2.2.3 数据库的类型和更新情况。从表1可看出,广西机构自建数据库的类型和学科分布基本合理,但从数据库内容更新频率和数据库是否有使用帮助上看就不太理想。数据库内容更新频率慢,只有22.52%的机构自建数据库每日更新,周更新的也只有6.31%。从数据库是否有使用帮助方面来看,有一半的机构自建的数据库没有帮助功能,这说明自建数据库的功能还需要提高。
2.2.4 共享的情况。从表1可看出,51.35%的机构愿意把自建数据库进行共享,17.12%的机构不愿意,还有31.53%的机构没有表态,这说明虽然有一半的机构愿意共享自建数据库,但还有19家机构不愿意共享。这些机构多为企业、科研院,其原因主要是牵涉到机构信息数据的保密问题,担心共享会造成企业机密外泄,带来不可挽回的经济损失。高校和公共图书馆是信息资源主要的聚集地,多数选择愿意共享,这是实现信息资源共建共享的前提和基础。
3广西机构自建数据库未来发展的建议
从以上调查的结果看,解决广西机构自建数据库存在的这些问题,广西的信息机构必须抓住机遇,采取多方合作的方式,走共建共享之路,才能把广西独特的区位优势、丰富的自然资源、古朴原始的民俗风情等信息更好展示出来,告知有需求的信息用户,更好地服务广西,促进广西经济的发展。
3.1 抓住机遇,加快广西特色信息资源建设
广西地处我国大陆东、中、西三个地带的交汇点,既是华南经济圈、西南经济圈与东盟经济圈的结合部,又是西南乃至西北地区最便捷的出海通道,还是联结粤港澳与西部地区的重要通道。随着中国—东盟自由贸易区的建立和中国东盟博览会永久落户南宁,广西北部湾经济区上升为国家战略等,这些都给广西的经济、文化等方面带来了良好的发展机遇,也给广西的信息机构带来了巨大的挑战。如何服务好广西,服务好东盟,成为了广西信息机构建设的一项重要内容。广西具有沿海、沿边、沿江的区位优势,丰富的矿产、海洋和旅游等资源。旅游资源如从古至今享有“桂林山水甲天下”美誉之称的桂林山水,素有“东方夏威夷”美誉之称的北海银滩,世界第二大跨国瀑布——德天瀑布,地下原始森林面积位居世界第一、垂直高度位居世界第二的百色乐业大石围天坑等;古朴原始民俗风情,各具特色的广西各民族服饰、饮食文化、居住习惯。丰富多彩、形式多样的民俗节庆,如壮族的蚂拐节、苗族的芦笙节、瑶族的盘王节、侗族的花炮节、京族的唱哈节、南宁国际民歌节、北海的珍珠节等等 [2],为广西自建数据库提供了丰富的建库资源。目前, 广西的经济处在最好的发展时期,中国—东盟自由贸易区的建立, 给广西乃至中国企业的海外投资带来一个广阔的区域性市场。企业“走出去,请进来” ,不仅要了解广西的政策法规、社会秩序、基础设施、宗教信仰、生活习惯、风土人情, 还要了解跨国经营和新市场开发策略等,这更促使广西各信息机构必须加快广西自然资源建设的开发,开发出与中国—东盟自由贸易区和中国东盟博览会相匹配的具有地域特色的自建数据库,以扩大广西在全国乃至全世界的影响范围。
3.2 采取多方合作,实现信息资源共建共享
随着现代通信技术和数字技术的飞速发展, 人们已步入了信息化社会,信息资源的共建、共知、共享是社会发展的需要,是形势发展的必然。信息资源的合作共享需要投入大量的人力、物力和财力,这种能力并不是每个单位都具备的。因此,广西除了要加强各信息机构之间的合作,还需要与其他通信公司、IT机构数据商等合作,利用这些公司、机构强大的经济和技术实力及其丰富的建库经验,整合广西各信息资源共享平台的数字资源。目前,广西已建有的信息资源服务平台中,不少的平台在不同程度上进行了馆馆合作、馆企合作。如:广西科研情报系统,依托广西科技情报研究所、广西壮族自治区图书馆、广西大学图书馆等单位组建的“广西科技文献共享与服务平台”;桂林地区高校图书馆、公共图书馆及科研图书馆联合建设的“桂林工程技术文献信息中心”;广西师范大学图书馆自主制作了广西人文社科文献资源共享平台网页,并与超星公司合作,建成了广西社会科学文献资源保障体系与共享网络平台;高校图书馆联合建立的“广西文献资源共享与服务平台”,整合各高校参建馆本地镜像及远程可访资源,借用读秀平台与参建馆资源链接提供统一检索服务及索取传递服务;广西公共图书馆系统的“基于OAI-PMH协议的互操作广西文化信息资源共享系统平台” 等[3]。广西应加强各平台之间的大合作,借鉴国内外资源共建共享的成功经验,建立全区的协作机制。如成立文献信息中心发展协调委员会,协调各平台之间、各信息机构的关系,制定相关条例,多渠道开展合作,把全区各个平台和各信息机构作为协作网的节点来传递信息,实现数字资源的共建共享。
3.3 逐步扩大开放自建数据库的访问权限
知识产权问题已成为制约信息机构自建数据库建设和利用的瓶颈,导致很多自建的数据库只能内部浏览而不对外开放,造成大量的信息资源处于闲置状态,降低了信息资源的利用率,浪费了大量的人力、物力和财力。因此,在访问权限问题上应采取相应的措施。对于未涉及知识产权的自建数据库资源,完全可以对机构外的人员开放;对于涉及知识产权的自建数据库资源,在没有解决知识产权之前只能对本机构内部的人员使用,机构外的人员只可以浏览文献的题名、作者和摘要;对于机构外的人员要获取文献全文的数字资源,可以提示机构外的人员从其他合法途径去获取或者通过联盟组织帮助用户获取[4]。如CALIS(中国高等教育文献保障系统)是国家经费支持的中国高校图书馆联盟,投入了大量的人力、物力和财力。CALIS具有丰富的数字资源,建有中外文图书、电子期刊、学位论文、经典专著、教学参考用书和其他重要文献等全文数据库; 联合书目、现刊目次、重点学科导航等二次文献数据库;中国工程技术史料、古文献等50多个跨学科专题特色数据库以及部分工具性数据库, 同时通过引进国内外数据库资源, 形成以数字化图书期刊为主、覆盖所有重点学科的学术文献资源体系[5];还可以通过数据库向导,根据机构外人员的不同类型进行设置,使不同类型的机构外人员拥有不同的访问权限。
3.4 加强自建数据库后期的维护、更新和宣传
建设自建数据库是一个不断补充、不断完善的工作。及时或定期对数据内容进行维护和更新,以保证自建数据库的新颖性。目前,版权问题也是自建数据库建设的一个关键问题,对没有解决版权的信息资源要尽快解决,以提高自建数据库的利用率。在解决版权问题上,对于原有资源,可以直接由著作权人授权,图书馆征得著作权人的同意,也可以借鉴国外图书馆的做法,采用“著作权补偿金制度”,也可以与出版商合作取得著作权的授权,还可以同著作权集体管理机构签订授权许可协议。对于网络信息资源, 目前我国还没有一个同网络管理相结合且方便使用的著作权管理制度, 因此, 信息机构通常可采用以下两种处理方式: 对于社会公有信息, 除非作者做出特别声明,否则信息机构就可以自由使用;受到著作权保护的网上作品,只要明确了是哪位著作权人的作品, 无论是局部用或全文使用, 信息机构都要与之取得联系获得授权,并支付一定报酬[6]。注意搜集在使用过程中的反馈信息,并及时修正,以保证数据的完整性,还要重视后期的宣传,不要让建设好的特色数据库存在“养在深闺无人识”的现象。宣传可以利用人们常用的通讯工具——手机,通过短信、微信等方式进行,在宣传的同时,还可以与用户进行互动,争取用户将自己的信息资源无条件赠送给本机构,存贮到本机构的自建数据库中,以充实已有的数据库。
4结语
机构自建数据库的建设工作是一项集资金、人员、设备、技术和产品运营于一体的系统工程,需要花费大量的人力、物力和财力,不是某个机构有能力完全做好的。建立多方合作,实现共建共享,优势互补是自建数据库未来的发展趋势。实践也表明,自建数据库的地方信息资源越突出,越具特色,就越符合信息用户的需求, 其价值就越大, 给其地方带来的经济效益也就越高。因此,广西各信息机构应加大自建数据库的建设,承担起为中外各界人士提供广西特色资源信息的责任和义务,为广西经济的快速发展做出贡献。
[参考文献]
[1] 郑立琴.高校图书馆自建数据库系列问题研究——广义电子资源及其管理与利用问题(二)[J].现代情报,2006(12):22—24.
[2] 陈建红,黄燕芬.从广西经济看广西特色数据库建设[J].中国西部科技,2007 (4):117—118,109.
[3] 廖球,莫崇菊.论广西区内文献信息资源共享的方式[J].江西图书馆学刊,2011(3) :30—33.
[4] 陈锦波.广州大学城高校图书馆自建特色数据库现状调查分析[J].图书馆学研究,2013(14):45—51.
[5] 陈凌,姚晓霞.中国高等教育文献保障系统共享服务及其成效[J] .医学信息学杂志,2010(1):11—15.
[6] 李三凤.我国高校图书馆特色数据库建设研究[D].湘潭:湘潭大学,2006:18.
[收稿日期]2014-01-16
[作者简介]冯广珍(1961—),女,馆员,广西师范学院图书馆,发表论文多篇。
[说明]本文系2013年CALIS广西文献信息服务中心预研项目“广西机构自建数据库建设及其共享模式研究”(项目编号:CALISGX201306)的研究成果之一。(上接第20页)性主要体现在信息处理机制上的灵活性、特色数据库建设标准上的灵活性、各节点的可增减性。特色大数据库系统不会因为一个虚拟数据中心或子节点的丢失而影响整个系统的运行,其他中心会自动替代已丢失的中心来处理用户的需求。在特色数据库内容建设上,不必太多考虑各个类别数据建设的标准和差异,各子节点可以在数据标签的基础之上,结合数据库的特性自定义内容字段。在整个特色大数据系统中,每一个子节点都是一个独立的计算单元和存储单元,相互间没有必然联系,可以根据需求和实际情况对子节点进行调节。
6结语
大数据带来了大机遇,高校图书馆特色数据库的建设应适应时代的发展。本文根据大数据时代的特点,结合各高校图书馆特色数据库的建设现状,提出了大数据时代特色数据库的建设模式,设计了用户信息的获取机制,利用“数据标签”将分散在不同高校不同类别的特色数据库虚拟集中起来,实现了统一展示、统一检索的功能,提高了资源的利用效率,特色大数据库系统的灵活性让它的优势尽显无遗。
[参考文献]
[1] 刘莹.我国高校图书馆特色数据库建设现状及发展策略研究[J].图书馆学研究,2008(7):36—38.
[2] 王嫚茹.东北地区高校图书馆特色数据库建设现状的调查与分析[J].图书馆学研究,2010(6):59—65.
[3] 黄艳芬.广东省高校图书馆特色数据库建设现状与对策[J].图书馆论坛,2008(2):144—146,157.
[4] 王金秀,张洁.湖北省高校图书馆特色数据库建设现状及发展策略研究[J].情报探索,2011(12):74—77.
[5] 林泽花.湖南省高校图书馆特色数据库建设现状及对策研究[J].高校图书馆工作,2011(1):52—54.
[6] 陈斌.知识管理视角下的图书馆知识服务[J].兰台世界,2013(14):101—102.
[收稿日期]2014-01-08
[作者简介]谭黔林(1983—),男,馆员,在读硕士,河池学院图书馆,研究方向为数字图书馆建设与图书馆微观服务。
[说明]本文系2012年度广西高等学院重大科研资助项目“河池少数民族文献信息资源共建共享研究”(项目编号:201202ZD082)与河池学院青年科研基金项目“广西高校图书馆特色数据库建设研究”(项目编号:2012B-H007)的成果之一。