民办高校特色文献资源数据库建设探讨
——以基于DIPS平台建设民办高等教育特色资源数据库为例
2012-04-08戴建新
戴建新
(广东培正学院 图书馆,广东 广州 510830)
民办高校特色文献资源数据库建设探讨
——以基于DIPS平台建设民办高等教育特色资源数据库为例
戴建新
(广东培正学院 图书馆,广东 广州 510830)
特色资源数据库便捷地实现了学科资源集中化,有利于提高信息资源的获取效率,推动高校教学和科研的发展。以基于DIPS平台建设民办高等教育特色资源数据库为例,探讨和总结如何建设特色文献资源数据库,对民办高校特色资源数据库建设具有重要借鉴作用。
民办高校;特色数据库;数据库建设;数字资源
中国民办高等教育事业飞速发展,以民办高等教育为主题的各种类型的数字化文献资源不断增加,形成数字资源的多样化。一方面,结构不同,来源不同,提供方式不同的各类数字化文献资源给数字资源的使用、资源的整合、统一管理和访问服务带来诸多困难;另一方面,民办高校普遍存在经费紧缺问题,无力购买大量的数字化资源。因此,如何将多样化的异构资源整合成一个有机的整体,建立民办高等教育特色文献数据库,解决民办高等教育研究日益突出的信息孤岛现象,为民办高等教育研究提供良好的信息服务,推进民办高等教育事业的发展具有重要的实用价值。
建立民办高等教育特色数据库的目标是充分开发和整合馆藏资源和网络信息资源,全面收录国内外民办高等教育纸质版、电子版、声像版、图片、网络版等各类数字化资源,使文献信息资源数字化和网络化,为研究人员提供全面、系统、高质量的文献资源和便捷高效的获取途径。数据库建设采用元数据收割协议,方便用户收割元数据,有利于文献资源共享。
一 建库原则
围绕民办高等教育研究的实际应用需求,把应用、开发和研究三者紧密结合。重视原始信息的利用和管理,加强信息资源的重组导航和集成整合,通过现代信息技术,使数据库建设的局部建设与整体规划有机结合,更好地发挥规模效益和整体优势的建设原则,具体实施体现在以下几个方面。
1.先进性。先进性不仅是效率的保证,更是长期投资的保障。首先要内容新颖、功能突出。数据库内容能够满足特定信息需求,丰富多样、覆盖面广,并有一定深度,足以反映学科前沿、水平和热点。信息数据可检索性强,能适应脱机、联机和网络检索,直接获取一次文献。其次要技术先进。采用先进的国际元数据标准和XML技术,对数字资源进行收集、加工、整理,达到统一规划与管理。支持对文献资源、光盘资源、音视频、各种数据库资源的加工、管理及利用,从多角度、全面揭示资源。对有价值的图像、文本、语音、影像、影视、软件和科学数据等多媒体信息进行搜集,组织规范性的加工,进行高质量保存和管理。
2.开放性。开放性是资源共建共享的基础和首要条件。它既要保证资源的共享,得到授权的用户在任何时间任何地点通过网络都可得到各种服务,又要保证资源的统一,各个资源建设单位必须服从整体协议。
3.安全性。通过对数字资源访问权限管理,用户访问权限设置,网络访问地址限制,加工、管理权限设置,从而确保内部数据的安全性和保密性。
4.标准化。数据库的建设应遵循相应的国际、国内业界标准,如Calis的标准。采用标准的元数据标准、中文核心元数据标准和MARC数据格式,符合中国信息资源建设的规范与标准,使资源大范围地共建共享成为可能。
5.兼容性。不但能与已有的数据库系统兼容,具备强大的扩充性和升级能力,而且能实现跨库检索,跨网站检索。
6.开放接口。提供具有开放性的接口,具备扩展性和可移植性。可以方便地根据项目具体需求进行二次开发,满足个性化的需求,或实现应用集成和相互操作。
二 数据库规划和建设方案
1.数据库系统开发平台和硬件系统的确定。
特色数据库的建设过程是通过软硬件平台实现的,其中软件平台一般指的是各种数据资源平台。常见的数据资源平台有清华同方的TPI系统、北大方正的德赛(DESi)系统、北京拓尔思的TRS平台、中国数图公司的DIPS系统等。这些系统虽然均可以完成数据加工、管理、发布等工作,但又具有各自的特色功能。我院数据库建设系统平台选用“DIPS高校特色资源库建设与发布系统”。DIPS系统是一套以全文检索技术为基础,互联网内容管理为核心,集资源数字化加工、数字内容管理、信息情报发布检索利用于一体的互联网内容建设基础平台软件。它能够满足大容量数据及多并发用户的要求,是新一代集文档影像的数字化加工、存储和全文检索的信息管理支撑平台。使用DIPS及其相应的辅助工具,可以将图书馆及文献机构中已有的各种海量信息资源,快速构建起基于互联网的信息资源库,并对这些资源进行统一管理和维护。利用DIPS提供的强大的全文检索技术,为使用者提供简便、快捷、准确的信息服务。同时,可以利用DIPS提供的收费管理功能,向社会提供有偿的特色信息服务,让信息资源发挥更大的应用价值。
数据库硬件系统由服务端和客户端两部分组成,服务端由一台服务器、一台磁盘阵列和几台管理录入计算机组成。服务器用于数据库的索引库和全文数据库,并负责数据的管理和发布, 提供按照字段查询和全文检索服务,并提供Web 服务和资源共享服务。磁盘阵列主要存放论文、电子图书、图片、视频等数字资源。管理录入计算机用于收集、加工数据和数据入库,如数字化处理、标引分类和相关管理。
服务器配置要求为:P4以上CPU,内存不少于512MB,一个可用空间足够大的独立硬盘或分区。操作系统可使用的对换空间最好在100MB以上,局域网连接设备。DIPS系统的软件运行环境要求并不高,当前主流的服务器以及计算机足以符合要求。通过对初期计划的资源存储情况调查,结合未来数据扩充的需要,选择了HP ProLiant DL388 G7服务器和HP MSA 2012磁盘阵列,MSA 2012放置有12个1TB的HP SATA硬盘,为确保数据安全,建立了RAID6阵列。
在局域网上,通过安装PDF 文档阅读工具、DIPS 文档阅读工具和其它多媒体播放器工具等, 可以对数据库的所有数据进行浏览检索。
2.数据库系统设计及实现。
(1)确定子库及字段。按照Calis数据库的建库标准和“民办高等教育文献资料数据库”的结构模块,创建了14个子库,包括民校概况、民校图库、办学规模、专业概况、专家学者、期刊论文、学位论文、图书著作、国外政策法规、国内政策法规、师资力量、招生就业、科研成果、文献保障。再根据每个子库的特点定义各库的字段,从而完成数据库字段的设定工作。
(2)获取和收集数据。数据的收集是数据库建设过程中十分重要的环节。为了保证收集信息的权威性和完整性,特别要注意以下几方面:① 确定合理的收集范围,包括时限范围、文种范围、地域范围、学科范围等。② 确定信息源的种类,包括期刊、图书、专利文献、学位论文、论文集、报告及网络信息等;③ 确定收录信息的形式,包括文字、图片、表格、音乐、动画及其它多媒体信息。④ 确定获取信息的途径。纸质文献获取资料的途径包括:期刊目录、综合性书目、著作目录、民办高等教育研究论文索引、论文集、资料汇编、学报和一些综合性普通教育期刊常设的高等教育专栏或固定栏目。电子文献获取途径包括:本馆已购买的电子数据库、互联网上主要民办教育文献信息源的网址、利用搜索引擎进行信息检索、利用专门教育文献数据库检索、登录各民办高校网站及其图书馆网站等。
(3)数据加工及入库。DIPS系统数据加工子系统采用C/S结构,一个或多个客户端用户能够独立或协同完成纸质资源的数字化加工。为了避免数据加工混乱,按照模块进行任务分配,即每个人员负责一个或几个模块,完成对象数据加工和元数据加工,对各种已有的电子资源(如:PDF、DOC、HTML等格式化文本,TXT纯文本,MARC数据,ODBC关系型数据,MP3、MPG、WMA、WMV、SWF、RM等多媒体数据,JPEG、BMP、TIF等图像数据,各种资料光盘数据及其它自定义格式等)进行批量处理、转换和导入等获取系统原始数据,再经过数据审核、装订、校对、标引等深加工处理,形成数据库的入库文件,最后形成数据库的源数据。数据入库时采用“SQL转Dips批量装订工具”,将加工好的数据批量入库。
(4)数据库网页设计与资源发布。DIPS网络发布与管理子系统采用B/S结构,通过标准IE浏览,完成DIPS数据库的网上发布、检索和应用服务。网络发布与管理系统遵循相关国内外标准、CALIS标准规范。如:XML语言编写发布界面、CALIS特色库本地网站基本服务规范、网站功能元素服务规范等。网页提供包括栏目检索、全文检索、二次检索和跨库检索等多种多样的检索方法,满足访问者“快而准”查找所需信息和资源的要求,方便用户操作。
三 数据库建设需要注意的几个问题
1.数据库的质量。在数据库的建设过程中必须严把质量关,要及时修正错误数据,确保数据的准确性、完整性和权威性。标准化是数据库建设的生命,是建设高质量特色数据库的根本保证。数据库建设应遵循相应的国际、国内业界标准。它不仅保证了数据库的可靠性、系统性、连续性、完整性和兼容性,而且有利于实现真正意义上的网络信息资源共享。
2.系统更新和维护。数据库的内容是动态的,数据要及时更新,保持数据的新颖性和有效性。由于应用环境的不断变化,数据库运行过程中物理存储会不断变化。因此,对数据库进行评价、调整、修改等维护工作是一个长期的任务,要保证和提高数据库系统运行的可靠性、安全性、协调性和运行效率。
3.尊重知识产权。在收集资料时应严格遵守有关法律法规,充分尊重并保护原作者的相关权利, 高度重视知识产权,在法律及协议许可范围内使用相关资源。
4.人才队伍建设。高素质人才队伍是建设特色数据库的核心和关键。特色数据库建设不仅需要图书馆专业人才,也需要计算机专业人才,以及与数据库学科相关的专业技术人才。因此,要想建设高水平的特色数据库,必须有一支专业配置合理的人才队伍。
[1]赵永强,曹欢增,冯军.高校图书馆特色数据库建设流程的研究——以基于DESi平台的制盐特色数据库为例[J].电脑知识与技术,2011(3):1477-1480.
[2]陈晓.基于DIPS 的高校图书馆特色数据库建设[J].情报探索,2008(7):50-51.
[3]代根兴,吴旭.高等教育教学成果相关文献数据库建设研究[J].情报科学,2003(11):1201-1203.
[4]李三凤.论高校图书馆特色数据库的建设[J].科技情报开发与经济,2005(5):41.
ClassNo.:G250.73DocumentMark:A
(责任编辑:郑英玲)
DiscussionofConstructionofLiteratureResourcesDatabasewithCharacteristicinPrivateUniversities
Dai Jianxin
The construction of resource database with characteristic materialized the centralization of disciplinary resources, and improve the efficiency to obtain the information resources ,it also promote the development of college teaching and scientific research. Based on DIPS private higher education platform, this paper discusses how to construct the literature resources database with the characteristics, which is used for reference for the construction of the resource database with characteristic.
private universities;database with characteristics;database construction;digitalized resources
戴建新,助理工程师,广东培正学院图书馆。
1672-6758(2012)11-0155-2
G250.73
A