APP下载

CALIS三期专题特色数据库建设体会

2014-03-28黄昭彦

图书馆界 2014年1期
关键词:元数据

黄昭彦

[摘要]通过参与CALIS三期特色库子项目《广西与东盟民族文化旅游信息库》的建设过程,阐述了CALIS三期特色库建库原则、对参与馆的技术支持,并就广西与东盟民族文化旅游信息库的建库思路与过程、存在问题进行了论述。

[关键词]CALIS;专题特色库建设;元数据;民族文化旅游信息库

1CALIS三期特色库的技术支持与建库原则

专题特色数据库是CALIS持续建设的子项目之一,经历了 “九五”“十五”两个阶段的积累,其中一期项目(1999—2000)建成专题特色库25个;二期项目(2003—2006)建成特色库55个,数据总量445万多条,全文比例达到38%;三期获批立项220个,建成并验收合格162个。

1.1 技术支持

1.1.1 建设基于SaaS技术的CALIS本地特色数据库系统共享版免费提供给成员馆使用。二期建设中已经通过CALIS认证的系统平台,或者未经CALIS认证但符合CALIS标准的都可继续使用。新参建的高校图书馆,由CALIS免费提供通用共享软件系统,成员馆可在无需高成本投入、无需担心系统高成本升级的情况下开展特色库建设。

1.1.2 二期时已制定了11类元数据规范及著录规则,三期进一步完善,并制定了基于SaaS技术的特色资源组织规范、存储规范、发布规范等一整套CALIS特色数据库标准规范体系。

1.1.3 升级CALIS全国高校专题特色数据库中心服务系统,由“特色数据库中心服务系统”和“参建单位建库系统”二级系统构成,形成统一元数据集和分散对象数据的架构。中心服务系统和参建单位系统均遵循相同的标准和规范,在统一的系统框架下形成二级系统之间的信息共享和信息交换机制,使整个系统具有开放性和可移植性。[1]

1.2 建库原则

1.2.1 遵循“分散建设、统一检索、资源共享、服务全国”的建设思路,全面挖掘、整理各类高校未开发利用的资源;重点资助独有或稀缺资源的数字化建设,网络原生数字资源的挖掘和整理;继续支持具有良好前期成果、学科特色、地方特色或民族特色鲜明的专题库建设;带动特色数据库建设的标准化,形成集中式的特色资源元数据仓储和服务平台,面向全国用户提供特色资源服务。

1.2.2 建库要求。可涵盖与选题有关的各种类型的文献,包括题录、文摘、全文、图像、音频、视频等。数据库应具有一定规模的数据量,其中数字对象比例应不少于30%,对确实属于独有、稀缺、内容有限的特色资源,数据量不作限制。数据库应统一按照《CALIS专题特色数据库描述元数据规范》中所规定的元数据规范进行标引。数据库应遵循CALIS特色库提出的框架体系和栏目设置要求。

1.2.3 服务模式。所有立项特色库均须免费开放元数据并提供公开的元数据检索,所有立项特色库的元数据均须被CALIS专题特色库中心系统收割并发布,所有立项特色库中不涉及知识产权的内容应能够直接提供全文;涉及知识产权的内容应提供文献传递服务。所有立项项目必须承诺永久运行,持续服务;如果遇到特殊情况不能再继续运行,须移交CALIS,允许CALIS进行维护或将该数据库委托其他单位进行维护[1]。

2广西与东盟民族文化旅游信息库建库思路

2.1 广西与东盟各国的民族渊源

东盟包括越南、文莱、缅甸、印度尼西亚、马来西亚、老挝、柬埔寨、菲律宾、泰国、新加坡等10国,这些都是民族众多、种族多元化的国家,与我国历史交往源远流长。广西是我国面向东盟的重要门户和前沿地带,拥有绚丽多姿的民族文化、灿烂辉煌的历史古迹和雄伟壮丽的山水风光。世居民族壮族与东南亚诸国泰、老、掸诸民族之间有着深远的渊源关系。20世纪90年代以来,东南亚各国的学者和相关人士纷纷到广西寻根问祖。从现代旅游业的发展趋势来看,这些都是富有强大吸引力、可供进一步开发、能够永续利用的旅游资源。

2.2 经济建设与旅游发展的需要

广西南宁已成功举办过10届东盟博览会,“中国—东盟”自由贸易区如期建成后,中国与东盟的贸易占到世界贸易的13%,中国和东盟各国越来越重视发展双边的经贸合作。东盟已成为中国吸引外资的重要来源地,也是中国企业“走出去”的首选地之一[2]。东盟各国文化交汇,经济快速发展,市场广阔,旅游业蓬勃发展,其中新加坡、马来西亚、泰国已逐渐成为世界著名的旅游胜地。目前,国家正积极推动广西与东盟各国合作开发民族文化旅游,力争把广西建成中国连接东盟的旅游大通道,进而成为与东盟国家连成一片的旅游目的地。

2.3 为教学与科研提供多维度的信息资源

多途径、多角度地采集该区域多民族原生态的民俗民风、宗教礼仪、风光、景观等电子和纸质信息,尤其突出视频、图片及特色资料的收集。经数字化加工平台整合在同一数据资源库中,编制出关联的检索条件,通过网页实现多模块的展示和检索,用以补充历年来此类资源在图书馆藏数据的严重不足,也为东盟旅游人才的培养提供快捷而针对性的区域情报服务。这既是对多年来该区域内许多不被重视、散落各地的民族文化的良好收集和整理,又是对广西与东盟旅游文化底蕴的较好补充。同时,借此大力宣扬广西和东盟的民族文化,努力推进该区域民族文化旅游产业的快速发展,为“中国—东盟”无国界旅游区的形成贡献一丝绵薄之力。

3广西与东盟民族文化旅游信息库建库过程

3.1 标准规范

广西与东盟民族文化旅游信息库严格遵循了特色库建设的基本信息规范、元数据规范、对象数据加工规范、资源组织、数据转换、资源检索、资源获取和展现、互操作接口、平台技术规范、业务管理规范、数据与系统安全规范等11类标准规范进行操作与建设。

3.2 子库构成

广西与东盟民族文化旅游信息库目前主要由图书库、期刊库、图片库、视频库、音频库组成,后期继续开发学位论文库、旅游网站导航库、政策法规库、舆图、地方志。

由于建设期只有8个月,地方与区域民族文化资源收集存在着一定的难度,至验收时,加工完成的文摘量为7 274条,文本全文4 586条,视频全文632条,图像全文425套。信息库的初期建设成效基本满足了专业人员对广西与东盟民族文化的概况了解和常规科学分析。

3.3 元数据著录细则

对象数据加工严格遵循CALIS对资源的元数据标准及著录规则,一条元数据可以对应多个对象数据,每个对象数据在系统中有CALIS-OID唯一标志,并符合《CALIS数字对象唯一标识符命名规范》[3]。核心元素按照CALIS专题特色库元数据规范和著录规则:期刊论文、学位论文、会议论文、电子图书、音频、网络资源、舆图、地方志。字段类型和属性依据读者检索习惯,选择了题名、责任者、出版者、出版地、出版年、ISBN/ISSN、摘要、主题、关键词、语种、中图分类、标志等。

3.4 数据发布

数据加工及审核完成后,建立各子库的唯一仓储标志名,将元数据发布到CALIS管理中心部署的发布平台,CALIS直接从发布平台收割数据。CALIS三期特色库通用系统1.0较好地解决了本地系统建设平台与“中心服务系统”共同形成的统一元数据集和分散对象数据的二级系统构架,中心服务系统和参建单位系统均遵循相同的标准和规范,在统一的系统框架下较好地形成了二级系统之间的信息共享和信息交换机制。

3.5 用户使用

桂林理工大学南宁分校在图书馆主页中设置了特色库链接点,读者可通过校园网IP直接登录到CALIS中心服务平台,通过查找关联词,经“资源搜索”“高级检索”“跨库检索”等功能,不仅能获取本馆特色库的资源,还可检索出CALIS其他高校特色库的相关资源。

4存在问题

4.1 资源类型及范围有待不断扩展

广西是中国西部边疆少数民族省份,东盟10国是亚洲南部沿海的一些国家,长期以来欠缺对这块区域民族文化的收集与分析研究,有很多原生态的文化资源散落民间没有得到很好的保存和记载,而这些对国家及民族之间经济与文化的传承、交流、互助互惠却起着举足轻重的作用。

为有效丰富和拓展广西与东盟民族文化旅游信息库的数据资源,在今后长期的建设过程中,除收集与加工有文献记载的数据外,还需要利用各种方式方法采集该区域独有的资源,同时借助本地小语种人才对东盟国家出版物有选择性的翻译和转录,逐渐形成该库独有的特色库资源。

4.2 专业性人才的培养

在三期特色库建设过程中,CALIS对大部分参建馆提供了强大的技术支持,使参建馆员能将更多的精力投入到资源的收集、分析、加工工作中,但由于建设期太短,新参与的多数馆员对特色库的标准、规范尚未获得足够的认识与理解,本地系统建设平台的运营与维护也需要专业性的计算机人才,这些或多或少都给数据的加工与发布带来了一定的影响。同时,特色库数据资源的可靠性、适用性、安全性也需要参建馆员审核、把关。因此,为保证特色库建设长期有序进行,建设人员的固定性及专业性理论与技能培养是必不可少的,这些都需要CALIS的初期培训支持和参建馆的后期互相磨合学习。

4.3 特色库展示平台功能需进一步强化

三期特色库验收时,中心服务系统已将各参建馆的数据集合在了同一平台上,通过开通IP向读者提供检索服务。由于三期特色库通用系统1.0是CALIS与方正公司共同研发的软件系统,随着三期项目的结项,研发工作也暂告一段落,从而造成平台功能的不完善,读者检索及申请资源服务存在极大的缺陷,这些都是系统后期研发工作中需要改进和强化的功能。

5结语

通过广西与东盟民族文化旅游信息库的建设,对区域性民族文化进行了细致的收集、分析、加工和发布,有效推进了广西与东盟各国民族文化的宣传与推广。对图书馆员而言,在参与CALIS三期特色数据库子项目建设过程中,对元数据的著录规范与细则有了深切的体会,为后期各类型特色库建设积累了许多经验与教训。同时,我们也看到CALIS在特色库建设中不断呈现的成效,从一、二期至现在的三期,CALIS已将全国各高校分散性的特色库资源统一到中心服务系统的整合平台中。虽然目前的发布系统仍存在许多的缺陷,但相信四期的特色库建设定会在信息检索与资源导航、网站的交互性、个性化定制服务等问题上取得突破性的进展,也为广大教学与研究者方便快捷地使用特色库资源搭建出优秀的服务平台。

[参考文献]

[1] CALIS三期特色数据库项目管理组.CALIS三期专题特色数据库建设方案、进展及要求[R].2011.

[2] 赖石成,钟伟.中国与东盟各国间的贸易与FDI关系实证研究[J].东南亚纵横,2011,7(7):16—20.

[3] CALIS三期特色数据库项目管理组,武汉大学图书馆资源组织部.CALIS三期专题特色数据库——建设标准规范[R].2011.

猜你喜欢

元数据
元数据国际交换共享的客家古民居数字记忆工程建设
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
利用VB读取中国知网过刊数据提取元数据的研究
财会信息资源元数据标准的研究
基于隐语义模型和用户信任的个性化推荐模型
基于关联数据的语义数字档案馆框架设计研究
基于角色控制的异构数据展示在企业门户中的应用
基于元数据映射机制的异构数据操作