地域特色图片数据库的设计与建设——以岭南工艺美术专题研究数据库为例
2014-01-01张婷
张 婷
(广州美术学院图书馆,广东 广州 510006)
1 引言
随着图书馆数字化建设的深入发展,各高校图书馆结合各自的学科特色、馆藏特色及地域特色,积极参与特色数据库建设,对馆藏的特色资源进行分类整理和数字化加工,以拓展图书馆的服务功能。
广州美术学院是扎根于岭南的唯一一所高等艺术类本科院校,“传承岭南文化,弘扬和继承发展岭南文化”是学院师生教学研究的特色和重点之一;学校图书馆不仅收藏了较为丰富的岭南民间工艺方面的著作和图册,而且一直注重搜集和整理相关的各类资料。为了更好地传承和推广岭南民间工艺,2011年开始,广州美术学院图书馆以中央财政支持地方高校项目“数字化美术与设计文献资源服务体系建设”为契机,开始对岭南民间工艺进行系统的资料搜集、整理和研究,着手建设岭南工艺美术专题研究数据库。
岭南工艺美术源于明代广州民间“广彩”,盛于清代的石湾微雕,传承岭南文化“先进性、革新性”的精神,并自成一体,成为岭南文化中独有的一部分。岭南工艺美术以传统民间手工艺品为主,包括广州的三雕一彩一绣(牙雕、玉雕、木雕、广彩、粤绣)、枫溪陶瓷、石湾公仔、佛山剪纸、肇庆端砚等,这些无不包含着独特的艺术个性,体现出丰富的岭南文化内涵。岭南工艺美术具有重要的历史、艺术和科学价值,对传承岭南民族文化血脉、继承和弘扬民族精神有着重要的作用。
我们期望通过本项目的实施及成果推广,能让社会更好地了解传统的岭南工艺,感受岭南传统工艺奇思妙想的灵感和巧夺天工的技艺,了解这些终身从艺的实践者、艺人、工艺美术家,更希望能借此促进社会对传统工艺的重视和传承。
2 数据库的框架设计与功能特色
特色数据库建设是一项繁琐浩大的工程,从数据库框架的设计到建设内容的策划,从用户界面设计到数据筛选与加工,从数据的著录规范到验收发布,都需要投入大量的精力和时间,而且每一步都需经过细细斟酌和反复修改才得以确定。
2.1 框架设计
数据库的框架设计至关重要,只有搭建好框架,才能进一步着手建设工作。岭南工艺美术专题数据库既包括文字资料还包含大量的图片资源。依据资料的类型划分,将底层库分为电子图书库、图片库、期刊论文库、人物库、媒体报道库、网络资源库、专业名词库等7个子库。
数据库横向分类的一级类目包括工艺美术作品、工艺美术家、专题研究论著、工艺美术词汇和网络资源,其中专题研究论著又细分为著作、期刊论文和媒体报道等二级类目。同时,本数据库还采用了纵向专题分类树的形式,将工艺美术分为民间刺绣、民间雕刻、民间剪纸、民间陶瓷、民间彩扎、民间绘画与年画、砚刻等类目,使每一个横向类目的内容同时按纵向分类树进行分类聚合。
图1 岭南工艺美术专题研究数据库横向类目
图2 岭南工艺美术专题研究数据库纵向类目
2.2 用户界面与数据库功能设计
数据库最终实现的功能也需在搭建框架时一并考虑,数据的组织方法是仅供在线浏览还是可供下载,图片的呈现方式、缩放功能,是否提供全文跨库检索等,都需经过深思熟虑、反复斟酌。岭南工艺美术专题研究数据库采用“纵向目录——传统民间艺术分类法”和“横向目录——专题分类”来揭示资源内容,可衍变出的资源组织方式和搜索角度灵活多样;提供了条目检索和全文检索及逐条记录浏览方式,期刊论文及媒体报道提供了在线浏览和下载功能;电子图书提供了在线浏览功能,部分直接链接至超星电子图书界面。所有工艺美术作品图片均可通过高清度展示,实现全图缩放、细节缩放、特定权限高清下载等功能,充分满足读者的各种个性化服务需求,形成大众读者的欣赏交流平台,可支持专业人员阅读、鉴赏和学习。
美观、友好的用户界面决定了数据库能否吸引用户使用以及功能能否完全实现,数据库主页面的设计需同时兼顾页面的美观实用和简洁明了,从数据库主页的色调、分类布局到封面页和首页的设计,以及数据库列表的显示模板,都要经过建库者与设计师的多次讨论磨合、反复修改。岭南工艺美术专题数据库的导航条和标题文字采用与广州美术学院主页相同的深红色调,导航条下面的左边是用户检索,可实现跨库的全文检索,中间显示工艺美术分类及专题研究,右边显示两幅不断变换的岭南工艺美术图片,整个界面简洁清晰,主题突出。
3 数据库的内容建设与发布
3.1 资料的收集与筛选
资料收集和筛选决定了数据库建设的质量。岭南工艺美术涉及范围较广,较为出色的传统工艺包括粤绣(广绣和潮绣)、潮州木雕、枫溪陶瓷、石湾公仔、佛山剪纸、肇庆端砚、广州牙雕、玉雕、灰塑等,相关图片及文字资料的查找分别以这些传统工艺名词作为主题词进行检索。通过本校图书馆收集或购买纸质资源或电子资源,同时进行网络资源收集或相关的展览收集。资料的查找类型与7个子库相对应,分别为文献著作、图片、期刊论文、工艺美术家资料、网络资源、专业词汇等。
①电子图书库:电子图书库是为了将岭南工艺美术相关的著作集中整合,供研究者使用。馆藏的相关著作进行扫描数字化加工,已购买的超星电子图书则直接链接到超星数字图书馆平台,整合有用的数字资源。
②图片库:图片库是为了以直观的形式集中展示岭南民间工艺美术作品的精美,资料的收集从馆藏图册着手,查找岭南工艺美术图片,进行对比筛选后,挑选出质量较高且具代表性的图片进行扫描数字化。
③人物库:通过《工艺美术家词典》等百科全书,挑选出岭南工艺美术家的资料,通过ORC识别系统对艺术家简介进行数字化,并通过作品集、著作、网络等载体收集工艺美术家的照片,由人物简介、照片及所获荣誉等字段形成人物库。
④期刊论文库:利用岭南工艺美术及其具体的岭南工艺类目作为检索词,如“端砚”“石湾公仔”“广彩”“粤绣”等,通过CNKI、维普等期刊全文数据库进行检索与筛选,下载到本地计算机进行组织整理。
⑤媒体报道库:媒体报道库是通过报纸、网络等媒介,收集对岭南工艺美术及工艺美术家进行报道、研究、评论的文章。
⑥网络资源库:搜罗与岭南工艺美术相关的网站,对其进行简单的描述和评价,集中展现,为研究者提供有用的专题网络导航。
⑦专业名词库:工艺美术词汇是以《英汉·汉英工艺美术造型艺术词汇》为蓝本,筛选了4000多条工艺美术词汇,作为简单的英汉对照参考工具。
3.2 资料的数字化加工和组织整理
由于数据的加工、组织和整理需要耗费大量的人力及物力,为了更好地完成数据库的建设,以“数字化美术与设计文献资源服务体系”建设项目为契机,数据库的数字化加工与元数据标引外包给中标公司,数字化加工包括纸质图书的批量扫描及OCR识别处理,图片的扫描、裁剪、对比度和亮度调节等。元数据标引主要是针对图片资源的字段标引和媒体报道的字段标引,电子图书可直接导入Marc数据,期刊论文则直接引用CNKI的数据。
中标公司采用的是汉能的DIPS文献处理系统。DIPS系统以全文检索技术为核心,集成了信息资源的采集挖掘、加工整理、数据库建设管理、内容发布与检索利用等功能,能够满足大容量数据及多用户并发的要求。它有多种入库方式,如传统的数据加工服务器、DIPS入库文件、DIPS-BS以及SQL转DIPS等。SQL转DIPS工具因操作简单、易于使用且功能全面,故使用范围最广。
3.3 元数据标引与元数据仓储
SQL2DIPS工具支持Excel、Access、SQL Server、Oracle等常用的数据存储格式。岭南工艺美术专题研究数据库采用Excel进行数据存储。
在Excel中著录数据应符合数据规范,首先要确定的是必备字段,按CALIS要求的必备字段是“标题、语种、权限管理、学科、资源类型”,各个子库可以有差异,著录时必备字段不能为空。著录自定义分类时,要确认分类名称与用户页面的名称是否一致,这关系到能否进行相关字段关联。若著录数据有对象文件,要确保对象文件与Excel表著录的名称完全一致(特别注意特殊符号、半角/全角、空格),否则会出现无法关联的情况。
在Excel中录入标引数据后,使用SQL转DISP工具进行数据入库。数据入库后,要把相应的对象文件上传至服务器指定的文件夹中。普通的资源对象如DOC、PDF、视频文件、网页文件等,只需把这些文件放至指定的文件夹即可;图片资源对象通常分为三至五级,首先就要转换图片大小格式,然后把图片放在对应的文件夹中。
3.4 数据的验收及发布
在发布数据之前,需要将数据进行多次的验收修改,将出错率降至最低。与普通的数据库相比,图片库更容易出现无法显示图片、图片与名称不相符、图片信息著录错误等问题。图片的验收,首先要从源文件夹中的图片开始筛查,确定图片及命名无误后,再核对Excel著录表的标引是否有问题,图片路径著录是否有误。对于拥有几千张甚至几万张图片的数据库来说,验收是至关重要且繁琐的阶段,为了避免图片“张冠李戴”,最后的验收不容忽视。
经过多次验收后,才能将数据库正式发布,按不同的读者层开放不同级别的图片,一般的读者可提供小图浏览功能;校内的读者可提供大图浏览功能;个别需要下载使用高清图片的读者,需向图书馆提出申请。
4 数据库建设存在的问题及启示
4.1 元数据著录的规范化与准确性问题
为了保持元数据库规范在功能、格式、数据结构、语法等方面的一致性,以及数据库共享,本数据库的建设参照了CALIS的《专门数字对象描述元数据规范设计指南》《期刊论文描述元数据著录规则》《电子图书描述元数据著录规则》《学位论文描述元数据著录规则》及《音频资料描述元数据著录规则》,并设计了《广州美术学院图书馆艺术图像元数据著录规范》,让元数据著录有据可依,更加规范化。
在著录的过程中,如遇多个关键词,要用半角分号连接;而自定义分类是与网页中的纵向分类导航相关的,要先明确使用中文还是编码,并且保证每一条著录数据的准确性;正文、资源对象、路径等著录字段要保持与文件名完全一致,否则无法关联。
在数据库的验收过程中,发现了不少与元数据著录不准确相关的问题。比较有代表性的如下:①图片“无法显示”。图片无法显示的原因,大部分是文件名与资源对象或路径字段著录不一致,导致无法关联。还有小部分是著录的元数据没有相匹配的图片资源,或是相应级别的图片资源缺失,以致无法正常显示。②论文“无法打开”或是显示出错。论文出错的问题,一部分是因为元数据著录不完全一致,另一部分是因为论文原文遗漏,以致无法正常打开。③人物库的段落显示格式不一致。因为在Excel中著录,无法对文本进行格式的编排,文字换行需用代码
表示。如果使用不准确,则会出现段落不清的现象。另外,还有文字校对工作也是重要环节,应尽量避免错字、少字、多字等低级错误的发生。
4.2 知识产权保护问题
为了避免因著作及画册数字化引起的知识产权问题,在每个数据库的首页,我们都将显示一段文字,表明此数据库所有内容仅限于本校校园网内师生学习和交流使用。
2006年7月1日开始施行的《信息网络传播权保护条例》第七条规定,图书馆、档案馆、纪念馆、博物馆、美术馆等可以不经著作权人许可,通过信息网络向本馆馆舍内服务对象提供本馆收藏的合法出版的数字作品和依法为陈列或者保存版本的需要以数字化形式复制的作品,不向其支付报酬,但不得直接或者间接获得经济利益。当事人另有约定的除外。由此可知,图书馆对本馆收藏的这些出版物进行数字化形式复制,仅限校内师生学习和交流,不获得任何经济利益,是在法律允许的范围内,并不存在侵权问题。
4.3 后期维护与建设问题
自建特色数据库的持续发展建设与后期维护是最容易忽略的问题。很多特色数据库都是以某个项目为依托建设起来的,项目完成以后数据库的建设就停滞下来,没有进行更新和维护。为了让特色数据库有持续发展的前景,应该与时俱进,不断地补充和完善内容。除了增加一些相关的图片、电子书以外,还应跟进论文、媒体报道的发展,对于网络资源链接,也要及时更新最新的相关信息,去除死链接等。
数据库的建设往往都是外包给公司加工处理,一次性大批量地建设;在没有后续项目资金的情况下,数据库的后期维护与建设只能依靠图书馆的工作人员。从补充资料的收集、数字化加工、数据著录到数据整理、验收入库等各个流程都需要图书馆员亲自完成,对技术及人员投入的要求都较高。在建库初期,就要将这些流程都熟知于心,且有足够的人力投入,才能实现可持续发展。
[1]陈晓.基于DIPS的高校图书馆特色数据库建设[J].情报探索,2008(7):50-51.
[2]邓娉.广州体育信息资源专题数据库建设与实践[J].图书馆学研究,2011(5):26-29.
[3]杨艳红.海南本土文化特色数据库建设研究——以“琼台书院”特色数据库建设为例[J].图书馆学研究,2013(8):32-35.
[4]樊予英.对我国高校图书馆特色数据库建设的思考——以“交通运输工程信息门户网站”为例[J].图书馆建设,2009(2):29-31,34.
[5]胡朝明,刘茜.高校图书馆纺织服装特色资源库建设现状分析[J].图书馆工作与研究,2010(2):67-70.
[6]李雪芬.基于内容的图像数据库本体构建探究——以中国美术学院艺术图像数据库为例[J].图书馆杂志,2011(4):63-65.
[7]李佳军.论“吉林西部草原文化网特色数据库”建设实践[J].图书馆学研究,2013(14):24-26.