岭南文献网络化建设实践与思考
2014-02-11宋琳琳中山大学资讯管理学院广州510006
●宋琳琳,刘 菡,赵 阳(中山大学 资讯管理学院,广州 510006)
地方文献是重要的地方记忆,数字化地方文献就是在翻新地方记忆、推广民族文化。为了解岭南文献资源建设实践成果,并为其他地区地方文献组织和利用提供参考,本文通过调查法和分析归纳法,访问了相关网站主页和专题数据库,记录其资源组织、标引描述、检索性能及服务等内容;从资源组织和服务两个方面总结了岭南文献网络化特点;最后,探讨其中存在的问题,并提出相应的意见或建议。
1 专题数据库建设
对于专题数据库而言,有些是以独立网站形式存在的,如“广州记忆”(青少年版)数据库(http://www.gzst.org.cn:8080/was40/index_gz.htm l.)、“江门华人华侨多媒体数据库(http://hq.jm lib.com/index2.htm l.)”;有些是作为网站的一个版块或栏目存在,如深圳图书馆之城的“深圳记忆”(http://www.szln.gov.cn/share.do.)、广东省情网的“广东省情数据库”(http://www.gd-info.gov.cn/shtm l/guangdong/index.shtm l)、广州地方志网站的“广州地情资料库”(http://www.gzsdfz.org.cn/)。
1.1 资源组织特点
(1)资源建设主体多样。包括文化行政机构,如广东省人民政府地方志办公室、江门市文化广电新闻出版局;文化资源管理机构,如广州少儿图书馆、全国文化信息资源共建共享深圳中心;文化遗产保护机构,如广州市地方志编纂委员会等。
(2)各主题资源相对集中聚结成库,资源表现形式多元。文化行政机构建设内容偏向历史地理、国宝档案、地方年鉴、华侨文献等方面;文化资源管理机构则以社会生活、民风民俗、饮食、音乐、景观等为主;文化遗产保护机构则侧重方志资料、名胜古迹、传统文化等。资源呈现除声像图文外,还有表格、flash、页面(窗体、动态、图标、图形按钮等)效果等新颖形式,如广东省情资料库以类似在线电子书阅览的形式提供数字化全文。
(3)类目层级简单、层次分明、资源导航完备。数据库采用主题分类相结合的方式设立类目,一级类目宽泛广博,横向设立栏目。一般类目体系都只有2-3级,最多不超过4级,大部分资源会展示在首页。基本具备全局导航、局部导航功能,还有的如广州地情资料库还设有所在位置指引、网站地图等。
(4)多个子数据库,分别进行资源组织。将资源划分为不同子数据库进行组织,根据资源的特点,确定描述项目、资源浏览和获取方式等。如“深圳记忆”数据库根据“深圳非物质文化遗产”“城市景观雕塑”“群众文化获奖作品”主题分别建设相应子数据库,根据资源特点各子数据库的著录内容、浏览方式不同。
(5)资源著录基本上实现了数据库内相对统一的著录标准,简单元数据格式如广州记忆完整版数据库,只有标题、内容等5个描述项目;结构化复杂格式如广东省情数据库,描述项目多达25个,比较全面地体现资源特性。此外,资源间的链接、栏目间跳转方便、流畅;数据库能以分类列表等多种形式提供资源浏览;数据库基本上能实现在线阅览。
1.2 资源服务特点
(1)基本具备简单检索以及浏览功能,可提供多种检索途径,部分运用了布尔逻辑检索技术如广东省情数据库。此外,还可提供对图片、影音等多媒体资源的检索以及跨库检索,如广州记忆完整版可实现库内资源包括声、像、图、文以及动漫资源的一站式获取。
(2)检索栏目多以工具条形式呈现,其嵌入网页,使用快捷,方便用户即用即得。部分具备高级检索的数据库中有可供专门检索的页面设置,如广东省情数据库,可供检索的字段简易,以全文检索为主,同样易于用户理解操作。
(3)提供简单的检索结果处理。如检索结果排序,广州记忆完整版子数据库提供相关性排序、时间正倒序;提供二次检索,广州地情资料库可选择是否智能扩展、不扩展检索或同义词、反义词扩展检索。
(4)检索结果列表形式丰富。有简易的标题、责任者列表,能以简明形式呈现大量检索记录,如江门华人华侨数据库;有的在此基础上添加了摘要,如广州记忆完整版子数据库;还有图文并茂的名片列表,显示了所有著录项及部分全文,如深圳记忆数据库。
2 岭南文献门户网站建设
岭南文献门户网站主要包含综合类、专门类和行业类三个类型。综合类包括全国文化信息资源共建共享体系中的省、市分支中心,如广东数字文化网(共享工程广东省中心)(http://www.gddcn.gov.cn/)、广州、肇庆、五邑数字文化网(http://www.gzdcn.org.cn/;http://www.zqdcn.gov.cn/;http://www.jm lib.com/) 以及深圳图书馆之城等;其他官方或民间组建的地方文化资源综合门户网站,如深圳文化网(http://www.szwen.gov.cn/)、广东文化网(http://www.gdwh.com.cn/)、东莞文化网(http://dgwh.dg.gov.cn/)等。专门类包括各省市文化馆、档案局(馆)、博物馆网站如“广州群文网”(http://www.gz-arts.com/index.asp)、“广东省博物馆”(http://www.gdmuseum.com/index.php)等;政府机构、科技、统计信息网站如“广东省统计局”等。行业类包括各种行业性信息网站。
2.1 资源组织特点
(1)资源丰富、数量庞大、展现形式新颖多样。这些网站资源主题内容丰富多样,涉及当地民俗、文化、艺术、人物、历史、地理、饮食等等各方面的资源,其中广东文化网在导航栏设置了6个一级主题,而其下划分了35个主题栏目。资源表现形式丰富,格式包括声、像、图、文、视频等,网页设计包括滚动新闻和图片动画、宣传视频、浮动图标等,如深圳文化网“深圳市文体旅游电子地图导航系统”以电子地图形式呈现。
(2)普遍采用等级式分类主题一体化的分类方法组织资源,资源整合横向纵向兼顾。以广州数字文化网为例,导航栏中按照主题设文化视角、区县之窗等八个板块,区县之窗下按照地区细分为越秀区等12个子类。站内资源层级清晰,基本上是2~4个类目层级,能将丰富多样的资源首页展示。资源描述项基本上包括标题、时间、来源、全文等。
(3)能将站内资源与站外资源结合整合,突出表现在综合类岭南文化资源门户网站中。一方面是站内资源确定类目体系、栏目内统一描述;另一方面是站外相关资源的组织,部分以专题导航形式提供资源链接,部分作为站内某一栏目提供对应链接。肇庆数字文化网将站内资源按分类主题相结合方式组织,其中“少儿文化”栏目对应链接到肇庆少儿图书馆网站、“分站导航”栏目提供链接网址导航,以此整合数字文化、文物书画等站外资源。此外,共享工程的部分分支中心依附图书馆网站进行建设,如“深圳图书馆之城”。
2.2 资源服务特点
(1)资源导航、路径指引清晰完备,方便返回到上一层、链接到其他栏目。多数网站已具备简单的站内检索功能,这些检索栏以工具栏形式显示,方便用户即用即得。
(2)尊重用户对象个性化的特点,开展区别服务。有针对特定年龄群体的资源整合,突出表现为对少年儿童群体的重视,很多网站都有专门针对儿童的栏目;还有针对不同主题专业的专门版本,如“广州市共享工程新农村版”以图文结合的方式提供农业资源指引。另外,部分网站如广东省博物馆网站提供了英文版、儿童版。
(3)以用户需求为中心,重视与用户之间的交流互动。网站提供便民信息服务,如东莞文化网“文化地图”标注了当地博物馆、纪念馆等文化场所,提供用户交通信息查询、地图搜索等功能。社交网络工具的应用,如东莞文化网设置“用户供需交流平台”等。
2.3 不同建设途径的区别
专题数据库通过细致全面的著录项目,以尽可能完备的标注凸显记录特点;分类组织描述对象以站内资源为主;多按照资源类型划分子数据库分别整合;类目设置相对简单,以检索为获取信息主要方式;提供服务比较单一,但检索功能比较齐全,可进行多字段、布尔逻辑、限定、跨库检索并提供检索结果处理等。门户网站通过简单著录项显示记录的基本信息;分类组织描述对象包括站内外相关资源,能统一整合同一栏目下各类型资源;类目设置更为丰富,以浏览为获取信息的主要方式;提供服务更多样化,能针对不同群体开展区别服务,只提供简单全文检索。
3 岭南地方文献网络资源建设存在的问题及建议
3.1 存在问题
(1)强调资源数量和种类而忽视了资源组织,类目体系存在主题划分多样、层次等级不一等状况,缺乏统一可供参照的体系化的组织构架。
(2)资源描述在特定栏目下相对统一,但是不同资源之间详略差异明显,并无统一的著录规则。对于文本型资源的描述,广州地情资料库著录内容包括标题、类目、责任者等不超过6项,但是广东省情数据库中著录项目多达25项;对于多媒体资源的描述,广州记忆动漫库中著录了内容、所属栏目、题名3项,而江门华人华侨数据库著录了标题、上传日期、作者、来源等8项。
(3)资源整合层次较浅。数据库不同类型的资源通常分别进行组织,只有少部分可以实现跨库检索;门户网站中虽有站内、外资源的整合,但两者之间相互独立,各自在栏目内集中,且站外资源组织采集、描述比较简单,基本上只是提供链接指引。
(4)资源服务内容比较单一,虽均具备检索功能,但并没有积极迎合用户兴趣、需求的变化,在个性化服务、交流互动等方面有所欠缺。
3.2 相关建议
3.2.1 资源组织
(1)网站类目体系的确定,可以参考分类主题法相关规则如《中国分类主题词表》,结合“全国文化信息资源共享工程”网站的类目设置等,编制科学、统一、人性化类目框架,确定规范类名,设置合理类目层次,为地方文献数字化建设类目构建提供参考。
(2)资源描述应确定统一的描述标准,如采用《地方志元数据规范》 《地方志元数据著录规则》、RDA元素等,对数据库资源进行标准化、规范化著录。如借鉴《北京地方文献数字化建设标准》的内容,确定不同载体、类型的地方文献数字化加工规范、标准、资源库框架等。[1]此外,网站建设还可以增加标签、网摘、用户标注等内容。
(3)资源整合的深化与拓展,采用如Open URL的SFX技术、Web service技术等建立异构数据库,将不同来源、结构及形式的数据库、网络资源集成到统一平台,并将资源按照字母、主题、类型、年代、地区、用户等进行多线索分类,建立资源导航和指南;整合的资源不仅包括地方文化相关的机构还有与地方文化相关的各主题方面如旅游、娱乐、餐饮等,并逐渐扩展到视频、音乐等多媒体网站以及微博、豆瓣等民间资源。
3.2.2 资源服务
(1)加强专题数据库检索功能。进一步整合数据库内资源,推广跨库检索;通过测算以及推理用户的检索意图,开展如拓展式、相关式、强调式等的动态推理导航,提高检索效率;[2]通过运用机器学习,建立地方文献知识本体,对事件文档进行分析、推测关联,实现基于事件检索等。
(2)信息服务个性化,运用如关联分析、协同过滤分析、Web数据挖掘技术,对注册用户基本信息、信息行为(检索记录、浏览历史、页面点击及停留时间等)进行统计分析,建立用户需求库、信息资源库等,构建用户之间、用户与资源之间的关联,挖掘用户的兴趣点、偏好等,向用户推荐资源、提供个性化的页面等,实现智能化主动服务。
(3)构建用户社区,引入社会化网络工具如实时在线咨询、微博,提供用户贴标签、资源评价、资源收藏、推荐、分享、转载、留言讨论等权限,增进用户之间的互动交流、加强对地方文献的宣传推广。结合当前用户关注的热点,提供创新服务,如开发移动终端程序促进网站资源的利用,设计一些相关的小游戏如填字游戏、匹配游戏等,促使用户更加了解和热爱地方文化。
[1]黄晓斌.地方文献的数字化建设策略[J].国家图书馆学刊,2009,01:60-64.
[2]吴平博.基于事件框架的主题相关文档智能检索的初步研究[D].北京:清华大学,2004.