古籍数据库建设策略研究
2023-04-05王梦怡
王梦怡
(浙大宁波理工学院 浙江宁波 315100)
1 扩大古籍数据库宣传
1.1 古籍数据库用户培训
专业基础和查询经验会影响用户的查询效率和使用感受。大多数用户都是以基本检索的方式为主,认为高级检索有难度且不能熟练掌握。对于设计检索式的意识和能力,不同用户的水平也不同。因此,无论是古籍数据库商还是图书馆、高校等相关单位,都应该加强对古籍数据库用户的培训,比如:古籍修复师这类职业对古籍信息需求量大,但该职业很多人年龄偏大,对古籍数据库的使用不多,更多使用纸质版古籍,有的可能不了解古籍数据库功能的强大,或不太会使用。应组织专门的培训班,针对这类相关用户进行培训,使其了解数据库使用方法,学习检索策略,提高检索技能,从而吸引用户,提高用户使用满意度。
1.2 古籍数据库线上宣传
1.2.1 开发古籍数据库App
大部分用户习惯使用搜索引擎查询信息,只需使用笔记本电脑、手机等移动设备,就能随时随地进行查询,十分便利。而如果想要使用移动设备查询古籍数据库,一般只能通过浏览器访问,会受到很多限制,目前也极少有关于古籍信息的App。如果可以开发出更多专门的古籍数据库App,集成查询界面,将会为用户提供极大的便利[1]。
1.2.2 提高搜索引擎检索命中率
使用古籍数据库查询的用户中大部分都是先用搜索引擎进行搜索,找到相关古籍数据库再点击进入,而不是直接使用古籍数据库,主要是需要通过搜索引擎缩小范围或锁定对应自身需求的数据库。鉴于此,数据库商应准确、完整地将数据库的信息发布到互联网上,或与搜索引擎建设商进行合作,尽量让自己的数据库能够通过搜索引擎被所需要的用户检索到。
1.2.3 开通古籍数据库相关公众号
目前微信几乎已经融入每个人的生活,使用微信公众号了解古籍信息的用户很多,可以开通关于古籍数据库的公众号,命名一定要简洁,易于被搜索到,并与古籍数据库建立关联,可以从公众号中链接到相关古籍数据库,亦可以在古籍数据库中关注公众号。微信公众号可以介绍古籍数据库的内容,实时更新古籍数据库收录、建设情况,让更多的潜在用户了解古籍数据库的不同种类及其特点,使用户了解怎样选择对应的古籍数据库。
1.2.4 开展个性化推送服务
利用微信、QQ、微博等社交软件平台,通过大数据分析,锁定相关用户,为不同的用户做个性化推送,内容主要结合其对古籍信息或数据库的关注点与兴趣点,增强依赖程度;针对潜在用户(比如档案馆员),可以结合其职业与古籍数据库的关联做推送,从而吸引其关注和使用。
1.2.5 建立古籍数据库相关博客站点
博客作为一种虚拟社区,有其固定的用户群体,可以在博客中介绍古籍数据库的内容,实时更新古籍数据库收录、建设的整体情况,让喜欢浏览博客的潜在用户了解古籍数据库的不同种类及其特点,普及古籍数据库的使用。
2 完善古籍数据库内容
2.1 古籍数据库收录内容
2.1.1 保证古籍信息质量与权威性
数据库在选择录入古籍文献时,一定要坚持原则,选择有权威性的、经过考证的、来源有据的、能够确认其真实性的古籍文献,遇到不能确定的文献,一定要核查考证,不能心存懈怠,将劣质的古籍文献放入库中,影响整个古籍数据库的品质和评价,只有保证信息质量,才会赢得用户的信任。
2.1.2 根据用户实际需求,合理分配古籍文献类型
很多数据库商在选择古籍时,比较重视经部、史部的建设,而子部本身书少,集部录入则较为欠缺,比如地方志等,要查专门的地方志数据库。但实际工作中很多古籍修复师、古籍保护工作者和博物馆员都比较关注集部,然后才是经部与子部,因此,数据库商在建设时应按照不同用户的实际需求科学分配产品类型的比重。另外,丛书也是很重要的一部分,不容忽视。还有的数据库根据一定原则将古籍按朝代、专业领域划分类别并展示在首页,或将数量巨大的类别在首页显示,供用户直接选择,这些方法一定要根据用户信息需求来设置,才能切实提高古籍利用效率[2]。
2.1.3 注重收书内容全面性
我国现有古籍数据库已有很大规模,大部分用户在使用古籍数据库查询之后,信息需求基本能够满足,但也有部分古籍文献内容不够全面,比如:清代晚期的书在中国基本古籍库中就比较少。为此,可以采取以下措施。
(1)增加冷门文献内容。很多用户是出于了解历史的兴趣使用古籍数据库,因此除了经书正史以外,可以收录一些较为偏僻冷门的历史文献,例如:可以更多地收录一些没有那么广为人知的地方志,以及小地方的名人事迹文献等。(2)针对不同年龄段收书。很多用户查询信息均以兴趣为主,因此可以有针对性地为不同年龄段用户收录感兴趣的古籍。(3)增加各专业古籍文献。可以增加一些涉及各个专业领域的古籍文献,满足那些出于增加专业知识储备使用古籍数据库的用户需求。
2.1.4 增加古籍内容完整度
目录、序言、题跋、附录、牌记、点校、题字是古籍文献特色的部分和代表性特征,很多从事古籍文献研究的用户都十分重视,因此在建设和录入时一定要跟随古籍正文完整地录入进库。
2.2 古籍数据库著录内容
2.2.1 书影与数字化全文对照
在古籍数据库的用户群体中,有的关注古籍原貌书影,有的需要编辑具体内容,更多的是二者兼需,希望能够同时进行对照,因此,无论是早期的书影数据库,还是后来的全文数据库,都应该朝着二者兼并的道路发展。
(1)注意提高书影的清晰度、还原度,尽量还原古籍原貌,古籍保护工作者、博物馆员和一些年龄较大的用户对此非常关注。(2)对于是否应将甲骨文、碑帖拓片等文献均进行数字化业界争议很大,优点是方便利用,缺点是在数字化过程中可能会与原件的原貌有所偏差,也可能会造成古籍损坏,因此,建设者应当根据实际情况慎重决定。
2.2.2 完整展现古籍外观原貌
古籍文献具有特殊性,其成书的版式与结构极具意义,不同时代、地域、作者的习俗与特点不同,很多古籍修复师、古籍保护工作者和图书馆员等是出于对古籍本身的兴趣使用古籍数据库,十分关注古籍的版式与结构,因此在拍照或扫描录入时,尽可能地将古籍原本拍摄、扫描完整,包括原书的轮廓、版式与结构,以及书衣、封面、护页、牌记、印章等,以供需要的用户研究使用。
2.2.3 提高查全率、查准率
目前,我国古籍数据库的查全率、查准率与期望水平还有很大的差距,部分用户因科研需要穷尽式查询,查全率与查准率的高低会直接影响他们的工作效率,因此急需改善以下几个方面。
(1)数据库收录古籍文献信息不够,应当尽量扩大数据库文献量;(2)索引词汇缺乏控制和专指性,应该提高索引词汇的专指性;(3)完善词表结构,明确词间关系;标引人员在进行标引工作时,应该清晰详细,保持前后一致,不可用词不当或有所遗漏。
2.2.4 完善著录体例及检索字段
由于古籍文献的特殊性,会比其他期刊论文需要更多的著录项来展现其多方面的信息,例如卷数、版本、载体形式、四部分类号、善本书号等,如果将这些信息都著录完善并设置关联的检索字段,用户便可以通过这些著录项对应的检索字段来进行检索,而不单单只是通过书名、作者检索,这就拓宽了检索的渠道。在这一点上,目前很多数据库都很欠缺,因此在进行古籍文献录入工作时,应当设置全面的著录体例,尽量完善著录项。
2.2.5 提高版本著录的全面性和完整性
由于古籍文献的特殊性,版本是十分重要的元素,也是大多数古籍用户都会关注和重视的部分,因此,古籍数据库建设的一项重要任务就是将古籍文献的版本特征全面、完整地著录下来,除了基本的责任者、出版年、出版者、出版地、藏地等,还有类似于刻工、经手的收藏家等,如果数据库可以尽量多的提供版本信息,用户就可以通过这些著录的版本信息发现、挖掘古籍原本或其他版本的线索,从而获得自己所需要的信息[3]。
此外,很多用户需要了解某本古籍已知的所有版本,但这些版本可能并不收录于某一个数据库中,或是还没有收录进古籍数据库,查询起来十分麻烦。如果数据库能够列出每本古籍已知的所有版本,并在古籍书目数据库中,将版本体现在古籍的目录中,就将会大大提高查询与研究效率。
2.2.6 加强“语料”标注,科学标记
“语料”查询是古籍数据库服务于用户极其重要的部分,因此数据库商应当重视对古籍文献进行语料标注的工作,保证质量。另外,还可以增加互动板块,使相关专业的用户参与到语料标注中来,提交审核通过后发布,集合大家的力量,在节约成本的同时,调动用户积极性,提高参与感。
3 提升古籍数据库功能
3.1 古籍数据库检索功能
3.1.1 多种检索方式相结合
有些古籍数据库只提供单一的检索方式,但不同的检索方式各有优势,需要依据检索需求而定,因此,古籍数据库应该在坚持自己特色的原则下拓展检索方式,提高用户检索效率。
3.1.2 建立跨库检索
大部分用户如果在一个古籍数据库中查询不到所需信息,都会选择换一个再次查询,但如果对古籍数据库不太了解,盲目换库,可能会出现多个库都检索无果的情况,增加查询工作量,影响用户查询体验,破坏用户对古籍数据库的印象和信任度。如果能够实现多个数据库的跨库检索,提供统一的检索平台,便可以省去来回更换数据库重复检索的麻烦。
3.1.3 关联异体字
在古籍文献的查询中,异体字是一个很大的困扰,对非相关专业的用户来说,缺乏专业知识的储备,会对检索造成极大的影响。因此,数据库应当对异体字进行标注和关联,自动替用户解决这一问题。
3.1.4 精确提取内容提要
当运行完检索程序后,系统会给出一个列出检索结果的页面,每一条检索结果中,除了书名、责任者、版本等基本信息外,还会给出一些该书的内容提要,由于古籍文献的特殊性,有些数据库是提供古籍文献中的部分序言,或总结、概括性内容的截图,或是直接摘录下来,大部分用户都会根据内容提要来判断该古籍文献是否符合自己的需要,是否值得打开浏览,这样在一定程度上提高了浏览效率。因此,应该精确提取古籍文献的内容提要,要能够概括全书的中心大意,这样才能为用户节省时间,提高信息筛选效率。
3.1.5 建立古籍内容关联
将相关的古籍文献或相关的内容建立关联,例如当用户在检索某一本书时,下面会为其推荐类似的古籍文献,这样可以为读者拓展所需的信息,提高查询效率,但这需要前期扎实的标注与索引工作的支撑。
3.2 古籍数据库其他功能
3.2.1 建设其他辅助功能
目前个别较为先进的古籍数据库已经可以提供除了文献检索以外的辅助功能,如繁简转换、联机字典、文献传递、新闻动态、文献推送、在线客服、评论互动等功能板块,但是实际使用的客户却不多。一方面目前只有少数古籍数据库可以提供这些功能,另一方面,提供这些功能的数据库在功能建设和服务上还很不成熟,比如字、词典容量不够大,不能提供知字查音;文献传递因版权及安全问题无法解决,很多还不能提供实际服务;新闻动态、文献推送更新不及时;在线客服及互动板块无专人管理,服务不及时或形同虚设等。由于这些功能的不健全,很多用户还是倾向于使用自己的纸本字典、其他软件等,如果不能提供相比之下更优异的服务,用户不可能会轻易改变原来的习惯。
此外,应该在新闻动态、专题介绍、文献推送等板块中针对古籍及本数据库建设情况进行介绍,使用户可以实时了解这些动态。古籍数据库应该重视逐步建全、完善这些功能板块,为用户提供便利,从而提高用户依赖程度。另外,不同年龄、学历、专业和职业的用户对古籍信息的需求点可能不同,在可操作范围内,如果古籍数据库能够分门别类对其进行设定或提供个性化服务,或许能够提高用户的好感度[4]。
3.2.2 完善阅读编辑功能
目前,一些数据库可以提供字体转换、笔记、书签、收藏等阅读编辑功能,但这些功能的配套延伸功能如排版、打印等,还远远比不上Word等办公软件,无法取代大多数用户的原有文档编辑习惯。因此,古籍数据库应该完善复制粘贴、截图、下载等相关功能,尽量为用户提供便利。
4 加强古籍数据库开发与利用
4.1 古籍数据库运行与维护
4.1.1 简化访问、下载、安装过程
有些古籍数据库在使用过程中十分不便,访问受到浏览器类型、版本,下载工具和安装环境的限制,十分繁琐。为此,古籍数据库在建设中,应当利用技术手段尽量简化登录、下载及安装过程,方便用户使用。
4.1.2 加强数据库运行维护
聘请专业的技术团队,提高数据库运行速度,从而提高检索速度、系统易用性、界面友好性。组织专门的相关专业人士定期进行维护,建设能够随着时代发展和计算机技术进步而及时更新的先进古籍数据库,从而满足用户日益增长的信息需求。
4.2 古籍数据库开放与共享
4.2.1 实现平台共享,避免重复建设
目前,我国古籍保护单位大多是国家各级事业单位,研究机构和图书馆等,都是彼此独立的,建设的古籍数据库也相对独立,再加上一些商业性质的古籍数据库,没有统一的规划建设,分类特色,重复建设现象较为明显,尤其是很多大部头的古籍文献。因此,应该统一由古籍保护权威机构来统一领导,建设一个统一的古籍数字化资源共享平台,类似于中国高等教育文献保障系统,大家可以互通有无,节约成本[5]。
4.2.2 扩大开放程度,降低查询费用
由于古籍文献的版权和信息安全问题,目前开放共享的程度还很低,就连文献传递实际能够真正实行的都很少,并且商业开发的数据库费用都十分高昂,只能依托高校和部分公共图书馆购买,限制IP 使用,这便会受到时间、地点的限制,造成不便,但这一点在短期内还难以改变[6]。未来如果可以提高开放意识,扩大开放程度,降低查询费用,那么古籍数据库的使用将会更加普及。
5 结语
我国历代注重文化的研究与传承,先辈们殚精竭虑、刻苦钻研,造就了一部部浓缩着智慧的古籍著作。相关工作者有责任和义务保护好这些珍贵的古籍文献,并在此基础上合理开发其潜在价值,使之发挥出重要作用。期望古籍数据库能够从多方面提升服务质量与层次,从而促进古籍资源的传播与利用,传承和弘扬古籍中的民族精神、历史智慧,以及中华民族传统文化,为了解和认识古代社会,研究古代文化风俗、典章制度和社会状况提供完备的资料。