浅议基于TPI平台的湖州地方志全文数据库建设
2012-02-15叶续俊
●张 琳,叶续俊,查 侃
(中共湖州市委党校 图书馆 信息管理中心,浙江 湖州 313004)
开发自建全文数据库是党校图书馆的一大功能,也是开展文献信息资源共享的一条重要途径。市级党校图书馆在转型中要加大开发特色数据库的力度来适应党校教育的转型,不断增加特色数字资源的数量,提高特色数字资源的质量,为大规模培训干部、大幅度提升干部素质的战略任务服务。全国党校“三大文库”建设是中央党校校委于2010年根据中央要求作出的重大工作部署,是以建设中央党校马克思主义理论文库、中国共产党历史文库、中国国情和地方志“三大文库”为中心而开展的数据库建设,中央党校要求充分发挥全国党校系统的整体力量,全面推进全国党校系统数字图书馆建设工作。为了充分利用中央党校这一高端平台,湖州市委党校本着彰显特色、立足现实、自主选择、量力而行、共建共享的原则,积极争取数据库项目,使湖州地方特色数据库能纳入全国中高级领导干部教育培训服务,进一步扩大湖州地方特色资源在全国的影响力,有效提升湖州市的知名度和美誉度。在湖州市委党校承建《湖州地方志全文数据库》过程中,在统筹资源、平台搭建、数字化标引、共建共享等方面做了有益的尝试,为图书馆自建特色数据库模式探索出一条可行之路。
1 湖州地方志全文数据库建设情况
2011年5月在迎接建党90周年之际,湖州市委党校向中央党校申请了“三大文库”建设子项目——“湖州地方志特色数字资源库”项目建设。2011年7月,中央党校下达了“项目通知书”,数据库立项成功,于是湖州市委党校开始了科学、合理、高效的规划、布局和实施,使资源的整合、数据库建设具备了可持续发展。
1.1 成立机构
湖州市委党校充分认识到数据库的建设光靠图书馆一家的力量是不够的,必须联合全市的力量,共同来完成这一课题,本着群策群力、共建共享、合作共赢的原则,以湖州党校牵头,组织协调各部门力量,共同建设具有湖州特色的全文数据库。为顺利进行数据库项目的建设,成立了两个领导小组——项目领导小组和项目工作小组。
项目领导小组主要负责项目总协调,包括审核项目实施方案、部门之间的协调、数据库建成后的终审等。项目成员单位包括市委办、市委党校、市委党史研究室、方志办、湖州师院图书馆、市图书馆、市档案局。
项目工作小组主要负责项目的具体实施,下设三个工作部门,包括联络部、资料部、技术部。联络部负责项目经费的申请、项目联络发函、项目建设分工、进展监督协调、验收等。资料部负责收集湖州地方志资源、设计数据库的框架和内容、资源编审。技术部负责数据库页面设计、资源的数字化加工、元数据标引、录入。
实施方案的制定十分重要,它关系到数据库建设的成败,方案必须思路清晰、要求明确、做法具体。报项目领导小组通过后,由市委办牵头召开联席会议,布置数据库建设实施方案,使各成员单位明确分工。
1.2 资料来源
湖州方志起源于三国吴时韦昭的《吴兴录》,兴盛于唐朝。唐代湖州的志书,不论数量还是种类,都是当时浙江诸州最多的,因而浙江方志的发展中心由六朝的会稽转移到了唐代的湖州。因此,湖州也被称为“方志之乡”。湖州市地方志资源比较丰富,如湖州凌、闵氏雕版印书独步天下。明朝朱元璋建都南京后,将杭州“西湖书院"所藏南宋国子监的藏书版移入南京国子监,王国维称此“吾浙之宝藏俄空”。富有刻书传统的浙江便自己动手,而且在数量和质量上都兴盛起来,更精细。特别是到了万历年间,正如毛春翔在《古书版本常谈》中所言:“徽州、吴兴乃后起之秀,岂但于苏常争价,实已超越苏、常。”[1]按顾志兴在《浙江藏书家藏书楼》一书中所言:“这在当时是独步天下的,可说是浙江出版史上之最。”[2]因此,为数据库的资源收集提供了良好的基础。经商议,确定资料提供单位由湖州市委党校图书馆、湖州师院图书馆、湖州市委地方志研究室、湖州市档案馆、湖州市图书馆等。通过统计各单位已有的方志资源,列出目录清单,进行资源摸底,实现互通有无,最后统一由市委党校汇总,经专家讨论确定此次收集方志的目录。本地没有的资源还需要向国家图书馆、上海图书馆、台湾傅斯年图书馆等外单位购买。
1.3 展示内容
“湖州地方志特色数字资源库”主要展示“方志之乡”湖州的地方志资源。主要内容包括各类方志及地方文献。按照数字资源库建设的统一技术标准,以电子书、电子书目为主。展示内容涉及湖州方志、湖州年鉴两个方面。
1.4 框架结构
湖州地方志栏目依据年代分5个子库作为二级类目,即宋元之前(含宋元)、明、清、民国、当代。
“宋元之前(含宋元)、明、清、民国”四个子库是旧志,收录1949年之前的志书,每个二级类目下细分府志、县志、专志(地域山川风物志)作为三级类目。府志包含吴兴志。县志包括乌程、归安、长兴、德清、武康、安吉、孝丰等志书。
“当代”子库是新志,收录1949年之后的志书,下设府志、县志、专志(乡镇村志、部门专志、地域山川风物志)作为三级类目。县志包括长兴、德清、安吉、吴兴、南浔等志书。
1.5 平台选择
湖州地方志全文数据库的建设依托TPI平台展开,清华同方TPI专业数据库制作管理系统是同方知网技术有限公司自主研制的数字化图书馆全面解决方案,它是一套基于网络平台上用于知识仓库创建、生产、管理、维护和发布的工具软件系统。使用它可以快捷、方便地掌握知识仓库建库、管理以及网上发布技术,建设自己的知识仓库和知识网站,将知识消息资源的建设与交流推广到全社会。
TPI系统的核心是KBASE检索服务器,它实现了信息的组织、存储与检索。电子图书制作(Book-Shop)、元数据加工工具(DataProcess)系统实现了原始文献资料的数字化和组织,内容发布(CPS)、检索网关和TPI检索服务器一起实现了资源发布。
选择TPI平台一方面由于其本身所具有的应用优势,如界面简洁、支持多种管理模式等,另一方面也是为了更好地和省委党校TPI数据平台接轨,实现数字资源的共建共享。
1.6 标引规范
特色资源库从库结构来说有论文、电子图书、图片、音视频等多种形式,为统一“同一内容特色数据库”标引,根据中央党校要求,对全文数据标引、电子书标引、图像标引、音视频标引、方志古籍标引作出了相应的元数据标引的规范,制定了《湖州市委党校自建数据库标引规范》,在此规范标引中除了对各字段作出明确规定外,还特别对PDF格式作了说明:上传人需把Word格式转成PDF格式上传,必须有标题(副标题)、作者、作者单位、原文出处、摘要、关键词、正文、参考文献、页码、水印。其中标题、作者、正文、页码、水印,原则上PDF必须是可以OCR的双层PDF格式,特殊的可视原文情况酌情处理。
2 湖州地方志全文数据库建设启示
此次数据库建设能顺利进行,离不开“领导重视、部门合力、技术成熟、队伍整齐”四个条件。在开发地方数字资源,建设特色数据库时,由于人力、财力和物力的制约,不可能像商业性的数据库开发商或有实力的图书馆一样来建,因此,要充分认清自己的能力和水平,摆正自己的位置,充分利用各类平台,竭力做好自己的特色数据库。
2.1 要有打造精品特色数据库的意识
方志是中国史学三大支柱之一,历来受到图书馆的重视,是特色资源建设的一部分,其主要作用是资政、存史、育人。因此,必须深度挖掘特色资源,全面深入地进行历史资料的收集、加工和组织,体现出史料的真实性、权威性、全面性和新颖性。
“湖州地方志特色数字资源库”项目建设是全国党校“三大文库”建设的子项目,对于研究、开发湖州自然、文化资源,发挥湖州优势,促进湖州经济、文化建设,以及编纂地方史志等都具有重要参考价值。此次建库,必须努力提高数据库质量,全面、详尽地展示每条记录的各项信息,包括出处、作者、来源、版本等,收纳不同版本,以便读者参考查阅。
数据库建设是一项系统工程,需要大量的努力和付出,但不能因此而降低要求,科学性、准确性是文献研究的重要前提,数据库建设也是如此,只有保证数据的科学性、准确性才能提高数据库的使用价值,建成的数据库才能达到精品数据库要求。
2.2 要有共建共享特色数据库的机制
要有长期合作共建特色数据库的机制。建立优势互补、联合共享的数字资源建设保障机制和共享平台。浙江省党校系统“十二五”信息化建设的总体目标要求重点建设“两大平台”,即管理服务平台和知识服务平台,其中知识服务平台建设就是为了实现数据资源的共建共享,省委党校联合市级党校共同以浙江党校学习网为载体,将党校特定学科领域的知识资源、知识工具和服务集成一个整体,以统一、开放、共享的平台形象展现给广大用户。数据资源的共建共享不仅为党校教学提供了更多更全面更优秀的资料,同时也有助于提高全省党校系统信息化建设的整体水平,加强各兄弟党校间的交流与合作,促进党校系统的整体发展。
此次湖州市委党校尝试与市委办等联合,多家单位共同承担开发建设任务,依托市委办的权威,召集全市相关部门召开联席会议,落实项目的实施方案,使数据库建设项目顺利展开。为专题特色数据库建设模式提供了良好的借鉴。
市级党校在特色数据库开发建设中,必须联合当地高校、相关研究机构、市图书馆等部门,走联合共建之路,整合资源优势,整合技术力量,节约成本开支。数据库初具规模后,还要建立长期共建的协作机制,明确“子库有专人负责、专人有任务要求、要求有时间限定”的工作机制,建立“学校内部有考核机制、系统外部有激励机制”的数据库运作机制,确保数据库的可持续发展。
2.3 要有特色数据库扩展预留的远见
此次湖州地方志全文数据库建设展示了湖州的方志和年鉴,数据库框架设计时,必须考虑扩展预留,为下一步建设湖州地方文献数据库打下基础,至少从内容上可扩展三个方面:湖州事物,湖州人物,湖州出版物。
湖州事物主要指在湖州区域内所存在、发生的自然现象与社会现象,它主要包括两方面的内容,一是指在湖州区域内历史上和社会上所发生的事,如事件、事故、事变、事情以及社会形成的阶级关系、社会关系和人际关系等,在文献的表现方式上,有地方史、地方志、大事记、地方年鉴、区域经济以及地方风情等
湖州人物主要是表述人物一生的传记、传略、评传、年谱等。
湖州出版物可分为内容完全涉及湖州地区的出版物以及内容部分涉及湖州地区的出版物两类,能反映湖州地区文化、科学、经济发展上的成就和地位,是反映湖州文化水准的标志之一。
在首页设计时,充分考虑这一需求,将首页制作成“湖州地方文献特色数字资源库”,预留地方史(湖州市、德清县、安吉县、长兴县)、大事记(湖州市、德清县、安吉县、长兴县)、地方人物(按历史年代排)栏目。为后续内容预留必要的版面空间,一方面避免了重复劳动,另一方面也为本地特色数据库的建设节约成本,方便后续工作的进行。
2.4 要有统一的元数据标引规范标准
特色资源库建设的标引规范是数据库建设的前提。标引规范标准使数据库标引人有法可依,有章可循,提升元数据标引的科学化、标准化、规范化水平。
湖州地方志特色数字资源库标引规范参照了全国党校图书馆“三大文库”数字资源建设规范中地方志元数据元素及著录细则,共有50项标引,全面深入的反映了每条数据的相关信息。规范标引信息不仅有利于数据检索,也有助于读者更全面的了解每条数据的相关信息,从而提高数据库的实用价值。
依照制定的标引规范进行操作,标引字段简明清晰,保证了建库的规范化,也有利于标引任务的分配和管理,有利于数据库的修改和扩展。2.5 要有建设特色数据库的人才队伍
建设精品数据库离不开优秀的专业人才队伍,包括两个方面的专业人才,一方面是要有一批具有专业技术技能和良好敬业精神的图书馆人才,能够解决数据库建设中遇到的技术难题,并耐心细致的做好各项工作,数据记录的整理和录入工作繁重而枯燥,容易出现错误,要确保数据的准确性和完整性,同时也需要制定一种合理有序的分工合作和监督机制,以降低信息出错的几率。另一方面,制作主题鲜明的特色数据库必须要有本专业相关的研究型专家的介入。此次湖州地方志全文数据库的建设就是重视了这两方面的人才,才得以顺利进行。项目组中有地方志办公室专门研究湖州方志的两位研究员和本校文化学、湖州古籍研究方面的副教授,在摸清家底阶段,首先由这些专家组成的资料组对湖州方志的种类、版本进行讨论、研究、考证,最后形成湖州地方志数据库需收录的目录,其中包含了收藏的地点信息,便于图书馆有的放矢去联系购买未收藏的资源。元数据标引完成后,再由专家组逐条进行审核,大大提高了方志收录的准确性和可靠性。
3 结束语
近年来湖州市委党校围绕中央党校提出的“三大文库”建设任务,本着为教学科研资政服务、为湖州市干部教育培训事业服务的宗旨,相继完成了湖州市情数据库、湖州特色专题数据库(湖州新农村建设、湖州文化、湖州党建、法治湖州、湖州特色产业、湖州和谐民生)、湖州地方志数据库、江南小延安特色数据库的开发建设任务。目前,数据库资料总量达7万多条,稳步推进了数字图书馆建设。
[1]毛春翔.古书版本常谈[M].上海:上海古籍出版社,2003:66.
[2]顾志兴.浙江藏书家藏书楼[M].杭州:浙江人民出版社,1987:80.