加大地方文献资源开发力度加快建设《伊犁日报》全文数据库
2022-03-13陈丽
陈 丽
(中共伊犁州委党校 新疆 伊犁 835000)
建设党校特色的数据库并充分体现区域性、特色性的要求,是当前伊犁州委党校图书馆的一项重要而紧迫的任务。
一、加大地方文献资源开发力度,加快建设《伊犁日报》全文数据库的重要性
伊犁州委党校图书馆现保存了已公开发行65年的汉文、维吾尔文、哈萨克文纸质版的《伊犁日报》。这套纸质版的已经公开发行65年的汉文、维吾尔文、哈萨克文纸质版的《伊犁日报》,是迄今保存唯一完整的重要地方文献资料,真实地反映了伊犁经济和社会发展变迁,可以为伊犁州各级领导干部提供咨政服务,弥足珍贵。如何根据《伊犁日报》的保存现状,建立全文数据库,充分发挥其价值是摆在我们面前的一项重要而亟待解决的任务。
(一)加快建设《伊犁日报》全文数据库,将有助于提高党校教研人员咨政服务水平
《伊犁日报》全文数据库是重要的地方文献史料,具有非常高的史料研究价值及综合治理经验的研究价值。通过全文数据库,可以整合伊犁州建州68年的政治、经济、军事、文化及社会各方面情况,研究者对史料梳理分析后,总结经验教训,既可以切实为州党委、州政府提供有效决策咨询,也可以为全州党员干部深入开展理想信念教育、党的宗旨教育,深入开展党史国史和新疆历史研究、革命传统教育提供素材,对深入开展反分裂斗争、维护稳定和民族团结教育发挥积极的作用。
(二)加快建设《伊犁日报》全文数据库,将填补伊犁州情特色数据库的空白
目前,伊犁州在州情数字资源建设方面空缺很多。其一,伊犁师范大学图书馆的哈萨克文化信息资源中心、伊犁州委党校图书馆的《伊犁地方文献》馆藏图书目录索引、原伊犁地区各图书馆的《报刊联合目录》等都是伊犁州州情重要的一手文献资源。均因技术支撑不够,管理不规范,经费支持力度不足等原因,处于各自发展、各自建库的状态。其二,在伊犁州非公开出版的刊物当中,《伊犁文史资料》《决策通讯》《伊犁党史》《伊犁哈萨克自治州统计年鉴》(2000年后的)《伊犁工作通讯》《伊犁哈萨克自治州人大志》等,均为内部出版刊物,发行方式主要是交换和赠送,发行和订购数量及宣传范围都极为有限。其三,《伊犁日报》作为地方党报,在庞大的知网、维普网等专业报纸数据库的建设中,并无立锥之地。建设《伊犁日报》全文数据库,即可以全方位整合伊犁州自成立以来的文史资料,又可以为建设伊犁州情特色数据库弥补详实、确切的数据资源。如伊犁宾馆“力群”电台的旧址,汉人街的“杨柳青”的故居等,都已经成为人们的记忆,只有少量的图片资料留下,而这些资源只有在《伊犁日报》中有记载,而我们可以通过数字化的方式将这些珍贵的历史资料永久地保存在特色数据库中,填补伊犁州情数据库的空白。
(三)加强建设《伊犁日报》全文数据库,将有利于增强党校图书馆社会效益
2017年,前身是伊犁农村信用社,在成立伊犁州农商银行之前,在伊犁州委党校图书馆花费近半年的时间查询有关伊犁农村信用社发展变化的相关报道,为2014年成立伊犁农商银行股份公司以及编辑伊犁信用社相关历史而收集到了较为真实、详实的一手资料。2019年11月,伊犁宾馆为了编撰《伊犁宾馆》大事记,到伊犁州委党校图书馆收集资料,经过近3个月的查询,收集到了伊犁宾馆成立、发展的历史轨迹,为编撰《伊犁宾馆》大事记提供了第一手的信息资源。2021年7月,伊犁州工会专程到伊犁州委党校图书馆查阅其成立以来表彰的先进人物。更有在上世纪七八十年代国营企业下岗职工下岗的公示、说明等,都只能在伊犁州委党校图书馆保存的纸质版的伊犁日报中查阅到,为这些下岗职工维护自身利益提供了真实的材料。加快建设《伊犁日报》全文数据库,不但满足于党校系统文献信息的需求,还可以满足全州、甚至全疆其他系统的文献需求,打造出的数据库,实现互联网上的共享,真正体现社会效益。
二、加大地方文献资源开发力度,建设《伊犁日报》全文数据库的状况及困境
伊犁州委党校图书馆从1957年建馆,几代图书馆人一直把保存《伊犁日报》作为工作的重中之重。为了更好地保存《伊犁日报》,上世纪九十年代初,中共伊犁州委党校图书馆将这些报纸专程送到新疆大学印刷厂,制成了精装报纸合订本,并由专人保存到今天。但因为年代悠久,保管条件有限,目前,这套《伊犁日报》已经破损、碳化,尤其是文革前的报纸,更需抢救。建设《伊犁日报》全文数据库,已经刻不容缓。
(一)《伊犁日报》纸质版的状况
1.文革前(1957.10.01——1966.12.30)。《伊犁日报》汉文纸质版保存的情况说明:版面为8 开4版,主要栏目包括“社论”“伊犁河”“要闻简报等,无缺期、无碳化。1959年和1961年报纸右上角稍有破损,其他均无破损。1952年——1959年文字清晰度为一般清晰,其他均为清晰,无缺期,精装。
2.文革期间及文革后——1989年12月31日。《伊犁日报》汉文纸质版保存的情况说明:版面为8 开4 版,主要栏目包括“社论”“伊犁河”“要闻简报”“毛主席语录”“简明新闻”“前哨”“短评”“社会新闻”“通讯”等,无缺期、无碳化、无破损,文字清晰度为清晰,无缺期,简装。注:1997年1月——6月为8 开4 版,1997年7月开始为16开4版。
3.1957年11月——1989年12月。《伊犁日报》维吾尔文纸质版保存情况说明:版面为16开4版,主要栏目包括“社论”“伊犁河”“要闻简报等,无缺期;1957年——1976年有碳化、无破损,文字清晰度清晰,无缺期,简装。
4.1956年3月2日-1989年12月《伊犁日报》哈萨克文纸质版保存情况说明。版面为16 开4版,主要栏目包括“社论”“伊犁河”“要闻简报”等,无缺期;1955年——1969年有碳化、无破损,文字清晰度清晰,无缺期,简装。
(二)建设《伊犁日报》全文数据库面临的困境
1.经费投入不足,数据库平台建设难以启动。中共伊犁州委党校图书馆的建设经费主要从党校办公经费中支出,并无专项经费,即使每任领导都很重视图书馆建设,但因受到经费制约,尚无能力开展《伊犁日报》全文数据库必需设备的投入和系统维护等工作。
2.数据库的标准化程度不一。报纸影像扫描阶段:1990年至今的由伊犁日报社扫描的电子版的《伊犁日报》,是全文扫描的。其他年代的报纸要利用扫描仪进行扫描,扫描仪的准确度及使用规格不一样,会直接影响扫描的效果,另外扫描技术参数的选择对数字影像占用的空间、清晰度及影像质量也有影响,缺乏统一的扫描影像精度是直接影响建库的主要因素。
版本不同:在文革前,是以8开版,4个版面出版的。一直到1997年,改为16 开。这样不同的版本扫描,对扫描仪的各个技术参数也有不同的要求和规定。
栏目设置:报纸因跨越年代长,每个年代版本、期数不同,里面的栏目设置也在变化。针对版本不同、栏目设置不同,在扫描过程中都要分类进行,采取不同的方法。
数据源的标准著录:《伊犁日报》海量的信息扫描完毕之后,进入数据源的分类、标引、著录阶段。对数据源加工的具体操作流程和制定标准,以现在图书馆人员的专业水平和技能来看,图书馆人员的专业水平参差不齐、国语水平良莠不齐、对数据源的分类不清、对数据源的著录标准不一等等都会直接影响到建库的质量和今后读者的评价。
3.计算机专业和图书专业人才队伍缺乏。长期以来,基层党校图书馆人员图书情报专业毕业的人寥寥无几,整体素质普遍偏低,队伍结构不尽合理,计算机、外语知识贫乏,知识结构普遍老化,缺乏对现代信息技能培训,很难适应现代图书馆建设数据库的要求。此外,由于伊犁州委党校图书馆待遇较低,职称评聘受限,无法吸引从事计算机和图书方面的专业人才,从而导致专业人才缺乏,阻碍图书馆数字化发展和《伊犁日报》全文数据库的建设。
4.少数民族文字翻译软件和计算机数据应用技术问题尚未有效解决。各少数民族在漫长的历史发展中创造了自己的语言和文字,并用这些文字记录了大量的文献资料。这些优秀的文献资源也是民族地区地方文献的重要特色。受少数民族语言翻译软件开发技术发展的影响,《伊犁日报》哈文版、《伊犁日报》维文版的扫描图像如何准确地翻译成国家通用语言文字、如何规范建库是摆在我们面前的一道难题。
三、加大地方文献资源开发力度,加快建设《伊犁日报》全文数据库的思考
(一)积极争取资金,打造伊犁州委党校数字化图书馆,创新文化服务模式
2021年,伊犁州委党校图书馆申请援疆资金380 万,打造了“伊犁历史文化研学书院”,在图书管理方面凸显智能化、数字化,引用了图创公司图书馆软件管理系统,除了将馆藏的6 万册汉文图书加工成芯片数字化之外,预留了链接《伊犁日报》全文数据库的空位,扫描后经过加工的数据库由专业人员接入云端的服务器,经过调试后就可以链接使用。
(二)《伊犁日报》全文数据库数据库标准化的选择
1.信息源。首先,根据伊犁州委党校图书馆《伊犁日报》的保存现状,对馆内所有报纸进行原件整理,由库房管理人员登记,按年代顺序逐一整理。发现缺期的尽快补齐,如文革前个别缺期的可以到旧货市场或收藏家手中商议拍照来弥补。其次,保证数据源的完整性。在宏观上,这些数据源可以跨几十年,还必须根据伊犁州的发展,连续反映伊犁州的发展轨迹,避免数据断层的出现,微观上要求数据库中的数据源尽可能完整规范,避免输出不完整。再次,保证数据源清晰、稳定。在整理数据源的初期,对于那些字迹模糊的,碳化严重的报纸应加以特别保护,实在无法确认的,在扫描的过程中请教档案修复的专家给予专门保护和修复,以保证数据源的清晰和稳定。
2.数据源扫描技术。选择什么样的设备,关系数据库建设的质量和进度。因此,应选择合适的电子影像系统缩微胶片扫描仪和电子影像处理软件。简单易用的中文图像界面,可以将缩微胶卷转换成数码格式,以TIFF 文件格式储存,并自动生成有序的文件名。但要注意扫描技术参数的选择对数字影像占用的空间、清晰度及影像质量都有影响,扫描参数的设置主要包括分辨率的设置及亮度和对比度的设置。为了使缩微胶片上的文字信息清晰可辨,需要达到的采样密度(分辨率)是300DPI。扫描时可以先选择几个影像比对,然后据此再进行微调,直到扫描图像清晰且边框没有黑边,确定出整盘扫描的对比度和曝光量再进行扫描,并及时做好数据备份,即采用硬盘和光盘双重备份。需要专业的计算机人员进行跟班指导,在仪器的使用和技术指导上要进行系统全面的培训,这样才能完成扫描阶段的工作。
3.数据源标引、分类和审核规则。根据读者对报纸检索需求,按照标引的著录格式,采用自定义的一种数字式文献通用标引格式。该格式结合中文文献数字化处理的特点和要求,在保持符合国家和国际标准通用规则的基础上,规定中文全文文献的编目格式以及全文数字式格式。并遵循《中国文献编目规则》以及有关的国家文献标准,以文章为单位来进行分析标引。每篇数字式文献的标引由以下16①文献的标引的16 个项目,即记录控制号、文献题名、主要责任者、主题分类号或关键词、文献说明(著录)、数字式资源制作者、其他责任者、数字式资源制作日期、文献类型、数字式资源数据格式、数字式资源标识符、数字式数据来源、语种、关联文献、内容范围、数字式资源权限管理]个项目即记录控制号、文献题名、主要责任者、主题分类号或关键词、文献说明(著录)、数字式资源制作者、其他责任者、数字式资源制作日期、文献类型、数字式资源数据格式、数字式资源标识符、数字式数据来源、语种、关联文献、内容范围、数字式资源权限管理.个项目组成,这就要求在标引的过程中,由专家进行专门培训,对各个项目的标引进行具体要求,每完成一篇都要进行严格审核,避免缺项、重项。
《伊犁日报》的子报有《伊犁晚报》(汉、哈萨克、维吾尔三种文版)、《伊犁法制生活报》(哈萨克文)、《伊犁广播电视报》(汉文)。针对这一特点,应扩展附属报名这一著录项,用于对正文内容所属报纸正刊的附属报纸名称进行著录,包括增刊、副刊、特刊、纪念刊、专刊等,为后续报名沿革的揭示打下良好的基础。例如,广告作为一种史料,记录社会生活的点滴,是还原历史的重要线索,因此对广告元数据的著录也应尽量揭示其内容特色。对广告标题、卷期信息、页码、版次等基础著录项也应做出准确的著录。伊犁日报的广告包罗万象,为了更好地揭示广告内容,还原当时社会经济发展的形态,保存好在生活中给人们留下记忆的广告,也具有收藏价值。
4.数据库的搭建方式和软件系统。全国党校系统图书馆中普遍存在技术力量不足和软硬件设备欠缺等问题,只有少部分党校的特色数据库建设采用了自建方式,就连中央党校在内的全国绝大多数省级党校图书馆都因技术力量和软硬件设备的短板,建设数据库都采用了外包的方式。所以,伊犁州委党校图书馆建设《伊犁日报》全文数据库可以采用外包方式。知网建设数据库TPI 技术日趋成熟,已经为全国党校系统图书馆43 家省、市级党校专门打造数据库,在全国党校系统图书馆“三大文库”建设应用中获奖项目占50%。具有系统性能稳定、功能强大,使用便捷,后期定期进行版本更新。尤其是TPI6.5版本,数据管理储存稳定、检索效率高、检索匹配更智能精准。以伊犁州委党校目前技术人员现状来看,还需要引进2 至3 名具备专业计算机知识、懂数据库发布维护的人员,以满足专题数据库建成后的自主维护和升级更新需要。
(三)健全机制,培养、锻炼一支信息化建设的人才队伍
高素质的人才是建设特色数据库的核心和关键。在网络环境下,各基层党校图书馆馆员不仅应该对数据库用户的主攻方向和发展动态有比较深入的了解,而且还应该有丰富的知识、较强的科研能力、整理加工文献信息的能力等。可以说,没有馆员事前对信息的取舍、组织、评价和解释,就不会有高质量的数据库。不仅如此,数据库建设还需要技术性人才的参与。面对人才短缺的困境,基层党校图书馆可采取相应的措施来加强专业人才的培养,如结合高层次人才引进项目,引进计算机和图书情报专业人员;又如,建立岗位目标责任制,培养敬业精神和质量意识,注重建库队伍的知识结构和更新,定期培训技能,提高业务水平。有条件的基层党校图书馆还可为专业人员提供学习和学术交流的机会,培养一批新时代数字化图书管理专业人员。