数字出版环境下的信息资源采集策略研究
2010-03-22何坚石
●袁 琳,何坚石
(1.武汉大学 信息管理学院,武汉 430072;2.韩山师范学院 科研处,广东 潮州 521041)
1 引言
信息资源采集是指从信息使用者的需要出发,通过各种渠道和形式获取相关信息的过程。它是信息资源建设中最基础的一个环节,是实现促进信息资源的深层开发、促进信息资源的动态更新、促进信息资源的迅速传播、促进信息资源的远程获取、促进信息资源的广泛共享等作用,以及最终为用户提供多种形式服务,满足用户各种需求的根本来源,所以它是图书馆工作的“木之本”“水之源”。随着电子计算机和现代通信技术的相互结合,以因特网为代表的高速信息网络将大量的用户、信息资源、信息服务系统紧密联系起来,形成了人们信息活动的重要空间。信息资源呈现出品种多,数量大以及来源渠道多样化等特点,信息传播的手段和方式在网络环境下也发生了巨大的变化,传统出版正向数字出版大踏步迈进,二者共存并相互促进。新的数字出版环境的出现,使得信息资源采集面临许多新的问题,因此如何及时有效调整信息资源采集策略显得尤为重要。
2 数字出版环境概述
数字出版,就是指从编辑加工、制作生产到发行传播过程中的所有信息都以二进制代码的形式存储于光、磁、电等介质中,必须借助计算机或类似设备来使用和传递信息的出版。[1]
其实数字出版是一个相当宽泛的概念,它是指采用二进制的数字技术从事的出版活动,涉及到版权、发行、支付平台和最后具体的服务模式,而它不仅指直接在网上编辑出版的内容,也不仅指把传统印刷版的东西数字化,或者是把传统的东西放到网上就是数字出版。真正的数字出版是依托传统的资源,用数字化手段进行立体化传播的方式,包括手机彩铃、互联网期刊、电子书、在线数据库等多种形式,在出版工艺、信息载体、用户体验等方面,都有别于传统的出版方式,表现出自身的优势。它以其信息量大、即时出版、成本低廉、节约资源、容易检索、无需印刷、无需仓储、无需运输、交互性强、多媒体性以及传播范围广等优势,开辟出了一个崭新的商业机遇和市场,数字出版正成为未来出版业新的增长点。
国内数字出版的概念从无到有,但是短短10来年的时间,它的发展速度和繁荣程度却不容忽视,IT、电信、通讯、传媒、出版、印刷、娱乐业、教育界,都以各自的方式涉足数字出版。新闻网站、互联网期刊、电子图书、网络游戏、在线音乐、手机书、数字印刷、网络学堂、远程教育等,都可以看作数字出版的产品形态,数字出版的时代已经来临。[2]
随着数字出版的兴起,传统出版业得到根本的改造,从内容创作、编辑、版式设计到制版,都实现了数字化,但传统出版物毕竟与数字出版物有区别,尤其是在完全脱离纸张的电子出版物至今仍未创造出很好效益的现阶段,各出版社的收益基本上还是靠纸张出版物来获得。所以二者的有机结合既可以用先进数字技术帮助发展有纸出版,又可以兼顾未来数字出版需要,并能实现平滑过渡,传统出版与数字出版共存和相互促进也就成为必然。
3 数字出版环境对图书馆信息资源采集的影响
数字出版与图书馆之间相互影响、相互作用,是互动的关系。数字出版技术给图书馆带来深远影响的同时,图书馆也将促进数字出版业的发展。数字出版技术给图书馆带来的影响主要体现在:数字化的兴起使传统图书馆的资源结构发生了巨大变化,拥有与存取共存,实体与虚拟共存;数字出版技术使图书馆文献收集、整理、流通的程序简化,将工作重心转移到信息服务和馆藏信息资源的开发上。[3]数字出版环境对图书馆信息资源采集的直接影响导致了出版形式的多元化,极大地丰富了各种载体形态的信息资源,与此同时也增加了图书馆信息选择的难度。
3.1 对信息资源载体选择的影响
随着网络信息时代的来临,各种文献信息量急剧增长,不但品种数量激增,而且载体形式也出现了多种形态。随着网络技术的不断发展,计算机处理文献信息能力的提高,促进了电子文献的迅速问世。与纸质载体的文献相比,电子文献具有传递信息速度快、检索方便、利于共享的特点,也有信息存量大、内容广、体积小、节约空间的优势,不仅图文声像并茂,艺术感强,而且能提供查询、统计、分析、排序,具有智能价值等优势;在数字化图书馆中,电子文献日渐成为其主体内容。尽管电子型文献正在迅猛发展,但是印刷型文献的许多优点,比如阅读方便、易于携带、阅读成本低等也是电子文献所无法取代的。同时,读者阅读习惯的改变也需要一定时间。以纸质为载体的印刷型文献还不可能完全被电子型文献所取代,两者并存的局面还将持续相当长的时间。这种信息存储载体的多元化,打破了传统图书馆文献传递的服务方式,极大地丰富了馆藏,方便了不同读者的需求,但同时也使信息资源采集工作日趋复杂和多样化。信息采集的对象不再只是纸质型文献和声像资料,还有大量的电子出版物、光盘、缩微文献、电子图书、数据库及网络文献等等。可见数字出版环境下要采集的信息不仅仅是印刷型、视听型、机读型,还有光盘型和网络型,各类文献并存,互为补充、成为整体,信息资源结构呈现出多元化特征。
3.2 对信息资源内容选择的影响
数字出版对信息资源内容选择的影响主要体现在信息资源内容范围的新扩展。一是网络数据库或光盘数据库的出现为图书馆馆藏内容范围的扩展提供了条件。因为网络数据库或光盘数据库本身都具有完整性和系统性的特点,不像印刷型文献那样,需要经过长期系统地积累,才能成为完整系统的文献集合体。因此,图书馆一旦购进了网络数据库或光盘数据库,该数据库就能立即成为这个图书馆馆藏的有效组成部分。由于这类数据库的内容完全可能是以往传统图书馆所不收藏的,如产品数据库、专利数据库等,这样就使数字图书馆能迅速扩展其馆藏内容范围。二是因特网为图书馆提供了丰富的信息资源,其中蕴藏着大量有价值的零次文献及其他信息,而许多信息是传统图书馆所无法收集的。因此,图书馆的馆藏内容范围与过去相比,出现了新的扩展。
数字出版环境不仅使图书馆文献资源内容的选择更为广泛和丰富,而且带来了新型的文献资源类型,即开放存取的类型,这一新的文献资源类型给图书馆带来了新的机遇与挑战。随着开放存取运动的蓬勃发展,因特网上出现了相当数量的开放存取学术资源,包括开放期刊、开放仓储、开放图书、开放课件等等,使图书馆可以抛开资金的限制去实现对学术资源尽可能大的扩容。开放资源的“更新快,时滞短”和“版权限制小”[4]的特点如果能得到充分利用,用户能在最短的时间了解到最新的研究成果。而开放存取资源无需购买使用权,只要与互联网相连用户就可免费获取到,使得资源共享得以真正实现。开放存取模式下的共享扩展了传统信息资源共享的时空范围,提高了信息资源共享的广度与深度。
3.3 对信息资源采集方式的影响
传统的图书馆文献采购仅能靠印本书目、订单或实体书店。实现数字发行后,电子商务与网上书店采购被普遍应用。网上书店是流通网络化的表现,而电子商务则是交易电子化的产物。图书馆对文献的采购方式需要随之变革,除了使用印本书目和电子目录来采集文献之外,网络信息采集也将成为图书馆工作重要部分,通过对网上各种信息的收集,制定出文献采购策略,针对性采购本馆所需文献。在数字化资源建设过程中应该接受“能获取,但不拥有”的理念。在数字化时代,大多数印刷型书刊都将成为联机数据库型的数字化文献,图书馆只需购买“许可权”,这些联机数据库实际就成为图书馆的“虚拟馆藏”。获取数字资源的方式,除了购买外,还有租借、联网检索等各种形式。
可见在数字出版环境下信息资源获取方式由单平面向多层次、多渠道转变。
3.4 对信息资源采集结构的影响
传统图书馆的馆藏资源主要由大量印刷本文献构成。数字出版技术广泛应用后,出版物的品种和类型出现多样化,这样就使得图书馆的馆藏结构发生明显改变,馆藏文献类型出现多元化。电子资源在图书馆馆藏资源中的比例日渐加大。
数字化信息资源建设需要考虑数字化信息资源内部各类型之间的比例关系,还要考虑到数字化信息资源与传统型文献资源之间的比例关系,根据本馆的用户需求特点以及经费情况合理配置各种数据库,包括单机数据库、联机光盘数据库、网络数据库以及网络电子书刊。另外,图书馆还需要合理规划印刷型文献资源与数字化信息资源之间的比例,使各类型信息资源有机地结合,发挥出最大的效益。有关资料显示,现在美国多家图书馆近年取消了多种印刷期刊的订购,原因就是与电子资源重复。目前,为了适应文献存贮与传输介质的变化和发展,为教学和科研提供信息资源保障,图书馆应改变当前馆藏以印刷型文献为主的局面,逐步扩大数字化信息资源收藏比例,并朝以数字化信息资源采集为主的方向发展。如在国内,国家图书馆(以下简称“国图”)自建和购买的数字资源已经达到250个TB,包括现有购买、自建及通过其他方式获取的中外文数据库136个,以每年7000—8000种文献的入库量,不断丰富着音像资源和多媒体光盘资源等。[5]正是基于强大的数字资源,使国图利用3G高速传输的特点,为读者提供了包括短信服务、移动数字图书馆、国图WAP、国图漫游和手机阅读等多种服务。
3.5 对信息资源采集经费的影响
经费短缺是一直困扰图书馆的难题。在数字环境中,各图书馆可以便捷地使用各地的信息资源,各图书馆可以将有限的经费用于购置各馆最常用的、有特色的文献,而其他信息需求则可以依靠网络资源去满足。但是,作为馆藏资源重要组成部分的电子文献,价格和配套费用较高,除需要较多的一次性投资外,还需要有较稳定的连续投资。并且电子文献对通讯设备、馆舍的布线及配套设备要求较高,因此,基础设施投资增大,图书馆的经费问题将更加严峻。
对于一般中小型图书馆来说,可以通过网络方式采集世界各地的各种学科、各种类型的信息资源。在经费的分配中,要根据资源共享的原则,用有限的经费去购买本馆最常用的文献,对于价格昂贵、用户较少的文献,则可以通过资源共享的方式去解决。在经费许可的情况下,可以订购配套印刷版和电子版文献。若是经费紧张应优先购买电子版文献,对于网络版数据库应通过合作采购的方式来降低成本。由于电子出版物信息量大而价格较低,可以根据各馆的用户和设备特点,有计划地分期分批采购不同种类的数字文献,如电子图书、期刊、数据库等,从而达到节约经费,补充现有馆藏信息不足的目的。
4 数字出版环境下信息资源采集的策略分析
4.1 梳理关系,准确定位
数字出版环境下图书馆信息资源的结构、获取方式以及信息资源保障体系的建立和质量评价标准都发生了很大变化。信息资源采集必须理清层层关系,根据各馆的服务对象、工作任务和有限的资源条件,在初始阶段就进行合理的定位。
理顺关系主要是要理清:(1) 价值与需要的关系。如何平衡“读者需要”与“文献价值”是信息采集过程中必须面对的问题,而以普尔、克特为代表的“需要论”和以杜威为代表的“价值论”是两个不同流派,推瑞和布斯威克综合了两者的思想,进一步发展了“需要论”的理论,认为选择文献一方面要重视出版物本身的价值,另一方面要重视社会的需要。[6]采集应当以需要为主,兼顾保存价值。(2)存取与拥有的关系。存取一般是指利用其他成员馆或信息提供者的信息资源来满足本馆用户信息需求的行为。拥有则是指通过收藏信息资源满足本馆用户乃至网络用户的信息需求行为。数字环境下,“拥有”本馆馆藏和“存取”馆外信息的关系不是相互对立或者必居其一的关系,而是相辅相成、长期共存、缺一不可的互动关系。应以资源共享为宗旨,注意“存取”与“拥有”之间的平衡。值得注意的是,拥有与存取的新发展——开放存取的出现。开放存取指的是数字化信息资源的免费共享和利用,具体地说,就是任何人通过互联网都可以实现对信息资源的免费浏览、阅读、下载、复制、传播、打印、检索和全文链接,可以对文献进行自动采集并建立索引,可以将作品作为数据传递给相应软件,或者进行任何其他合法使用。[7]开放存取这种鲜明的特点和优势在经费、理念、资源共享等方面给信息采集带来了积极而深远的影响。(3)购进文献与购买服务的关系。购买服务主要是指有偿地利用本馆之外的文献信息来为本馆的读者服务,以购买服务的方式为读者提供资料,并将其作为对购进文献的强化与补充是切实可行的。但购买服务同样有不少制约因素,如剥夺读者的浏览权,购买服务获取的信息资源使用的一次性及时效性等与购进文献相比都有差距。购进文献与购买服务应保持适当的平衡,应当综合考虑各种因素,做到成本最优,最经济地优化资源配置。(4)实体资源与虚拟资源的关系。现代图书馆馆藏的内涵远远超越了印刷型、缩微型、视听型资料的范畴,延伸至各种不同信息格式、信息类型的数字信息资源。现实馆藏与虚拟馆藏是相互依存而又各自独立的信息资源,两者将长期并存互补,并可以在一定条件下合理转化。因此,图书馆的信息资源建设要做到实体馆藏和虚拟馆藏合理配比、均衡发展。
合理定位主要有以下几个方面:(1)总体目标的合理定位。信息资源采集的目标应该根据图书馆的性质、任务来确定。(2)学科专业结构的合理定位。在明确总体目标后,需要明确信息资源在各学科专业之间的分配比率,也即信息资源学科专业结构的合理定位。(3)时间和文种结构的合理定位。不同专业对资源的时间要求不尽相同,有的在时间构成上是求新、求快,但有些特殊的专业可能并不如此,像语言、文献、历史等可能要求是跨度要尽量的长。不同专业对资源的文种要求也各不相同,有的以中文为主,有的可能是西文为主。(4)载体类型的结构定位。图书馆应该根据自身特点确定印刷型文献与非印刷型文献的采集比例,印刷型文献中图书、期刊等不同类型载体的采集比例,构建合理的信息载体类型结构。
4.2 合作采集,协调共享
随着信息技术飞速发展,文献信息种类繁多、变化快、信息量大,再加上读者需求的多元化、动态化,以及受经费的制约,任何一个图书馆都不可能依靠自身的力量将所有专业、所有类型的文献尽数收藏,全面满足读者多层次的需求。只有加强图书馆间的馆际协作,开展联合采购、联合存贮、联合编目、联机检索,实现资源共享,才是图书馆信息资源建设的必然发展方向。随着社会信息化的进程,人们可以通过多种渠道、多种手段来获取信息,图书馆将与其他信息提供机构展开激烈的竞争。因此,今天的图书馆比以前更需要合作,更需要充分发挥整体优势和潜能。合作不仅关系到每个图书馆的前途,也决定着整个行业系统的命运。
在图书馆网络化建设普遍展开的新形势下,特别是虚拟馆藏概念的出现,只有各馆都尽快建立起特色藏书,同时通过一系列的协议相互提供馆际互借、文献传送等保障性服务,图书馆的整体藏书建设才能称得上高质量、高品位,才能实现真正意义上的资源共享。因此,加强馆际采访协调与合作,明确重点分工采访,从根本上改变各馆片面追求“大而全”“小而全”的现象,才能实现信息资源的有效配置,建立起地区的或系统的文献保障体系。目前不少图书馆按地区组织了不同类型的文献资源共建共享协调网络,如中国图书馆学会建立的“图书馆集体采购协调中心”、广东省开展的“信息资源共享工程”“华东地区委属12所高校外刊订购协调中心”等等。
特别值得一提的是集团购买这一采集方式。集团购买是一种以统一联合体的方式来共同采集信息资源,实现联合体各成员之间互惠互利的重要手段。图书馆文献采集工作中典型的集团购买形式表现在超大规模、价格昂贵的数据库的联合引进上。如2001年北京大学、清华大学等联合引进了美国科学情报研究所(ISI)的科学引文索引网络版Web of Science。CALIS(中国高等教育文献保障系统,China Academic Library Information System)华南中心由中山大学牵头联合该地区数十家高校图书馆共同引进了生物学文摘(BA)网络版BP(BIOSIS Previews)。基于现阶段我国的国情和经济状况,图书馆文献采集工作中的集团购买正在成为资源有效配置的一种重要方式。集团采购包括地区采购协作协调和建立图书馆联盟。区域性采购协调以CALIS发展最为迅速,自1998年开始建设以来,CALIS管理中心引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库;采用独立开发与引用消化相结合的道路,主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。迄今参加CALIS项目建设和获取CALIS服务的成员馆已超过500家。[8]通过图书馆联盟和集团购买也正成为信息采集工作的重头戏。
4.3 突出特色,调整结构
在信息网络化的今天,借助于高速网络的数据库检索与信息传输发挥着日益重要的作用,图书馆以自身馆藏丰富服务于用户的优势正在削弱。因为,第一,任何图书馆单靠自己有限的馆藏来满足用户的无限需求是不可想象的;第二,用户对信息的获取主要取决于信息的准确性、新颖性和获取的方便性,而不管是从哪个国家、哪个图书馆获得的。图书馆的价值不再以其拥有的馆藏规模和广度来衡量,而是以它为用户提供所需信息的能力来衡量。因此,一个图书馆的特色收藏将是一个图书馆的生命和存在的价值。未来图书馆的发展只有依靠特色才具有生存空间。
资源特色化建设主要包括:(1)专业特色。即对某个学科、某些专业和专题的信息资源进行完整系统地收藏,形成专业特色。这种具有针对性的信息资源建设是未来图书馆的立足点。(2)地方特色。一个图书馆的发展在重视大环境的同时,必须立足本地区,为当地的信息用户提供信息资源和信息服务。因此,图书馆要根据本地区的地理、历史、经济、文化特点,建设完整系统的信息库,从而形成地方特色。(3)类型特色。根据图书馆的任务、历史特点和有关部门的统筹安排,对某些信息媒体类型进行采集和系统收藏而形成特色。(4)文种特色。根据某种历史渊源和现实条件,对某些语种的信息资源进行系统采集,在形成特色的收藏基础上,建设开发特色数据库。
如何加强特色资源的建设,不少单位已经取得了不小成绩。如首都图书馆的《北京地方文献报刊索引》、上海图书馆的“中国文化名人手稿馆”、山东省图书馆的《山东省图书馆藏易学书目》、山东泰安师专图书馆的“泰山文献室”,以及“北京大学学位论文”“中国人民大学文库”等,都值得我们学习借鉴。
特色文献资源建设还应注重文献收集的途径与载体的多样化。特色文献由于出版发行上的原因和图书馆购书经费的限制,不易收齐,通常要多渠道、多途径进行收藏,除了正常订购、采购外,还可以通过信函征集、资料交流、广告征集、上门收购、接受送缴、建立征集网络、馆际间的协调协作等方式来进行收藏。另外其载体类型不仅要包括印刷型文献,还应包括电子文献信息,种类有电子期刊、电子报纸、电子信息查询系统以及磁带式、光盘和联机方式的特色文献数据库等。
要重视有特色的二、三次文献数据库的建设。具有特色的数据信息资源是图书馆信息资源建设的创新标志,是对馆藏信息资源或社会信息资源开发的有力手段,只有形成特色才有不可替代性,才具有存在的价值,才能为实现信息资源共享作出一份贡献。
4.4 加强调查,合理配置
数字出版环境下进行多元化信息资源建设的同时必然涉及到馆藏资源的合理配置问题,要求加强服务对象及其需求,信息资源的可获得性、易用性以及费用等情况的调查,以求做好馆藏资源的优化配置,充分发挥资源的使用价值,充分实现图书馆的职能。
要合理配置馆藏资源和网上资源。虽然电子文献大大丰富了图书馆信息资源基础,但并不意味着可以取代图书馆文本文献的收藏。图书馆应致力于馆藏文献的发展,从实际出发,在对馆藏信息资源进行系统规划和合理配置时,要兼顾不同类型和层次的读者的信息需求,建立最佳的信息资源模式组合;要考虑不同信息载体的优势和劣势,兼顾纸质资源、电子资源和其他载体资源,实现不同载体信息资源的优势互补,整合实体资源与虚拟资源,形成完整统一的馆藏体系,从而实现各类资源的最佳配置,以充分发挥各自的功能和优势。
[1]徐丽芳.数字出版社:概念与形态[J].出版发行研究,2005(7):5-12
[2]郑松涛.我国数字出版发展态势分析[J].河北青年管理干部学院学报,2006(3):104-106.
[3]唐秀峰.数字出版与图书馆新服务模式[J].科技情报开发与经济,2008(35):47-48.
[4]陈振辉.高校图书馆开放存取资源建设浅析[J].图书馆研究与工作,2007(4):32-34.
[5]寿婷尔.读书日:国家图书馆行驶在数字化轨道上 [EB/OL].(2009-04-24).http://info.edu.hc360.com/2009/04/241103173552.shtml.
[6]石武强.试论文献采访中平衡“读者需要”与“文献价值”的关系[J].图书馆工作与研究,2003 (2):10-12.
[7]罗竹莲.拥有与存取理论在图书馆信息资源建设中的应用 [J].兰台世界,2008(8):62-63.
[8] CALIS 介绍 [EB/OL].(2009-11-28).http://www.calis.edu.cn./calisnew/cails_index.asp?fid=1&class=1.