图书馆OA数字化文献资源建设相关问题分析与对策
2018-11-13
(山东省图书馆,山东 济南 250199)
开放获取(Open Access,OA)运动在国内外已经有10多年的发展历程,目前正借助互联网时代逐渐向深入发展。OA数字化文献资源已经成为包括图书馆在内的所有互联网用户重要的数字化文献资源类型。不过,由于受到多方面主客观因素的影响,图书馆在建设OA数字化文献资源过程中,仍然存在着一些值得分析和研究的问题。在此,对其中的文献搜索、文献下载和文献存储问题进行研究和探讨,并力求寻找到解决问题的相关对策。
1 图书馆OA数字化文献资源建设中的文献搜索问题分析与对策
1.1 搜索引擎工具使用问题的分析与对策
图书馆OA数字化文献资源建设过程中的文献搜索是首要工作环节,其中存在着一些值得分析和研究的问题,包括选择搜索工具、采用搜索方法、掌握搜索技巧等方面。其核心目的是解决在互联网上能否搜索到所需要的OA数字化文献资源的问题。选择搜索工具的主要内容集中在对于搜索引擎和浏览器的选择方面。因为从搜索引擎工具的角度来讲,使用不同的搜索引擎,其搜索效果往往差别很大,这种差别主要表现在文献搜索的全面性(要求数量大)、准确性(要求命中率高)和速度性(要求搜索速度快)。目前,在互联网搜索过程中,用户使用最多的搜索引擎有百度搜索引擎、谷歌搜索引擎、搜狗搜索引擎、360搜索引擎等。这种排序是根据我国用户的熟悉程度设定的,然而,从实际搜索效果和准确的搜索统计数据来看却并非如此。因此,在实际的文献搜索过程中,要科学合理并灵活地选择使用各种搜索引擎工具。
1.2 搜索引擎和浏览器使用问题的分析与对策
以2017年12月29日通过互联网搜索语句“学术共产主义开放获取文献资源网站”为例,其采用加引号限定的精确搜索方式,各种搜索引擎的搜索统计数据分别为:谷歌166条、搜狗39条、360搜索33条、百度21条。将此语句改为未加引号的常规搜索,其统计数据分别为:谷歌 103 000 条、360搜索 56 100 条、搜狗9701条、百度95条。由此可见,使用不同品牌的搜索引擎工具最终搜索的结果相差很大,这种状况势必会对图书馆OA数字化文献资源建设产生重要影响。与搜索引擎工具类似,使用不同品牌的浏览器工具,往往会对不同文种OA数字化文献资源的搜索结果产生重要影响。例如,在浏览器是否具有外文网站在线翻译为中文界面的功能方面,不同品牌的浏览器往往差别很大。其中既有直接提供翻译功能,且使用方便的浏览器,如360安全浏览器、搜狗浏览器;也有可以添加翻译功能,使用不太方便的浏览器,如IE浏览器;以及不具备翻译功能的其他品牌浏览器等。
1.3 搜索真实性、方法与技巧问题的分析与对策
在图书馆建设OA数字化文献资源的互联网搜索过程中,还会遇到搜索真实性的问题,即所搜索到的数字化文献资源是否真正的OA数字化文献资源的问题。因为在互联网搜索实践中,往往存在着有些名义上为开放获取文献资源,实际却并非如此的情况。此时需要利用图书馆员的搜商素质和搜索能力,配合相关的技术手段和方法加以鉴别和验证,不可盲目地相信一些网站的广告和宣传。在采用搜索方法方面,需要在搜索的过程中灵活机动地综合运用各种科学有效的搜索方法。其中包括常用的顺查法、倒查法、抽查法、追溯法、交替法、关键词法、翻译法、限定法和搭脚手架法等。掌握一定的搜索技巧也是取得搜索成功的重要条件,在特定情况下甚至是关键性条件。例如,对于各种特定格式的OA数字化文献的搜索技巧,OA数字化古籍文献的搜索技巧,国外OA数字化文献的搜索技巧,网盘OA数字化文献的搜索技巧等。
2 图书馆OA数字化文献资源建设中的限定条件下载问题分析与对策
2.1 注册登录限定性下载获取问题的分析与对策
这是指部分OA数字化文献资源下载获取的前提条件,是需要用户在相关的文献资源网站上注册登录后,方可实现下载获取,而不能直接下载获取的一种限定性下载获取情况类型。对于这种用户必须注册登录后方可开放获取的限定性下载情况进行原因分析,会发现这是网站为了便于统计、分析和掌握客户数量及其相关信息,从而为网站的有效运营和扩大发展提供客户统计数据而采取的相关技术性管理措施,同时也是许多网站通常所采取的技术方法。对于这种注册登录限定性下载情况的解决和处理方法一般比较简单:一、可以按照网站的要求进行注册和登录即可;二、对于某些文献资源网站,如较为常用的文档分享资源网站,则可以采用专用的文献资源下载器下载,如常用的百度文库、豆丁网、道客巴巴等文档分享资源网站,可以采用冰点下载器进行下载获取;常用的优酷、爱奇艺、腾讯、百度等视频文献资源网站,则可以采用“硕鼠下载器”或专用的视频播放器进行下载获取,从而可以有效地解决需要注册登录的限定性下载获取问题。
2.2 消耗积分限定性下载获取问题的分析与对策
这是指部分OA数字化文献资源下载获取的前提条件,是需要用户在相关的文献资源网站上具备并消耗一定数量的积分虚拟货币后,方可实现下载获取的一种限定性下载获取情况类型。这种虚拟货币在不同的网站有不同的名称,常见的名称有积分、财富值、豆元、金币等。产生这种限定性情况的原因往往是多方面的,多见的原因如网站为了进一步扩大影响,或文献资源的上传者为了通过积分换取一定的报酬,抑或是为了通过积累积分获得自己的相关下载获取权力等。对于这种消耗积分限定性下载获取情况的解决方法,一是可以通过参加网站所要求的各种活动来积累积分,但这需要付出一定的时间成本,而且会受到网站规则的制约,无法随心所欲地获取积分;二是选择更为有效也是速度更快的解决方法,即可以采用专用的文献资源下载器软件进行下载获取,从而免除所有的积分类虚拟货币的限定性下载获取条件。
2.3 设定密码限定性下载获取问题的分析与对策
这是指部分OA数字化文献资源下载获取的前提条件,是需要用户在相关的文献资源网站上提供所需要的密码后,方可实现下载获取的一种限定性下载获取情况类型。对于设定密码限定性下载获取情况的原因进行分析,排除一些非正常情况的黑客所为外,往往属于上传开放获取文献的拥有者所做出的条件限定,即不想过于让自己所上传的开放获取文献资源处于完全开放的环境之中,而是针对特定需要的用户实行开放获取。在这种情况下,就有必要采用一定的限定性措施,而下载获取密码就是最为常用的一种限定性技术手段。根据密码限定级别的不同,又可分为设定提取密码、下载密码和解压密码1—3个层次的不同下载密码情况。对于设定密码限定性下载获取情况的解决对策,可以采用通过相关渠道首先获取到下载密码,然后再运用下载获取的方法予以解决。密码设置的类型主要有集中统一设置型、分散单独设置型和分散集中混合设置型3种。集中统一设置型一般是由文献资源整合网站集中统一设置的文献开放下载提取密码,分散单独设置型多为开放获取文献上传者为每种文献下载获取时为用户单独设置的独立获取密码。
2.4 开放获取数字化期刊设定密码限定性下载获取实例
在此以开放获取数字化期刊文献资源为例,对设定密码限定性下载获取的实例予以解析。首先,通过开放获取数字化期刊文献资源整合网站获取密码的方式予以解决。如对于仅具有设定获取密码一个密码级别的期刊文献资源,通过网站渠道取得获取密码即可解决。如“百度网盘”网站中设置有获取密码的部分整本开放获取数字化期刊文献资源就是如此。具有提取密码和解压密码两个层次的下载获取密码,需要首先输入第1层次的提取密码下载获取到文献资源,然后再输入第2层次的解压密码将下载获取后的压缩文件予以解压缩。若为具有3个层次的提取密码、下载密码和解压密码,则需要首先利用获取密码获取文献,再利用下载密码完成下载,最后再利用解压密码完成文献的解压缩。如“云杂志”“尚杂志”“谷博杂志馆”“喜泡泡杂志馆”等网站免费期刊栏目中的整本开放获取数字化期刊文献资源即是如此,它们分别都采用了3个层次的密码限定性下载获取措施。
3 图书馆OA数字化文献资源建设中的下载过程中的问题分析与对策
3.1 无法下载获取问题的分析与对策
这是指原本可以从网盘下载,但现在无法直接从网盘中下载获取利用的情况。对于这种情况进行原因分析后,认为此类情况的原因相对较为复杂,其中既有短时间内用户从网盘下载文献数量过多,引起网盘启动的技术性下载限定措施发挥作用;也有计算机系统反应迟缓的原因,导致短时间内出现无法直接从网盘中下载获取利用的情况;还有一些属于原因不明或已经不值得再去深究的原因。对于这种无法下载获取情况的解决方法,可以采用将需要下载获取的OA数字化文献资源先保存到用户自己的网盘中(前提是需要有先注册的网盘),然后再从网盘中下载获取的方法予以解决。另外一种解决方法,是可以先退出网盘,推迟一段时间后再打开网盘继续下载的方法解决。实践效果证明,这往往是一种较为有效的解决方法,尽管需要占用一定的延时时间。
3.2 中途下载获取失败问题的分析与对策
这是指下载获取过程中出现中途下载失败的情况。对于这种情况进行分析后发现,它往往也是由于多方面的原因所造成的。其中既包括有采用某种品牌的浏览器的技术性原因,也包括有网络运营商对下载文献资源数量较多时所采取的限定性措施原因,还包括受到网络带宽限制而产生的通过网络节点产生局部拥堵原因。如利用搜狗浏览器下载获取过程中,其最大同时下载文件数量一般为5个,其余文件处于等待下载获取状态中。如在下载过程中会出现下载速度逐渐减慢,以至于最后出现下载失败的提示。此类情况往往出现在需要下载获取容量较大的文件时,如50MB以上,甚至数百MB的大容量文件情况。对于下载获取过程中出现中途下载失败的情况,最常用也是最有效的解决办法,是更换不同品牌的浏览器。如及时将搜狗品牌浏览器的下载获取工作,改为由谷歌品牌浏览器下载获取,在下载获取的过程中往往会取得相当好的效果。
3.3 下载获取速度下降问题的分析与对策
这是指下载获取过程中出现因网站限速导致下载速度明显下降的情况。它一般是由于网站或网络运营商通过技术监控措施,发现存在用户大量下载文献资源的情况后,所采取的技术性限速措施,其目的往往是为了在一定范围内平衡分配各用户之间的网速。对于这种下载获取速度下降的情况,可以采用先暂停下载,然后通过继续下载以便获得加速的方法予以解决。以搜狗浏览器为例,当同时有5个文件正在下载,每个文件约50—60K/秒的下载速度,不久后(往往数分钟)其下载速度就可能会急剧下降到10—20K/秒。此时需要点击暂停一下,然后马上恢复下载,则可以达到瞬间100—200K/秒的下载速度,然后又恢复到正常50—60K/秒的下载速度。另外,根据下载速度的具体情况,也可以尝试在不同品牌的浏览器之间相互转化,根据实际情况予以优选解决。这种解决方法在网速不变的情况下,有时可以达到原有下载速度的6倍左右,效果往往是非常明显的。
4 图书馆OA数字化文献资源建设中的文献存储问题分析与对策
4.1 文献存储方式的选择问题分析与对策
在图书馆OA数字化文献资源建设过程中,对于已经通过搜索过程、下载获取过程获取到的OA数字化文献资源,只有将其保存和存储到一定的数字化存储空间中,方可以实现将互联网上的OA数字化文献资源成功转变为图书馆的馆藏开放获取数字化文献资源,从而最终完成图书馆的OA数字化文献资源建设过程。所以,图书馆对OA数字化文献资源的数字化存储是重要的工作环节,也是文献资源建设的最后环节。在这其中首先涉及选择存储方式问题。一般情况下可以选择网下存储方式、网上存储方式以及网下网上同时存储方式3种存储方式。网下存储方式的优势是可以单独变为图书馆所拥有的OA数字化文献资源,而不再会受到互联网上各种因素的影响和干扰。缺点是需要图书馆投入资金购置存储所需要使用的相关设备。如图书馆服务器设备、图书馆移动硬盘设备。网上存储方式的优势是可以节约图书馆购置存储设备的资金,甚至可以实现免费存储。缺点是可能会受到互联网固有缺点的影响,从而影响到图书馆存储OA数字化文献资源的稳定性。而网下网上同时存储方式,一方面同时具有两种存储方式的优缺点,另一方面,可以通过优势互补、缺点互抵,达到更好的存储效果。
4.2 文献存储及其时限性的问题分析与对策
在图书馆OA数字化文献资源存储的实践过程中,存在着一些需要研究和解决的相关问题,其中主要集中在文献存储的容量性、时限性和速度性问题三方面。如果这些问题不能得到妥善的解决,则存储过程将难以顺利实现,从而最终影响图书馆OA数字化文献资源建设的效果。文献存储的时限性是指OA数字化文献资源在存储空间中可以存留时间的长短。由于它体现了文献存储的时效问题,所以,也是文献存储的重要指标之一。文献存储的时限性目前包括永久性存储、限时性存储和同时存在的混合性存储3种类型。图书馆在OA数字化文献资源存储的实践过程中,要根据实际需求灵活地进行选择文献的存储时限,对于没有必要长久存储的文献,可以采用临时存储措施。即使已经长久存储的文献,也可以根据实际需要调整为临时存储或予以删除,从而为新增文献腾出所需要的存储空间。
4.3 文献存储容量性的问题分析与对策
文献存储的容量性是指OA数字化文献资源能够获得多大的存储空间,由于它体现了文献存储的空间大小问题,所以,是文献存储的重要指标之一。文献存储的容量包括文献存储空间的总容量问题和存储文献的单个容量问题。从理论上讲,总存储容量和单个文献存储容量当然是越大越好,因为这样可以解决任何容量大小文献的存储。然而,由于受到各种条件的限制,这种理想化的存储容量是很难达到的。所以,在这种情况下,就要寻找尽可能接近理想存储容量的条件。就目前网下和网上存储的现实情况而言,某些电子邮箱(如网易126邮箱)存储可以基本实现无限总容量的文献长久存储,但是其单个文献容量则一般限制在50MB以内,临时存储单个文献容量限制在2GB以内。所以它仅适合存储大量单个文献容量较小的OA数字化文献资源。目前“115网盘”单个账户的总存储容量在10TB,单个文献存储容量在5GB。通过注册多个账户,它适合图书馆存储单个容量更大的文献资源。
4.4 文献存储速度性的问题分析与对策
文献存储的速度性是指OA数字化文献资源在向存储空间上传存储或从存储空间下载获取(即反存储)过程中,文献资源的上传或下载速度快慢,由于它体现了文献存储的效率问题,所以,也是文献存储的重要指标之一。存储文献上传或下载速度的快慢问题,往往取决于多种因素,其中既有电信运营服务商的网络带宽影响因素,也有存储文献所使用网站的技术性因素,还有用户所使用浏览器的技术性因素,以及图书馆工作人员的操作水平因素等。图书馆可以自主采取对策提高存储速度的因素主要为后3种因素。即在满足其他存储条件的基础上,选择存储和下载速度更快的文献存储资源网站,采用存储和下载速度更快的浏览器,提供图书馆员文献存储所需要的技术水平,掌握能够及时处理各种存储和下载传输问题的技能。
5 结 语
随着国内外来自政府、学术组织、出版发行机构、图书馆等文献收藏和服务机构,以及广大互联网用户的全方位支持,OA数字化文献资源正在日益成为包括图书馆在内的所有用户重要的数字化文献资源来源类型。图书馆要在OA数字化文献资源建设的过程中,只有认真分析和研究所遇到的各种问题,并且有针对性地提出相应的解决对策,才能够更为顺利地完成建设任务,从而进一步丰富图书馆的馆藏数字化文献资源,为用户提供更为有利的文献资源服务保障。随着互联网时代各种新技术的不断发展,图书馆在OA数字化文献资源建设的过程中也会有新的问题出现,不过,它们也同时为图书馆提供了新的学习机会和研究空间。