数字图书馆远程访问技术之测试分析
2009-11-19王寒冰
王寒冰
〔摘 要〕随着网上电子资源的极大丰富,远程访问数字图书馆资源的技术被广泛的关注。本文基于本校图书馆实际环境,就目前比较流行的VPN和反向代理技术及其访问模型展开研究,分析相同网络环境下各自的应用效果和网络数据流通,旨在得出远程访问电子资源较优的可行性措施参考。
〔关键词〕远程访问;测试分析;反向代理;VPN
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2009)09-0104-04
Test Analysis of the Long-distance Access of Digital LibraryWang Hanbing
(Guangzhou Radio & TV University,Guangzhou 510091,China)
〔Abstract〕With the development of electronic resources,more and more attentions were paid to the long-distance access of digital library.According to the actual situation of Guangzhou radio & TV university,this paper studied on VPN and reverse web proxy,and the access model,obtained the correlation data though the experiment.The goal is to obtain a feasible solution.
〔Key words〕long-distance access;test analysis;reverse web proxy;VPN
随着网上电子资源的极大丰富,解决远程访问数字图书馆资源的技术被广泛的关注。
远程访问电子资源,又叫校外访问(off-campus access),是指突破IP地址的物理限制,可以在任何能上网的地方使用电子资源。然而,高校图书馆购买或租用的电子资源提供商都对其数据库产品有相应的知识产权保护措施,以防止资源的非授权使用和无限制传播扩散。正是在这样一种保护知识产权的背景下,电子资源使用范围的限制就制约了师生对资源的利用。因此,利用现代网络技术实现灵活的校外访问一直是各大高校数字图书馆亟待解决的问题。
本文针对本校图书馆实际环境,就目前比较流行的VPN和反向代理技术及其访问模型展开研究,分析相同网络环境下各自的应用效果和网络数据流通,旨在得出远程访问电子资源较优的可行性措施参考。
1 应用需求
本馆作为远程开放大学各种远程教学资源和
参考文献的主要来源,为师生配备了众多电子图书和学习资源,同时,本校校园网提供了足够的网络带宽供远程学习使用,如果能够实现资源随时随地地查阅和共享就能极大的丰富远程教育内容。
远程访问的实现概括来说均通过伪装校园网IP来实现,要么借用校园网内IP身份访问,要么临时通过专用设备分配校园网内IP实现访问。通过观察,对图书馆的访问行为多是出于文献的查看,在数据传输的安全方面VPN和Web反向代理技术均能达到应用要求,而数字图书馆远程访问用户大多数都是非计算机专业人士,而图书馆的维护人员也不可能上门去维护、安装,因此用户使用的简单、方便性应是首要考虑的。
2 模型分析
2.1 VPN技术模型
目前,VPN主流应用技术分为两种:IPsec VPN和SSL VPN.IPsec执行的是网络层协议,IPsec VPN在正式通信前通信双方要遵循某些要素和策略的协定,如协议的操作模式、密码算法、密钥等,要求在通信双方设备上安装特定的客户端软件。SSL VPN是一种基于SSL/TSL的协议,以Web Server构架为依托的VPN实现,在数据传输中的数据包进行加密,从而在应用层保护了数据的安全性,SSL VPN在每一次通过浏览器建立通道的时候,会自动将ActiveX或Java程序下载到本地,做SSL代理程序,同时,把相关客户端的数据打包到SSL通道中去,同时也具有相应的访问控制功能。
VPN技术实现的虚拟专网中,网络通信链接并不需要传统专用网络的物理链路,而是利用某种公共网络的现有物理链路动态组成。由于虚拟专网技术能够将外网客户端以虚拟网络的形式包含于校园内部网之中,所以外网用户也可以以合法身份使用内网的电子资源。VPN技术通过对用户的身份验证、地址管理、数据加密、密钥管理等特殊管理功能,保证了合法用户在校外访问校内资源的权利并提高了访问的安全性。
VPN访问模型如图1所示。
【说明】
<1>客户端通过互联网访问VPN专用设备,并进行身份验证。
<2>验证通过。
<3>服务器和客户端之间建立虚拟专网。
<4>用户通过专网发送请求,服务器通过专网返回请求内容。
2.2 Web反向代理技术模型
当代理服务器能够代理外部主机访问内部特定网络时,该技术就是Web反向代理技术,也叫改进的反向代理技术。此时,反向代理服务器对外部表现为一个虚拟服务器,其上并不提供服务的任何具体内容,真实服务提供者仍是内部服务器。
Web反向代理实质上是一种通过在繁忙的电子图书服务器和Internet之间增加一个高速的WEB缓冲服务器,使内部服务器对外部访问来说完全不可见,降低实际的数字图书服务器的负载的同时也增强了内部网络信息的安全,运行在应用层。当互联网用户访问某个电子图书服务器时,通过DNS服务器解析后的IP地址是反向代理服务器的IP地址,而非原始的IP地址,这时反向代理服务器充当真实服务器,浏览器可以与它连接,无需再直接与真实服务器相连。当师生在校外访问图书馆资源时,只需直接访问反向代理服务器,认为由其提供服务。
Web反向代理访问模型如图2所示。
<1>客户端发送请求,代理服务器对外充当电子图书服务器,用户并不知晓它的存在。
<2>代理服务器把请求转发给电子图书服务器。
<3>电子图书服务器识别请求来自校园网,返回请求内容。
<4>代理服务器最终将请求内容返回请求客户端。
3 测试分析报告
本测试利用VPN和反向代理技术展开网络流量测试和远程访问用户的应用测试,并针对不同的场合要求作出实际数据的综合性分析。
3.1 测试设备简介
VPN(SINFOR M5600-S VPN服务器)SINFOR M5600-S VPN服务器是面向大型企业、核心网络推出的电信级千兆VPN产品,适合部署在大型企业的数据中心、核心网络环境下。
反向代理软件(EZproxy)Ezproxy目前在国外已广泛应用,尤其是欧美高校更为普遍。目前,国内的北京理工大学、清华大学等已经正式使用该软件为师生提供数据库的校外访问服务。
3.2 测试构思
3.2.1 网络流量测试
网络流量测试使用2台计算机链接校园外部网络(简称计算机A和计算机B),机A作为测试监控机,B作为真实模拟校外远程访问机。其中,机B负责实施VPN方法和Web反向代理方法访问数字图书馆资源,主要测试活动为下载图书馆内同一较大资源,过程被机A监控;机A使用网络层监控分析软件对机B的活动实施IP对IP的单点监测分析,分析相应的网络流量统计,同时了解流量应用组成以及如何被利用以及检测网络带宽利用率等,以得到网络利用方面较优的方案。
3.2.2 应用比较
针对利用VPN和Web反向代理展开远程访问时,客户端的安装使用难易程度展开应用比较,以得到适合推广的客户端应用方案。
3.3 测试过程
3.3.1 网络流量测试
第一步,A和B分别分配同一网段的校园外网络IP:58.*.*.*,关闭两台计算机其他所有应用程序。
第二步,A打开网络分析软件,B登陆本校图书馆的校外访问入口:http:∥libgate.ougz.com.cn/login,找到下载资源链接,其中,资源大小为28 588 978字节(27.2M)。
第三步,B开始下载指定数据,A对下载过程实施监控,确保准确捕捉该下载行为影响到的网络数据。下载完毕后,捕获网络数据包、检测网络传输的所有数据。
第四步,B登陆VPN服务器,选择共享资源中的同一下载资源。
第五步,重复第三步。
3.3.2 应用比较
利用Web反向代理客户端登陆,只需在客户端浏览器登陆网址:http:∥libgate.ougz.com.cn/login,输入已注册的帐号,即可访问数字图书馆资源,用户使用没有特殊要求,与浏览网页一样方便,支持B/S应用。
利用VPN客户端登陆,需要安装客户端程序,并且给每个用户配备USB安全Key,普及起来存在一定的操作门槛,需培训使用。远程访问支持所有基于IP的C/S、B/S应用。
3.4 测试结果报告与分析
3.4.1 TCP会话测试结果
4.4.2 数据包分布饼图
4.4.3 测试分析报告
由测试分析可见,VPN技术接入方式灵活,安全性较高,但对一般读者而言对VPN使用环境的搭建有一定的使用门槛,同时,从数据分析看到,由于VPN在网络层传输数据需要二次封装,较大数据包的绝对数量和相对占有率都明显增加,传输利用率也有显著提高,但是在多用户同时访问时,会显著增加网络开销。也正因为如此,VPN技术的安全性能较高,所以一般应用在对安全性要求高的场合(如:校外网络管理)等。
Web反向代理通过解释访问的方式来实现远程访问。它提供了远程用户无缝访问图书馆的电子资源。反向代理模式不需要用户在客户端进行任何的配置,读者通过反向代理访问数据库行为和不使用反向代理访问数据库行为一致,不需要任何培训,读者可以从校外“透明地”访问被限定在校园网内地电子资源。还可以使用反向代理软件进行身份认证,方便管理和监控。EZproxy还可设置对某类电子资源进行保护,当读者使用反向代理服务器进行恶意下载时,系统会将该用户自动加入黑名单同时封禁其访问权限。
针对普通电子资源的校外访问,由于服务面广,用户技术层次不一,采用改进的反向代理模式可以减少用户配置工作量,并可以进行灵活的管理控制,因此选择改进的反向代理模式解决图书馆电子资源远程访问问题。
4 结论和展望
在倡导终身教育的今天,随着远程教育的日益普及和学习资源的日益数字化,一向禁锢在校园内特别是图书馆内的各种学习资源将不可避免的大范围开放给远程学习者使用。采用改进的反向代理技术能够实现方便的部署,便捷的访问,轻松使用,不失为一种比较好的解决方案。
在技术实现校外访问之后,由于互联网的无限延展性,对于著作版权的保护问题同样是要重视的问题,同时,伴随着电子资源的海量增长和不同用户并发访问,针对不同用户的特色访问和海量数据的分析以及更高的安全性也许就是今后要面临的新挑战。
参考文献
[1]叶新明.校外访问图书馆电子资源研究[J].图书馆杂志,2006,(4):43-45.
[2]侯福丽.合法用户校外访问图书馆电子资源方式探究[J].图书馆学研究,2007,(4):62-63,67.
[3]叶新明.美国大学合法用户在校外利用图书馆电子资源的访问方式调查与研究[J].大学图书馆学报,2006,(2):98-102.
[4]秦鸿.利用VPN技术实现远程访问的研究与实践[J].图书情报工作,2007,(3):117-120.
[5]夏志方.远程访问图书馆电子资源技术综述[J].图书情报工作,2006,(3):123-126.
[6]晁成春.高校图书馆反向代理服务[J].农业图书情报学刊,2007,(6):48-49,73.
[7]李玉壁.我国知识产权教育及政策研究[J].教育研究,2005,(5):58-63.
[8]张仁,等.基于Web浏览器的SSL VPN网关系统的设计和实现[J].计算机工程与设计,2007,(4):835-838,841.