北京大学桌面云解决图书馆运维“堵点”问题
2018-03-09张乃帅杜晓峰
文/张乃帅 杜晓峰
随着信息技术在图书馆的大规模应用,各类计算机及其外接设备如打印机、扫描仪、条码扫描枪等已经渗透到图书馆业务的各个环节当中。这些日益碎片化、场景化和智能化的计算机设备为图书馆的业务发展带来了日新月异的变化,但也对其管理与维护提出了挑战,一方面,随着数字图书馆的发展,计算机及其外设的数量和类型日益增多,给管理与维护带来难度;另一方面,在创新驱动发展的新形势下,图书馆人往往把目光聚焦在新服务、新技术应用层面,对重复、繁杂、枯燥以及具有不可预见性的计算机管理与维护不够重视,多处在维持状态,一旦出现问题如大规模病毒攻击等,用户损失就很惨重。随着计算机设备的增多,以及信息环境的不断开放,这种被动应对问题的管理模式已经不能适应图书馆信息化发展的需要,必须利用新的技术和服务手段,防患于未然。桌面虚拟化技术及私有云存储服务为我们提供了新的思路。本文将以北京大学图书馆为例,基于应用场景,探讨桌面虚拟化技术及私有云存储服务在计算机管理与维护中的应用,旨在为图书馆同行提供参考和借鉴。
图书馆计算机应用场景
北京大学图书馆现有计算机810余台,打印机和扫描仪120余台,条码扫描枪100余个。这些设备可分为四种应用场景,分别为图书馆日常工作用机、电子资源检索区用机、用户培训中心用机和OPAC检索区用机。
日常工作用机分布在各个部门,主要用于支撑图书馆各项业务的正常开展。
电子资源检索区用机主要供用户检索、下载资源、浏览网络等。北京大学图书馆的电子资源检索区共有计算机114台,自助打印复印设备3台,每年使用人次达20多万次。
用户培训中心是图书馆为校内外读者及工作人员提供培训交流的重要场所。北京大学图书馆的用户培训中心共有计算机61台,主要承担图书馆的“一小时讲座”;不定期的馆员业务培训;CALIS、CASHL各类业务培训等;不同的培训对操作系统版本、应用软件等的需求各不相同,对管理机制要求很高,若出现故障,会对培训工作造成很大影响。
OPAC检索用机功能单一,主要供读者检索书目数据库。
不同应用场景遇到的问题
图书馆日常工作用机
图书馆日常工作用机的管理与维护中主要存在以下几方面的问题。
1.机型各异,操作系统版本众多,难以统一管理
由于采购批次不同,馆员对操作系统的需求和接受度不同,以及部分业务软件对操作系统版本的特殊要求,导致图书馆日常工作用机的操作系统五花八门:Windows XP、Windows7、Windows8.1、Windows10等系统的32位及64位版本。在系统稳定运行的情况下,操作系统版本众多的弊端表现得没有那么明显,但是,在遇到应用软件故障、外接设备增加或者调整的情况下,操作系统版本众多的弊端表现得一览无遗。有时对于同一个原因造成的应用软件故障,不同版本的操作系统表现出来的故障现象不同,需要采取的应对措施不同,这需要运维人员具备丰富的经验及高超的排查手段,才能快速处理遇到的各类问题,减少对工作人员日常工作的影响。
2.数据无法统一备份
由于计算机分属不同的部门,由不同的馆员使用,每个人对数据备份的重视程度不同,对数据备份的频率也不同,一旦发生数据丢失,其恢复难度极大,尤其对于重要数据,一旦丢失造成的损失无法估量。以2017年大规模爆发的某病毒为例,该病毒主要通过邮件、远程桌面漏洞等方式进行传播,受害者一旦受到该病毒攻击,其计算机内存储的所有文档、图片等文件均会被病毒使用AES等加密算法加密,被加密过的文件无法打开,只有向木马发布者支付一定数量的比特币(或者其他不可追踪的支付方式)才能获取解密密钥进行解密,如无解密密钥,以现有计算机的计算能力,无法通过暴力计算的方法进行解密。对于这类数据丢失,一旦发生意味着数据将无法恢复,应对这类病毒,除了做好预防,加强防范意识外,完整的数据备份是唯一有效的数据恢复途径。
桌面虚拟化技术的应用可彻底解决使用还原卡维护电子资源检索区用机带来的诸多不便,可更快地满足读者的需求,减少维护所需的人力及时间。
3.计算机更换时用户的个性化需求会影响正常业务
通常情况下,计算机使用五年左右,其性能及稳定性明显下降,故障率显著上升。为保证业务的正常稳定开展,我们初步把五年设定为计算机的更换周期。在计算机更换过程中,需要进行数据迁移以及业务软件的重新安装。不同部门的馆员使用的常用软件不同,不同馆员使用同一种软件的个性化配置不同,无法为新置计算机预装及配置所有常用软件。几乎每台计算机更换后都要根据用户的使用情况进行个性化配置,即使这样,也无法做到更换完后的计算机与原计算机配置完全相同,所以,每次计算机更换后,馆员都需要适应一段时间才能熟练使用新计算机。
电子资源检索区用机
电子资源检索区计算机运行维护过程中暴露出的问题非常突出。概述如下:
1.现有保护还原方式技术落后,产品不稳定
电子资源检索区的系统保护还原使用的是硬盘保护还原卡的方式。还原卡安装在主板的PCI插槽里,通过还原卡的ROM芯片在计算机启动时最先获得控制权,接管BIOS的INT13中断,将FAT、引导区、CMOS信息、中断向量表等信息都保存到卡内的临时储存单元中或是在硬盘的隐藏扇区中,用自带的中断向量表替换原始的中断向量表;再另外将FAT信息保存到临时储存单元中,用来应付对硬盘内数据的修改;最后是在硬盘中找到一部分连续的空磁盘空间,然后将修改的数据保存到其中。这样,只要对硬盘的读写操作都要经过硬盘保护卡的保护程序进行保护性的读写,每当向硬盘写入数据时,虽然完成了写入到硬盘的操作,但并没有真正修改硬盘中的FAT。
这类保护卡采用的技术原理相对简单,但存在着病毒流行的风险。
2.维护操作不友好
硬盘保护还原卡方式对电子资源检索区的计算机进行维护时,通常是在其中一台上安装所有待维护的软件后,通过广播方式向其他客户端发送新的系统数据。更新方式包括全部更新和增量更新,软件升级维护较多的情况下,增量更新的数据量也异常庞大,达到GB量级,即使在百兆网络环境下,也需要较长时间才能发送完。而且数据更新时必须关闭电子资源检索区网络交换机的上联端口,否则将会出现广播风暴,导致整个图书馆网络瘫痪。所以,这种采用还原卡方式的系统维护非常受限,尤其在维护时间上很不灵活,一般只能安排在国家法定节假日或者假期闭馆时进行,否则就需要关闭电子资源检索区,影响读者使用图书馆电子资源。
3.还原卡缺乏行业标准
还原卡类产品目前缺少行业标准,还原卡的功能、稳定性等缺乏统一的规范。新产品的发布也缺少大规模的测试,产品质量参差不齐。还原卡在生产时是以当时已有的操作系统为基础进行设计的,随着技术的不断发展,操作系统版本也在逐渐更新,还原卡驱动无法兼容新操作系统的问题经常发生。这也导致电子资源检索区无法及时升级至最新操作系统,无法及时为读者提供最新的用户体验。还原卡厂商为了追求新功能,不断发布新版本的还原卡,对已发布的还原卡缺少必要的更新投入,导致不同版本的还原卡之间存在兼容性问题,无法协同工作。
4.故障排查困难
由于还原卡的质量不一且缺少公开维护文档,而由还原卡引起的问题往往无规律可循,故障表现也不明显,排查起来非常困难。
5.规模调整难度大
现有使用还原卡维护方式,对计算机配置、还原卡版本要求很高,只有使用同一版本还原卡且计算机硬件配置完全相同,才能进行统一管理。不同的计算机配置,使用的硬件驱动不同,只能分组进行维护。这极大地限制了电子资源检索区的规模。随着功能定位及读者需求的不断变化,电子资源检索区面临着合并、调整,这对管理维护提出了很高的挑战。
用户培训中心用机
用户培训中心因为面向不同的任务和需求,时常需要更换配置,更换应用场景,多操作系统间互相切换,既耗时又不好管理,尤其在不同操作系统之间切换更容易出问题。
用户无需关注数据存放在何处、存放于何种设备上,只需根据使用习惯存储及获取自己的数据即可。私有云存储服务即是将数据存储在本地数据中心也就是图书馆数据中心的云存储服务。
OPAC检索用机
OPAC检索用机应用场景比较简单,无需提供复杂的应用软件及数据库服务,只需提供稳定访问OPAC服务,方便读者检索馆藏资源即可。OPAC检索应用场景的特点是专用、简单、稳定。
桌面虚拟化技术及私有云存储服务解决方案
从上述计算机及外设管理可以看出,目前遇到的主要问题归结为两个方面,一是操作系统与硬件绑定,耦合度过高,硬件更换必然导致操作系统更换及数据迁移;二是馆员工作所用数据分散在各自计算机内,无法统一管理及备份。桌面虚拟化技术与私有云存储服务作为当前计算和存储领域的热门技术,其特性非常适合图书馆,可很大程度上解决当前图书馆计算机及外设管理中遇到的问题。
桌面虚拟化技术是指将计算机的终端系统(即桌面)进行虚拟化,以达到桌面使用的灵活性与安全性的技术。桌面虚拟化依赖于服务器虚拟化,是将位于数据中心的服务器虚拟化,生成大量的独立桌面操作系统,并通过专有的虚拟桌面协议发送给终端设备。
云存储服务是指将数据资源存储在数据中心而非本地,用户能够随时随地使用各种智能终端(PC、智能手机等)通过网络来访问和使用这些资源。用户无需关注数据存放在何处、存放于何种设备上,只需根据使用习惯存储及获取自己的数据即可。私有云存储服务即是将数据存储在本地数据中心也就是图书馆数据中心的云存储服务。云存储从使用者角度可以分为“存储为下载”、“存储为备份”和“上传下载均衡”三类。构建“存储为备份”的私有云存储即可满足常规备份需求,保护用户数据安全。
图书馆工作用机
针对现有业务部门遇到的操作系统版本太多,维护困难的情形,桌面虚拟化提供了完美的解决方案。根据部门的业务需求,制作预装常用软件的操作系统映像,并以该映像创建桌面池,部门馆员全部从桌面池中获取桌面,并在统一镜像的基础上补充所需个性化软件及配置,从而获得所需的完整桌面。馆员只需一台支持虚拟桌面访问协议的零客户端及鼠标键盘,即可访问自己的桌面。对于U盘、打印机等设备,可通过USB重定向等功能连接到虚拟桌面上,使用起来与本地计算机相比几乎没有区别。通过使用虚拟桌面,操作系统与硬件完全分离,本地使用的零客户端发生故障并不会影响到操作系统,只需更换零客户端并使用虚拟桌面用户名密码登录,即可获取到原来的桌面。由于零客户端内部构造简单,故障率极低,发生故障也不会导致数据丢失,无需现场排查维修,直接更换即可,可极大减少硬件故障对日常工作的影响,也可减少大量的硬件故障排查和维护时间。
定期备份虽能起到保护数据的作用,但是如果数据丢失发生在两次备份之间,丢失的数据也无法恢复。
针对数据分散无法统一备份的问题,虚拟桌面方案也能有效地解决。由于虚拟桌面在数据中心运行,用户数据也从分散的计算机中汇集到数据中心的存储服务器上。存储管理员可根据数据备份需求制定策略,定期备份用户数据,此过程甚至是透明的,用户无法感知到备份过程的存在。定期备份虽能起到保护数据的作用,但是如果数据丢失发生在两次备份之间,丢失的数据也无法恢复。存储为备份的私有云存储服务可有效地解决这一问题。用户只需在虚拟桌面内安装私有云存储客户端并做简单配置,即可实现数据实时同步到私有云存储上,对于文件被修改的情况,私有云存储上会生成该文件的不同版本并进行存储,用户可选择历史版本进行恢复,哪怕发生文件被勒索病毒加密的情况,也可轻松恢复,确保重要数据万无一失。
电子资源检索和OPAC检索用机
电子资源检索区遇到的问题也可通过桌面虚拟化技术予以解决。只需构建用于电子资源检索区的虚拟桌面池,并配置为定时刷新,即可满足电子资源检索区操作系统还原需求,定时将操作系统还原为最初安装版本,避免因读者更改配置导致计算机不可用或操作不慎导致的个人隐私数据泄露等问题的出现。对于电子资源检索区所面临的软件更新及维护操作,也无需关闭检索区机器来实现。通过在虚拟桌面管理端更新电子资源检索区桌面池模板虚拟机映像,并配置为下次刷新时使用新映像,即可在非开放时间更新桌面池中的所有桌面,无需占用电子资源检索区及OPAC检索区的开放时间。桌面虚拟化技术的应用可彻底解决使用还原卡维护电子资源检索区用机带来的诸多不便,可更快地满足读者的需求,减少维护所需的人力及时间。
OPAC检索用机可视为一个分散在各楼层的功能更单一的电子资源检索区,解决方案与电子资源检索区完全相同。
用户培训中心用机
针对用户培训中心应用场景,桌面虚拟化技术也能提供很好的用户体验。通过提前收集用户需求并制作不同的操作系统模板映像,根据不同的用户要求随时调整桌面池模板,即可实时满足用户需求,既提高响应速度又便于管理。
目前,桌面虚拟化技术已非常成熟,相关产品也非常多。北大图书馆采用国内某品牌的桌面虚拟化软硬件产品构建了桌面虚拟化环境并投入到实际生产环境使用,在管理及应用层面均取得良好的效果。以OPAC检索为例,虚拟桌面终端分布于各楼层各阅览室,供读者检索OPAC目录使用。随着北大图书馆馆舍改造的进展及馆舍布局的调整,这些OPAC检索用机可以方便地迁移至其他楼层,也可根据需要随时改变用途,变更为电子资源检索用机,满足不同的业务需要。
私有云存储服务目前也有很多商业产品及开源软件可供选择,以开源软件为例,Owncloud、Seafile、Sparkleshare等都能很好地满足需求,相应的开源软件社区可以提供大量的技术支持,如需更专业、有针对性的服务,还可购买相应的商业服务,服务非常灵活。
总结与展望
本文以北京大学图书馆为例,基于应用场景,分析了高校图书馆计算机及外设管理和维护中存在的瓶颈问题,并针对问题提出了基于桌面虚拟化和私有云存储服务的解决方案。这些方案能很好地解决当下计算机管理和维护中的难点,可以为同行提供借鉴。但这些方案也存在着对网络依赖度高、对存储系统压力大等缺点。如果网络不稳定或者出现频繁断网的情况,零客户端就无法连接虚拟桌面,馆员则无法开展正常业务,读者也无法检索OPAC目录和电子资源;如果存储系统性能不足,虚拟桌面的IO响应不及时,用户体验也会很差。如何构建更稳定的网络环境,如何规划和调整存储系统以满足大量虚拟桌面同时开机带来的IO风暴,将成为下一步研究和实践的重点。