基于虚拟化技术的气象数字档案检索系统研究
2019-12-26勾志竟任建玲
勾志竟,任建玲,王 敏
(天津市气象信息中心 天津 300190)
0 引 言
随着气象业务服务面不断拓宽,气象档案的作用也日益突出,而气象档案信息化只完成了由纸质资料到信息化产品的部分工作,且气象档案内容涉及安全保密范畴,在气象行业内部对如何利用档案信息化产品还没有较成熟的经验。
天津市气象档案馆从1986年成立以来,经过9个数字化项目的建设,完成了馆藏众多种类历史气象观测档案的图像扫描工作,形成历史气象观测档案数字化文件,涉及地面气象观测记录月报表、气压、气温、湿度、日照、降水、风向风速等自记记录月报表、电线积冰记录月报表、气象月总簿、农业、地面气象观测记录年报表、降水自记纸、降水自记纸曲线提取数据文件、风向风速自记纸、气温自记纸、湿度自记纸和建国前原始观测记录档案共 17大类资料,数据量约870GB。由于没有相应的安全使用技术,几年来没有有效地利用这些数字图像资料为业务和科研人员服务。
利用虚拟化技术搭建气象观测档案扫描图像安全查阅系统,不仅可以减少对历史纸质资料的翻阅,提高检索效率,保护纸质档案,降低档案管理员的工作量,减少由于档案移动引起的工作失误,而且系统采用虚拟化技术可保证扫描图像文件的安全,防止资料未经授权访问的事件发生。同时,有利于提高原始观测记录档案的利用率,更好地为业务、科研和决策服务,进而提高气象档案信息化管理水平,推动和促进气象档案信息化建设。
1 平台架构与数据资源环境
1.1 平台架构
历史气象观测档案数字化图像检索平台开发在Windows环境下,编程语言采用 PHP,数据库采用MySQL,Web服务器采用Apache,系统框架采用B/S模式,使用户可以根据需求自主访问气象档案资料,减少对历史纸质资料的翻阅,在保护珍贵气象纸质档案的同时,极大地提高了检索效率。
1.2 资料目录
气象档案数字化建设工作形成的图像文件,格式统一、命名规范,对于规范使用图像资料打下了良好的基础。前期,对馆藏 17大类 116万页历史气象观测档案扫描图像进行分类梳理,并结合气象专家意见,形成的资料目录为:报表类资料、自记纸类资料、观测簿类资料以及台站沿革类资料 4个一级子类。其中,报表类资料包括地面资料、高空资料、辐射资料、农气资料、酸雨资料5个二级子类。
报表类地面资料包括:地面气象观测记录月报表(气表-1)、气压自记记录月报表(气表-2P)、气温自记记录月报表(气表-2T)、相对湿度记录月报表(气表-2U)、日照自记记录月报表(气表-4)、降水自记记录月报表(气表-5)、风向风速自记记录月报表(气表-6)、电线积冰记录月报表(气表-8)、地面气象观测记录年报表(气表-21)及建国前各类报表。报表类高空资料包括:探空球测风观测记录表(高表-12)、雷达测风观测记录表(高表-13)、探空观测记录表(高表-14)。报表类农气资料包括:农气表-1、农气表-2、农气表-3。
自记纸类资料包括:降水自记纸、风向风速自记纸、温度自记纸、气压自记纸、湿度自记纸、日照自记纸、建国前各类自记纸。
观测簿类资料包括:气簿-1、气簿-2、气簿-3、农气簿-1、农气簿-2、农气簿-3、建国前各类观测簿。
台站沿革类资料包括:地面站、农气站、高空站、辐射站、酸雨站沿革资料。
1.3 数据库表设计
根据历史气象观测档案数字化检索平台的主要功能所设计的数据库中包含以下几个表:报表类资料一级分类表 bigtype,如表1;报表类资料二级分类表smalltype,如表2;自记纸类资料分类表;观测簿类资料分类表;台站沿革类资料分类表等。
表1 资料一级分类表Tab.1 First data classification table
表2 资料二级分类表Tab.2 Secondary data classification table
2 平台关键技术
根据对用户的需求调研和使用历史气象观测档案的习惯,结合现有数字化文件的分类信息,采用mysql设计了系统数据库表,主要包括:报表类资料一级分类表、报表类资料二级分类表、自记纸类资料分类表等,在此基础上对历史气象观测档案数字化图像检索平台软件进行设计。系统最关键的检索模块采用 JavaScript技术实现资料类别及时间的多级联动,用户可以按需求检索历史气象观测档案,同时采用 JQuery技术实现对检索结果图片的缩放、漫游等显示功能。
从历史气象观测档案涉密和安全的角度出发,采用桌面虚拟化技术可实现较简单的共享机制无法实现的隔离和划分,这些特性可实现对数据和服务进行可控和安全的访问,从底层架构上保证了宝贵资料的安全性,如图1所示。气象观测记录档案逐年增加,对传统的系统存储空间有很大的挑战,采用虚拟化技术可以在不影响用户的情况下对物理资源进行删除、升级或改变。具体实现过程如下:
①基于已有的服务器虚拟化平台,建立虚拟机,安装虚拟桌面代理,构成桌面虚拟化交付平台。
②在购置的瘦客户机终端,为了保证用户信息的安全,系统采用 MD5加密技术将用户密码加密存储到后台数据库,用户在系统主界面登录框输入相应用户名及密码,系统将后台库存储的加密后的密码转换后进行比对,如果通过验证,即可直接登录至虚拟桌面,访问数字化检索平台软件。
③用户输入检索条件进行检索,在使用过程中,虚拟桌面代理程序将虚拟机端的图像进行压缩编码,以流的形式传递到客户端,呈现在终端设备上,同时收集客户终端设备上输入的鼠标、键盘指令,回传至虚拟机端,完成桌面交互过程。
在整个使用过程中,真实数据从未离开过数据中心,用户终端不会接收到任何真实数据资料,传递至客户端的仅仅是由服务器处理完毕的结果画面。
图1 平台运行流程图Fig.1 Platform operation flow chart
气象数字档案检索系统已经部署完成,并实现了业务化使用。随着虚拟化技术的应用,本成果在技术上具备的共性程度很高,在气象系统推广应用的前景很好,同时在其他行业的档案管理方面也具备扩散的能力。
3 结 语
气象观测记录档案是珍贵的档案资料,因其特殊性及技术手段的缺失,未能有效利用这些数字图像资料为业务和科研人员服务。本文以虚拟化技术为研究视角,搭建了历史气象观测档案数字化图像检索平台,从底层保证了档案的安全性,提高了原始观测记录档案的利用率,从而更好地为业务、科研和决策服务,提高了气象档案信息化管理水平,推动和促进了气象档案信息化建设。