多普勒天气雷达地州级资料共享平台的设计与实现
2019-08-06何周见
何周见
摘 要:基于现阶段查询雷达历史资料的步骤较为繁琐,效率低下,笔者设计开发一套雷达资料自动备份、入库系统,将雷达数据自动压缩、归档,资料管理员无需人工操作;使用者通过选择少量的参数可以直接得到打包好的数据,用户体验及检索、效率较现有手段有大幅提高,让台站资料备份及资料使用者效率均大幅提高,具有很强的实用性。
关键词:雷达资料;自动备份;查询效率
引言
雷达资料是天气预报中最为重要的资料之一。预报员在预报技术总结和历史天气个例分析中经常都需要用到。由于雷达数据数量多、容量大,雷达台站资料室一般以月为单位进行资料备份,将雷达基数据进行压缩、按DVD容量归档后再刻录到DVD光盘中予以存档,已经刻录的资料往往都会即时删除以腾出空间存储最新的资料,存档的资料也只限于本站,与本地天气较为相关的周边几部雷达资料现阶段不予保存。
基于以上,现阶段查询雷达历史资料的步骤较为繁琐,首先资料使用者需要将个例天气的时间段交给资料室,由于雷达站平时不对产品文件进行备份,资料室将包含基数据资料的光盘找出,然后通过PUP程序手工进行产品请求设置,等待PUP程序进行资料处理,最后将产品交给使用人员进行个例分析。由于PUP处理产品的效率非常低,整个过程需要耗费大量的人力和时间,整体工作效率低下。因此笔者设计开发一套雷达资料自动备份、入库系统,系统自动将最新的雷达资料进行压缩、分文件夹存储、处理,资料室人员只需直接将文件夹刻录即可。前台的查询页面,预报员只需要输入起始时间,系统自动将时间段内的基数据及产品进行显示供用户下载。可大幅提高工作效率,具有很强的实用性。
目前,国家气象信息中心全国新一代天气雷达信息共享平台(CIMISS)已经开始投入使用,CIMISS可以方便的根据站号、时间段、产品种类进行雷达资料查询,但是到目前为止,存在以下主要问题: 查询出来的产品是以网址形式给出,需要进行逐条下载;不能多种产品同时查询,一次只能查询出一种产品;无CIMISS系统运行前的大部分历史资料; 多种产品无法查询出结果。开发本系统可以使本市及所辖县的气象工作者能够方便的进行本研究区域的雷达历史资料查询,为预报及科研提供稳定、易用的数据共享平台,并实现雷达资料的处理、归档、存储自动化,提高台站资料备份的工作效率。
研究内容:
1压缩文件自动分文件夹的算法研究
由于天气情况的差异,雷达基数据经过压缩后的文件大小不一样,大小可以相差数倍,在新一代多普勒天气雷达双偏振升级以前,没有天气过程的基数据经过压缩最小只有几十Kb,有天气过程的情况可以达到4M左右,双偏振升级以后,一个双极化的基数据容量达到50M左右,没有天气情况压缩后的容量在1M~15M之间,但是一张DVD光盘的容量是固定的,加上我国的天气雷达在汛期和非汛期之间开机时间不一样,如何在数据易于检索和光盘容易利用率最大化之间找到一个平衡点是本项目需要解决的一个关键问题。经过数年的使用者数据检索、上级单位索要台站数据等情况分析,我们最终定下来将汛期与非汛期分开,单张DVD容量以时间为索引进行刻录的方法。本办法虽然有少量浪费DVD容量的缺点,但是在存放、检索的效率上大大提高。特别是目前存储设备价格的降低,DVD碟片长时间存储内容易丢失的现状,将历史资料以磁盘阵列的形式保存或许是未来的趋势。无论是检索效率还是保存质量上较现有形式均有较大提高,目前我台站的DVD刻录资料,由于资料室的环境及其他因素影响,4年前的基本已经无法读取,在资料应用上有很大的损失。
2 数据存储方式的选择及优化
目前我局资料室存储的雷达数据容量大概为2T,压缩文件是以文件形式存储在硬盘中还是以二进制形式存储在数据库中,两种方式的读取效率比较以及最终选择的方式的优化策略是本系统开发过程中需要解决的关键问题之一。开发人员利用2017年的整年数据做过一次存储效率的实验,发现只要将产品的存储以日期为索引建立文件夹进行存储,查询效率虽然与存储在MYSQL数据库中相比有所延迟,但是基本也能满足业务需要,且在业务维护方面要简单的多,且不需要进行数据库安装、备份等操作。加上购买的硬盘盒具有自动的热备份功能,我们最终选用了编写程序以文件形式将基数据及产品文件进行存储的方法。
3 用户并发访问的问题。
虽然本系统的使用对象为地州及所属县局的气象科研工作者与预报员,使用人数总量不多,但是由于经费问题,硬件设备成为了多用户高效率并发访问的一个问题。本系统全套流程均运行在WINDOWS平台上,系统基于dotnet framework框架,使用C#语言在Visual Studio 2012平台上进行开发,服务器部署在windows 2008 server服务器上,在开发测试过程中发现,用户并发使用量达70+以上时,对服务器造成了较大的压力,服务器甚至会出现临时宕机的状态。经过对本地州以及所属十二个县局的计算机IP进行调研发现,一般很难达到70人同时使用,且在试运行一年期间发現,同时使用的人数最大是15个,因此在多用户并发方面暂时没有太大的压力,但是随着资料存储时间变长,数据量增大,需要在存储策略方面进行改进。
5 天气个例的问题
在将近一年的试用过程中发现,资料使用者对于灾害性天气过程的资料使用量非常大,占总调用数据量的85%以上,因此开发团队在试用一年之后决定将灾害性天气过程作为一个单独的内容,使用一个新的硬盘盒进行存储,这样总的存储量比之前总的存储量少了近80%,查询效率得到进一步的提高。同时,在和同事的交流过程中发现,使用者在对历史天气个例的分析中,对当时的数值预报产品也有很大的需求,但是由于数值预报产品的容量太大,基本没有保存,希望本系统可以将灾害性天气过程的数值预报产品一并进行备份,系统开发团队将会认真考虑这一需求。
总结
与2014年前获得其台站的数据较为困难相比,现阶段全国的雷达的数据均可以通过资料共享获取,使得本系统的开发进行比较顺利。开发团队成员搭配合理,需求明确,易于分工合作,且临聘了3名 测试人员对系统进行了比较专业的阶段性测试,使得系统在稳定性、易用性,用户体验方面较之前的系统有较大提高。