APP下载

安丘地震台前兆数据库与管理系统运行维护

2016-09-19池国民赵银刚孙启凯

高原地震 2016年3期
关键词:安丘前兆台网

池国民,赵银刚,孙启凯

(1.山东省地震局安丘地震台,山东安丘 262100; 2.中国地震局第一监测中心,天津 300180)



安丘地震台前兆数据库与管理系统运行维护

池国民1,赵银刚1,孙启凯2

(1.山东省地震局安丘地震台,山东安丘262100;2.中国地震局第一监测中心,天津300180)

通过对山东省地震局安丘地震台前兆数据库与管理系统运行维护情况总结分析,提供了日常运行中常见问题的解决办法,以期为基层地震台站前兆数据库与管理系统运行维护提供参考。

地震台站;前兆数据库与管理系统;运行维护

0 引 言

随着我国“十五”数字化地震前兆观测网络建设项目完成,各省、自治区、直辖市地震局建立了区域前兆台网中心和地震台站数据库。目前,我国地震行业系统已经建成了从地震前兆台站到区域前兆台网中心、区域前兆台网中心到国家前兆中心、国家前兆中心到各地震学科中心的专有行业网络[1]。“十五”项目建设中,以中国地震行业标准和规范为根据,考虑到中国地震前兆数据的存储特点以及各方面需求,“十五”系统采用美国甲骨文公司的Oracle数据库。Oracle数据库具有完整的数据管理方面功能,如数据的大量性以及数据保存的持久性、数据查询共享、消除数据冗余、数据高度安全等,同时可以通过多种方法和手段实现Oracle数据库的表空间管理、数据备份及恢复、系统开发。由于地震前兆观测网络在“十五”项目建设中使用了Linux操作系统和Oracle数据库管理系统,管理和维护人员普遍缺乏相关工作经验[2]。特别是对于基层地震台站而言,台站数据库的初次安装及具体参数配置大多由上级区域前兆台网中心完成,台站人员缺少实际操作机会,因此数据库的管理维护相对困难。本文以山东省地震局安丘地震台(以下简称安丘台)为例,对前兆数据库与管理系统运行维护情况总结分析,提供了日常运行中常见问题的解决办法,以期为基层地震台站前兆数据库与管理系统运行维护提供参考。

1 前兆数据库

1.1安丘台数据库简介

安丘台前兆服务器是在Suse Linux操作平台下安装Oracle 10g数据库,Suse Linux操作平台和Oracle 10g数据库的安装使用需要服务器满足一定的硬件配置要求,安丘台配备浪潮NF5120型服务器,具体配置为CPU为2.40 GHz,内存12 G,硬盘1 TB。为了方便台站人员管理维护,将前兆Oracle数据库、数据管理系统的应用软件安装在同一台服务器上,安丘台所有数字化前兆观测仪器直接通过网线与台站节点网络连接,在台站节点上布设地震前兆数据库系统,管理前兆数字化仪器产出的原始数据、经工作人员合理处理后的预处理数据、人工仪器及模拟仪器产出的数据,以及通过各学科专业数据预处理软件计算产出的各种产品数据。以上数据可通过数据库自身同步功能完成前兆台站、区域前兆台网中心、国家地震台网中心的逐级报送。

1.2台站数据库和区域中心数据库的关系

地震台站数据库的主要任务是汇集前兆仪器采集的观测数据,保存数字化仪器、模拟仪器、人工仪器产出的原始数据,预处理数据,以及各种均值、日志等产品数据,完成地震前兆观测数据资料保存、入库、数据交换和上报等工作。同时为地震工作者使用地震分析预报软件提供数据支持和保证。

区域前兆台网中心数据库负责汇集本区域各级地震台站数据库保存的数据,同时完成数据同步并保存本区域数字化数据,为研究人员开展地震分析预报工作提供数据支持,同时完成向国家台网中心报送数据以及数据共享服务(具体工作模式如图1)。

图1 前兆台站、区域前兆台网中心工作模式

1.3前兆Oracle数据库优点

与“九五”前兆系统所使用的SQL Server数据库相比较,“十五”系统的前兆Oracle数据库的功能十分强大,具有伸缩性、服务器并行性、操作平台开放性等优点,操作简易且高度安全,可以支持多个用户,大事务量处理,满足数据分布式处理,同时具有很强的可移植性[3]。“十五”前兆系统数据库应用Suse Linux操作系统,与“九五”前兆系统采用的Windows操作系统相比,Oracle数据库更加稳定安全。

1.4数据库日常维护

“十五”系统数据库的日常管理维护较“九五”系统数据库而言更为繁琐复杂。如何保证数据库健康、稳定运行,并进一步完善和提高应用系统的稳定性和功能性,是每一个基层台站前兆数据库管理人员值得研究和思考的问题。结合安丘台日常工作实际,总结前兆数据库日常维护工作主要有数据库重启、修改root密码和服务器系统时间、数据库解锁,数据库表空间查询及扩展、数据库备份和恢复等。

1.4.1数据库重启

在服务器正常运行过程中,突然停电、数据正在交换时网络突然中断或者由于其他不明原因造成服务器死机的情况下,需要对数据库服务器进行重启。直接切断电源来重启服务器的方式非常容易造成数据丢失,严重时甚至可能造成数据库瘫痪,出现无法恢复观测数据的严重后果,必须要杜绝此类不合理的操作[4]。为节省机柜空间,平日里数据库服务器通常不会连接显示器、键盘和鼠标等输入输出设备,此时一般使用电脑上预安装的远程控制软件重启服务器。安丘台一般通过SSH软件来实现。

SSH登录数据库的步骤如下:SSH窗口中点击“ Quick Connect”,输入台站数据库服务器的IP地址和用户名,最后输入登录密码。以Oracle用户方式登录数据库服务器,具体重启命令如下。

su-oracle(切换到Oracle用户下)exportORACLE_SID=PDBQZ(连接Oracle数据库实例,即PDBQZ实例)sqlplus/assysdba(使用系统用户进入)shutdownimmediate(关闭数据库)startup(启动数据库)exit(退出sqlplus)lsnrctlstart(启动监听)exit(退出oracle用户)

当服务器突然断电或者死机的情况发生时,还需要对前兆数据管理系统进行重启。通过SSH登录数据库服务器后,输入如下重启命令。

cd/install(进入管理系统安装目录)./stoprun.sh(关闭管理系统)./run.sh(启动管理系统)exit(退出ssh)

为简化服务器重启步骤,提高工作效率,同时避免人为因素造成的SQL表达式输入错误,安丘台技术人员编写了一个Linux系统可加载执行的.sh文件,利用root用户先登录Oracle数据库服务器,然后直接运行program/install目录下的可执行文件restore.sh,可实现数据库快速重启。

1.4.2修改root密码和服务器系统时间

为了确保数据库服务器安全,以防他人非法登陆数据库服务器,台站数据库管理人员需要定期修改服务器root密码,可使用SSH软件通过passwd命令完成。

使用SSH软件,通过date-s命令可完成对系统时钟的修改(图2)。

图2 修改系统时间

1.4.3数据库解锁

在日常工作中,当有多个用户对数据库同时进行访问,因访问量过大,可能导致数据库锁死的情况出现。此时需立即对Qzprocess用户进行解锁。利用SSH软件,使用Oracle用户先登录服务器,然后输入解锁命令,即可完成数据库解锁,最后再重新登陆服务器,具体解锁命令如下。

exportORACLE_SID=PDBQZsqlplus/assysdbaalteruserqzprocessidentifiedbypassworeaccoutunlock(数据库解锁命令)

1.4.4数据库表空间查询及扩展

在Oracle数据库中一个数据库包含一个或者多个表空间逻辑单元,表空间的维护与管理是一项非常重要的工作。在Oracle10g的版本里,共有5个系统默认创建的表空间,其名称及主要存储内容见表1。除了Oracle系统默认创建的表空间之外,用户还可以根据应用系统的规模大小,以及存放对象的具体情况来决定是否创建多个表空间。目前,我们在“十五”系统前兆数据库里创建了QZDATA表空间,用来存储前兆数据的各种相关信息。利用SSH软件,进入Oracle的SQL命令模式下,输入如下口令:select tablespace_name from dba_tablespaces可查询“十五”系统数据库所有表空间名称。

表1 系统默认创建表空间及其主要存储内容

台站数据库管理人员要定期对各表空间及其剩余表空间大小进行查询,以防止当表空间不足时,导致数据库无法正常运行,影响数据处理。在日常工作中,安丘台工作人员通常使用SSH软件,输入如下口令来查看表空间使用情况。

SELECTa.tablespace_name,round(a.bytes/1024/1024,2)"total(M)",round(b.bytes/1024/1024,2)"used(M)",round(c.bytes/1024/1024,2)"free(M)",round((b.bytes*100)/a.bytes,2)"%USED",round((c.bytes*100)/a.bytes,2)"%FREE"FROMsys.sm$ts_availa,sys.sm$ts_usedb,sys.sm$ts_freecWHEREa.tablespace_name=b.tablespace_nameANDa.tablespace_name=c.tablespace_name;

具体在图3的查询结果中,需要重点注意的是Qzdata表空间剩余空间的大小(即free(M)一栏下显示的数字),若发现剩余空间不足时,就需要对QZDATA表空间进行扩展。对表空间如何扩展问题,本文在此不再赘述。

图3 查询表空间剩余空间大小

1.4.5数据库备份和恢复

由于基层地震台站一般没有备用服务器,计算机系统存在的安全问题导致的介质故障或用户错误,都会对数据库数据的正确性、安全性造成影响,严重时可能造成系统瘫痪[5-6]。为了防止数据库突发故障,造成前兆观测数据损失,台站数据库管理人员要定期对数据库进行备份(台站数据库一般半月备份一次即可)。Oracle数据库备份方式有很多种,标准备份方法主要有冷备份、热备份和导出/导入备份,其中冷备份低度维护、高度安全,是实现数据库迁移和数据恢复最简洁高效的方法,适用于前兆台站和区域前兆台网中心的一种日常备份方式。

安丘台目前前兆观测仪器相对较少,分数据仪器主要有FHD-2B型质子磁力仪、ZD9A-Ⅱ地电场仪、三维断层形变监测仪等,仅有GM4磁通门磁力仪一套秒数据仪器且目前尚处于试运行阶段,数据日产出量约几千Byte,整个前兆数据库大小约为2 G,为小型Oracle数据库,安丘台一般每半月对台站数据库进行一次冷备份,具体操作流程如图4。

图4 Oracle数据库备份流程

简单说,冷备份实际为一种物理备份方式,可以采取直接拷贝的方式,将oradata文件直接拷贝到别的移动存储设备上,并将备份文件上传至数据库服务器,通过移动介质进行文件拷贝的时候,一定要将其存储格式设定成Linux操作系统特有的ext2、ext3格式。值得特别注意的是:(1)拷贝前必须将目标数据库服务器oradata文件夹内容清空;(2)备份前服务器必须处于关闭状态,否则数据库文件系统备份无效。

当数据库突发意外情况故障时,严重时例如应用服务器瘫痪,特别是在基层地震台站,因为管理系统自身不支持数据库备份,这将导致数据丢失,这时候如果有数据库冷备份压缩包,可采取如下方案恢复数据库。

若数据库服务器崩溃,需要先在原服务器或者新服务器上重新再次安装相同的Suse Linux操作系统和Oracle数据库,然后创建PDBQZ实例,关闭数据库以及监听,解压冷备份压缩包;若Oracle数据库发生崩溃,则需要关闭数据库以及监听,解压最近一次冷备份压缩包。具体解压缩包流程如图5。

图5 解压缩包流程

值得注意的是,数据库恢复成功后,此时的数据库并不完整,需要利用数据管理系统对缺少的部分数据进行重新采集,并及时进行数据预处理,这样入库以后的数据就完整了。

2 前兆数据管理系统

“十五”中国地震前兆台网数据管理系统是直接面向用户的可视化管理系统。地震行业工作人员可以通过该系统对Oracle数据库进行各种操作,实现观测数据的入库,同时保证数据库及时更新。数据管理系统主要由采集模块、交换模块、监控模块以及用户界面等五部分构成[7]。安丘台所有入网的前兆观测仪器均通过前兆数据管理系统进行管理。数据管理系统的日常运行维护相对简单,其运行异常主要有以下几种表现:①在断电或者死机情况下,重启Oracle数据库后,但是无法进入数据管理系统界面;②打开前兆数据管理系统页面时,显示“数据库操作失败,请返回”;③执行数据交换任务时,数据交换模块长时间没有响应,再次进行手动交换时,界面显示“数据交换中,此操作无效”。对于①、③两种情况,只需要重启前兆数据管理系统即可,②的情况则需要重启Oracle数据库。

另外,前兆数据管理系统运行一段时间之后,可能会出现运行过慢的情况,从而导致在手动采集观测数据时,可能会出现“任务进行中”,长时间等待都不结束的问题,此时也需要重启数据管理系统来解决。

3 几点思考

经过2012年5月前兆技术系统运行管理培训和几年的系统运行维护,笔者有以下几点经验体会。

3.1关于备用仪器

目前山东省地震局的数字化前兆台站基本上每个台站配备一台服务器,在服务器出现故障时无备用设备。考虑到服务器的价格偏高,每个前兆台站配备一台服务器备用并不现实。建议省地震局前兆台网中心应有1~2台服务器备用设备,以便在前兆台站或台网中心服务器故障时及时更换备用设备,确保观测资料的连续完整性。

3.2机房的温度变化

安丘台2015年12月10日11时30分发生服务器死机,用SSH软件重启服务器失效,用手动(冷启动)对服务器进行重启,通过数据管理系统手动采集数据时发现服务器时间已经变为2010年,手工重新设置时间,重启服务器和数据管理系统后,采集数据成功。经过分析认为,服务器频繁出现死机状况,这与网络室的工作环境变化(即温度变化)有一定关系,温度过高或温度过低都能导致服务器死机。因此建议机房最好配备一台空调,用来控制房间温度变化。

3.3UPS供电系统

前兆仪器的正常运行离不开稳定可靠的电源供电系统。当雷雨季节来临时,为了避免前兆仪器遭受雷击,需要将交流市电切换成UPS供电。台站值班人员要每天检查一次UPS供电系统,保证UPS电量充足正常工作,防止UPS问题导致服务器以及前兆观测仪器不能正常工作。

3.4注意相互交流沟通

台站工作人员发现服务器等设备故障时,要及时查找原因并采取适当的处理措施。对不能处理的问题要及时联系上级台网中心的技术人员。实践经验证明,前兆台站与台网中心的技术人员保持必要的交流沟通,有助于及时发现并解决问题,从而提高工作效率。

3.5开发系统维护软件

由于数据库和管理系统维护的极端重要性,建议开发一些系统维护软件。例如:数据库一键备份及导出、数据库和管理系统启动和停止、数据一键恢复等,从而实现数据库的简单、智能、快捷维护,从根本上提高工作效率。

4 结束语

随着我国地震前兆台网规模的不断发展壮大,同时为了给地震研究人员更加快速及时的提供真实可靠的数据资料,地震数据库由“九五”系统的SQL Server 数据库发展为“十五”系统的Oracle数据库。对于基层地震台站数据库管理人员而言,管理和维护好数据库是一项极为重要的工作,需要不断加强对前兆数据库和数据管理系统运行维护方面的学习,不断总结工作经验,对平日工作中遇到的问题及时总结分析,提出相应的解决方案,并在实践中加以运用和证明,最终得到一系列合理的数据库和管理系统运行维护方法,从而为保障前兆台站以及区域台网的正常运行提供强有力的技术支撑。

[1]全建军,郑永通,巫立华,等.永安地震台地震前兆数据库维护[J].地震地磁观测与研究,2015,36(2):118-123.

[2]哈斯高娃,陈向东,杨昕,等.新疆数字化地震前兆数据库运行管理中若干问题分析[J].内陆地震,2010,24(1):57-63.

[3]袁燕妮,卢婷,张晓明,等.四川省地震局“十五”地震前兆数据库维护[J].四川地震,2011(3):22-26.

[4]胡玉良,程冬焱,穆慧敏,等.山西地震前兆台网系统运行维护[J].山西地震,2013(3):44-48.

[5]龚永俭,陈嵩.浅谈地震台站信息节点的维护管理—以天津市地震局宝坻地震台为例[J].高原地震,2012,24(3):48-53.

[6]李国佑,李增华.采用数据库冷备份更换升级玉树地震台前兆服务器[J].高原地震,2015,27(增刊):68-70.

[7]洪旭瑜,余丹,刘坚刚,等.地震前兆台网oracle数据库与管理系统的维护与管理[J].华南地震,2013,33(4):117-124.

OPERATION AND MAINTENANCE OF THE PRECURSOR DATABASE AND MANAGEMENT SYSTEM OF ANQIU SEISMIC STATION

CHI Guomin1,ZHAO Yingang1,SUN Qikai2

(1.AnqiuSeismicStation,EarthquakeAdministrationOfShandongProvince,Anqiu262100,China;2.FirstCurstMonitoringAndApplicationCenter,CEA,Tianjin300180,China)

Based on the analysis of the operation and maintenance of the precursor database and management system of Anqiu seismic station ,earthquake administration of shandong province,the methods of common problems in daily operation are provided and the reference for the operation and maintenance of the precursor database and management system of the basic level seismic station is also provided in the paper.

Seismic station; Precursor database and management system; Operation and maintenance

2016-03-28

池国民(1987—),男,山东诸城人,助理工程师,工学学士学位,主要从事电磁、形变观测和台站信息节点、地震仪器维护工作。

P315-39

A

1005-586X(2016)03-0059-06

猜你喜欢

安丘前兆台网
地球物理台网仪器维修信息管理的研究与实现
论春秋时期天命观的变迁及其新标准
推进报台网深度融合 做强区级融媒体中心
哪些现象是地震前兆
山东安丘仓方早生桃生产管理技术探讨
西藏地震应急流动台网浅析
MRG9000媒资卫士在市级电视台全台网的应用
安丘蜜桃标准化栽培技术规程
安丘董家庄汉画像石墓主人之谜
腾冲地电场震前的前兆异常分析