APP下载

地面气象观测常见的故障排查及应急措施

2019-01-23缪明榕姜淑杨刘成兰张树民吴嘉伟

软件 2018年12期
关键词:备份串口光纤

缪明榕,姜淑杨,刘成兰,张树民,吴嘉伟



地面气象观测常见的故障排查及应急措施

缪明榕,姜淑杨,刘成兰,张树民,吴嘉伟

(南通市气象局,江苏 南通 226001)

地面气象观测站的每个正点次的Z文件都要及时地上传到国家局信息中心,参与全国、全球或区域性的数据交换。这就要求台站业务人员,在故障发生时及时排除故障,若预计1小时内故障无法修复的,就要快速有效地启动应急处理方案,以免影响正点数据上传。文章针对地面观测常见的自动站、串口服务器、计算机、网络故障,给出了应急时故障排查步骤,以及快速启动应急处理的措施和观测数据应急处理的方法。

自动站;串口服务器;故障;应急措施

0 引言

随着科技的发展,气象观测的设备自动化程度也越来越高,对数据数据质量的准确性和及时性都提出了更高的要求。台站业务人员,只有不断提高自身的业务水平和应急处理的能力才能适应新的管理要求。地面气象观测站的每个正点时次的Z文件都要及时地上传的国家局信息中心,参与全国、全球或区域性的数据交换。这就要求台站业务人员,在故障发生时及时排除故障。若预计故障无法在1小时内修复,应立即启用备份观测设备或移动观测,按照规范规定进行观测发报。若短时间内无法修复时,应及时向上级管理部门报告,并寻求技术支持。根据情况在事发后6小时内向省局报告[1]。自动站故障发生12小时内在ASOM平台中的“维修维护工作台”的“新建故障单”中填写故障情况并上报[2]。国家级台站涉及到仪器故障导致数据错误的,必须在72小时内恢复正常。

1 自动站故障应急措施

自动站仪器故障分为多种情况,一般有采集器故障、观测传感器故障、光纤通讯传输模块故障等等,图1给出了不同情况下对故障进行分析,提出自动站故障的应急处理方法。

(1)当仪器故障出现,不能在正点前恢复的,值班员因立即启用备份自动站上传数据文 件,没有备份自动站的应立即做好人工观测的准备[3]。故障不能在1小时内排除的,应立即在ASOM网站上报仪器故障报修单,并及时上级主管部门汇报,组织力量抢修。

(2)检查主采和和分采供电情况,主要是检查“运行”是否亮、电源箱空气开关是否断开、220 V供电是否正常,将电池连接插头断开,用万用表量取电池电压是否在10.8-14.4 V之间。

(3)检查光纤通讯的方法:检查采集器和光纤通讯盒中的光纤转换器的灯是否亮;更换一组备份光纤,注意光纤头是交叉连接法;用激光笔在光纤头中照射,查看光纤另一端是否有亮光;检查光缆是否有咬断或破坏的痕迹;

(4)检查主采集器,查看“运行”灯是否正常。重启采集器,查看故障现象是否排除。

图1 自动站仪器故障分析检查步骤和处理方法

(5)更换相应部件时注意断开电源。

2 串口服务器的故障应急措施

台站有辐射、雪深、云高等自动观测传感器设备的,在传输端一般都有串口服务器设备,当计算机中ISOS业务软件采集的数据均缺测时,可首先检查串口服务器工作是否正常。江苏无线电研究所有限公司现在安装的新型自动站串口服务器有ISOS-HC/A型和MOXA Nport 5650-8-DTL型串口服务器两种,如图2所示。分别介绍一下串口服务器故障排查过程。

2.1 ISOS-HC/A型串口服务器的故障排查

(1)检查串口服务器的电源是否正常。

(2)检查室内光纤通讯盒工作是否正常,检查网线接口灯是否亮,如果不亮更换网口或者网线,此时网口指示灯还不亮说明交换机有问题,更换备份光纤通讯盒[4]。室内室外光纤交换机通过光纤连接正确后,光纤指示灯会亮起来,如果该指示灯不亮,说明尾纤可能插入顺序不对,交换尾纤的插入顺序,交换后还是不亮有可能是光缆断开。

图2 ISOS-HC/A型和MOXA NPORT型串口服务器内部结构

(3)检查计算机数据采集网卡IP地址设置是否为192.168.10.X(X为1-254,不能为10);

(4)在DOS命令窗口ping串口服务器IP地址192.168.10.10,查看是否畅通;

(5)如果ping不通,将串口服务器断电重启,重复第(4)步;

(6)如果仍ping不通,用一根牙签在串口服务器设备细孔处摁住5秒钟,将设备恢复出厂设置。在测报计算机中的串口设置软件SMOPORT中设置串口服务器IP地址为192.168.10.10,点击“连接设备”后会出现用户名和密码对话框,用户名:SMOPORT,密码:SMOPORT,查看是否出现设备信息及状态。若连接成功,点击“设备串口信息”,进入串口信息的查询与配置窗口。根据连接情况选择串口号,此串口号为ISOS软件中的串口号保持一致,波特率9600,数据位8,奇偶校验N,停止位1,工作方式 RS232,数据格式转换无。完成串口信息设置后,点击“设置当前串口”按钮[5]。重复第(4)步,如果拼通串口服务器地址,则说明已成功连接设备。SMOPORT软件配置,如图3所示。关闭SMOPORT软件,打开ISOS业务软件,查看数据是否恢复正常采集。

图3 SMOPORT软件配置

(7)如果连接串口服务器成功,说明其工作正常,若业务软件仍未接收到数据,则需检查其它仪器设备。若第(6)中点击“连接设备”出现“连接服务器失败”窗口,说明串口服务器可能故障。

(8)将接在串口服务器光纤收发接口上的两根光纤端口卸下(一般为一组橙色光纤),从底柱的操作口将这对光纤拔出(注意对光纤进行必要保护,轻拉,以免损坏光纤),直接接在主采集器底面的光纤收发器口。

将室内光纤端从ZQZ-PT2型光纤交换机中卸下,安装至原来的ZQZ-PBF型通讯器中,注意光纤插入顺序,通过R232串口线连接至电脑。修改ISOS业务软件中主采集器的通讯端口(一般台式机为Com1口)。这样可以保证气压、温湿度、风向风速、降水、地温、草温、大型蒸发、能见度等基本观测要素数据的采集。

(9)及时跟省探测中心和厂家联系,对故障的串口服务器进行维修。

2.2 MOXA Nport 5650-8-DTL型串口服务器故障排查

(1)方法同2.1第(1)~(5)步。

(2)如果仍ping不通,MOXA Nport的管理工具NPort Administrator,点击菜单栏的“Search”按钮,搜索串口服务器。软件会进入“Configration”界面,查看右边是否搜索到串口服务器设备。双击右边搜索到的设备,进入配置界面,选择“Network”进入IP地址配置界面。查课,串口服务器IP地址是否为192.168.10.10。若不是,则修改并保存。选择“serial”,检查串口参数是否正确,波特率 9600,数据位8,奇偶校验N,停止位1,工作方式RS232,数据格式转换无。NPort Administrator管理软件界面如图4所示。

(3)若能搜索到串口服务器设备信息,则说明串口通讯正常。点击左边的“Com Mapping”,并点击菜单栏的“Add”,扫描软件虚拟出来的8个串口信息。核实各设备接入串口服务器的串口号是否和测报计算机端的虚拟串口对应。串口服务器8个串口信息如图5所示。

PC机端串口对应查看是根据NPort软件中Port1-8对应的COM口来判别,红色框中为Port号,黄色框中为Port对应的COM口。

图4 NPort Administrator管理软件界面

图5 串口服务器8个串口信息

(4)检查计算机数据采集网卡IP地址设置是否为192.168.10.X,确保两者在同一个网段内。ping串口服务器地址192.168.10.10,查看是否畅通。如果能ping通,说明其工作正常,若业务软件仍未接收到数据,则需检查其它仪器设备。若第(2)步中修改串口服务器IP地址失败,说明串口服务器可能故障,则需跟省探测中心和厂家联系,进行维修。

(5)立即将主通讯光纤与采集器的直连,方法同2.1的第(8)步。

2.3 单个观测要素数据缺测故障排查

串口服务器可以连接自动站、能见度仪、天气现象仪、辐射计等多个设备,当出现ISOS业务软件中只有某一设备显示采集失败时,可能是单个要素的光纤模块出现故障[6],要排除此类故障有两种方法。下面以辐射数据采集失败为例来分析。

方法一:断开串口服务器电源,将辐射光纤模块上的两根光纤连接到其他备用的光纤模块中,注意光纤连接顺序,恢复电源供电。修改ISOS业务软件中辐射通讯参数的串口号,进行数据采集。

方法二:断开串口服务器电源,拔开辐射光纤模块两端的光纤和数据插头,将辐射光纤模块卸下,并安装上备用模块,插上光纤和数据插头,恢复电源供电。

上述两种方法一般可以排除单个观测要素数据缺测的故障,若仍不能排除,则可能是串口服务器故障,则需跟省探测中心和厂家联系,进行维修。

3 自动站计算机故障应急措施

地面气象观测业务计算机24小时处于运行状态,不间断地采集、处理、储存和传输数据[7],长时间运行可能会造成计算机软硬件故障。计算机也可能会遭受感应雷击、电脑病毒的入侵等使计算机 发生故障。当出现观测计算机故障时,用备份计算机采集自动站数据和编发报。故障时刻出现在观测发报时间来不及用跟换备份计算机采集资料时,应立即启用独立的备份自动站采集数据并发报,同时在最快的时间内排除故障。

启用备份计算机的方法步骤:

(1)启用备份机前,应注意先备份数据。

(2)快速将R232数据线或串口数据网线接至备份计算机中。

(3)打开备份机,将ISOS软件自动备份的最新数据文件解压缩后拷贝至相应文件夹中,打开ISOS业务软件,检查相应参数是否正确,进行数据采集。

(4)删除AWSNET文件夹下Temp和Fail文件里的所有数据。打开ISOS软件里参数设置工人录入参数发送参数设置把预设好的M_Z分钟数据文件、Z文件、日数据、日照数据、重要报、酸雨日数据的地址(跟主站的发送地址、用户名、密码一样)是否发送都打“√”,此步操作必须在正点之前完成,确保能有正点数据上传。

(5)若数据采集和数据传输仍有异常,则需要考虑启用备份自动站数据传输。

(6)立即对主站计算机进行维修。主站计算机恢复正常后,打开ISOS业务软件,待软件自动补全缺测数据后,对故障影响的正点时次进行补调,人工质控后保存,形成CCA入库,确保主站数据的连续性。

(7)若主自动站故障,主站计算机无法采集到正常数据,启动备份站。待主自动站恢复正常后,把受影响的正点时次的备份站数据全部录入到主站计算机上。

4 网络设备故障应急措施

网络故障出现情况有多种,可分为省局网络故障、市局网络故障、站内网络故障、电信等通讯公司线路故障、ISOS软件故障等[8-10]。遇到网络故障时,值班员首先得判断网络故障原因,再采取不同的应急处理方式。操作步骤如下:

(1)检查计算机机是否与内网正常连接,有时也有出现内网显示正常,但实际不通的情况,最好先重启计算机机,看能否解决。

(2)如果本机网络显示无法连接,立即启用无线网络,开启VPN,保证业务数据正常传输。

(3)在“观测业务调整”QQ群询问或打电话到省局信息中心询问,判断省局网络传输是否正常。若是省局网络故障,则暂时保持无线网络传输数据,等省局网络恢复后再断开无线网络。

(4)若省局网络传输正常,在市局ping 10.125.194.254(市局内网网关)是否畅通,若ping不通,应检查市局接入层的接入交换机、核心交换机的运行情况,并立即通知网络维护人员[11]。若网关能ping通,说明核心层到接入层的链路是通的,可以考虑是否是运营商的线路出了问题。

(5)若市局网络传输正常,在站内ping 10.125. xxx.254(本站内网网关)是否畅通,如能ping通,说明站内局域网正常,则可能是市局到本站的网络链路中断,检查电信、联通通讯光纤接入机房的光纤转换器工作是否正常[12-13]。若电信、联通通讯正常,依次排查电源适配器和光纤转换器等。

(6)若无线网卡故障、欠费或信号不好等原因,导致不能连接无线3G网络时,可以在观测计算机中安装一个无线接收器,连接本站内的无线,再VPN登陆省局服务器。

(7)如果是省局服务器故障而导致正点报文无法传输时,立即将AWSNET文件夹中的正点长Z和状态报文可以通过外网QQ软件在“观测业务调整”QQ群中,请省局信息中心转发。注意只需转发正点报文,其他分钟报文可等省局网络恢复后再上传。

(8)若是计算机硬件故障,则需立即更换备份计算机。

(9)若是ISOS软件故障,则立即需更换备份计算机不能影响发报。再卸载业务软件,重新安装。

5 观测数据应急处理方法

(1)由于通讯引起的自动站数据采集异常,待故障排除后,ISOS业务软件会自动下载补全缺测期间的观测数据。故障期间正点长Z文件需重新编发CCA文件并上传,或者在MDOS平台的“快捷通道”,进入“数据查询与质疑”界面进行数据修改[14]。

(2)由于某个传感器故障导致该要素观测数据异常或缺测,或者某个分采集器故障导致该类要素观测数据异常或缺测时,正点长Z文件中可用备份自动站的相应要素观测数据代替,但是注意与其要素相关的统计值和极值。

(3)由于采集器故障导致全部要素观测数据异常或缺测,立即启用备份自动站上传数据。

6 结束语

随着科技的发展,气象观测的设备也基本实现自动化,为地面气象观测实施无人值守,提供了基础。地面观测业务人员将来的业务工作倾向将是故障的排除和应急处理。所以,每个气象业务人员只有不断地提高自己的能力,才能适应新的业务发展。

[1] 林铂岷, 黄红辉, 黄菊. 应对地面气象观测业务改革的一些措施[J]. 气象研究与应用, 2012. 33(2): 81-82.

[2] 吴文辉, 王燕妮. 故障诊断系统设计[J]. 软件, 2015, 36(5): 105-107

[3] 朱会. 基于 BP 网络的遥测装备故障诊断研究[J]. 软件, 2018, 39(4): 214-217

[4] 涂启志. 测量结果不确定度的估计与表达[J]. 现代电子技术, 2009(17): 124-127.

[5] 中国气象局综合观测司. 降水观测规范-称重式降水传感器[S]. 北京: 中国气象局综合观测司, 2011.

[6] 中国气象局监测网络司. 气象仪器和观测方法指南(6版)[M]. 北京: 中国气象局监测网络司, 2005.

[7] 黄嘉佑. 气象统计分析与预报方法[M]. 北京: 气象出版社, 2004.

[8] 许嘉玲, 陈德诚. 地面气象年报数据质量控制辅助软件的设计与应用[J]. 气象研究与应用. 2012. 33(2): 68-71.

[9] 巩思汉. 基于工作流的应急预案管理系统的设计与实现[J].软件, 2015, 36(11): 89-91

[10] 覃爱金, 陈韦菊, 胡祖权. 广西地面气象观测站无人值守运行模式探讨[J]. 气象研究与应用. 2017. 38(4): 58-61.

[11] 杨银, 杨玲君. SL3-1型双翻斗式雨量传感器故障分析及排除方法[J]. 气象科技, 2012, 40(2): 319-320.

[12] 张书林, 刘军, 闫龙川, 等. 基于深度学习的电力骨干通信网故障诊断研究[J]. 软件, 2018, 39(3): 194-198.

[13] 段明璐, 杨勋姮. 软件故障树算法建模的研究[J]. 软件, 2018, 39(2): 66-74.

[14] 吴文辉, 王燕妮. 故障诊断系统设计[J]. 软件, 2015, 36(5): 105-107.

The Ground Meteorological Observation Common Fault Clearance and Emergency Measures

MIAO Ming-rong, JIANG Shu-yang, LIU Cheng-lan, ZHANG Shu-min, WU Jia-wei

(Nantong Meteorological service, jiangsu Nantong 226001)

The Z files of every punctuality of the ground meteorological observation stationmust be uploaded to the National Bureau Information Center in time to participate in national, global or regional data exchange. This requires the station operators to remove thefailure timely. If the failure is not expected to be repaired within 1 hour, the emergency response plans must be started quickly and effectively, so as not to affect the uploading of the punctuate data. Aiming at the common faults of automatic station, serial port server, computer and network in ground observation, the article gives the steps of troubleshooting in emergency, as well as the measures to jump-start emergency handling and the methods of observation data emergency handling.

Automatic station; Serial server; Fault; Emergency measures

TP211

A

10.3969/j.issn.1003-6970.2018.12.015

南通市气象局气象科技项目资助(项目编号:NQK201804)

缪明榕(1985-),男,本科,工程师,主要从事气象探测技术保障;姜淑杨(1990-),本科,工程师,主要从事气象探测技术保障;刘成兰(1981-),本科,工程师,主要从事气象行政审批;张树民(1984-),男,研究方向:天气预报技术研究;吴嘉伟(1984-),男,本科,工程师,主要从事气象探测技术保障。

缪明榕,姜淑杨,刘成兰,等. 地面气象观测常见的故障排查及应急措施[J]. 软件,2018,39(12):64-69

猜你喜欢

备份串口光纤
浅谈AB PLC串口跟RFID传感器的通讯应用
FIBBR King-A系列HDMI光纤线
创建vSphere 备份任务
高品质的忠实还原 FIBBR Ultra Pro2 HDMI光纤线
一条光纤HDMI线的诞生长飞/长芯盛FIBBR工厂走访实录
全国产1550nm 窄脉宽光纤放大器
旧瓶装新酒天宫二号从备份变实验室
USB接口的多串口数据并行接收方法探索
基于蓝牙串口适配器的GPS接收机与AutoCAD的实时无线通信
基于并行控制的FPGA多串口拓展实现