北京市海淀区新型自动气象站故障排查分析
2017-08-09王莹张玮史辰
王莹 张玮 史辰
摘要 以北京市海淀区新型自动气象站故障排查过程为例,探讨优化自动气象站故障排查方法及后续处理,为新型自动气象站正常运行、探测数据正常采集传输和有效降低自动气象站故障率提供参考。
关键词 新型自动气象站;故障排查;排查流程;北京市海淀区
中图分类号 P415.1+2 文献标识码 B 文章编号 1007-5739(2017)13-0207-04
Abstract Taking the troubleshooting process of the new automatic weather station of Haidian District in Beijing City as an example,the approach and subsequent processing of troubleshooting optimization were discussed,in order to provide references for normal operation of the new automatic weather station,normal collection and transmission of detection data,and reducing the failure rate of the automatic weather station.
Key words new automatic weather station;troubleshooting;investigation process;Haidian District of Beijing City
随着气象现代化建设的推进,气象观测自动化程度已经有了长足的进步,2012年新型自动气象站在全国范围得到普及,观测要素的数量、精度及频次都得到了极大的提升,但作为新型设备,在新型自动气象站故障率降低的同时,其故障类型、检测方法步骤也与以往有所不同[1]。而新型自动气象站故障的迅速诊断、排查及数据的后续处理是综合业务的重要组成部分,是每位业务人员都应掌握的技能。尽管各台站在新型自动气象站运行保障中已经积累了一定的维修经验,但台站的故障排查能力仍有待加强。究其原因,一是台站业务人员对新型自动气象站的理论知识掌握不够;二是台站人员岗位流动性大,难有固定人员从事保障工作;三是平时业务工作中动手操作机会少,参加过系统性保障培训的人员不多,发生故障时需要通过联系探测中心人员寻求远程指导,导致诊断时间长、排查效率低。这导致新型自动气象站的保障、维修效率方面的问题日趋突出[2]。
北京海淀属于国家一般气象站,现有2套自动气象站设备,分别是华云生产的DZZ5新型自动气象站(业务站)和CAWS600自动气象站(备份站),辖区内设有15个区域自动站和1个GNSS(global navigation satellite systems)/MET水汽站。本文根据新型自动气象站ISOS软件中全部数据缺测、部分数据缺测和单个要素数据缺测3种情况,介绍海淀新型自动站故障的诊断、排查及有关数据处理的过程,并归纳出DZZ5新型自动气象站运行过程中出现故障排查思路及建议,以供气象工作人员实践中参考[2]。
1 全部数据缺测故障排查过程
1.1 故障现象
2016年10月5日9:16,值班室观测业务电脑SMO软件连续报警,发现数据全部缺测,立即开展故障排查,避免影响整点报文。
1.2 排查过程和思路
遇到数据缺测时,应保持冷静,遵循就近原则,先迅速排查室内,室内排查完毕,形成大致方向,再携带万用表、机箱钥匙等工具赶赴观测场。
1.2.1 排查室内(9:16—9:30)。①查看室内供电和计算机的本地连接是否正常。②运行调试软件。首先,打开Nport软件查看串口是否变化,发现并未更换,如变化改回原来的串口。其次,用DOS命令ping串口服務器IP查看是否正常连接,发现连接无误,则室内通讯模块运行正常。最后,打开SMO软件的参数设置中启用通讯查看,显示内容为:采集器无返回,读取串口COM5。初步判定为主采集器和串口服务器(包括主采集器、串口服务器、通讯线路)之间出现问题,室内排查完毕。
1.2.2 排查室外(9:30—10:10)。①排查串口服务器(9:30—9:45)。到观测场查看串口服务器指示灯,发现主采集器返回灯未亮,复位串口服务器观察,值班室内数据仍然不正常。②排查主采集器(9:50—10:10)。打开主采集器箱门,发现运行指示灯异常,复位观察,听到2声滴响,1 min后值班室内数据逐渐恢复正常。③如果仍未恢复,需进一步排查。
故障发生时,业务人员一方面要及时排查故障,另一方面要将故障发生情况上报北京市气象信息中心和本单位业务主管领导,并在中国气象局综合气象观测系统运行监控平台(简称ASOM系统)填写故障报告单。
1.3 数据处理
由于数据缺测时间为9:16—10:25,导致10:00、11:00整点数据受到影响,所以需要进行数据处理,发送报文。首先补调数据,在SMO软件中按以下步骤操作,点击数据处理→历史数据查询(下载历史数据)→开始下载,根据补调结果不同分为以下2种情况。
1.3.1 补调成功。在SMO软件上,按以下步骤操作,点击数据处理→历史数据查询(下载历史数据)→开始下载,补调数据成功则需在MOI点击观测与编报→上传文件补充编发,选择Z文件,选择补发时段补发报文;如补调不成功,则查看D:\ISOS\SMO\dataset\北京\54399\AWS\新型自动站\设备\Minute\中查看txt内原始数据文件是否缺测,发现10:00前10 min、正点后10 min数据全部缺测,10:00正点数据则只能用备份自动站的数据代替。
1.3.2 补调失败。由于故障时间不包含定时观测时次,无需人工观测能见度,数据采用备份站数据代替。具体操作如下:记录备份站气压、气温、湿度(相对湿度、水汽压、露点温度)、2 min和10 min风向、风速、地面温度(含草温)、浅层和深层地温数据,其中海平面气压输入气压和气温后自动计算,地面温度(含草温)、气温、相对湿度、气压小时极值和小时内最大风速、极大风速从实有记录中挑选,能见度及极值、瞬时风向风速全部按缺测处理。8:00—10:00无新的天气现象出现,也没有已出现且需要记录时间的天气现象,天气现象栏无需更改。故障时段内无降水现象,删除小时降水量中缺测的分钟降水量。除风向外,其余要素数据扩大10倍输入,缺测数据输“-”。应在14:00(下一定时观测时次)前完成数据处理和上传。
这里值得注意的是,小时内能见度数据异常时,极值不能从实有记录中挑选,9:16—10:25数据缺测导致10:00、11:00的最小能见度以及出现时间都受到影响,故10:00和11:00的最小能见度和出现时间按缺测处理,11:00正点数据需处理上传。分钟降水量中的缺测也应删除。
以上操作应在14:00(下一定时观测时次)前完成数据处理和上传。
1.3.3 MDOS备注。按国家局业务规定,新型自动气象站出现此类故障影响正点数据时,要在12 h内将包含数据处理方法等内容的备注上传到MDOS。
按以下步骤进行,登录MDOS软件功能菜单→元数据信息处理→备注信息登记→一般备注事件→理由填写:由于主采集器故障,9:16—10:25数据缺测,10:00正点数据用备份站代替,10:00和11:00最小能见度和出现时间按缺测处理;气压、气温、相对湿度、风、地面温度、草温的小时极值从实有记录挑选,不影响日极值(因MDOS系统升级,以上操作针对的是V1.2.1旧版,V2.0新版中具体操作略有差异,但不影响备注内容)。
在ASOM系统填写完整的故障单。同时,值班员仍需观察对比新型自动气象站的数据和备份站的差异,持续关注新型自动气象站的运行情况并做好记录,确保数据的有效性和准确性。
2 某一类观测数据缺测故障排查过程
2.1 故障现象
2015年9月14日6:10,观测室报警,查看观测数据,草面温度、地面温度、浅层、深层地温全部缺测。
2.2 排查思路
因与地温分采集器相关的数据全部缺测,去观测场查看地温分采集器,断电重启,回值班室查看,地面数据仍全部缺测,然后打开机箱查看主采集器,发现CAN总线松动。
2.3 解决办法
断开主采集器电源,连接好CAN总线,复位主采集器。回值班室查看数据,恢复正常[3-4]。
3 某一项观测数据缺测故障排查过程
3.1 故障现象
2016年7月15日,ISOS软件报警,80 cm深层地温数据缺测。
3.2 排查思路
故障现象发现后,排查时要全面,逐步排查,规范操作。由于地温传感器为标准4线制铂电阻温度传感器。铂电阻温度传感器根据金属铂的电阻值随温度变化测定温度[5]。现行业务中使用的Pt100铂电阻在0 ℃的电阻值是R0=100 Ω(另有Pt1000阻值不同),以0 ℃为基点温度,在温度为t(℃)时的电阻值Rt=R0(1+At+Bt2)[4](A、B为系数,经标定可以求出其值)。结合原理排查如下:①由于只有80 cm地温数据异常,其他深层地温数据正常,故排除主、分采集器和CAN线故障。②用万用表测试地温分采集器面板上端子处80 cm地温传感器的同端和异端电阻,发现80 cm深层地温电阻明显异常,将160 cm深层地温线插入机箱下面80 cm地温传感器的航空插头,再次测量电阻值在正常范围内,排除传感器至分采集器通信线路故障。③将80 cm深层地温传感器挖出,发现一处有明显的老鼠撕咬痕迹。依次用蜂鸣档以及电阻档测试4线头的1、3两线,发现蓝色线无蜂鸣声,电阻值极大,确认故障出现在地温传感器头或地温传感器线上。④将地温传感器线剪短用水温测试法测试后发现传感器正常,排除传感器头故障确认传感器线故障。
3.3 解决办法
用深层地温传感器备件替换坏件,与地温分采集器连接好线后,等待观察,数据恢复正常。
4 自动站故障排查流程
4.1 注意事项
在排查故障的过程中,需要保持冷静,逐步排查,规范操作。因为每个设备都有指示灯,对排查故障有很重要的指示意義,所以要重视指示灯的使用。另外,采集器电源箱、计算机、UPS、打印机均与市电相接,插拔电源插头时,切记应注意安全。
4.2 故障排查流程图
台站观测业务人员能够迅速判断和处理故障,对保障自动站运行和数据准确性、完整性非常重要。新型自动气象站在全国范围内业务运行后,各台站应该根据新型站软硬件特点和台站情况建立故障排查流程,流程满足逻辑清晰、实用性高、兼顾效率的原则。本文从台站运行保障工作经验出发,提出一种故障排查流程设计,以供参考。
根据出现异常的要素类别和数量将故障分为3类,故障分类及可能原因见表1。以下按照上述分类介绍相应的排查流程。
4.2.1 全部要素缺测。解决此类故障,根据新型自动站数据传输方式(图1),设计排查步骤如下。
首先检查计算机与串口服务器的网络连接是否正常。在DOS命令窗口输入“ping串口服务器IP地址”,如果数据收发正常,说明问题出在串口服务器上游的主采集器或串口通信线路上,按照步骤(1)进行排查,否则按照B。
(1)流程见图2。①查看主采集器运行状态。如主采集器运行状态指示灯异常,进入图2右区,用万用表直流电压档测量供电电压,确保供电正常(12V),复位主采集器。指示灯仍异常,用串口转USB线直连笔记本和主采集器,通过ISOS中采集软件SMO维护终端功能或串口调试工具读取主采集器数据,如数据仍全部缺测或异常,则确认主采集器故障,需要更换。如主采集器运行状态指示灯正常或直连数据正常,则进入图2左区进行通信故障排查。②检查串口服务器。可首先尝试复位,更换主采集器串口线与串口服务器的接口(Port口),更换后通过串口服务器管理软件查看新接口对应的COM端口,更改ISOS采集软件SMO通信参数,数据恢复则排查结束,仍异常说明主采集器至串口服务器的通信线路故障或串口服务器自身故障。③检查主采集器至串口服务器的通信线路。用万用表蜂鸣档检查包括端子、防雷板和导线在内的通信线路有无短路或断路,如有异常,找到具体故障点后进行更换。确定线路无故障后,数据仍未恢复说明串口服务器出现故障。
注意图2左右两区有交叉,因实际业务中可能出现2处以上故障,此时排查难度增加。
(2)数据收发不正常。①检查供电与外表可见的损坏。查看串口服务器和光电转换模块供电是否正常,串口服务器指示灯是否正常,连接计算机和串口服务器的光纤、以太网线是否有明显损坏,接口是否有松动脱落。②复位。连接仍未恢复,重启光电转换模块和串口服务器。③详细检查。连接仍未恢复,用以太网线将笔记本电脑与串口服务器直连,使用ping命令再次测试网络连接。无法连接说明串口服务器或以太网线损坏,更换网线后仍不能连接,说明换串口服务器损坏;连接正常说明光电转换模块、光纤或至业务计算机以太网线损坏,光纤可借助光源进行检查,仍未恢复则需更换以太网线或光电转换模块。
4.2.2 部分要素缺测。依据铂电阻温度传感器的原理和特点,新型站采用了温湿分采集器和地温分采集器,并通过CAN总线实现与主采集器的通信。当温湿或所有地温(含草温)数据同时出现异常,应依次检查分采供电、分采到主采通信线(包括端子、防雷板、CAN线等)是否存在短路或断路。以上处理完成后数据仍异常,说明分采故障或主采CAN接口故障,需及时更换。
如不是通过某一分采集器的气象要素全部异常,则应按单个要素数据异常进行排查。
4.2.3 单个要素数据缺测。单个要素数据缺测或异常多为供电、通信线或传感器故障,也可能是主采集器对应端口损坏,按上述顺序排查较为合理。注意检查通信线路应包括防雷板、端子和各段的数据线。以下介绍几种传感器检查方法。
(1)温度传感器(包括气温、地温、草温)。断电,用万用表测量传感器四线电阻值,包括2组同端电阻和1组异端电阻,同端电阻值应为几欧量级,异端电阻值在100 Ω左右,通过以上电阻值计算温度,如与实际温度相差较大,说明传感器损坏。
(2)湿度传感器。加电条件下用万用表测量信号电压值(毫伏档),与当前实际相对湿度相差较大,则说明传感器损坏。
(3)翻斗式雨量传感器。断开与主采集器连接,使用万用表蜂鸣档检查干簧管在拨动计数翻斗是否能够接通,无法连通说明干簧管损坏,需更换雨量传感器。
(4)风向传感器。将风向标固定在东北、东南、西南、西北4个方位,依次读取风向数据,只出现偏东风或偏西风说明传感器D6位出现故障,只出现偏北风或偏南风说明D5位出现故障。其余5位格雷码盘出现故障较难发现,且排查较为复杂,气象资料业务系统MDOS中能够检测此类故障(系统偏差),在此不做展开。
(5)风速传感器。转动风杯,用万用表电压档测量风速信号,测量值应该在3 V左右或交替出现0、5 V,否则说明传感器损坏。
(6)气压和前向散射能见度仪。仪器为智能传感器,其故障排查较为复杂。气压故障建议直接更换;能见度数据异常,注意检查仪器安装位置是否有变动、镜头是否污染等,仍不能解决时建议停止使用并在定时时次启用人工观测,及时联系上级装备保障部门完成仪器维修。
4.3 进一步改进措施
为了进一步提高故障诊断速度,降低自动气象站故障率,首先,要加强业务基本技能,熟练掌握操作难点和技巧,以提高自身实践能力;其次,要加强新型自动站维护维修方面的学习培训,多同其他台站进行交流和学习;再次,要结合本站实际情况,制定出符合国家标准的测报工作规范,进而有效约束测报人员的不良习惯,做到操作規范,防止故障发生;最后,在日常工作中,要强化责任意识,及时发现问题并做好异常情况处理,积极做好各项测报工作,提高地面测报工作质量。
此外,本文并未涉及台站与省级信息中心通信故障的排查解决。目前,北京市大多数台站采用拨号作为备份通信方式,鉴于3G/4G通信技术的成熟和普及,建议北京市气象局统一布设3G/4G模块作为新的备份通信方式,提高通信方式切换效率。
5 参考文献
[1] 丁圣,王欣.新型自动气象站故障检测方法[J].气象水文海洋仪器,2014(2):91-95.
[2] 范存飞,赵宇,李炳坤,等.新型自动站故障排查与维修[J].现代农业科技,2016(15):236-238.
[3] 何振文,陈文燕,赖惠文.自动气象站地温传感器故障成因及排除[J].广东气象,2011,28(2):55-56.
[4] 胡玉峰.自动气象站原理与测量方法[M].北京:气象出版社,2004:50-53.
[5] 中国气象局综合观测司.地面气象观测规范[M].北京:气象出版社,2003.
[6] 中国气象局气象探测中心.新型自动气象站实用手册[M].北京:气象出版社,2016.
[7] 中国气象局气象探测中心.地面气象观测业务技术规定实用手册[M].北京:气象出版社,2016.
[8] 中国气象局气象探测中心.台站地面综合观测业务软件(ISOS)用户操作手册[M].北京:气象出版社,2014.