黑龙江测震台站综合系统故障分析
2023-11-15徐建权高峰高东辉李继业张思萌张永刚张雁翔
徐建权 高峰 高东辉 李继业 张思萌 张永刚 张雁翔
(中国哈尔滨150090 黑龙江省地震局)
0 引言
故障诊断、预测和系统健康管理是在实际应用条件下对产品或系统进行可靠性评估的方法。其包括:使用保险或预警装置进行可靠性评估;基于数据驱动对故障征兆进行监测和推理;基于系统应用环境和寿命周期载荷开展失效物理建模(派克·迈克尔等,2010)。对于数字化系统来说,其自身精密性、精确性要求较高,同时系统大多数是由光、机、电元件所组合而成,每一环节都是具备着自身特点和相关专业领域的(黄圣棕,2019)。高业欣等(2022)通过汇集SSY 型伸缩仪维修知识开发了故障诊断指导系统,进而融合推理机平台对设备进行状态检测。陶志刚等(2021)对流体监测系统及其辅助系统的主要故障按功能进行了分类与统计,在整理历史故障的基础上分析典型故障并给出了处理建议。本文以分析黑龙江测震系统的可靠度及故障类型为目的,对黑龙江全省测震及相关方面故障进行系统分析。从外部通信、外部供电、内部测震、综合系统等多角度研究故障的诱因、分类、发生时段、时长、维修周期等,进而提出解决问题的办法,以提升测震台网监测系统的可靠度。
1 台网概况
1.1 地震监测系统运行环境
黑龙江省面积47.3 万 km2,地理纬度较高。山地海拔300—1 000 m,占总面积的58%。平原占总面积的28%(黑龙江省地震局,2004)。黑龙江省极端最高气温为龙江县41.1℃。最低气温出现在漠河及呼中之间高海拔地区,可低至-55.1℃(蒋慧亮等,2022)。
黑龙江31 个地震速报监测站包括9 个国家直属台站、22 个区域直属台站。其中,山洞观测12 个;地面观测17 个;井下观测2 个。均采用市电供电,4 M 移动专线与接收端通信,监测站平均间距70 km,中部区域分布相对密集,五大连池北部、望奎西部监测站数量较少且间距较远,该区域也是设备维护、供电、通信较不便利的地带。黑龙江地震监测站分布如图1 所示。
图1 黑龙江地震速报监测站分布Fig.1 Basic distribution of quick earthquake observation stations in Heilongjiang Province
1.2 地震监测系统基本结构
监测站内部系统可分为专业设备、辅助设备2 类。专业监测设备包括数据采集器和地震计,二者用来采集地脉动信号;辅助监测设备是以地震监测为最终目的的具有其他功能的设备,包括交直流供电、网络通信、避雷设施等。监测站内部技术系统连接如图2 所示。
图2 监测站内部技术系统连接示意图Fig.2 Internal technical system connection of observation station
外部市电的输电线普遍悬空架设,因相距远、路况差等原因,另有部分监测站使用风光互补供电方式。外部通信方面,运营商接入端采用双线路、双路由模式接入,区域中心至运营商上联基站采用双线路、双路由模式上联至2 个不同的运营商基站,经由市级传输网上联至骨干传输网(图3)(方瑶等,2022);台站端采用单线路、单路由模式接入,经市级传输网上联至骨干传输网。
图3 监测站外部网络通信示意图(据方瑶等,2022)Fig.3 External network communication diagram of observation station(Fang et al,2022)
2 监测系统故障分析
2.1 设备故障分类
监测系统故障即在工作过程中因某种原因导致设备功能失效或不能达到预定技术指标,继而影响相关系统正常运行。地震监测系统故障可分为2 大类:①临时性故障。此类故障包括间歇性故障,通常由停电、机械作业、风动干扰等外部原因导致设备产出数据不能达到预定技术指标。当干扰消除,设备可自行恢复正常工作,但临时故障也可能导致永久性故障。②永久性故障。此类故障又可进一步按时间、发展过程、故障原因、严重程度等进行分类(图4)。永久性故障无法自行恢复,必须进行维修或更换。
图4 监测系统故障分类Fig.4 Fault classification of monitoring system
2.1.1 按时间分类。①早发性故障:由仪器正常工作前存在的问题所引起的故障,如设备内部虚焊、运输时的振动、错误的调试安装等。②突发性故障:受各种不利因素或偶然外界因素的影响而发生的故障。此类故障的特点是具有偶然性、突发性,一般与使用时间无关,事先无任何征兆,难以预测,如信号线遭破坏所导致的数据中断、插口松动所导致的相应功能失效、遭到雷击等。③渐进性故障:由设备技术参数劣化所导致的故障,包括长期的不良因素影响和设备自身零件、接线的老化。此类故障会导致设备工作状态或产出数据长期不正常,并逐步恶化。通过定期检查设备输出数据及标定结果、设备使用年限等可预测此类故障。
2.1.2 按发展过程分类。①潜在故障:是一种预示功能故障即将发生的可鉴别状态。故障逐渐发展,但尚未在功能方面表现出来,却又接近萌发的阶段。当这种情况能够被鉴别时,认为也是一种故障现象。对于潜在故障,可以尝试通过获取设备参数、信息,校验设备标定结果来鉴别。②功能故障:在无外界因素干扰的情况下,设备不能达到功能预定的工作要求或状态,设备应有的工作能力明显降低,甚至不能工作。这类故障可通过操作者的感受及输出的参数、数据来进行判断。
2.1.3 按故障原因分类。①人为故障:由于在制造、维修、使用、运输、管理等方面存在问题,使设备过早丧失了其应有功能,或其他作业影响及人为故意破坏所导致的故障;②自然环境故障:设备在其使用期内,因受周围自然因素影响而出现的故障,如雷击、低温、潮湿、腐蚀、动物等;③自身故障:仪器内部程序故障、仪器或线路硬件自然老化、标定结果偏离基准值等影响到仪器功能,导致仪器无法正常运行、产出数据。
2.1.4 按严重程度分类。①临界故障:即潜在故障,是危及设备正常工作的故障诱因;②轻度故障:影响设备不常用功能,如不接受标定命令或指示灯损坏等故障,此类故障不影响设备日常监测及数据传输;③严重故障:影响设备日常工作,需及时修复的故障,如插口损坏、内部电路板损坏等影响监测系统日常监测、供电、通信的故障。
2.2 历史故障汇总与分析
为研究测震系统正常运转的可靠度,在不考虑人为主动中断信号的前提下对2018—2021 年黑龙江31 个监测站3 套子系统故障进行分析(表1)。
表1 2018—2021 年黑龙江省测震系统故障统计Table 1 Fault Statistics of Seismic system in Heilongjiang Province from 2018 to 2021
2.2.1 外部通信系统故障分析。外部通信系统故障是指监测站所在地的通信系统出现故障,导致监测站信号无法上传至运营商骨干网,继而造成对省台传输信号的中断。由于架设位置偏远、缺乏养护、损耗老化等原因,长期连续工作的通信设备会出现工作不稳定、传输数据丢包等功能性故障,进而影响整套通信系统的运转。这类故障对于通信设备、通信系统而言是渐进性的。通信设备的故障次数占外部通信系统故障总次数的87.31%,时长占比为77.87%。
为屏蔽干扰,通常对信号传输光缆进行埋地铺设,但光缆质量、铺设长度、冻土、施工等因素都会对其可靠度造成影响,黑龙江省光缆故障最主要的原因是人为误操作,在农耕、修路、地下管网施工等作业时会出现误将光缆挖断、刮破,影响信号传输的情况。所以,光缆故障对于通信系统而言既有渐进性的也有突发性的。光缆故障次数占通信系统故障总次数的11.13%,时长占比为20.33%。
露天架设的通信设备除日常损耗及老化外,也容易受到自然灾害的影响和破坏,2018—2021 年通信链路4 次被冻雨、大风等自然力破坏。自然灾害引起的故障对于通信系统和监测系统来讲都是突发性故障。自然灾害导致的故障占外部通信系统故障总次数的0.78%,时长占比为1.35%。
2022 年黑龙江省测震通信系统优化改造之前,外部通信系统故障具有连锁反应,如负责信息中转的基站出现故障,不仅会使当地信号中断,还会使下层地区基站和监测站的信号无法通过,而中断原因就是中转基站的问题,与下层地区系统无关,但对于省局接收端或地震监测系统来讲两地信号属于同时中断,所以,将下层监测站信号无法通过中转基站的次数与时长算作外部通信系统的间接故障来统计。2018—2021 年有4 次5 个监测站受到此类影响出现信号中断。间接故障次数占外部通信系统故障总次数的0.78%,时长占比为0.45%。
2.2.2 外部供电系统故障分析。此处的外部供电系统是指地震监测站外部的相关供电设施。供电线路的铺设与通信系统一样,路途远,路况差,相对于市区缺乏维护保障,同时变压器及供电线等设施裸露室外,易受外界因素影响,如电压不稳定的临时性故障。监测站外部供电中断后,由4 只100 A·H 蓄电池供应黑龙江省地震监测站所配备的设备,可连续供电4—7 d(贾军等,2012 年)。但直接使用市电且自身无蓄电功能的设备在市电停电后则会立刻断电并停止运行。如果蓄电池亏电,智能电源会自动开启亏电保护,全部设备停止运行,这时远程才可能发现信号出现问题。另一种情况是当地市电故障导致当地基站停电,在供电部门恢复供电或通信部门恢复通信之前也会发生信号中断,即通信中断不会影响市电,而市电中断有可能影响通信。外部供电设备故障次数占外部供电系统故障总次数的88.95%,时长占比为88.2%。
向监测站供电的电缆普遍架设在空中,到达监测站周边才可能埋地铺设,而多数监测站地处山区,架空的电缆会面临雷击、风扰、线杆老化等问题,埋地的电缆也遭到过人工作业的误伤。供电线路故障次数占外部供电系统故障总次数的4.07%,时长占比为3%。
12 次自然灾害导致的故障中雷击2 次,大风9 次,大雪1 次。外部供电系统故障中自然灾害次数占总次数的6.98%,时长占比为8.8%。
2.2.3 监测站测震系统故障分析。潮湿、雷击、设备老化是影响监测站监测系统正常运行的主要因素,监测站密闭不通风,温差会导致墙体返潮及设备、接线表面结露、结冰,甚至造成短路、腐蚀等伤害。雷击会使硬件失去全部或部分功能以及产出数据的失效,即虽有信号,但波形没有地脉动,属无效数据。黑龙江省31 个监测站在用设备中2004—2010 年生产的地震计19 台,数据采集器13 台,智能电源22 台。设备现处在浴盆曲线的损耗故障期,已属于超期服役,在面临极端环境时其承受能力远不如前。外部震动可能导致波形无法识别,加速硬件损耗,而正常的地脉动波形周期小且均匀,虽有地震计零漂现象,但波形形态没有特殊变化。观测房电瓶受潮如图5 所示。雷击、震动及正常情况下120 s 波形形态对比如图6 所示。
图5 电瓶受潮湿影响Fig.5 The battery is affected by humidity
图6 120 s 记录波形形态对比(a)数据采集器受雷击波形;(b)地震计受震动干扰波形;(c)正常波形Fig.6 Comparison of recorded waveforms for 120 s
2018—2021 年数据采集器故障21 次,其中,自身故障18 次,雷击3 次。雷电会通过供电线路、GPS 天线击中数据采集器,若只有数据采集器遭雷击,未殃及其他用电设备,则为GPS 引雷;若雷电经市电进入没有防雷措施的监测站会破坏连接交流电的设备,还可能陆续击伤、击毁其他相关联设备。专业监测设备故障次数占监测站测震系统总故障次数的44.68%,时长占比46.25%。
对于远程接收端,内部辅助通信系统与外部通信系统发生故障时信号状态相同,都是网络信号不稳定或中断,但故障点不同,相应的维修人员、方式、周期也不同。由环境影响造成的监测站内部通信系统故障3 次,其中,雷击2 次、洪水1 次,其他5 次为通信设备自身故障。辅助通信系统故障次数占监测站测震系统总故障的19.15%,时长占比36.62%。
若监测站供电出现问题,远程接收端很难及时发现,通常只有电量耗尽导致数据中断时才会报警,内部供电与外部供电的停电状态都是瞬时的。监测站供电系统故障中智能电源自身故障7 次,室内交流供电故障6 次,环境影响导致室内总开关跳闸3 次。辅助供电系统故障占监测站测震系统总故障的36.17%,时长占比17.13%。
外部通信、外部供电、监测站测震等3 套子系统故障在整套监测系统故障中占比情况如表2 所示。
表2 3 套子系统故障次数及时长占比Table2 Proportion of failure times and duration of three sets of subsystems
由表2 可计算出外部通信、外部供电、监测站测震等3 套子系统平均单次故障维修周期分别为14.96 h、18.43 h、133.79 h,综合系统平均单次故障维修周期为23.42 h。其原因是地方监测人员维护能力较弱,手段较少,没有固定的巡检、维修流程,发现故障时主要由省地震台人员前往维修或邮寄更换故障设备,各中心台即使有维修水平,也没有备机备件,所以出现反应不够迅速、路程较远、维修周期较长的结果。外部通信、供电故障不是省内总部工作人员前往维修,而是故障设备所在地的供电或通信运维机构及时反应,有效维修的结果。测震设备的优势是仪器性能、工作环境相对稳定,所以长期保持在浴盆曲线的偶然故障期,但漫长的维修周期也较大程度上降低了监测站测震系统的可靠度。
2.3 月故障累计及分析
黑龙江省监测站主用的EDAS-24 型数据采集器极限工作温度为-20℃、55℃,所以低温对系统稳定运行不利。每年从4 月开始,人、牲畜等各类活动逐渐开展,甚至野生动物结束冬眠也会直接或间接影响外部通信、供电系统的正常运转。除温差外,从4 月开始的降雨、雷电等因素可导致外部设备、线缆潮湿或受到雷击,这对观测房内、外部系统运行也产生了一定影响。下面以月为单位对2018—2021 年故障在外部通信、外部供电、监测站测震系统等3 个方面进行统计。月故障柱状图如图7 所示。
由图7 可见,外部通信系统每年1—3 月故障次数较少,同时也较稳定,因为在该时段黑龙江空气干燥且湿度变化小,人畜活动较少,这在很大程度上减少了对外部通信系统的干扰和破坏,通信和供电的用量也相对较少且稳定。4 月初温差、潮湿、人畜活动、降雨等问题开始出现,故障增加较明显。从5 月开始,随着生产生活的恢复及降雨次数的增加,系统故障次数激增,5—8 月降雨较频繁,雷雨直接影响通信基站等设施正常运行,该时段成为外部通信系统故障高发期。9—12 月通信系统故障次数相比故障高发期均有减少,且2018—2021年这4个月的月累积故障数稳定在47次左右。外部通信系统除设备故障外,较常见的是光缆线路故障,2018—2021 年光缆直接故障57 次,间接故障2 次。黑龙江每年12 至来年2 月处于严冬,冻土坚硬,非必要情况是不进行野外作业及道路、管网整修的,因此,该时段通信光缆基本不受温差及人为干扰,运行较稳定,2018—2021 年这3 个月光缆故障共3 次。而10 月光缆故障较其他月份频繁,有17 次,占全部光缆故障次数的29.83%,通信光缆都是埋地铺设,10 月雨水、温度对其影响有限,主要是人工作业中的误操作使光缆损伤严重。4—9 月的雨季并没有过多的光缆故障,同样是人工作业失误所致,历次光缆故障均源于光缆被挖断。总体来讲,每年1—4 月是外部通信系统故障低谷期,5—8 月为高峰期,9—12 月为平稳期。
监测站外部供电系统普遍裸露在室外,所以雷雨、温差、潮湿、人畜等因素对室外供电系统的正常运行有直接影响。每年进入5 月,采矿、建筑、旅游等行业用电量激增,外部供电故障次数随之增加并达到顶峰,6 月末用电量趋于稳定,故障有所减少。总体来讲,每年5—9 月是外部供电系统故障高发期,1—4 月为低谷期,10—12 月为平稳期。
由图7 可见,2018—2021 年设备故障次数明显小于室外通信、供电设备故障,这说明对设备进行针对性防护很有必要且效果显著。但若监测站因雷击跳闸,即断开市电,那么在蓄电池电量低于保护电量或监测站有直接连接市电的设备时,观测系统将出现相关故障。雨季期间,尤其是那些为了优良基岩质量及较小台基噪声而地处山洞或背靠岩体的监测站会出现严重返潮、渗水问题,而设备运转时自身带有一定温度,这种环境下在设备缝隙及线缆接口处更容易受潮、结露,从而引发设备故障。观测设备故障高发期为6—7 月,恰巧也是雨季,其他时段故障次数较均衡。
3 监测系统可靠度计算
4 年为35 040 h,将每1 h 的波形数据看作1 个产品,那么整套系统工作到35 040 h,根据下式(李良巧,2012)
及表 1 数据可以计算4 年中3 套系统自行运转的可靠度,即N0=35 040 h,外部通信、外部供电、监测站测震系统的可靠度计算结果分别为
综合测震系统的可靠度为
2018—2021 年监测站内部系统故障总数仅为47 次,占整体系统故障总数的6.43%,但其故障时长占总故障时长的36.74%。由此可见,测震设备从发现故障到维修再到恢复运行是较长的过程,而外部通信、供电故障次数则分别占整体系统故障总次数的70.04%、23.53%,但二者故障时长依次占故障总时长的44.74%、18.52%,
根据下式(李良巧,2012)
得到监测系统平均故障间隔时间
4 故障的处理建议
4.1 外部通信系统
为监测站设置双流传输模式,使用有自动切换信道功能的H3 三层12 V 交换机,在光纤与无线传输之间进行智能切换。此方法要注意交换机与映翰通的网络地址设置需在同一网段且IP 不能冲突。传输方式如图8 所示。
图8 双信道自动切换传输模式Fig.8 Dual channel automatic switching transmission mode
4.2 外部供电系统
对监测站相关供电系统进行了解和备案,如供电源、线路架设、中转设备等情况。将每次供电故障情况进行咨询和记录,统计严重故障点或环节。在此基础上,由地震相关部门与当地电业部门进行有针对性的交涉以提升供电系统可靠性。针对监测站内部供电,在必要情况下安装风光互补供电设备,由当地台站人员视情维护。对于某些台站光电转换器使用交流电的情况,应酌情采用UPS 供电,或改为直流供电设备并由智能电源供电,以此应对短时间的市电中断。
4.3 监测站测震系统
雷击将设备硬件损毁后,通常只能返厂更换,但可以早作预防,如启动智能电源隔离供电模式、传输线缆埋地及安装避雷箱、避雷地网、GPS 避雷器、避雷针等,但黑龙江省监测站尚无安装避雷针的先例。GPS 具有引雷的隐患,为监测站安装避雷针并连接地网或圈梁,可以避免GPS 遭雷击。h为避雷针高度;p为影响因数;hp为被保护物高度;Rp为避雷针在hp水平面上的保护半径;当h≤30 m时,p=1;当hp≥0.5 h时,Rp=(h-hp)p=hap,ha为避雷针有效高度(卢伟辉等,2005 年)。假设GPS 接收器距地面高度为3 m,避雷针距地面高度为4 m 或比GPS 接收器位置高1 m,将避雷针安置在距GPS 接收器1 m 以内就可以对GPS 天线起到有效的避雷保护作用。
目前,黑龙江监测站防潮方式为通过苯板或防潮涂层对监测站内墙进行隔潮,地震计的防潮措施是在泡沫箱内使用泡沫颗粒吸湿。以上做法成本高,针对性不强,容易出现防潮能力降低,且所有监测站无法隔绝地面返潮。可有针对性地研制防潮装置以保护测震设备,降低费效比。科学有效的防护可提高设备保养水平、减少环境问题造成的故障率,从而提高地震台站数据质量、观测质量等(徐建权等,2017)。
针对设备老化问题,可以通过PHM 进行预估。PHM 方法允许在系统的实际生命周期条件下对其可靠性进行评估,以预测将发生故障的时间、地点,从而消除系统风险(派克·迈克尔等,2010)。利用此方法,也可对远程设备进行主动维护,即通过对设备反馈状态或产出数据的检查、计算、对比,分析设备或系统的当前正常状态,或存在的故障隐患。
针对监测系统维修问题,省地震台或地震中心站可以从历次维修中报废设备里拆除一些未损坏的零件,替换出现相应故障的设备,可以较大程度降低维护成本及周期,但需要了解设备内部结构、功能,具备维修理论基础,且设备保质期内应酌情拆卸。
5 结论
在整体地震监测系统中,外部通信系统故障次数较多,故障时间较长,外部供电系统故障次数位列第2,但故障时长远比监测站监测系统短。从平均单次维修周期来看,监测系统相比其他2 套系统反应慢,路程远,手段不多,所以导致故障时长远大于外部通信、供电系统。
从时间段来看,每年1—3 月运行环境相对稳定,所以监测系统故障较少,4 月冬春交替时节系统故障有明显上升趋势,5—9 月雷雨及人畜活动对系统影响较严重,是监测系统故障高发期,10 月光缆故障次数较多且均为人工作业中误操作所致,10—12 月总体故障相对高发期有所减少且较稳定。
通过计算得到,黑龙江地震监测系统可靠度仅为0.51,平均故障间隔时间为47.93 h,这对于常年自行运转的系统及不间断监测数据来讲,故障过于频繁,应对系统进行更有针对性的维护,并由被动维护向主动维护转变,以提高系统可靠度。