APP下载

地铁智能运维平台的环网架构及其性能探析

2022-07-21马廷博王伟

中国科技纵横 2022年12期
关键词:单环双环环网

马廷博 王伟

(中车青岛四方机车车辆股份有限公司,山东青岛 266111)

0.引言

国内各地的系统运维工作,大部分还是依靠定期与预防式检修,此过程需消耗诸多资源投入,而且检修结果也仅能依托于技术员与行为管理规范。一旦技术员与某个操作步骤出现失误,反而会使地铁设施发生故障。

1.地铁智能运维平台

1.1 运维工作意图

地铁实施运维的根本意图是保障列车安全、平稳、高效地运营。安全方面是让系统处于可控的运转工况下,保证乘客、工作者的安全,设施完备无损。而高效方面则要求系统在基本运营效率的情况下,投入的成本及资源趋近于合理,满足地铁交通的服务需要。其属于设施资产密集类的产业,涉及大量的设施与专业。

1.2 智能运维情况

国内地铁轨道交通正在全面发展中,交通网络不断完善,而在乘客分布不均、设施结构多元化、客流量不断增加等客观现象中,对于设施的可用性有更高标准。而大规模地运营与复杂设施体系、改造升级项目,加重相关运维工作的压力。如今,国内现已开通的地铁运维工作,还是会采取常规的运维方式,其特征表现在:预防及事后修理较多,缺乏预测修理;应用技术员作业,运维效率不佳;工作数据精细化及频率均有缺陷;大数据系统及智能化的落实深度不足等。比如,某地铁在2016年,专业列车日检达到18万余次;均衡修超过6千次;架大修有150多次。这种状态持续到2020年,其每年日检会达到40万次;均衡修超1万次;架大修有700次左右。对于地铁列车的内部维修方法也大多运用人工检测,相应的检修工具、自动化水平等都会引起检查结果的波动。而新建与改造的工程,会应用最新科技,和已有设施可能并不匹配。而在网络化建设的趋势下,轨道交通也进行相应的尝试,提升运维工作效果。如综合监测系统、故障预警系统等[1]。

2.智能平台环网架构类型

2.1 全冗余架构

(1)环网接入部分。系统服务器直接连接交换机,其配备双网卡的绑定功能,分成主网卡与备网卡,各自连接到主交换机与备用交换机上。系统平常工作运行中,主网卡发挥作用,保持较为活跃的工作状态,而备用网卡则为静默状态。一旦主网卡发生异常情况,备用网卡会随即被启动,暂时取代主网卡的位置,维持正常的环网保护运行。(2)系统交换机部分。在各个节点机柜处,都会配备2台交换机,同样分成主用与备用,其启动关系与网卡类似,在主交换机发生异常,无法继续工作时,备用交换机立即负责相应的数据传输转发工作,维持系统的稳定运行,支持环网保护。2台交换机是借助堆叠线实现连接,能传送心跳报文以及业务信息等。(3)系统连接线路。为确保系统能稳定运行,保持平台信息通畅,在各节点处,2台主交换机可以进行连接,并且备用交换机也会相互连接。此外,还设有支持跨设备对接的链路聚合,把2条链路设置在某个跨设备的接口,支持链路之间的信息备份,保障信息流量能稳定输送。(4)系统平台拓扑部分。网络拓扑是环境,依托于ERPS协议,防止形成环路,继而引发广播风暴。另外,在平台发生异常状况后能立即启动冗余配置的备份链路,以保持平台正常的网络连接,能满足电信级的切换标准。此种环网架构运行下,如果发生二度异常,运维业务不会终止。

2.2 双环网结构

(1)接入部分。系统服务器2个网卡处于不绑定的状态,而且各网卡都是运行工作的状态,二者各自会连接2个独立运行的环网,通过服务器上层程序,进行双发选收信息,以实现对运维业务的保护。(2)交换机部分。同样会设置两台交换机,但不涉及主交换机及备用之分,而且二者无需相互连接以及堆叠。各自从属于不同的环网,如果某台设备发生运行异常情况,仅能波及到相连的环网,不会干扰到另外的环网,以此达到冗余保护的效果。(3)系统线路。按照双环网的结构特点,各节点也会配置2条链路,但各自连接不同的环网,一个突发异常情况,不能对另外的环网有任何干扰,达到线路保护的目的。(4)系统拓扑。相互处于独立状态的环网,各自按照ERPS协议运转,可防止在环网中出现广播风暴,而且在故障切换中支持运维业务倒换,达到环网内部运维保护的效果。同时,2个环网信息互为备份,有效提升智能运维系统的稳定性。此种环网架构运行下,也能确保在发生二度异常时运维业务保持原状[2]。

2.3 单环网结构

该结构可以说是上一种的简化版,直接消除其中一个环网,仅留下一个环网运行。此结构不涉及接入、线路与交换机方面的冗余布置,其中仅有拓扑冗余。相较而言,其优劣势比较明显,优点在于:整体框架比较简单,能省去部分设施资源的使用,使得运维平台建造成本下降。但缺点是性能较差,运维稳定性不足。

3.地铁交通智能运维平台环网架构性能探讨

3.1 运行可靠性

运维平台运行可靠性的分析方式较多,如定界法、因子分解法、图变换、状态枚举法等。虽然可以较为精准地确定环网架构的可靠性,但操作过程比较繁琐,如果在现实地铁改造项目中运用,无疑会增加工作量。因而,建议选择古典概型的方法,评估上述环网框架即可,相关分析过程如下:

(1)全冗余结构。根据该环网结构,可将其当成若干基础割集相互串联的框架。设环网中其中一条链路实际可靠性是λ;而其中某台交换机运行可靠性是P;服务器的数据发送端下挂于节点1;相应数据接收端则下挂于节点k;在此环路的节点共有n个;平台总体的运行可靠性是P1。由此:u=2λ-λ2,υ= [λP(2 -λP)],x=(1-P)·(λ+P-λP)·(λP)2,整理出以下表达式:

其中,P(La)表示在系统环路处于正常运转状态下,平台信息数据流能直接按照顺时针方向的链路La进行所需传送任务的可靠性;P(Lb)表示在正常顺时针方向的链路La出现异常,无法使用的情况下,信息数据流会转而变成逆时针方向输送,通过链路Lb进行数据传送的可靠性。在可靠性评估中,为简化计算分析的过程,可通过工程化假设处理。

一方面,把网络拓扑分成各自独立的子集,而主设备和主链路;备用设备和备用链路,分别看成基础割集。在地铁运维系统中,仅要确保其中某个割集保持通畅,便可认定相应节点和相邻节点之间,有可用的数据传输渠道。另一方面,主用和备用交换机,而且具有相距不远的堆叠线,同时铺设于人工值守的机柜中,在发生运行异常时,能迅速替换,此过程中的检修时长趋近于0。所以,便能不考虑此部分对于运维平台总体可靠性的干扰问题,也就是可靠性可等同于“1”。在上述两项假设下进行可靠性评估计算,可减少实际的运算量[3]。

(2)双环网结构。基本思路与全冗余大致相同。设设环网中其中一条链路实际可靠性是λ;而其中某台交换机运行可靠性是P;服务器的数据发送端下挂于节点1;相应数据接收端则下挂于节点k;在此环路的节点共有n个;平台总体的运行可靠性是P2;w=P(A网)。由此可得出以下表达式:

其中,Ring1表示环网1。通过上述表达式代入整理,可得到如下表达式:

P2=2·P(A网)-P2(A网)=w(2-w)

(3)单环网结构。在单环网的系统中,仅包含一个环网,可以看成在双环网框架下,A网的运行可靠性。把单环网平台的总体运行可靠性设成P3。由此能得到以下表达式:

P3=P(A网)=λk+1Pk+λn-k+3Pn-k+2-λn+2Pn

(4)可靠性比较。以某市地铁列车运行状况为例,其网络运行异常一般出现在光纤链路的部分,没有犹豫交换机问题,出现网络中断的情况。按照交换机的运转性能参数,其的平均无故障时长(MTBF)是57年;平均修复时长(MTTR)是2h,由此按照平台可靠性的运算表达式,能得出:

由此能得出该运维系统交换机的运行可靠性(P)为0.99999,为便于后续分析便利,可靠性取值为0.99。

针对运维系统平台光缆问题,因为故障存在明显的偶然性与随机性,所以需把其可靠性(λ)当成变量,取值范围在0.9~1,基于此,评估对于传输网络可靠性的干扰程度。通过分析环网架构中的节点总数;环网内服务器的接收端下挂节点,也就是从接收端至发送端之间的距离,借此评估各种环网结构的运行可靠性。经过对比探讨,3种环网架构中,全冗余架构的可靠性最好,而后是双环网、单环网。这种现象表现是因为在全冗余结构中,采取心跳线连接,构成大量的连接路径。通过相关分析:在运维平台设备与链路的工作可靠性,都能达到0.999及其以上的情况下,全冗余结构和双环网结构相较,前者故障率能比后者减少3个数量级左右[4]。

3.2 网络收敛性能

在运维平台发生拓扑调整及异常情况,会随即启动链路切换。而运行状态收敛期间,环网结构、运行协议都会对切换过程的时长有影响。地铁智能系统运行中的故障,目前分成两个等级。

(1)一级故障。1)在节点主链路发生断线时,全冗余结构的切换时长,是由链路聚合组内的切换情况决定,把报文设成100ms的工况下,发生此故障时,交换机会与极少数报文无法获取,启动链路切换操作。双环网结构下,不涉及主备分别,所以切换时长是根据服务器本身的判决时长与A网运行协议的倒换时长确定。假设判决时长超过倒换时长,则接收端不能倒换至B网,直接把输送路径切换成倒换时长,同时该时间小于50ms。如果判决时长更短,系统服务器可随即完成切换。在单环网结构下,切换动作完全由倒换时长确定。2)服务器的主链路发生断线时,全冗余结构下,切换动作是根据网卡与备用交换机确定。在交换机处于堆叠状态时,2个交换机地址解析协议没有同步,在数据传输切换至备用设备中,应重新运行,会消耗一段时间。在双环网结构下,切换动作是根据服务器本身与系统上层程序的处理情况确定,而后者是和服务器程序有联系,时间通常在200ms以内。在单环网结构下,服务器直接和网络连接,没有任何额外的运行链路,所以在发生此故障时,会直接导致数据通信中断。3)节点的主交换机宕机,全冗余结构中,会受到交换机堆叠中2台设备切换时长影响。在备交换机从备用工况调整成主要工况后,同样要经历学习的过程,切换动作实现时间较长。而双环网与单环网在遇到此种平台故障时,表现和节点主链路的断线异常相同。

(2)二级故障。1)节点互联链路加上断线故障。全冗余结构下,切换周期是由链路聚合组内的切换时长,还有协议倒换时长共同决定。假设遇到两条链路一起断线,会先在聚合口中进行业务切换,而后通过协议保护切换,此过程需等待较长的时间。双环网结构下,切换动作是根据A网的保护时间确定,而B网不会对整个平台运行产生任何干扰。单环网结构中,发生2条链路的异常情况时,由于其没有配备任何保护路径,所以会直接阻断运维业务的正常运行。2)节点内的交换机都出现故障。全冗余结构中,面对此故障的切换处理比较复杂,包含堆叠情况、地址解析协议以及ERPF,此切换过程大约会等待5s。双环网结构中,服务器间的判决时长会超过协议倒换动作的时间,在系统服务器察觉到此类异常前,平台的切换动作就已经结束。在单环网结构中,没有配置任何对于节点中的额外保护。3)节点的主交换机以及相应备用链路同时出现故障,全冗余架构对此故障的切换处理反应和上一种相同。双环网结构下,2个子网都具备启动切换的条件,而且切换时长依旧会短于服务器处理时间,导致服务器获取到异常故障前切换动作就已完成。此外,对于此种故障现象,单环网完全不具备处理性能[5]。

总的来讲,全冗余结构的收敛效率最低,其他2种架构在该项性能上的表现没有过大差距,但后者的长期可用性更差,无法完成二级故障的系统保护。联系上文对3种环网架构的分析,三者各有应用优劣势。具体来说,在可靠性上,全冗余架构最佳,其次是双环网;在拓扑构成的复杂性上,全冗余架构最为复杂,单环网是相对最简单的一种;系统运行收敛性能上,单环网架构的反应速度最快,全冗余架构是最慢的;环网建造成本上,全冗余环网造价最高,超过单环网的2倍,而双环网与其相差不大。

4.结语

智能化的运维平台投入到地铁交通中,有助于优化系统运维的效果,控制资源消耗,并维系轨道交通的运行安全。通过比较不同环网架构,总结出各自的适用范围。全冗余结构可用于系统可靠性标准极为严格的项目,如信号系统,双环网则用在可靠性与延时方面无过高标准的项目中,如综合监控系统,单环网能用在可靠性标准偏低、延时方面标准高、对于造价有要求的项目。

猜你喜欢

单环双环环网
响应面法优化开发单环刺螠罐头食品
pH、氨氮和亚硝酸盐对单环刺螠稚螠耗氧率和排氨率的影响
基于ODUk Spring方式实现基础网络环网保护的研究
高速公路万兆环网建设探析
“单环学习”与“双环学习”
电流双环控制的LCL单相并网逆变器逆变研究
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
聚丙烯成核剂双环[2.2.1]-庚烷-2,3-二羧酸钠的合成
双环法结合双“V”形乳腺切除法在乳房肥大整形术中的应用
万兆环网在京秦高速智能化监控中的应用