基于路由模拟的网络推演分析系统的设计和实现
2017-03-02王民昆邓志森张大伟熊志杰
王民昆,徐 晓,邓志森,张大伟,熊志杰
(国网西南分部调控中心 四川 成都610041)
基于路由模拟的网络推演分析系统的设计和实现
王民昆,徐 晓,邓志森,张大伟,熊志杰
(国网西南分部调控中心 四川 成都610041)
通过对现网中指导流量穿越网络路径的路由协议配置进行监测,同步配置到支持同样标准路由协议的Agent模拟器中,通过算法自动匹配现网物理链路关系,构建由Agent模拟器为载体的虚拟1:1网络。在不影响现网的前提下,对模拟网进行设备、端口、配置的增删变化,实现对实际网络变更付诸实施前的故障排除和网络推演,以防止由于简单的配置错误或网络构架问题引起网络故障导致的高昂代价。
Agent模拟器;同步算法;路由推演;设计
电力的网络架构和配置都比较复杂,目前通过管理系统可以简便的监控网络拓扑、接口流量、业务质量,但是当网络管理员需要对网络进行设备升级、配置变更时牵一发而动全身;电力的网络灾备要求很高,基本所有业务都要有冗余备份链路,管理员的组网经验决定了冗余链路的健壮程度,但是还是无法预知如果出现了设备或端口故障时,路由走向会怎样,当前的组网是否能满足需求。文中通过一种Agent模拟器来实现路由协议,同步现网的设备配置和连接关系,让模拟器之间的路由通信与现网保持一致,实现对现网的核心设备网络的1:1模拟。配置变更或灾备预演前,只需在模拟网上进行设备、端口和配置变更,模拟网就会推演出实际的变更后的网络路由变化,减少了可能发生的错误导致的维护成本。
1 设备路由模拟
通过Agent模拟器来模拟现网的设备,对于路由推演系统来讲需要Agent实现现网使用的路由协议,以电力调度网为例,最核心的就是 OSPF(RFC2328)和BGP(RFC4271)协议。Agent实现路由协议在软件编码上实际与设备相同,与设备最大的差别是性能,Agent包装在一个512 M内存的虚拟机内,用于实现路由计算,不用考虑实际网络带来的业务压力,所以成本比实际设备也少很多。Agent支持telnet/SNMP操作,可以在上面预先测试现网将要实施的配置变更。
设备端口最终通过绑定操作系统的物理网卡实现与外界通信,可以模拟多种端口类型,由于都是虚拟网卡,所以物理端口的带宽无法通过Agent设备直接体现,但是可以通过配置端口的配置速率来调整端口的实际带宽速率。由于路由协议的选路与带宽有关,例如OSPF可以直接在接口视图下直接配置开销值;或者配置接口的带宽参考值,OSPF根据带宽参考值自动计算接口的开销值,计算公式为:接口开销=带宽参考值÷接口期望带宽。如果没有在接口视图下配置此接口的开销值,OSPF会根据该接口的带宽自动计算其开销值。接口开销是路由选路的关键,将直接影响链路的流量走向。
2 物理链路同步
为了很方便的将现网的设备物理连接关系模拟出来,开发了一款界面图形化的全真网络模拟软件,可以选中两端设备和端口构建和现网物理链路完全一致的组网,Agent设备启动后,根据链路连接和实现的路由协议完成路由表的构建。
图1 全真网络模拟软件界面
3 网络配置翻译
1:1模拟的要求就是配置要一致,Agent具备网络设备一样的路由计算能力,但是需要一个自动化的同步算法将实际网络设备的路由相关配置备份到Agent上,这样Agent启动之后之间的路由学习结果才会与现网保持一致。配置备份最好的方式就是配置文件下发,原理其实和手工输入命令行下发到设备上一样,这就需要一个翻译器,将各个厂商的网络设备不同的命令行实现方式转化成Agent能够理解的配置格式并下发到Agent上。系统通过进行配置片段模板比较的方式,在本地储存一份配置模板库,这个库中保存了各个厂商不同的业务命令行配置片段模板与Agent自身的配置模板的比较对应关系。系统可以很方便的将现网设备中的配置解析成一个个业务配置片段,并在配置模板库中进行对应匹配,最后将各个业务按照Agent自身的配置格式下发到Agent上,完成业务的1:1复制。
图2 样例
4 路由拓扑
推演的基础是路由拓扑,区别于二层拓扑的通过LLDP协议和MAC学习来绘制连接关系,三层拓扑连接关系需要通过路由表RFC1157/4292学习来计算。在网络设备的三层拓扑图中,3层设备之间通过IP地址计算在同一个子网,且两端接口都是PPP接口,则可认为两个设备间是PPP直连链路;如果不是PPP接口,那么则根据子网进行连接。但这还并不能真实的展示三层设备间的链路关系。通过设备的 IP路由表信息,判断,如果一个设备的路由表中存在另一个设备的非直连 (indirect)下一跳地址,那么我们就认为两个设备间存在直连链路关系。以A设备为例,去往10.1.1.0和10.3.1.0的下一跳都是10.2.1.1,证明A到B的GE0/2方向有连线,以此类推。
5 推演展现
推演主要针对两种场景,一种是灾备考验,通过在模拟系统上手动关闭某些端口,系统实时计算出现问题之后的路由变化展现给管理员;一种是实施预测,管理员要对网络配置进行修改或扩容,在实施之前,直接在模拟系统上把预先需要实施的配置变更或新增Agent模拟器和连线关系进行配置,系统实时的计算当前网络的变化,并给出变化后的效果,如果实施的内容有问题,在模拟网络就会第一时间体现出来。如图:现网遂宁到广元的流量会经过备调的设备进行传输,在模拟系统上将遂宁连接备调的端口shutdown,两者之间的链路变为红色(Down)。这时系统会模拟OSPF的最短路径开销在剩余的几个备选链路中选择一条新的路由(图中选中的路径)。
图3 链路关系图
图4 链路推演图
6 结束语
网络推演是一项很深入长远的系统工程,对于网络的性能优化和管理至关重要,也任重道远。从拓扑可视化->流量实时监控->业务质量细分->Troubleshooting->路由变更模拟->故障预测->容量管理,实现对现在到未来的全面掌控。本系统实现了对路由的模拟,在网络推演的路上迈了很关键的一歩,为后续的流量模拟和容量管理打下了理论和技术基础。
[1]王晓锋,张恬,毛力,等.核心节点全局计算与存储的路由模拟策略[J].计算机工程与应用,2010(33):9-100.
[2]朱伟,戴月明,王晓锋.异构计算环境下网络路由模拟任务的非线性划分[J].系统仿真学报,2014(3):574-579.
[3]曹一家,陈彦如,曹丽华,等.复杂系统理论在电力系统中的应用研究展望[J].中国电机工程学报,2012(19):1-9.
[4]王佳明,刘文颖,张建立.恶劣天气下的复杂电网连锁故障在线预警[J].电网技术,2012(5):239-244.
[5]毛安家,张戈力,吕跃春,等.2011年9月8日美墨大停电事故的分析及其对我国电力调度运行管理的启示[J].电网技术,2012(4):74-78.
[6]刘耀年,术茜,康科飞,等.基于电抗加权介数指标的电网脆弱线路识别[J].电力系统保护与控制,2011(23):89-92.
[7]曹一家,王光增,曹丽华,等.基于潮流熵的复杂电网自组织临界态判断模型[J].电力系统自动化,2011(7):1-6.
[8]智韬,司光亚,贺筱媛.电力关键基础设施网络仿真模型研究[J].系统仿真学报,2010(11):2732-2737.
[9]余加喜,郭志忠,白雪峰,等.基于面向时间过程的静态安全分析 (英文)[J].电工技术学报,2010(10):142-149.
[10]康重庆,夏清,刘梅,等.电力系统负荷预测[M].北京:中国电力出版社,2007.
[11]刘天琪.现代电力系统分析理论与方法[M].北京:中国电力出版社,2007.
[12]国家电力调度通信中心,编.电网典型事故分析[M].北京:中国电力出版社,2008.
[13]徐林,王秀丽,王锡凡.基于电气介数的电网连锁故障传播机制与积极防御[J].中国电机工程学报,2010(13):61-68.
[14]刘有飞,李政,刘镭.电网互联和电力市场运营下的电网稳定安全运行对策研究[J].华中电力,2009(5):12-15.
[15]曹毅,张明智,曹强,等.国家关键基础设施安全对经济系统的影响建模分析[J].装备指挥技术学院学报,2009(3):91-95.
The system design and implementation of network routing simulation analysis based on deduction
WANG Min-kun,XU Xiao,DENG Zhi-sen,ZHANG Da-wei,XIONG Zhi-jie
(State Grid Southwest Division Regulation and Control Center,Chengdu 610041,China)
The network flow monitoring through network path routing protocol configuration,synchronous configuration to support the same standard routing protocol agent simulator.By the algorithm automatically match the existing network link physical relationship,constructed by agent simulator for networks with virtual carriers 1:1.Under the premise of not affecting the current network and of network simulation of equipment,interface,configuration of the additions and deletions to change,realize the actual network change into before the implementation of the troubleshooting and network inference,to prevent due to simple configuration errors or network architecture problems caused by network failure causes of costly.
Agent simulator;synchronization algorithm;routing inference;design
TN99
:A
:1674-6236(2017)03-0065-03
2016-02-26稿件编号:201602155
王民昆(1973—),男,重庆人,硕士,高级工程师。研究方向:电网调度自动化。