SDN/NFV关键技术的分析和实现:MICT—OSTM
2017-01-19张轶卿
张轶卿
摘要:提出一种支持软件定义网络(SDN)/网络功能虚拟化(NFV)网络的新一代统一编排、自动运维和开放运营管理系统架构——MICT-OSTM。MICT-OSTM通过网络抽象全方位开放运营商能力,构建创新业务生态链。MICT-OSTM支持端对端的统一业务编排和资源管理,支持基于模型驱动的业务开通自动化,支持基于网络实时监测分析和策略优化的运维自动化。MICT-OSTM为SDN/NFV大规模投入商用摸索出一条可行之路。
关键词: 模型驱动;端对端业务编排;业务自动化;运维自动化
1 引入SDN/NFV的必要性
工业4.0、“互联网+”等国家战略,带动着整个传统产业大升级,与互联网结合,向智能化、规模定制方向发展。这种智能化、规模化的产业升级,要求海量的数据集中到云端,带动整个社会进入云时代。云时代需要灵活动态网络资源配置,高效资源利用率,传统电信网络需要面对更加复杂多变的差异化场景需求,需要突破传统的垂直分割的刚性网络体系和复杂繁多的封闭网元架构。
云计算、软件定义网络(SDN)/网络功能虚拟化(NFV)技术应时而生,为电信网络的变革提供了技术驱动力。随着SDN/NFV的引入,电信网络设备的封闭性有望打破,网络架构将从垂直封闭架构转向水平开放架构,主要体现在网络控制与转发分离、网元软硬件的解耦和虚拟化、网络的云化和IT化等多个方面,最终实现网络重构。
目前,全球的电信运营商基本上都已经开展了SDN/NFV网络的试验和部署。中国电信运营商的关注点主要在编排、电信云、网元虚拟化(如虚拟IP多媒体子系统(vIMS)/虚拟演进分组核心网(vEPC)/虚拟宽带网络网关(vBNG)/虚拟客户终端设备(vCPE))等方面,美国AT&T预计到2020年实现全网75%的设备SDN/NFV化。
电信运营商引入SDN/NFV,一方面希望推动网络转型从封闭走向开放,另一方面希望解决困境和挑战:
(1)传统业务受到通过互联网向用户提供各种应用服务(OTT)的冲击,收入下降,新业务上线周期长,创新业务开发和开展缓慢,严重削弱了运营商的竞争力。
(2)网络和业务紧耦合,难以实现资源的动态复用,自动化配置程度不高,开放性不够,无法满足个性化和差异化的定制化业务需求。
(3)网络环境复杂化,网管和业务及厂家耦合性高,标准化程度低导致运维体系复杂,运维自动化程度低,运维成本高。
(4)网络扩容受制于设备商供货能力,不仅投资大,速度慢,而且引入第三方设备也面临与现有网络互通难,周期长,成本高的难题。
要解决以上这些困境和挑战,只是引入SDN/NFV技术对传统网络改造还不能达到目标,还必须进一步对传统的运维运营体系进行升级改造来实现资源弹性化、运维智能化和运营智能化。
2 MICT-OSTM架构及关键技术实现
2.1 MICT-OSTM架构的提出
为了真正实践SDN思想[1],让运营商网络更加智能、开放、便捷,需要将运营商网络装上智能操作系统,类似计算机硬件装上Windows。我们提出了基于软件定义网络思路的运营商智能网络操作系统——中兴通讯ElasticNet MICT-OSTM。MICT-OSTM具有4个方面的目标:
(1)能力开放服务化。通过网络操作系统,将运营商SDN/NFV网络各个层次的网络程序编程接口(API)标准化,资源虚拟化,形成面向客户的能力开放服务,向客户提供全局资源视图和网络控制API能力,政企应用或者第三方应用能够利用API接口简单、灵活地实现自己需要的网络能力;另外一方面通过网络操作系统,向第三方合作伙伴提供云化在线开发环境,支持第三方厂商的在线开发、运维、运营等,真正形成创新业务生态链。
(2)网络部署自动化。传统的电信网元从规划到安装再到割接入网通常需要几个月的时间;而网元虚拟化后,基于统一的云化硬件,通过网络操作系统,新增网元就相当于软件安装,整个安装过程例如网元部署自动化、配置自动化、测试激活自动化全流程,基本无需人工介入。
(3)业务开通实时化。传统网络开通主要依靠网管和人工,因此业务开通流程自动化并没有带来业务开通的实时化;而SDN/NFV网络,通过网络操作系统,实现网络资源的动态实时管理,从业务订单到资源申请再到业务配置和激活,全程自动化,无需人工介入,提升了用户业务的快速响应能力。
(4)运维自动化。传统网络的运维主要依靠故障告警、性能监测控制和客户投诉,发现问题后再通过人工进行处理;而SDN/NFV网络,通过网络操作系统,可以实时分析性能,多层次告警关联分析和预定义策略,实施告警自愈和主动服务等级协议(SLA)保障措施,保障用户业务不受故障的影响,大大降低人工快速响应速度需求,减少运维人力需求。
2.2 MICT-OSTM的设计思路
在系统设计上,MICT-OSTM利用抽象设计的理念,通过对资源平面、业务平面、客户平面的3层抽象实现网络管理的标准化和灵活性[2],其中资源平面抽象包含网元功能抽象和网络连接抽象两个部分。通过网元功能抽象,屏蔽了不同设备厂商网元的具体实现,为上层的业务平面提供了统一的网元功能逻辑视图,提供从业务视图到逻辑功能资源视图的映射和统一的控制接口;通过网络连接抽象,屏蔽了不同设备厂商转发设备的具体实现,为上层的业务平面提供了统一的网络拓扑连接视图,提供了标准化的网络连接控制API。业务平面的抽象主要是业务抽象,将业务实现流程抽象为可以模型化描述的工作流,建立从业务到资源的逻辑视图,这样未来创新业务的定义和开通实现可以基于信息模型驱动,大大缩短业务开发和开通的时间;客户平面的抽象主要是将面向最终客户的产品采用标准化信息模型描述,并且建立从产品到业务的逻辑视图,产品开通流程通过标准化的工作流来描述,最终实现基于订单驱动的业务开通全流程。
2.3 MICT-OSTM的分层结构
根据MICT-OSTM的设计思路,参考软件定义网络的思想,MICT-OSTM总体架构的分层结构如图1 所示。
MICT-OSTM的结构包括5个层次,即基础网络层、控制层、资源编排层、业务编排层、客户编排层[3],该架构可更加灵活、方便地支持各种新型的网络体系结构以及新网络业务。在MICT-OSTM总体架构的最下层是基础网络层,主要包含传统网络设备、SDN转发层设备、虚拟化硬件平台网络功能虚拟化基础设施解决方案(NFVI)、虚拟化网络功能(VNF),该层由不同的设备厂商提供,主要提供网元的功能和转发层的功能,严格意义上来讲该层不属于MICT-OSTM的功能范围;在基础设施层之上是控制层,主要包含传统设备的网元管理系统功能、虚拟化硬件管理功能、云平台的管理系统功能、虚拟网元的管理功能、SDN设备的控制功能,这一层是运营商网络的控制平面,该控制平面以标准化的形式实现,屏蔽下层基础网络平面的多样性和异构性,并为上层提供统一网元功能和连接视图和统一的北向控制接口;在控制层之上是资源编排层,该层提供网络资源的统一管理监测控制和编排,并通过控制层提供的控制接口实现网络资源的生命周期管理功能,资源编排层及以下层统一被抽象为资源平面;在资源编排层之上,是业务编排层,业务编排层提供端对端网络业务的开通实现和统一编排,通过调用控制接口,请求资源编排层提供所需的虚拟网络功能和相应的网络连接资源;在业务编排层之上是客户编排层,主要负责提供最终客户的自助服务、订单服务、服务账单和计费、产品编排、能力开放等直接面向客户的服务能力,通过客户编排层和业务编排层的协同支撑用户从订单到实现的全自动实时的服务。
2.4 MICT-OSTM的系统功能架构
MICT-OSTM的系统功能架构如图2所示,主要可以分为两个部分:直接面向客户的部分以及面向网络的部分。直接面向客户部分,主要以向客户提供服务能力为主,对应图2中客户编排层的功能实体,例如客户自服务Portal,主要负责提供客户自助订购服务、自助式业务管理和维护等功能,API网关主要向第三方合作者或者企业提供运营商可开放能力,传统业务支撑系统(BSS)增强功能:产品目录,订单编排等,这部分功能主要是为了实现从运营商定义产品到用户定义产品的转变,通过订单编排客户可以根据实际需要从运营商能够提供的基础业务或者能力中任意组合,定义个人产品包,系统自动生成产品包模型和产品到业务的模型驱动流程进入产品目录,无需改动任何程序。面向网络的部分,主要负责面向客户的服务在运营商中网络中的具体实现,对应图2中业务编排层、资源编排层、控制层、基础网络层中的功能实体,包括端对端的业务编排,网络和业务统一规划和设计,网络资源和拓扑的统一管理功能,网络和业务基于策略的自动化保障功能,用户角色的统一授权功能等等。
2.5 端对端业务编排和协同编排器
MICT-OSTM中包含两层编排体系:一层是全局业务编排系统(GSO),负责端对端的业务编排, 它为SDN/NFV网络体系结构和新的网络业务提供了从设计、开发、运行、测试的完整的闭环流程;另外一层是协同编排器,主要包含NFV网络编排系统(NFVO)、企业应用管理系统(EAM)、SDN编排系统(SDNO)。
GSO编排器负责端对端业务开通、业务测试、业务激活等功能,主要处理来自客户编排层分解的用户订单业务请求,一方面触发从面向客户的业务到面向资源的、业务的转化工作流程,解析订单业务对应的资源模型,如果涉及到传统网络资源,则向传统网络的资源管理系统申请相关的资源;如果涉及SDN/NFV资源,则向协同编排器发起相关请求,由协同编排器负责对应资源的分配、创建和变更。另外一方面还需要进一步完成业务的配置、测试和激活等事宜。
NFVO编排器主要提供欧洲电信标准化协会(ETSI)NFV规范中NFV管理和编排(MANO)领域中要求的功能[4],实现虚拟网络服务(NS)和网络切片的自动化编排与全生命周期管理。它主要是根据NS设计以及客户端相关的参数配置,实施NS的部署、弹性、修改、升级、查询,启动、停止、终止等动作。NFVO的功能架构如图3所示,主要包含图形用户界面(GUI)管理门户、南向接口适配、北向接口及驱动插件、工作流框架、生命周期管理框架、资源管理框架等,这些模块以微服务的方式集成,其中模型设计主要包含NS模型、切片模型设计等。由于未来网络中设计人员和日常维护人员通常应该是分开的,在下一代运营运维系统的设计中,我们通过高级规划和设计系统(APDS)将散落在各个系统中的设计相关的功能以微服务门户方式集成,实现统一的权限管理。
SDN编排器主要提供统一的网络连接编排、业务模型管理、网络模型管理、资源管理、性能监测控制、安全控制,以及统一的、端到端的、业务路径的拓扑呈现等功能,具体如图4所示。
SDN网络中通常存在多个SDN控制器。要建立跨域端对端的连接,一种方案就是SDN控制器之间实现东西向的接口,但是这种方案复杂性高,耦合性强,难以构建大规模网络;另外一种方案就是SDN控制器提供标准的北向接口,提供基础的网络逻辑连接功能和拓扑视图功能,由SDN编排器根据业务需求和网络拓扑构建端对端的连接,这种方案并不要求整网全部都是SDN,传统的网络也可以通过网元管理系统(EMS)抽象,提供类似SDN控制器的功能,只不过SDN控制器管理的网络动态调优能力更强,接入更加灵活。
SDN编排器提供标准的北向接口,与上层应用和编排器协同,实现集中式的连接控制和拓扑管理,负责将面向客户和业务的连接需求转化为面向网络的连接需求,下发到具体的SDN控制器和EMS进行控制,实现完整意义的网络虚拟化,使网络更具有“弹性”,降低了网络的开通、运维等成本。
2.6 统一的策略保障框架
未来网络中在基础设施云化、软硬件解耦的场景下,多厂商集成是个大概率事件,而且虚拟网元以VNF软件版本提供的可能性也大为增加,因此类似传统网络中每个网元都自带网管的话,在管理上就非常不方便,因此未来网元网管弱化,与网元版本集成,主要完成网管代理,实现事件上报,配置下发等简化网管功能是个趋势。
MICT-OSTM中包含了全局策略保障系统(GA),主要提供全网业务质量保障框架,其中包含跨域跨厂商的大数据采集和分析、统一告警和性能分析、服务保障和基于策略的网络优化等功能,统一集中跨厂商管理是主要的特点,除此之外还包含全局资产管理(GI)和全局配置管理。
GA提供MICT-OSTM中几个比较重要的能力。首先是统一的大数据采集、存储、计算分析能力。通过事件上报、探针采集、文件采集等多种数据采集手段获取从基础网络层到业务编排层的信息,对整个网络状态、服务质量、客户体验、客户行为、故障告警等进行分析和预测,并且通过API开放支持系统中其他应用的事件订阅和测量任务请求,帮助其他应用实现实时的关键绩效指标(KPI)阀值监测控制,在此基础上,还提供了统一的系统、状态、告警、性能监测控制视图以及根告警和服务影响分析。其次是提供了统一的基于策略的网络和业务保障闭环框架。未来的网络资源管理和业务开通流程是全自动化的,每时每次都有可能有新的虚拟机或容量被创建或释放并且接入网络,导致网络的拓扑也在不断发生变化,因此完全依靠人工去排查告警,去做网络优化和业务质量保障就变得更加的困难。一个基于策略的网络自动化运维体系就变得非常重要。这里提到的策略是多方面和多层次的,策略的本质是可监测控制事件和对应的动作,表达方式是模板,例如NS和VNF弹性伸缩策略、流量路径优化策略、资源分配策略、网络部署策略、安全管理策略、告警自愈策略等;策略保障的执行也是有层次的,例如NFVO负责执行NS的弹性伸缩策略,VNFM负责执行VNF的弹性伸缩策略,而GA模块中关注的是端对端网络和业务的保障策略,根据策略实时监测控制端对端网络的指标和用户的体验指标或者事件,当事件触发或者相关指标达到门阀时执行相关动作,实现网络和业务的优化保障。
GI主要提供全局的资产管理和拓扑管理。与传统网络资源和拓扑管理主要依靠人工录入和静态管理不同的是,SDN/NFV网络的资源和拓扑是动态的,因此全局资源和拓扑管理一方面要具备实时性,另外一方面还有具备自动发现和维护机制。SDN/NFV网络中不同层次的管理网元都具备资源管理的功能,例如VIM能够管理NFVI资源,提供虚拟机资源的申请、释放、扩缩容等;VNFM能够管理VNF资源,提供虚拟网元的创建、释放、扩缩容等,这些管理网元负责对应资源的生命周期管理,但是资源视图只是局部的,而GI需要把局部性的资源和拓扑信息通过技术手段聚合起来,建立整网资源的实时存量管理和关联关系视图,并且提供API供各个模块实时查询,为网络的全局质量保障框架和业务开通提供有力的支持,但是GI不负责资源的生命周期管理。
全局配置管理主要负责端对端网络配置管理、测试激活管理、接入适配管理等功能,负责对接传统网络和SDN/NFV网络的EMS网管。由于传统网络的网管的北向接口标准化程度不高,因此需要提供一个接入适配功能,屏蔽厂商差异性,向系统中其他模块提供标准化的API接口。这样可以使得新旧网络呈现出相同的管理逻辑视图,而网元接入管理还提供配置管理功能,支持通过配置模板实现新增网元的自动化配置,以及网络和资源的测试诊断等一系列的功能。
2.7 全局业务和规划框架
高级规划设计系统(APDS)主要负责下一代运维系统中的规划设计功能,包含模型设计、策略设计、在线验证、分发管理、统一的目录和版本数据库等。通过统一的集成门户,一方面把网络运维中规划设计和日常运维在界面和入口上进行分离;另一方面将设计环境和生产环境隔离,设计权限和运维权限分离,进一步提升网络的安全性和管理的专业性。
模型设计主要负责提供统一的可视化模型设计集成环境,支撑产品、业务、资源、工作流等模型设计和管理功能,这里的资源主要是指面向网络的资源如虚拟化NS、VNF等,对应输出的是网络服务描述符(NSD)、虚拟网络功能描述符(VNFD)、虚拟网络功能转发表(VNFFG)、虚拟网络链接描述符(VLD)等云应用拓扑和编排规范(TOSCA)格式模板。
策略设计主要负责提供统一的策略规则的可视化设计和管理。策略管理主要包含策略分类、策略效果验证、策略冲突检测、策略分发等功能,策略效果验证功能主要是通过API调用获取指定策略规则,下发前后的相关KPI指标进行对比分析,并且根据分析结果,进一步对策略进行设计优化。
在线验证主要负责设计环境的输出结果到生成环境正式使用前的验证工作。在线验证需要搭建模拟生产环境,将需要验证的设计结果投放到模拟生产环境中进行全方位的测试验证,例如在模拟生产环境通过NFVO调用需验证的VNFD模板实例化生成新的VNF,并且启动相关的自动化验证流程,输出相关的测试报告,如果测试结果通过,则可以登记和上传到生成环境的相应目录,成为正式的模板。
分发管理主要负责将设计环境中经验证后模板和版本分发到相应的网元和目录,支持接口适配、格式转换、版本控制等功能。
目录/版本数据库主要负责统一的模板目录和各种资源库的数据存储,提供API供上层应用调用,模板目录包含产品目录、业务目录、资源目录等,资源库包含策略库、工作流库、版本image等。
3 结束语
目前SDN/NFV的商用还处于发展的初期阶段,为真正实践软件定义网络的思想,让网络更加开放、敏捷、高效、实时,我们提出了基于软件定义网络思想的下一代运营运维架构——中兴ElasticNet MICT-OSTM。MICT-OSTM借鉴了IT企业成功的运维理念和经验,基于SDN/NFV以及大数据分析等技术,实现基础设施云化,软硬件解耦,全网资源统一分配,构建统一业务与资源编排管理系统,实现基于策略驱动和模型驱动的运维自动化流程和即插即用的网元集中化运维管理,推动业务一体化开发与统一发布,实现网络能力服务化,业务创新生态化,为SDN/NFV大规模投入商用摸索出一条可行的运维之路。
参考文献
[1] Open Networking Foundation. Software-Defined Networking: The New Form for networks [R]. ONF, 2012
[2] MEF Forum. Lifecycle Service Orchestration (LSO): Reference Architecture and Framework [R]. MEF Forum, 2016
[3] TM Forum. Transformation to an Agile and Virtualized World [EB/OL]. ( 2016-04-21) [2016-09-01]. https://www.tmforum.org/zoom/zoom-poster/
[4] ETSI. Network Functions Virtualization (NFV): Management and Orchestration[S]: GS NFV-MAN 001 V1.1.1. ETSI, 2014