APP下载

5G 高可用专网组网设计研究

2022-10-22蔡子华陈丰刘子建郭春旭

广东通信技术 2022年9期
关键词:基带可用性专网

[蔡子华 陈丰 刘子建 郭春旭]

1 引言

为满足行业客户差异化的业务需求,三大电信运营商均早在2020 年就推出了各具特色的5G 专网解决方案。经过产业各方的协同推进,目前5G 专网的商用落地和规模部署已取得显著成效。从5G 专网架构来看,多数行业企业选用了“混合专网”的方案,即复用运营商大网无线资源,并将5G 用户面下沉部署至企业园区,与运营商中心网络5G 控制面联动。这种方案的收益在于,一方面运营商可充分利用已建的大网资源,快速部署园区专网业务,另一方面企业用户可收获业务低时延传输、数据不出园区等服务体验。但是,随着5G专网从行业外围进入核心生产环节,网络可用性开始与生产成本及效益高耦合。比如,煤矿采煤设备机械臂的应用层设有心跳监测机制,一旦5G 专网断链导致应用层中断超过300 ms,机械臂将自动停止并且需要人工恢复,进而将影响生产效率。为此,煤矿、工业制造、电力等一批自身主导权强、议价能力高的行业客户出于生产安全、网络自主可控等考虑,相继提出5G 专网高可用能力升级诉求。

2 5G 混合专网核心痛点

5G 网络是由终端设施、无线接入网、传输网、核心交换网及相应的运行支撑系统组成的复杂综合系统,影响其可用性的因素包括设备/节点可靠性、组网设计、网络的组织和维护管理,以及机房、配套动力等网络所依存的环境条件等。对于运营商而言,5G 公网面向的是差异化的用户需求,且网络建设受到成本的制约,因而其可用性设计更侧重于核心网、传输网核心层等一旦发生故障则可能大范围影响用户使用的组成部分。对于企业而言,采用5G 混合专网模式意味着对成本更为敏感,但由于追求网络端到端可用性,其在局部的可用性要求上又高于5G 公网,如无线网侧。这就要求重点关注设备/节点可靠性和组网设计,以实现网络可用性的最优化和成本合理性的平衡。

典型的5G 混合专网架构如图1 所示,其核心痛点包括外部网络故障或断链对园区网络的影响,以及园区网络内部设备的故障。

图1 典型5G 混合专网架构及可能的故障模式

外部网络故障或断链对园区网络的影响可进一步细分为运营商中心控制面网元故障、企业园区与中心网元的传输中断两种情况。对于前者,运营商通常通过部署双DC,多网元形成网元资源池进行业务容灾的方式来保证中心网元的高可用性,其发生故障的概率较小。更可能发生的是后者。考虑到可能存在因物业阻挠施工导致传输实际未成环、光缆因施工被挖断等情形,一旦传输中断,此时园区与运营商中心网络之间的N2 和N4 接口将同时中断,此时会导致企业园区所有业务中断,业务无法接入。

园区网络内部设备故障可能表现为终端侧CPE 故障、无线网侧基站主控板和基带板等关键器件故障、园区用户面网元故障等。对此,通常通过部署多套设备进行容灾解决,但也要考虑成本的合理性进行差异化的组网设计。

3 5G 高可用专网组网设计

5G 端到端专网可以视为由终端、无线网、传输网和核心网组成的独立串联系统。借鉴RBD(Reliability Block Diagram,可靠性框图)模型,对于串联系统,所有子系统均正常时才能保证系统正常运行。因此,5G 专网的可用度A 为

其中,AUE、AAN、ATN和ACN分别为终端、无线网、传输网和核心网子系统的可用度。

可见,为了使企业定制的5G 专网达到相应的可用度要求,必须针对终端、无线网、传输网和核心网的组网进行增强设计。

3.1 终端侧

对于未内置5G 通信模块的终端,通常采用CPE 转接的方式,也即终端设备通过RS485 等接口直接接入CPE,再经由CPE 接入5G 网络。考虑到无线链路的脆弱性,传输过程可能存在丢包,或出现偶发的大时延问题,导致业务中断。可以通过增加冗余无线链路,无线链路互为备份,从而保证单链路丢包或故障时业务不中断。例如,增设AR 路由器,下挂原有的一个或多个终端设备。AR路由器与双CPE 桥接。当AR 路由器接收到下挂终端的上行数据时,将数据经由主用链路发送至对端的主用CPE并接入5G 专网。一旦AR 路由器侦测到主用链路故障或信号传输质量不佳,将自动进行倒换,把数据经由备用链路发送至对端的备用CPE 并接入网络。这样便实现了发送端的5G 双链路备份。此外,通过在网关设备内置双5G通信模块以便接入不同5G 频段或网络,也是可行的方法。其本质也是增加冗余无线链路。

3.2 无线网侧

无线网侧的增强设计可以从设备可用性和链路可用性入手,通过冗余备份来保障整体的可用性。

3.2.1 关键部件冗余备份

BBU 支持的单板主要包括主控传输板、基带处理板、风扇模块、电源模块、环境监控单元等。其中,主控传输板主要为BBU 内的其他单板提供信令处理和资源管理功能,并对外提供传输、LMT 等接口以实现信号传输、配置管理和设备管理等功能。基带处理板主要完成上下行数据的基带处理功能,并提供与射频模块通信的CPRI 或eCPRI 接口。

在常规配置下,BBU 仅配置一块主控传输板。若该单板故障,则将导致基站长时间业务中断。对此,可考虑配置两块型号相同的主控传输板进行冷备份。在初始配置时,当BBU 上电启动后,如果两块主控传输板均为正常状态,BBU 将通过主备竞争决定主用单板。如果其中一块单板不在位或为异常状态,则另一块正常工作的单板直接竞争为主用单板。随后,主备主控传输板之间比较文件差异,以主用单板为基准,同步所有差异文件大备用单板。所同步的文件仅包括配置数据、软件、日志等静态数据。当主用单板出现严重故障时,而备用单板在位且链路正常,BBU 将自动倒换到备用单板,以此保证基站能继续正常运行。试点数据表明,从主控传输板倒换到基站业务恢复正常的时间与下带的射频模块数量有关。对常规的三小区室外基站,其业务恢复的预期时间为4~7 min。

当BBU 的一块基带板出现故障时,同样直接影响在该单板上部署的基站小区业务。对此可考虑每个AAU/RRU 同时与两块基带板相连,形成热备份环形组网。这种组网方式,环上有且只有一个AAU/RRU。BBU 通过其中一块基带板建立操作维护链路,但用户面数据会同时在两条CPRI 或eCPRI 链路上传输,且传输内容相同。这样,当与AAU/RRU 建立操作维护链路的基带板故障时,环上的AAU/RRU 业务会中断并迅速切换到另一块基带板重新建立通信。

3.2.2 无线链路冗余备份

考虑到无线信道易受环境的影响,尤其是在工业现场等复杂环境下,存在高频的电气设备或其他干扰源,可能对5G 特定频段造成较严重的干扰。因此,在重要的24 h 不间断生产环境下,5G 专网采用双频覆盖是有必要的。对于室外基站,可在相同站址设置双倍套数的AAU/RRU,并采用不同的授权频段进行信号覆盖。AAU/RRU上联至不同的BBU 上或者同一BBU 的不同基带板上,并设置为不同的逻辑小区。当某一频段的小区无线链路受干扰或故障时,终端可通过异频重选驻留到另一频段的小区上。对于室分系统,前述思路仍然适用。但考虑到室内布点空间受限且数字室分的远端单元具备多频支持能力,也可以考虑交织覆盖的方式,即通过合理控制远端单元覆盖范围,使其同频不同点位交叉冗余覆盖(部分覆盖区域重叠),交叉的远端单元配置为同一逻辑小区。这样,即使某一远端单元发生故障,与其相邻并有一定范围覆盖冗余的另一远端单元仍可提供有效信号覆盖,终端可正常驻留而不需要进行同频切换。

3.2.3 无线高可用组网设计

根据关键部件和无线链路冗余备份的思路,可以组合设计出多种组网方案。综合考虑技术可行性、方案实用性和性能表现等因素,图2 给出了3 种典型的无线高可用组网方案。

图2 5G 无线高可用典型组网方案

3.3 传输网侧

运营商传输网一般采用分层组网,包括边缘接入层、汇聚层和核心层。边缘接入层设备采用环形组网,分别与汇聚层节点相连。汇聚层设备双归到核心层设备。核心层设备则多采用全互连或半互连方式。传输网整体具备高可用特性。在不考虑非标准设计的情况下,传输网侧的故障点更多可能出现在BBU 与接入层路由器的传输链路上。对此,可采用IP 主备路由的方案,即BBU 主控传输板上两个物理传输接口经过层二网络连接到主备网关路由器上。BBU 和主备网关网路由器间启用BFD(Bidirectional Forwarding Detection,双向转发检测)进行链路状态检测,并将BFD状态关联到其路由状态,适时触发主备路由倒换。对于到基站的返程路由,主备网关路由器也各自配置备份路由,在某个路由发生故障时,网关路由器能从备份路由把返程报文返回给基站。

3.4 核心网侧

在图3 所示5G 混合专网中,用户面UPF 下沉至企业园区部署。对此,可以通过园区UPF 与运营商中心UPF 的联动来保障网元级的可用性,也即园区UPF 和中心UPF 二者规划的企业业务规则保持一致,且中心UPF通过专线等形式保证可访问园区应用服务器。当园区UPF发生故障时,SMF 基于N4 接口探测实时感知故障,将删除园区UPF,保留用户会话,此时终端通过中心UPF 继续访问本地应用。但这一方案并未解决外部网络传输中断对园区业务的影响。当与大网的N4 链路故障,或N2/N4链路同时故障时,如园区UPF 正常,仅可提供对连接态用户的业务保活;如园区UPF 也故障,则所有业务将中断。同理,如果园区部署2 套主备的UPF,也仅能解决园区单个UPF 故障时业务迂回至中心UPF 转发的问题,但仍无法解决N4 或N2/N4 断链的问题带来的影响。

图3 5G 混合专网核心网增强方案

对此,可考虑的方案是,在通过运营商中心网络5G控制面网元提供园区用户信令面处理功能的同时,在园区本地部署应急控制面AMF/SMF/UDM 网元功能,且中心网络UDM 定期将用户签约数据同步给园区UDM,如图3所示。

当企业园区与中心网络的传输未中断时,用户通过中心网络的AMF/SMF/UDM 鉴权接入,中心网络的UDM基于切片、DNN 或IMSI 号段定期导出园区用户数据文件并上传至外置的SFTP 服务器,园区UDM 主动从SFTP服务器下载对应的用户数据文件并加载生效。

当企业园区与中心网络的传输中断时,对于新开机用户,终端接入时,园区5G 基站选择园区应急AMF、SMF接入,其业务无影响。对于当前出于连接态的在线业务用户而言,园区5G 基站保持连接态,中心网络的AMF 和SMF 以及园区UPF 均保持用户连接态,业务也无影响。而对于已注册但因终端移动或其他原因而触发信令交互的用户,园区5G 基站将选择应急AMF 处理,AMF 引导用户重新注册,业务快速恢复。

由上述分析可知,通过在园区本地部署应急AMF/SMF/UDM,能够有效应对N4 或N2/N4 断链的问题。不难推导,为保障园区用户业务进一步的可用性,可以在企业园区同时部署两套应急AMF/SMF/UDM 和两套UPF。两套AMF/SMF/UDM 可以设置为负荷分担的模式,而两套UPF 可以按需设置为负荷分担模式或者主备冗余模式。

4 5G 高可用专网方案选择

根据前述关于终端、无线网、传输网和核心网的增强设计,可以组合出多种5G端到端组网方案。在实际应用时,应遵循差异化原则,针对不同企业园区提供差异化的高可用组网设计,为用户提供合适的方案。具体有以下原则可供部署时参考。

其一,组网设计应充分考虑成本制约因素以及基于场景的容灾保障范围。

以BBU 基带板热备份为例,假设基带板可用度为B,考虑到实际上保护倒换动作不可能100%成功,设定基带板倒换成功率为Sw,则1+1 基带板间主备备份系统的可用度应为主用基带板可用概率与主用基带板失效转换到备用基带板的可用概率之和,即有

从性能角度而言,随着基带板冗余度的提升,可用性相应提高。但从成本角度看,支持6 小区的基带板单价约占BBU(含机框、安装套件、主控板、基带板、回传光模块、时钟套件、载波软件包等关键部件)整体单价的30% 至40%。如果在整个企业园区批量应用基带板主备方案,将给运营商或用户带来明显的成本攀升压力。在成本制约的前提下,建议优先考虑针对覆盖关键产线区域的5G 基站实施冗余备份方案,而非针对全园区基站。

其二,应综合考虑整体部署并分解可用性指标到5G专网的各组成部分。在端到端可用性已达一定程度(例如99.99%)时,针对局部的增强设计可能对端到端可用性的提升作用不明显。

其三,在组网设计时,将端到端网络可用性的提升程度转化为对于因业务中断导致的经济损失的止损能力,对于企业用户而言更加可感知。

5 结束语

工业控制等业务场景对时延、抖动和可用性的要求极其严苛。在为这类场景的企业定制5G 专网时需重点考虑网络高可用性的实现。本文讨论了5G 高可用专网的组网设计及方案的选择原则。在实际应用中,为了进一步提升5G 专网的可用性,除了通过冗余组网设计使得系统即使发生故障其功能也不受影响外,还需通过简化硬件设计、提升生产工艺等方法降低5G 系统软硬件的故障率,以及通过故障检测、诊断、隔离和恢复机制来实现因5G 系统故障导致功能受损时能够快速恢复。

猜你喜欢

基带可用性专网
核电站DCS可用性测试应用研究
面向移动应用的软件可用性研究综述
DSP在5G通信基带处理平台设计中的应用
5G专网: 运营商的双刃剑
机构知识库网站可用性评价指标的计量学分析
中国移动发布边缘计算等多项5G专网能力
5G专网的抉择:网络切片还是“另起炉灶”?
有了5G,我们还需要专网吗?
苹果推出自研基带芯片要过几道坎?
Intel 5G大动作!PC瞬间飞起