影响深圳本地网PON用户低速数据业务因素研究
2013-02-28黄鹂,何磊
黄 鹂,何 磊
(中国电信股份有限公司深圳分公司 深圳518017)
1 引言
在PSTN向NGN演进的过程中,传统的交换业务受到了巨大冲击,特别是随着PON的发展,e8-C的大量使用,IP承载多种业务已成为大趋势。这是由Internet的影响和广大用户对更加丰富的业务的需求所决定的。
IP网是一种分组交换技术,用于数据传送、不面向连接的尽力而为的分组交换。网络中的每个分组独立进行路由选择,其开放性和灵活性都以牺牲QoS为代价。因此在这种网络中,传统的交换业务也会遇到新的问题,特别是低速数据业务,包括传真机、POS机、保密电话等,它们对网络条件的要求更为严苛,受到的影响更大,如在较差的网络表现下,话音还是可用的状态,而低速数据业务已经不可用。其中以传真业务出现的问题最为复杂并且非常具有代表性,因此本文主要以传真业务为例,具体讨论在话音正常的情况下,影响PON用户低速数据业务的因素。
2 IP实时传真及实现方式
IP实时传真方式,即利用IP网络进行实时的传真通信,是真正的端到端通信方式。实时传真网关转发信令和报文,对传真终端几乎是透明的。目前主流的实时IP传真技术主要有G.711透明传输和T.38传真两种。
·G.711透明传输方式:采用这种传真方式时,两个网关只需支持G.711,对于报文不做任何处理。优点是对传真机的兼容性较好,缺点是在网络条件较差的情况下传真成功率低。
·T.38传真方式:对网络的分组丢失率具有很好的顽健性,即使前N次的传真报文丢失了,只要收到本次传真报文,就可以获取完整的传真数据。因此T.38传真对IP网络质量的依赖性不强,但对DSP能力的需求大。但存在传真机兼容的问题,建议在网络质量好的情况下采用G.711透明传输的传真方式。
3 影响传真业务的因素
本文大体从3个层面讨论在深圳本地网组网的情况下,以传真业务为代表的低速数据业务所遇到的问题。这3个层面分别为接入层、承载层和控制层。
首先了解深圳电信NGN组网模式和PON结构,目前其PON话音通道的组网架构如图1所示。
3.1 承载层
传真业务为代表的低速数据业务对于网络质量的敏感度比普通话音业务更高,因此,网络质量差(时延、抖动、分组丢失)是导致传真业务质量差甚至失败的最主要原因。
图1 目前PON语音通道组网
3.1.1 网络质量标准
依据通信行业标准YD/T 1071-2000《IP电话网关设备技术要求》[1],大体把网络质量分为3个等级,见表1。
表1 网络等级
根据表1中对于网络质量等级的划分,在实际的特定场景测试中可以得到不同网络等级下的业务表现,见表2,其中,灰色底标标注是指不能满足实际运营要求的业务表现,对于相同情况下的网络表现,传真和modem业务对网络质量的要求更高,传真业务等成功的条件也相对更为苛刻。
表2 不同网络条件下的业务表现
3.1.2 影响网络质量的因素
IP网络承载与PSTN和ATM有很大区别。PSTN是通过端到端的连接,固定地占用64 kbit/s的带宽提供具有质量保证的服务。ATM作为分组交换技术,面向连接,具有完备的QoS管理机制,以保证多业务的服务质量。IP网络承载与ATM虽然都是分组交换技术,但IP却是用于数据传送、不面向连接的尽力而为(best effort)的分组交换。网络中的每个分组独立地进行路由选择,其开放性和灵活性以牺牲QoS为代价。
下面主要针对影响IP网络质量的3个主要因素进行分析。
(1)时延
一般来说,实时性要求不同,对网络时延的要求也不同,如低速数据业务,对时延的要求比较高。网络中一个节点(主机或路由器)的时延[2]主要由发送时延、传播时延、处理时延和排队时延组成。这些时延成分所起的作用可能变化很大。一般而言,处理时延通常是微不足道的。而最为复杂和令人感兴趣的是排队时延,而且与其他3项时延不同的是,排队时延对于不同的分组是不同的。
(2)抖动
语音信号是连续的,在发送端经过压缩打包后在IP网络中传输时,由于数据分组传送的路径可能不同,不同的数据分组到达接收端的时间也可能不同,导致接收端在回放语音时产生时断时续的状况,称为抖动。
(3)分组丢失率
一般情况下,数据分组在网络中产生拥塞的点被丢掉,在传输线路中产生的错误分组同样也会被丢掉。通常当接收分组的数量超过输出端口的大小限制时就会产生拥塞,由此产生分组丢失。
传真业务对于网络质量的要求主要体现在时延上。一个典型的端到端时延在网络中的分布,主要由发送时延、传播时延和处理时延构成。但不能通过将这些时延进行简单相加来体现时延特性,这主要是因为IP网络本身不能像TDM那样,提供完善的QoS保证机制,当网络中的业务流量突然增大时会产生拥塞,分组的排队时间增加,必然会有优先级低的业务分组被丢弃,导致业务的服务质量下降。
3.1.3 深圳试验网络测试
(1)网络质量检测机器人
在实际情况下,测量网络质量通常采用ping测量工具软件[3]。
在系统默认的配置下,ping工具将以1 s为时间间隔持续不断地向指定目的主机发送长度为64 byte的ICMP请求分组,直到用户中止。但通常对于较精细地了解网络时延特征而言,1 s的探测分组发送时间间隔太大[4]。虽然ping工具得出的测试结果清晰直观,但得出的结果无法智能记录并且导出。
由于本文要对几万个网元进行测试并对结果进行分析,若不能自动记录结果,会产生非常大的工作量,并且也无法确保原始数据的准确性。因此,本文开发了自动ping分组软件,该软件可自发性按照设定的条件对若干个IP地址进行检测,并且增加了结果的自动输出,修改了发送分组的时间间隔为500 ms。为了方便下文的阐述,本文暂定这种修改后的网络质量监测工具为网络质量检测机器人。
(2)对深圳试验网络的测试与分析
目前PON组网分为语音专网组网模式和使用IP城域网混合业务承载网的组网模式。
对语音专网使用检测机器人进行检测,在3层交换机上,对每个ONU设备发送100个数据分组,发现时延基本上能控制在10 ms左右,分组丢失率为0,如图2所示。
专网模式下,和理论中的纯话音业务IP网相似,因此在这种模式下,时延中起决定作用的为处理时延,而目前深圳电信已经采用了符合最高标准的设备,因此,目前这种组网模式下,只要日常维护得当,基本符合良好的网络标准。
图2 话音专网试验
下面对IP城域网做同样的实验,抽取一个已搭建好,但尚未投入使用的试验网络的网络质量检测机器人。对测试结果数据进行分析,结果如图3所示。可以看到,共测试IP地址43 354个。其中不可达地址10 199个,可达地址33 155个,地址不可达的最主要原因是,部分设备禁止使用ICMP,次要原因为用户重启导致DHCP地址重新分配或用户终端吊死。在此将不可达地址剔除出分析列表。
在这33 155个可达地址中,平均时延大于40 ms的地址有2 073个,占全部可达地址的6%;分组丢失率大于10%的地址为1 070个,占全部可达地址的3%,其中时延大于40 ms的地址有166个,时延小于40 ms的地址有904个;时延抖动超过10 ms的地址有8 370个,约占全部可达地址的25%,时延抖动超过20 ms的地址有4 415个,约占可达地址的13%。
根据上文的分析,传真业务对于网络质量的要求尤其体现在时延上。下面将对IP城域网的时延进行更进一步测试,努力通过更多的实验数据进行对比,得出有用的结论。
为此,进一步分忙时闲时对城域网进行测试。从40 000个IP地址中抽出4 000多个进行分时段测试(0:00-9:00为闲时,10:00-21:00为忙时),测试结果如图4所示,分别给出忙时、闲时在不同时延范围内地址数的比较。其中,对于时延大于40 ms的地址数,忙时比闲时多出7.8%;为了更清晰地进行对比,将小于40 ms的时延段细化,可以看到在闲时测试下,时延在10 ms内的地址数大大超出忙时;而在10~40 ms范围地址数忙时多于闲时。
将同样的结果数据绘成平滑曲线,可以更加清楚地看到忙时、闲时的变化,如图5所示。忙时的曲线较闲时的曲线发生了明显的右移(这里的x轴坐标和条形图x轴坐标相同),这说明在忙时时段内,同样硬件条件下,时延增加的概率会变大。
图3 网络质量测试结果
IP网具有长期性能较好、暂态性能较差的特点,所以当网络中业务流量突然增大时,会产生拥塞,分组排队的时间增加,排队时延成为主要成分。实际的在网实验结果,也很好地证明了这个观点,在忙时时段内,由于业务的增加,时延也高于闲时,这大大增加了业务出现问题的几率。
另外,IP网络本身不能像TDM那样提供完善的QoS保证机制,分组排队的时间增加,必然会有优先级低的业务分组被丢弃,导致业务的服务质量下降。
3.2 接入层
接入层主要包括用户传真终端,上联ONU、OLT这些接入设备及中间的传输网络。主要影响传真业务的参数配置和硬件。
3.2.1 参数配置
检查参数配置是否正确;参数配置是否和传真机终端型号匹配。以MA5616为例,“workmode”表示传真模式的选择,包括透传(thoroughly)和T.38参数;“flow”表示传真切换模式的选择,包括v2、v3、v5参数。
深圳现网目前标准配置的传真参数为“透传+v3flow”。
在这里有一点特别值得注意,即中兴通讯自己有一种特殊的传输模式——Robust(顽健)模式,前文中介绍了Robust是一种透传增强模式,增加了冗余处理,以提高传真的成功率。但只有中兴通讯设备和少量烽火FTTH设备对其支持,兼容性不强,特别是到后期SIP中继开通之后,引入了互通问题,Robust模式送上去的信令与SIP信令进行叠加后,造成传真失败,因此除非在极特殊的情况下,一般不予以使用。
3.2.2 硬件
(1)传真机问题
检查传真纸是否放好;传真机接收时,需确保传真机已放好传真纸、打印墨盒没有用完、各部件工作正常。传真机是否已设置“拒绝接收”功能,确保传真机已正确设置。
(2)网络中各部分硬件的问题
外线质量和终端电压是否达到要求,这两种因素是最容易出现的,因此特别值得注意;其他问题,如上联ONU、OLT设备板卡端口等是否出现问题,设备版本是否匹配及其他设备因素。
图4 忙闲时测试结果对比(条形图)
图5 忙闲时测试结果对比(曲线图)
3.3 控制层
在控制层中,关键要检查与低速业务有关的参数配置是否正确。以华为公司SOFTX3000为例。
·不能出现“No fax”、“No modem”字样。若媒体网关支持检测传真信号,则不能出现“No fax”;若媒体网关支持检测modem信号,则不能出现“No modem”。
·需要包含“v3 fax flow”字样,表示本网关的传真业务协商由软交换控制。
·网关编解码配置是否正确,以确定当前的传真类型为T.38还是透明传输传真。
·相关EC配置是否正确。高速传真本身有EC处理,要求网关的EC功能关闭;低速传真要求EC打开。
4 结束语
本文从实际出发,第一次从整个网络的角度,全面分析了影响以传真业务为代表的低速数据业务的因素。分析过程中,在深圳现网的情况下,做了大量实验,力求尽可能用丰富的事实数据“说话”。希望此文能在今后的维护工作中起到参考价值。
1 IP与多媒体标准研究组.IP电话网关设备技术要求.电信技术,2000(10)
2 Kurose J F,Ross K W.计算机网络:自顶向下方法(第四版).陈鸣译.北京:机械工业出版社,2009
3 Postel J.Internet Control Message Protocol.RFC 792,Internet Engineering Task Force,1981
4 Stallings W.数据与计算机通信.北京:电子工业出版社,2008