针对微信支付业务失败的LTE网络优化分析
2022-05-25刘学武王凯
刘学武 王凯
摘要:为提升微信支付失败率这一用户感知指标,从LTE网络侧对微信支付的影响因素,包括故障、覆盖、负荷、干扰、参数设置等进行分析,提出对应提升措施并实施优化。对微信支付指标与网络KPI指标、用户感知指标、覆盖、负荷指标进行关联对比,对微信支付失败进行了实际的模拟测试,分析与失败率关联特征。同时对涉及的端到端流程以及定义算法进行简要解析,找出可能影响指标的问题。
关键词:微信支付;失败率;LTE;用户感知;网络优化
一、引言
为提升移动网络用户满意度,通信运营商需要对各类移动互联网业务的质量进行监控和优化提升,如流媒体业务、手机游戏、支付类业务等。4G LTE网络仍是当前移动通信数据业务主力网络,微信支付作为移动互联网的一种典型业务应用,对微信支付业务失败进行LTE网络专项优化提升可有效提升用户使用感知。
描述支付失败的指标有时也表述为“支付卡顿率”,这里统一以“支付失败率”表示,计算公式为:支付失败率=小区支付失败率加权总和/小区个数加权总和。
二、基础无线网优化分析及措施
从微信支付失败率的定义看,该指标是针对出现微信支付失败的小区进行加权统计计算出的,因此最直接的提升措施就是降低支付失败的小区数量,重点针对支付失败重复出现的TOP小区进行分析处理。取某月支付失败数据提取TOP小区进行原因归类,按照覆盖RSRP、上行干扰、拥塞高负荷等显性分类原因占比如图1所示。其中也有近50%难以确定网络侧原因,首先对较明确的基础无线网络问题进行分析优化。
(一)覆盖优化
通过上下行路损、链路平衡及终端测量报告(MR)数据分析相关支付差小区的覆盖状况。以248283-11小区为例,基础指标没有明显异常,平均RSRP也正常,但是上行SINR偏差,上行SINR小于10dB的占比50%左右;查看时间提前量(TA)值,1km到1.5km的样本点偏多。调查该小区现场情况,发现其位于山沟里面,周围站点稀疏,近点覆盖山下居民,远点覆盖到了山上景区,导致该小区整体RSRP正常,但是远点用户多,有些被山势遮挡,终端上行信号衰减大。由于泰安有较多山地,尤其是泰山景区周边,此类情况较多,对此主要通过天线RF优化进行改善。
(二)干扰问题优化
主要针对上行高干扰问题处理。上行干扰易引起上行解错或导致下行丢包概率增加。经集中排查处理多处外部干扰源,包括私装信号放大器,ATM机,电力抄表设备,森林防火设备,行车记录仪,电厂设备等各种类型。
(三)参数类优化
从无线网配置的参数看,主要存在几个风险点对支付指标有负面影响:1.对支付类小包业务没有针对性优化;2.互操作参数不合理可能带来重选延迟容易导致干扰以及负荷不均;3.部分小区的随机接入信道(PRACH)参数配置错误;4.功率参数有优化余地。对这些问题分别进行优化。
1. 支付类小包业务参数优化
支付类属于小数据包业务,频繁的信令连接、释放会降低网络效率[1],而TCP代理及预调度功能通过快速服务器下发的数据进行快速应答,缩短了服务器发送下一轮数据的RTT时延,而且基站对服务器的数据包也是逐包应答,所以从两个方面实现了(时延、ACK应答数量)加速。微信支付使用的协议一般都是HTTP协议,所以可以开启预调度功能,主要实现的功能就是GET预调度和HTTP下行包应答预调度,降低相应流程时延,提升网络效率。通过相关参数核查,并将异常参数拉齐优化。
2.互操作参数优化
针对4G回落3G的高倒流情况,加强覆盖的同时修改调整3\4G互操作参数,主要避免用户占用4G网络差;对异频切换A1/A2门限优化调整,尤其针对L1800与L2100插花站点,并加强RF优化,提升SINR及覆盖,从而降低支付失败率。
3. PRACH信道配置问题
支付业务的发起成功率与LTE无线网随机接入信道(PRACH)性能有关联,从KPI指标分析,发现存在一些小区的PRACH专用preamble检测失败次数高,msg3的检测成功率低。选择典型小区229119-31小区(异常)和229119-11小区(正常)的小区对比,发现31小區的前导码与周围的码冲突。进一步筛选网络中存在类似问题的小区共1600余个,经过参数优化,msg3检测成功率从65%提升到69%,相关参数优化情况如图2所示。
4. Pa功率参数
在下行功率计算中,有Pa、Pb参数,其用来定义了A类、B类符号的功率增益,当业务信道的功率增益增加,CQI将跟随改善。针对有功率余量且CQI差、弱覆盖等问题小区,调整修改功率参数PA从-3修改为0,提升支付成功率。
(四)隐性故障处理
针对传输质量可能存在的隐性故障进行排查处理,通过对传输路径的指定节点之间的传输质量,比如时延、抖动和丢包进行测量,并获取性能统计数据来分析基站的传输质量,统计基站到核心网传输时延高于15ms站点进行排查,避免由于传输问题而导致的支付失败。另外,部分室内分布站点存在RRU通过光纤分布系统连接多个远端机导致时延大、RRU端口配置与实际不符问题;部分宏站的天线端口不平衡问题等,对此根据实际分别处理。
(五) 基础优化效果
经过以上从覆盖、干扰、参数、隐性故障处理等多方面集中采取了大量优化措施,取得了一定成效,从指标看网络接通、切换、用户速率、上下行质差均有不同程度的改善,微信支付失败率指标也有逐步改善趋势。
三、支付失败指标的关联性分析和模拟测试
考虑从全省各地市的支付失败指标和其他基础质量指标的纵、横向对比来进行支付指标的关联性分析,并设法进行一定量的模拟支付失败测试,以进一步深入优化。
(一)网络质量指标地市间对比
从山东各地市4G无线网络质量主要KPI性能指标(主要包括E-RAB掉话率、E-RAB建立成功率、RRC建立成功率、CQI优良比等)、用户感知类指标(主要包括TCP传输时延、下行TCP平均丢包率等)、下行覆盖指标(主要包括RSRP高于-110dBm的覆盖率等)、上行覆盖指标(上行SINR优良占比等)、无线负荷指标(PRB高负荷占比等)进行对比分析,可以得到以下几点结论:
1.KPI指标以及用户感知类的某个单项指标与微信支付失败率没有明确对应关系;
2.上行覆盖与支付失败率有正相关性,但也不是支付失败的决定性因素;
3.在未引起拥塞的情况下无线负荷与支付指标相关性较弱。
(二)微信支付失败的模拟测试
微信支付失败指标从公式看统计的是微信支付失败的小区,但具体失败行为是从业务应用侧的统计,从前述关联分析看具体与LTE网络的某个指标或计数器没有明确对应。为进一步研究问题,通过大量实际测试模拟了在LTE网络下几种支付场景。测试过程如下:
1.正常支付做了600次,全部成功。
2.在LTE网络下进行支付过程中将数据连接断掉。这种是模拟支付过程脱网,付方在LTE网络下发起支付,输密码前断开数据连接,多数会提示“交易请求已提交...”有时会提示“网络通信出现问题...”。收方手机终端有支付失败的提示,如图3所示。
3.模拟支付过程中4G切换3G。4G发起支付,输密码前手工切换到3G,付方变为3G时,有短暂“网络连接不可用...”立即输入密码,实际交易失败,收方提示支付失败。
4.网络正常情况下,付方取消支付时,收方提示支付失败。
5.通过进出电梯模拟信号变弱场景。找一个电梯弱覆盖环境,手机不做设置的情况下,在4G发生支付,进入电梯(电梯无信号覆盖),支付失败情况和断掉网络连接效果一样,付方多了一个微信支付等待的过程。
模拟测试小结:1.在不进行人工干预的情况下,很难直接测试到支付失败;2.第一种模拟场景,实际大部分用户应该是在有4G网络下发起支付才会统计为4G支付小区的,因此直接脱网可能性比较小,极弱覆盖场景可能会遇到;3.第二种,在4G网络下支付过程中突然切换到3G,这种应该有实际场景。支付过程中4G向3G切换时,因为网络原因消息没有送达导致失败;4.第三种,用户撤单导致支付失败,应该不属网络原因;5.电梯弱覆盖应该是实际存在的场景。
通过微信支付失败场景的大量模拟测试,可以验证在弱覆盖场景下的支付失败问题。
四、微信支付指标的其他影响因素分析
前面进行支付失败原因分类时有近50%小区难以确定明显LTE网络原因,在优化过程中也出现过支付指标突变情况,且省内各地市同步变化,显然这与网络质量并不直接相关,还存在其他影响因素。
(一)微信相关应用服务涉及软硬件影响
从微信支付的原理和流程来看,支付行为涉及付款方、收款方、微信方以及相关业务方,微信用户通过微信应用页面、APP以及二维码使用登录的微信号完成支付,支付请求通过微信官方服务器再接入相关商家处理完业务后,再由微信服务器发给发起请求的用户,完成一次基于微信的交互[2]。由于支付业务对安全性等要求的特殊性,服务器和终端之间还有身份认证、数字签名等多种交互流程。因此支付失败除移动网络本身因素外,还涉及微信支付应用的相关服务器和软件等,需要从业务层、网络层、控制层端到端的全流程分析[3]。
(二)微信支付指标的定义算法影响
从各地市横向和纵向对比分析看,微信支付失败率与平台统计规则和算法也有较强相关性。腾讯公司定义的指标的计算方式如下:
先根据支付业务量确定基站小区的支付业务量级(WEIGHT_PAY)L1~L10,即量级为从0到总量级均匀划分的等长区间,确定L1~L10权重为1至19,以2为步长递增;其次确定小区的支付失败率:支付失败率=小区失败率加权总和/小区个数加权总和。
例:假设A、B两个支付失败小区,一周内每日失败率分别为A1、A2…A7,B1、B2…B7,量级权重分别为x1、x2…x7和y1、y2…y7,则支付失败指标为:A1x1+A2x2+…A7x7+B1y1+B2y2…B7y7除以x1+x2+…x7+y1+y2…y7,其中x、y为1、3、5、7、9……19。
以上定义中由于支付权重的有限级数量化特征会带来一个问题:相同支付失败次数发生在高权重小区比发生在低权重小区失败率更低。简单说就是两个“算数支付失败率(支付失败次数/支付总次数)”相同的小区因支付次数和权重不同会定义为不同的失败率,这与通常对网络质量指标的理解是不一致的。因为考虑了业务量因素,使該定义与用户分布和用户行为有了较大关联,并不是单纯网络质量的反映。
五、结束语
微信支付作为移动互联网的一种典型业务应用,反映了用户对数据业务的感知。经过对支付失败指标专项优化分析,总结如下:
(一)通过对重复出现的支付失败小区分析优化,支付失败与网络覆盖、上行干扰、参数优化、隐性故障等有直接关系,这些也不同程度反映在其他一些KPI/KQI指标中,对这些质差TOP小区的处理作为一项日常工作需要长期坚持,久久为功,进而提升用户感知。
(二)弱覆盖场景下可以模拟测试到支付失败情况。
(三)支付业务失败涉及端到端的全流程。
(四)按微信支付失败率的定义,支付权重对指标计算结果影响较大,即支付权重越高,支付失败率越低。这种计算方式的受人为因素影响。
作者单位:刘学武 王凯 中国联通泰安市分公司
刘学武(1973.09-),男,汉族,山东泰安,学士,高级工程师,研究方向:移动通信无线网络优化;
王凯(1984.04-),男,汉族,山东泰安,硕士,高级工程师,研究方向:移动通信无线网络优化。
参 考 文 献
[1]宋蒙,范斌,孙雷.LTE系统小数据包业务无线资源优化研究[J].移动通信,2014(15):85-88.
[2]顾永好.基于微信客户端的微信支付研究与实现[J].通讯世界,2016(04):26-27.
[3]黄美璇.基于扫码的微信支付系统的设计与实现[J].淮海工学院学报(自然科学版),2018(03):34-37.