一种TD-LTE下行速率影响因素评估方法
2022-06-13孙学耕郑新旺沈爱国
孙学耕,郑新旺,沈爱国
(1.福建水利电力职业技术学院,福建 永安 366000;2.集美大学 诚毅学院,福建 厦门 361021)
随着LTE(long term evolution)网络的普及和LTE智能手机终端的成熟,相比于3G、4G移动通信,5G的应用和体验毫无疑问更接近个人通信,人们开始展望5G技术能够提供更高的数据速率、更大的容量和传输带宽.更高的网络下载速率,可以使用户获得更好的业务体验,从而营造良好的口碑.此外,目前衍生的抖音、快手、哔哩哔哩、美团等应用软件,对移动通信网络提出了更高的要求.比如,快速下载文件、高清数据、高清监控,还有随时随地的视频功能等,都对移动通信网络提出的挑战,因此若要从根本上解决这一问题就必须真正提高无线网络的下载速率.
网络下载速度是无线网络是否处于最优化状态的直接证据,也是最能直接影响到用户对无线网络服务的体验[1].通常,运营商采用终端路测体现用户的速率感知和移动性感知.因此,路测下载速率的提升是道路优化的一个主要目标[2].在工程上,移动运营商通常通过一些专业的测试软件设备,如CDS (cellular drive test system ,小区路测系统)、ATU(automatic test unit,自动测试单元),定期或不定期地根据某些测试路线和测试区域进行FTP(file transfer protocol,文件传输协议) download测试,以此评估LTE网络的下行速率大小是否达到移动集团测试规范的下行速率基准值或者挑战值.
本文在分析下载速率的影响因素的基础上,提出一种基于多元线性回归的下行速率影响因素的评估方法.实测由FTP Download路测数据为研究对象,引入数据分析流程,结合LTE网络下FTP Download测试的业务特性对下行速率的影响因素进行评估.该方法在通过对归一化处理的数据集拟合的多元线性回归方程中指出了下行速率各影响因素的比重,可以为LTE网络优化人员在处理下行速率低的问题时提供更清晰、更便捷的解决思路.
1 TD-LTE下行速率与主要影响因素
TD-LTE(time division-long term evolution)是一种以时分为特点的高速无线通信技术,其上下行在同一个频点的时隙进行分配,但现网实际测试的下载速率与理论计算值有较大差距.对其造成影响的因素,主要有以下三类.
1.1 LTE网管配置参数
LTE网络配置参数是电信运营商为保证网络正常运营而设置的参数,为保障网络稳定运行,该类型参数通常是稳定不变的.与下载速率相关的网管配置参数有[3]:LTE双工制式TDD(time division duplexing,时分双工)和FDD(frequency division duplexing,频分双工)、频谱带宽(5、10、20 MHz)、工作频率、频段(DEF),而业务子帧配比(SA)、特殊子帧配比(SSP)的配置根据DE频段为SA2、SSP7,F频段设置为SA2、SSP5和CRS(cell reference signal,小区参考信号),功率设置基本保持不变.
1.2 无线参数
1.2.1 空口资源参数 LTE规范定义了6种系统带宽[4],如系统带宽为20 MHz对应的RB数是100个.RB资源一定的情况下,连接数量越多,每个UE调度的次数将越少,相应的速率也会下降.与RB数相关的无线参数有PDSCH RB Count/s(PDSCH信道每秒调度的次数)和PDSCH Scheduled RB Count/slot(PDSCH信道每时隙调度的RB数).
1.2.2 空口质量参数 参数主要有参考信号接收功率RSRP(reference signal received power)[5]、信号与干扰加躁声比SINR(signal to interference plus noise ratio)、调制与编码策略MCS(modulation and coding scheme)、信道质量指示CQI(channel quality indication)和误块率BLER(block error rate).RSRP是衡量LTE覆盖的基础性指标,是LTE各业务能够正常运行的基础.SINR分为上行SINR和下行SINR,与下行速率有关的是下行SINR.下行SINR=RS接收功率/(干扰功率+噪声功率),LTE性能严重依赖于SINR,SINR变差会直接影响下载速度[6].下行调度MCS取决于两个因素:一方面取决于UE上报的CQI,另一方面取决于调度算法.CQI 是无线信道通信质量的测量标准[7].UE反馈的CQI范围0~15与SINR有关:SINR高则CQI大,SINR低则CQI小,CQI的选取准则是UE接收到的BLER<10%的值.UE上报给eNodeB后,根据设备商的算法将4 bit转成5 bit,然后查找MCS 索引与TBS索引表选择对应的MSC阶数.调度算法则需要熟悉各通信设备商调度类参数并进行优化.
1.2.3 传输模式参数 根据无线信道质量,LTE系统设计了9种传输模式TM(transport mode)[8],分别应对不同的应用场景.LTE宏站大部分采用的是8通道天线,可以支持的传输模式为TM2/TM3/TM7/TM8.当无线环境较差时UE采用的是TM2、TM7模式,当无线环境良好的时候采用的TM3或TM8,不同的传输模式转换以CQI和RI(rank index,秩指示)两个参数进行控制.当RI>1时PDSCH数据流是双层,RI≤1时数据流只有单层.
1.3 设备特性参数
设备特性因素有运营商提供的FTP测试服务器、UE Category(用户设备等级)[9].通常在LTE测试时,会先根据测试规范进行测试FTP服务器是否存在性能异常,待无异常后进行FTP测试.UE能力可以从LTE的信令消息设备能力消息获取.目前,中国移动进行网络质量道路测试通常采用自动路测单元ATU设备.该设备支持GSM、WCDMA、CDMA2000、FDD-LTE、TDD-LTE同时测试,可以消除测试设备型号差异性和偶然性,从而系统地掌握网络的通信质量.
2 基于多元线性回归方程的TD-LTE下载速率影响因素评估
由于影响TD-LTE下载速率的因素较多,有必要对其进行系统分析.本节提出一种基于线性回归方程的评估方法,根据实测数据对影响因素进行分析.方法如图1所示.
图1 评估方法流程图Fig.1 Evaluation flow
(1)数据探索是了解分析数据.如:数据集的大小、数据类型、数据质量、数据的概率分布等.
(2)数据清洗是数据分析极其重要的一步,它往往决定了数据分析结果中准确率的上限.它的主要内容是结合业务背景进行异常值、缺失值的处理.
(3)数据特征处理包括字符型变量的数值化处理,如果变量间的量纲差距较大,还需要对各变量进行标准化处理.
(4)建立模型拟合是根据要分析的目标是分类还是回归进行模型选择.本例分析的因变量与多个自变量之间的关系适用于多元线性回归方程进行分析.多元线性回归模型通常用来描述变量y和x之间的随机线性关系,表达式为:
y=β0+β1x1+β2x2+…+βkxk+ξ.
其中:x1,…,xk是非随机的变量;y是随机的因变量;β0,…,βk是回归系数;ξ是随机误差项.
(5)结果分析是对拟合后的模型结果进行统计学分析,检验是否满足相关的检验要求.若满足检验要求才可采用,否则需要重新选择模型进行拟合再分析,避免因错误的结论勿引入歧途.
2.1 评估场景及数据集探索
2.1.1 数据集来源 根据下行速率的影响因素,利用LTE测试软件Pioneer导出中国移动某地市LTE网络的FTP Download 测试log选取的15个参数字段,如表1所示.
表1 数据集样例Tab.1 Dataset samples
2.1.2 组网情况 在中国移动LTE组网中,有TDD-LTE和FDD-LTE两种制式.其中,TDD-LTE制式的站点比例最高,如本例路测数据中TDD制式LTE采样点约占85%.TDD-LTE制式的LTE有两种子帧配置: SA(业务子帧)设置为2(3D∶1U),SSP(特殊子帧)设置为7(10∶2∶2)或6(9∶3∶2).当DwPTS(Downlink Pilot Time Slot,下行导频时隙)的符号个数≥9个时候可以传输下行数据.
2.1.3 业务特性 采用中国移动网络评估网络所用的ATU测试设备,某网格进行FTP下载业务测试的log作为数据源,分析LTE下载速率的影响因素.从测试信令分析,在FTP下载业务过程中,从 FTP Download Connect Request到FTP Download First Data,从FTP Download Disconnect到新一次的FTP Download Connect Request 的FTP 下载速率为0.
2.1.4 数据探索 数据集总共有121 837条数据.从缺失值情况看,除了WorkMode和TM不存在缺失值,其余13个参数字段均存在缺失值,其中FTPDownloadRate的缺失值最多达到2 761个.从参数数据类型看,WorkMode、TM为字符串,需要转换为数值型变量编码.EARFCNDL字段虽为数值型变量也属于分类型变量,需要重新数值化编码.
2.2 数据清洗与特征处理
数据清洗是根据数据集特征量结合业务背景和异常值进行处理的过程,它是确保数据分析准确性的必要步骤.
2.2.1 数据集业务背景处理 ①剔除LTE制式中的FDD制式;②根据测试log分析,测试阶段的FTP下载次数一共有12次.需要根据业务特性,进行剔除处理;③剔除非宏站频点产生的采样点.它是由于测试终端在道路接收到由于室分频点信号泄漏到室外道路产生;④剔除非20 M带宽的采样点记录;⑤删除网管固定配置参数字段:WorkMode、Band、SubFrame Assign Type、Special SubFrame Patterns、Bandwidth DL(MHz).原始采样点记录121 837条,根据以上规则剔除后,待分析采样点记录为88 860条,10个参数字段.对分类型变量EARFCN DL、TM、CodeWord Number进行重编码,重编码后的参数变量名分别为SEARFCNDL、STM、SCodeWordNumber,其他变量原值纳入.
2.2.2 缺失值处理 缺失值的处理根据业务发生的时间点和占用的频点(下行)进行填充.
2.2.3 异常值分析 由SPSS生成各统计量的标准差、极小值、极大值见表2,结合各字段参数的极小值和极大值,均在LTE测试规范内,无异常值,无需处理.
2.2.4 变量标准化 根据表2,可看出各字段间的标准差相差较大,需进行标准化处理.
表2 统计量Tab.2 Statistics
2.3 模型拟合
回归分析的目标在于研究因变量与引起其变化的自变量之间的函数关系[10].通过SPSS软件的分析功能选择“回归”-“线性回归”模型,按如下步骤设置.
(1)因变量选择FTP Download Rate,其余特征作为自变量.
(2)选用基于方差分析F检验概率实施自变量的筛选,进入为0.05,删除为0.10.
(3)自变量进入方程的顺序为“逐步进入”.输出结果见表3~6.
表3 输入/移去的变量aTab.3 Variables of entered/removeda
表4 模型汇总Tab.4 Model summary
表5 ANOVAaTab.5 ANOVAa
表6 系数aTab.6 Coefficienta
2.4 结果分析
(1)输入/移去的变量.表3显示,所有的变量经过10轮的筛选还是纳入了回归方程中.这与理论分析中影响因素在统计学上得到了验证.
(2)模型汇总.在表4中呈现了10个回归模型,从表格可知模型3-10的调整R方已经达到了0.8以上,这表明这8个方程的拟合都具有很好的质量.其中模型10最好,因为它的调整R方不仅最大而且还纳入了所有的自变量,可以更好表征所有的自变量对因变量的影响.
(3)“ANOVA”表格.表5是针对回归分析过程所做的方差分析.10个模型的F值都远大于3.84,说明这10个回归方程都具有很强的影响力,能够很好表达影响FTP Download速率的因素.另外,Sig值均为0,表示在回归方程进行方差分析时,自变量变化对因变量的取值有显著性差异,这与理论分析相符.
(4)“系数”表格.从表6并结合以上分析,本文选取自变量最全的模型10进行分析,可得10个自变量的Sig都为0.000,都小于0.05,说明这10个变量对因变量具有很好的影响力.这些自变量对应的t值的绝对值也均大于1.96,同样说明了这一点.而常量的Sig值为1.000,大于0.05,说明该项对因变量影响小,可以剔除.
本次线性回归方程采样“逐步”筛选的方式选择自变量,形成了10个回归模型.通过分析可得“模型10”的R方值最大,涉及到的自变量最多,而且方程中所有自变量的Sig值均小于0.05,说明模型最优.
经过本次线性回归,可以获得如下方程式:
y=0.799X1+0.386X2+0.208X3+0.129X4+0.169X5-0.102X6+ 0.053X7-0.032X8+0.014X9-0.009X10.
其中,y代表FTP Download Rate,X1代表MCS Average DLs,X2代表PDSCH RB Counts,X3代表 SCodeWordNumber,X4代表 RSRP,X5代表 SINR,X6代表 PDSCH BLER,X7代表 WideBandCQI,X8代表 PDSCHScheduledRBCountslot,X9代表SEARFCNDL,X10代表STM.在归一化后的多元线性回归方程表达式中,系数的正负号分别表示对因变量的影响方向是正向的、负向的,系数大小则表示各变量方程中对因变量的影响程度.另外,方程10个影响因素变量中,对因变量有正向影响的变量中系数排前3位的自变量有MCS(系数=0.799)、PDSCH RB Counts(系数=0.386)、SCodeWordNumber(系数=0.208),而负向影响因素中系数较大的为PDSCH BLER(系数=-0.102).因此,在下行速率分析优化时,可以对照下行速率的影响因素指标,优先分析主要的正向影响因素有哪些指标偏低,在负向影响因素的哪些指标偏高,然后根据这些因素产生原因以及相应的优化方法进行分析优化.
3 结语
在4G时代,LTE的速率成为人们对无线网络的最大需求,TD-LTE速率因素的研究成为人们关注的重点[11].在过去的下行速率实际分析与优化中,4G网络优化人员知道下行速率的影响因素,但不清楚影响因素中的影响程度,也未有一个评估方法进行指导优化的重点.难以知悉尽可能挖掘下行速率潜力、提高网络的资源利用率和频谱效率,而是看到什么指标差就优化什么.本文基于测试log结合业务特性并运用大数据挖掘方法,利用SPSS工具和多元线性回归算法,拟合表征了LTE下行速率影响因素的评估方法.这一方法不仅可以应用在分析当前的LTE下行速率,也可适用于LTE上行速率以及5G的速率分析和优化上.本文研究思路也可以在分析和优化4G/5G其他网络问题时作为借鉴.