基于用户数据实现天线方位角纠偏的方法
2020-07-10朱格苗王计斌闫兴秀
朱格苗 徐 慧 王计斌 闫兴秀 余 健
南京华苏科技有限公司
0 引言
近年来,随着通信网络的不断发展,其复杂性也越来越高,网络优化成为运营商面临的主要问题之一,而准确的工参尤其是方位角是网络优化的基石,如何获取正确的方位角是目前研究的重点问题之一。
目前,小区方位角核查主要采用人工定期巡检的方法,分批逐步核查全网所有小区的方位角,该方式不仅耗时、耗人、耗力,而且运维成本较高。另一种自动核查天线方位角的方法是分析小区覆盖范围,目前通常是对路测数据进行分析。
目前很多学者的研究都是从某一方面对天线方位角进行计算,而没有全面考虑到数据的差异。本文利用OTT数据、MDT数据、MR数据和工参数据,从各个方面考虑数据的差异性,相应地提出五个算法,分别对用户数据进行分析,从而预测天线的方位角,并将五种算法通过赋予不同的权重形成一种联合算法。本文方法的主要创新点是将五种预测算法联合在一起,规避了单独算法的一些缺点,以达到更高的精度和更好的稳定性。
1 数据收集
我们的方法收集了三种不同的数据:用户数据(OTT、MDT)、小区工参信息表、小区真实勘站数据。
用户数据收集的是特定时间及空间上用户手机上报的实时信息。最终保留的指标有:小区唯一标识(ECI)、用户经度、用户纬度、参考信号接收功率(Reference Signal Received Power,RSRP)(以下简称RSRP)。
小区工参信息表收集的是一定区域内大量小区的基本信息,每行代表一个ECI。最终保留下列指标:小区唯一标识(ECI)、小区经度、小区纬度、工参方位角、小区覆盖类型。
小区真实勘站数据收集的是小区真实的信息,包括小区唯一标识(ECI)、勘站方位角。
对用户数据进行分析,利用我们的联合算法对小区方位角进行预测,并且将预测的方位角和真实勘站的数据进行对比,得出算法预测的准确性。当算法的准确性较高时,该算法则投入生产应用,这样则可以节省大量的人力、物力,不需要对每个小区进行实际勘站就能获得准确的工参。
2 方法论
在实际生活中,当收集到的样本数据量较小时,预测值与真实值之间常常会有较大的误差,为了避免误差过大,本文将五种基本预测算法和权重算法结合,形成联合算法,从而对用户数据进行预测,这样可以在一定程度上保证预测结果的准确性。基于用户数据实现天线方位角纠偏的方法主要分为以下5个步骤:
步骤1:收集数据。收集用户数据和工参数据样本以及勘站数据。
步骤2:数据处理。首先将工参表中小区经度和纬度为空的小区删除,只选取小区覆盖类型为室外的小区,在栅格级多天时间粒度上对用户数据和工参数据通过小区唯一标识码进行匹配,然后对匹配后的数据组进行去重处理,统计每个小区下的用户数据数量,仅保留用户数据数量大于阈值区,根据小区经纬度和用户数据经纬度,计算用户数据到小区的距离,并且进行异常值检测,删除距离较远的用户数据,再通过小区经纬度和用户经纬度计算用户相对小区的角度,以正北方位为0度。
步骤3:分别采用基于采样点强度预测算法、基于采样点密度分扇区预测算法、基于采样点强度和密度结合的预测算法、基于采样点强度的分层统计预测算法、基于采样点强度分扇区的预测算法,计算每个小区的预测方位角。
步骤4:使用用户数据和实测的勘站数据作为训练集,用步骤3的五种预测方法对训练集进行预测,再根据预测结果使用蒙特卡罗方法训练出五种预测方法的权重。
步骤5:根据步骤4的权重在训练集上得到的预测效果,选出最优权重,确定最优权重的预测模型,根据最优权重的预测模型对用户数据进行预测,得出小区的预测方位角。
图1 基于五种预测模型算法的天线方位角工参清洗的说明示意图
2.1 基于采样点强度的预测算法
该算法从采样点的强度出发,将信号强度作为主要指标进行考虑。主要是计算每个小区唯一标识码下RSRP值最大的前n个采样点角度的均值作为方位角预测值,n为自然数。
2.2 基于采样点密度分扇区的预测算法
该算法从采样点密度分扇区进行考虑,将采样点有规律地划分为多个区域。每个小区唯一标识码下,以基站经纬度为圆心,以基站的正北方向为0度,顺时针方向角度增加,每N度划分一个扇区,将基站的区域划分为360/N(取整数)个扇区。根据采样点的经纬度和基站的经纬度,计算得到采样点与基站之间相对正北方向的夹角,根据该角度将采样点按照到小区的角度,每N度划分一个扇区,分成360/N份,将每个采样点都划分到其所属扇区,统计每个扇区中点的个数,取点的个数最多的扇区角度作为方位角预测值。
2.3 基于采样点强度和密度结合的预测算法
该算法将采样点的密度和强度结合考虑,首先同2.2中的扇区的划分方法一致,进行扇区划分,同样是将采样点有规律地划分成多个区域。每个小区唯一标识码下,将采样点按照到小区的角度每N度划分一个扇区,分成360/N份,N∈[1,360],360/N取整数;然后统计每个小区唯一标识码下的采样点总数扇区中采样点数占比,取出360/N个扇形区域中采样点个数大于总采样点d%的扇区,d∈[1,99],计算这些扇区中RSRP值最大的前n个采样点RSRP均值,n为自然数,取出RSRP均值最大的扇形区域t个,t的范围为[1,360/N]之间的整数,计算这t个扇区角度的均值作为方位角预测值。
2.4 基于采样点强度的分层统计预测算法
该算法是在第一个基于采样点强度的预测算法的基础上进行的改进,这个算法考虑距离变量的作用。每个小区唯一标识码下,先将距离去重,再计算n-1个不同的百分位数,按照从小到大排列,根据用户数据到小区的距离划分m环,m≥3。第一环:距离≦第一个百分位数;第二环:第一个百分位数<距离≦第二个百分位数;第三环:第二个百分位数<距离≦第三个百分位数;第四环:第三个百分位数<距离≦第四个百分位数;第n环:第n-1个百分位数<距离,删除最小环和最大环的数据,保留中间环数据;确定位于中间环中每环RSRP值最大的前n个采样点角度均值,最后求前n个采样点角度均值的均值作为方位角预测值,n为自然数。
2.5 基于采样点强度分扇区的预测算法
该算法是在第一个基于采样点强度的预测算法的基础上进行的改进。它将采样点有规律地划分为多个区域,然后基于采样点强度进行计算。每个小区唯一标识码下,将采样点按照到小区的角度每N度划分一个扇区分成360/N份,求每个扇区下RSRP值最大的前n个采样点的RSRP均值,最后取RSRP均值最大的扇区角度为方位角预测值。
2.6 蒙特卡罗方法
为了将前面的五种算法进行联合,通过蒙特卡罗方法随机从训练集中抽取一部分数据作为训练样本,共随机选取P次得到P份训练样本;针对每份训练样本随机生成Q个权重组合,Q为自然数;针对每个权重组合,统计训练模型输出的预测方位角与勘站方位角的偏差在R°以内的个数占比作为该权重组合的置信度,R的取值范围为[0,360];针对每份训练样本,确定置信度最大的权重组合。
在具体实现时,按照如下公式(1)和(2),针对每份训练样本确定置信度最大的权重组合。
其中,公式(1)中的Z为实际预测误差,angelpredict为预测方位角,angeltrue为勘站方位角;公式(2)中cost表示权重组合对应的误差系数,M为训练样本中总勘站小区数量,K为设定的角度误差阈值。
从上面的公式可知,权重组合的置信度为1-cost,例如,cost为20%,则权重组合的置信度就为1-20%,即为80%。
2.7 检验结果
对于上述的联合算法模型,我们通过最终损失函数值来衡量改进,损失函数越小则越好,通过训练出的最好模型可以对新的用户数据进行预测方位角,并根据最终输出的结果更新小区工参信息。最终选取一部分小区进行勘站,将预测结果和勘站数据进行对比,判断算法的准确性。
3 实验及结果
3.1 实验
本文收集了国内某省30天691个小区的OTT(Over The Top)数据,并且对这691个小区进行勘站,获取小区真实信息数据,从而计算联合算法预测结果的准确性、稳定性。
为了确保数据的完整性,需要对数据进行异常值处理,对缺少小区唯一标识码和经纬度信息的数据予以剔除,删除采样点中距离异常的数据和重复的采样点数据。首先将训练数据放到模型中训练、预测,将每个算法得到的预测数据和误差数据保存,接着将训练数据放到联合算法中训练、预测,将得到的预测数据和误差数据保存,最后是对比联合算法和五种算法的预测效果,分别计算联合算法和五种算法在训练集、验证集上的误差,计算误差小于20度(包含20度)的个数占比。
3.2 实验结果
在实验中发现,联合算法的预测准确性更高,使用联合算法进行预测,得到如下所示的一些相关图。
图2是实验例中某个小区10米栅格级OTT采样点RSRP热力图,从图中可以看出该小区的识别码、名称、30天的采样点数以及工参方位角和预测方位角,以及每个栅格中平均RSRP值的强弱。
图2 10米栅格级OTT采样点rsrp热力图
图3是实验例中某市预测方位角与勘站结果对比分析图,分别计算了预测误差小于等于20度、35度、45度的小区个数占比,从图中可以看出预测偏差小于45度的小区占比达到96.88%,预测偏差小于35度的小区占比达到87.53%,预测偏差小于20度的小区占比达到80.39%,占比都较大,说明预测模型有较好的准确性。
图3 预测方位角与勘站结果对比分析图
图4、5、6分别是居民小区、道路小区、城中村小区预测工参与勘站结果对比分析图,分别计算了预测误差小于等于20度、35度、45度的小区个数占比,从图中可以看出预测偏差小于45度的小区占比分别达到95.96%、95.96%、93.96%,预测偏差小于35度的小区占比分别达到81.25%、86.25%、87.25%,预测偏差小于20度的小区占比分别达到75.36%、82.35%、79.36%,占比都较大且表现一致,可以说明预测模型在道路、城中村等场景中都有较好的准确性。
图4 居民区小区预测方位角与勘站结果对比分析图
图5 道路小区预测方位角与勘站结果对比分析图
图6 城中村小区预测方位角与勘站结果对比分析
图7是实施例中方位角错误实际效果图,该小区中根据OTT采样点预测的方位角为75度,而实际勘测的方位角为60度,但是工参表中的方位角为20度,预测的方位角与实际勘测的方位角误差较小,经验证发现,该小区工参方位角为人为录入错误,此算法为平台软件快速甄别小区方位角异常提供了理论及技术支撑。
图7 小区方位角错误实际效果图
图8是实施例中接反小区实际效果图,图8中(a)和(b)的蓝色加粗线条标注的扇形区域和红色加粗线条标注的扇形区域表示两个相邻小区,小区周边的各小圆圈表示采样点。参见图8中的(a)图可知,利用本方法提供的上述预测模型,基于采样点的数据,预测出第一个小区(红色加粗线条标注的扇形区域)的方位角预测值为300度,而实际勘测第一个小区的方位角为187度;参见图8中的(b)图可知,基于采样点的数据,预测出第二个小区(红色加粗线条标注的扇形区域)的预测方位角为120度,而实际勘测第二个小区的方位角为293度,可见,这两个相邻小区的预测误差很大,这提供给维护人员作为参考数据,维护人员现场核查发现这两个小区的天线被人为接反,此算法为平台软件快速甄别接反小区提供了理论及技术支撑。
图8 接反小区实际效果图
4 结束语
本文提出了一种基于用户数据实现天线方位角纠偏的方法,将五种预测算法联合在一起,规避了单独算法的一些缺点,提高了方法的准确性和稳定性。经实际勘站证明模型的准确性如下:预测偏差小于45度的小区占比达到96.88%,预测偏差小于35度的小区占比达到87.53%,预测偏差小于20度的小区占比达到80.39%,并且在各个场景表现一致。本文通过对分析的数据画栅格级用户数据RSRP热力图,获得小区周围的采样点信息以及预测的方位角,通过更深层次的分析,可以找出工参中方位角错误、接反小区等问题,以对运营商的工参数据进行修正,对其网络优化工作具有指导意义。