APP下载

基于聚类算法模型的移动通信基站站址的规划研究

2023-12-27陈方芳

山东商业职业技术学院学报 2023年6期
关键词:站址栅格复杂度

陈方芳

(黎明职业大学 通识教育学院,福建 泉州 362000)

1 引言

1.1 问题背景

移动通信飞速发展推动了5G网络技术的广泛应用,5G网络大带宽的特点大大提高了传输的效率,给人们带来了极大的便利。运营商在努力满足数据需求和新应用支持的建设过程中面临一个关键问题就是基站密度的需求。所有无线通信都要面临带宽与覆盖范围之间的权衡,带宽越大,每个基站能覆盖的范围就越小(如图1)。

图1 4G和5G无线信号传播对比

新基站站址的选择和参数配置[1],要遵循专业原则,合理规划设计,确保网络满足覆盖和容量等建设目标,在空间布局设计上保证基站规划的科学性,追求提供更优质的客户服务。实际的建设规划中考虑到成本和一些其他因素必然会有区域弱覆盖无法完全解决的情况,这时需要筛选出业务量高的弱覆盖区域优先安排解决。

1.2 研究现状与文献回顾

2019年6月6日,中国工信部向通信运营商发放5G商用牌照,我国正式进入5G商用阶段。近几年, 关于5G相关业务发展问题备受关注, 并对此展开了多层次、多角度的研究探讨。

苏丽芳2020年总结出我国未来建立健全电信业法律规制可资借鉴的有益经验[2]。高德金(2023)探讨了5G网络建设规划中对无限资源配置的方法和准则[3]。何丽(2022)根据高铁无线通信网络建设需求,对5G网络在高速铁路环境下部署的参数及面临的问题进行研究[4]。学者们从不同角度对5G时代的发展展开了不少研究。但是截至2023年3月4日0时,以“5G基站”为主题在中国知网数据库中进行检索后,再以“聚类分析”为主题,在结果中检索到的文献总数只有6篇[5-10]。可见,对5G基站结合聚类分析的研究非常少,而对5G基站弱覆盖区域的研究更是匮乏。基于此,本文运用聚类算法中的K-means聚类算法,与戴维森堡丁指数相结合,探索通过总时间复杂度尽量低的聚类模型,对弱覆盖点进行区域聚类得到弱覆盖区域,以期实现对不同的弱覆盖区域分开管理,使得可以更好的解决弱覆盖问题。

2 模型原理

2.1 K-means聚类算法

K-means聚类算法[11]在对所研究对象进行分类时,着眼于分类对象具体特征的相似程度,在划分类别的过程中尽量使得不同类别对象之间的差异性最明显,反之;对于同一类别中的分类对象则是具有尽量相似的具体特征,这样以研究对象样本间的相似与差异程度为依据的分类原则可以归纳为“增大类内聚,减少类间距”(如图2)。聚类属于非监督学习,K均值聚类是最基础常用的聚类算法。它的基本思想是,通过迭代寻找k个簇(Cluster)的一种划分方案,使得聚类结果对应的损失函数最小。其中,损失函数可以定义为各个样本距离所属簇中心点的误差平方和:

图2 聚类分析建模原理

其中Xi代表i个个体、Ci是Xi的簇、μCi代表簇对应的中心、M是样本总数。

K-means聚类算法以空间中k个点为中心进行聚类,对最靠近他们的对象归类。逐次计算各簇中心的值为新的中心值,迭代更新,直至簇中心位置不再改变或者达到最大迭代次数。其聚类具体过程[12]如下:

(1)首先确定一个k值,即我们希望将数据集经过聚类得到k个集合;

(2)从数据集中随机选择k个数据点作为质心;

(3)对数据集中每一个点,计算其与每一个质心的距离(如欧式距离),离哪个质心近,就划分到那个质心所属的集合;

(4)把所有数据归好集合后,一共有k个集合,重新计算每个集合的质心;

(5)如果新计算出来的质心和原来的质心之间的距离小于某一个设置的阈值(也就是新计算出来的质心坐标位置相较之前没有明显变化,具有一定的稳定性,我们称之为达到收敛的状态),这时可以认为聚类已经达到期望的结果,算法终止;

(6)如果新质点和原质点距离变化很大,需要迭代3~5步骤。

用K-means聚类算法对数据进行聚类分析前,需要对给定的原始数据进行必要的数据清洗,把孤立的不合理的点进行剔除,以免影响聚类结果的精确度。根据以上的分析步骤可以将K-means聚类算法计算过程用以下流程图表示(图3):

图3 K-means聚类算法计算流程图

2.2 戴维森堡丁指数

戴维森堡丁指数(DBI)[13]是由大卫L·戴维斯和唐纳德·Bouldin提出的一种评估聚类算法优劣的指标。它是一个内部衡量的指标,即对于聚类效果的评估,是通过使用数据集内部的数量和特征进行衡量的,主要考虑不同类间数据离散程度和同一类内数据的紧密性。DBI指数是计算任意两类别的类内距离平均距离之和除以两聚类中心距离求最大值,它先根据簇的直径的长度找到与直径最相似的簇,然后计算它们之间的相似度,最后算得整个聚类结果的平均相似度。具体计算指标如下:

(1)首先定义聚类中n个m维样本点之间的平均值avg,它表明了簇内点的分散程度,代表了簇内的所有点到簇中心的平均距离:

(2)根据两个类内样本间的平均距离,得到DBI指数的计算公式如下:

其中,ci和cj表示类Ci和Cj的聚类中心,k代表着簇中心表征的第k个值,而‖ci-cj‖则是第i个簇和第j个簇之间的中心距离。最后,通过一个基于簇的个数的平方为时间复杂度的循环,来找到每个簇和剩下所有簇中的哪个相似度最高(表现最差的结果),在对所有相似度之和做平均就能得到戴维森堡丁指数。

戴维森堡丁指数(DBI)的值越小,意味着类内距离越小,同时类间距离越大,即类内相似度高,类间相似度低,说明聚类结果越好,给定的聚类个数越接近真实的聚类个数。

3 模型准备与分析

3.1 实证分析数据给定

本文对模型实证分析的数据来源于2022 年第十二届 MathorCup 高校数学建模挑战赛中D题提供的材料[14]。给定材料的数据包含给定讨论区域目前弱覆盖点的已知信息,包括各个弱覆盖点的坐标指数、现有网络基站对应的业务量以及弱覆盖点区域的业务量信息,一共552,849条数据。为了更好的解决弱覆盖问题,需要对弱覆盖点进行区域聚类,把距离近的弱覆盖点聚成一类,可以得到弱覆盖区域,这样可以对不同的弱覆盖区域分开管理使得可以更好的解决弱覆盖问题。

3.2 数据的区域化栅格结构

对已知数据进行区域化栅格结构的处理方法操作简单,尤其适用于对数据量较大时的空间聚合研究。数据的栅格化[15]首先需要对研究的数据空间通过规律性的网格进行划分,然后对每个网格所对应的单元用对应的属性值进行标志,在划分的过程中数据的区域化栅格结构的精确度决定于所划分栅格的大小。通过对数据空间进行栅格化聚合分析,可以实现对异网覆盖的地理化指标的分析和评估。

为了计算过程的简化,在进行栅格划分的过程中,用很小的栅格对给定区域进行划分,并且将每个小栅格视作一个个点,这样任意给定的区域就都可以相应地被划分为有限个的点。这些点都包含相应栅格范围的属性,包括点的坐标、是否属于弱覆盖点以及相应的业务量等。

3.3 数据的初步整理

实现对所有弱覆盖点进行有效聚类,并且使得聚类所用方法的总时间复杂度尽量低,需要先对给定数据进行初步整理。移动网络站址在规划建设中要求不同基站站址之间的距离不能小于等于给定门限10,这就包括了新建基站站址之间距离和新基站与原有基站站址之间的距离,所以,我们需要先对题目附件给出的数据进行数据清洗,也就是将弱覆盖点坐标和旧基站点坐标之间的门限低于10的点进行剔除。通过Excel软件对数据进行整理和筛选,除去数据多余化,获得有效数据量377,646条。

4 模型建立与求解

4.1 模型建立

4.1.1 建立聚类结果图,计算聚类中心点

通过Matlab[16]建立出聚类结果图(图4),选择特征空间内的k个点,设置为聚类中心的初始值,依次计算其他每个点到这个中心点的距离,选择K-means求平均的方法,计算并选择最近的一个点标记为新的聚类中心,然后再计算并获取新的聚类中心点。

图4 聚类结果图

4.1.2 拟合区域弱覆盖点,推选最优解法

拟合出区域中的弱覆盖点(图5),可以观察到弱覆盖点的大概位置,选择基站要尽量在较为密集的区域。区域中的覆盖坐标分布较为偏远地区,中心受影响小,通过区域的弱覆盖点方位的规划,推选最优的解法。

图5 区域中的弱覆盖点

4.1.3 拟合现网站址坐标,得出聚类中心值以及类别

根据现有数据值,拟合出现网站址坐标(图6),增加基站尽量选择较为稀疏的地方,比如图中圆圈的地方。使用 K-means 聚类进行分析,得出了聚类中心值以及类别。

图6 现网站站址坐标

4.2 模型求解

借助Excel对最佳数据值进行编辑运算,得到现网站址坐标的聚类中心值(表1)和聚类频数与百分比情况(表2)。

表1 现网址坐标聚类中心值

4.3 DBI指数聚类评估

使用Matlab对其中100个聚类中心点计算DBI指数如图7所示。

图7 指数变化情况

进一步地,根据DBI指数的变化情况,得到时间复杂度评价情况,表3是时间复杂度数据按区间分类汇总情况。

表3 时间复杂度评价分类

通过DBI指数对聚类方法进行聚类评估,100个聚类中心点中只有17个是属于时间复杂度非常高的情况,评估效果较好。

5 结语

5G基站站址的选择和参数配置要遵循专业原则,合理规划,本文在充分考虑业务量的情况下,结合信号分布,基于栅格数据结构的基础上,通过对数据进行Matlab软件拟合绘图,确定决策变量和约束条件,对弱覆盖点进行K-means聚类分析,然后对结果进行综合取优的方式在限定的区域范围内选择最有价值的解,实现对相应范围内的基站选址进行合理规划,列表给出宏基站和微基站的规划址坐标信息,可以在尽量降低时间复杂度的基础上,实现对不同的弱覆盖区域分开管理,形成高价值问题区域,使5G基站资源的高价值充分落实,对移动通信基站站址的规划提出有效建议。

猜你喜欢

站址栅格复杂度
2G/3G退网时间预测和站址影响分析
基于邻域栅格筛选的点云边缘点提取方法*
一种低复杂度的惯性/GNSS矢量深组合方法
求图上广探树的时间复杂度
某雷达导51 头中心控制软件圈复杂度分析与改进
瓜洲站站址方案的价值量化比选
不同剖面形状的栅格壁对栅格翼气动特性的影响
出口技术复杂度研究回顾与评述
基于CVT排布的非周期栅格密度加权阵设计
调整压气站站址的计算方法