基于热点度轨迹显影机制的网络社区聚类算法
2019-09-09陶硕,刘盈
陶 硕 ,刘 盈
(1.马鞍山职业技术学院电子信息系,安徽,马鞍山243031;2.井冈山大学电子与信息工程学院,江西,吉安343009)
0 引言
近年来,网络社区理论已经从传统的社交领域逐步渗透入移动无线传感网(Mobile Wireless Sensor Network,M-WSN)、物联网(Internet of Things,IOT),网络社区聚类算法也开始进行实际应用部署,以解决网络定位、数据传输等网络技术难题[1-2]。
网络社区聚类算法作为一种能够有效捕捉网络热点并实现对网络节点形态及模式追踪的常用方法,已成为国内外学者的研究热点。如Kai等[3]提出了一种基于时空二向度特征捕捉机制的网络社区聚类算法,该方法通过正交方式在时间、空间两个维度进行聚类特征捕捉,并采用周期时移机制实现热点聚类的动态更新,提高聚类生成及更新的效率,在移动无线传感网领域具有较好的应用场景。但是,该算法实现过程复杂,需要采用复杂的信道-信源信号过滤预成型机制来实现特征构拟,在实际应用中,难以进行大规模的部署应用。Zhi等[4]提出了一种基于连通度热点更新机制的网络社区聚类算法,该方案主要通过区域广播算法实现对拓扑联通状况的实时感知,且使用君士坦丁寻址机制来精确获取基于流量交互度的连通评估阈值,有效捕捉节点与周围节点的连通度,实现过程具有便捷化特点。然而,该算法需要采用被动旋跳方式进行区域广播,易造成严重的网络拥塞现象。Chun等[5]提出了一种基于区域节点竞争机制的网络社区聚类算法,通过预设区域聚类节点方式进行区域更新,且在文献[4]的基础上针对区域聚类节点的连通度进行二次聚类,具有很强的传输稳定性能。但是,由于聚类形成过程需要采用复杂的递归方法,导致算法的收敛性能较差,难以达到高效传输的目的。
为了解决上述问题,本文提出了一种基于热点度轨迹显影机制的网络社区聚类算法。根据网络社区聚类具有的多径一体特性,采用抽样方法来强化对热点信号的捕捉,并结合角度估计方法来实现热点的精确搜寻,提升聚类效率。随后,通过社区网络节点信号发射中形成的传输矩阵,对热点矢量信号空间完成按列重排,并设计了热点度轨迹显影,实现热点的迅速显影,提高聚类的存活时间。最后,通过 MATLAB仿真软件,测试了本文算法的有效性。
1 本文算法设计
鉴于当前网络社区聚类算法更多的是基于移动无线传感及数据采集领域[6],且考虑到当前网络节点正逐步从传统的固定感知网络转向移动感知网络,因此,在本文算法中,信号预发射模型以LTE-5G为主[7],其模型见图 1。在某个具体的时刻,整个社区中有若干个等待聚合的社区节点,需要通过一定的算法进行聚合,且这些节点均需要通过一定的聚合算法进行聚集,以便形成数据互通、热点聚集、传输多径为典型特征的网络社区聚类。此外,由于节点均处于流动状态,如移动无线传感网、移动物联网,二者均采用典型的LTE-5G制式网络,因此,在聚合过程中需要考虑链路抖动因素,以便聚类能够正常工作,有效减缓背景噪声的影响。
图1 网络社区聚类Fig.1 Network community clustering
设M个社区节点需要M个热点节点来协助,以形成响应聚类,社区节点的接入信号为G1,G2,⋅ ⋅⋅,GM。该信号传输周期为Ei,其中i=1,2,3,…,M。则第M个社区节点的当前信号特征为:
其中,F(M)(ω) 为社区节点预发射中的信道固定频率;H(M)(ω)为社区节点在信道固定频率条件下传输噪声的能量[8];S(ω)为热点节点的信号能量分布。
根据模型(1)热点节点的信号能量分布,则社区节点当前信号时域特征s(t)可由下式获取:
其中,ai为热点节点对应的最大信号强度值。
根据模型(2),基于多径传输理论[9]可知,M个社区节点同时获取的热点节点信号为:
其中,di,j为社区节点搜寻热点节点时最大搜索距离。
图2 社区节点搜寻热点节点Fig.2 Community node search hotspot node
随后,根据模型(7)可得:
对网络中全部社区节点按模型(3)获取的矩阵进行轨迹划分,划分方式如下:
图3 本文算法流程图Fig.3 The flow chart of algorithm
2 仿真实验
为便于验证本文算法的效果,采用 MATLAB软件实施测试。为了突出所提算法的优势,将聚类流动性映射算法[12](Clustering Liquidity Mapping Algorithms,CLM 算法)、超欧里几何热度聚类算法[13](Hyper-Eulerian Geometric Thermal Clustering Algorithms,H-EGTC算法)作为对照组。实验参数设置如下:网络节点采用随机分布模型,节点密度不低于0.1个/m2,网络通信信号采用LTE-5G信号,中心频率为1.024 GHZ,信道信噪比不低于16 dB。评估指标为聚合时间、热点显示时间、搜寻失误率、能耗。
2.1 聚合时间
图4为聚合时间仿真结果。依图发现,本文算法具有更低的聚合时间,显著低于 CLM 算法及H-EGTC算法。这是由于本文算法采用轨迹划分方式直接对各个热点进行显影,可显著提高社区节点匹配热点的效率,降低单个社区节点成功聚合的周期;而且在搜寻过程中采用了角度估计方法来进一步提高了聚合精确度,能够适应高流动性的场景,要优于 CLM 算法单纯采用的周期聚方法,以及H-EGTC算法采取的拓扑聚合机制。CLM算法采用周期聚合方式,需要根据聚类生成周期等多个维度来设定聚合阈值,难以适应流动性较高的实际环境。H-EGTC算法需要在统计节点热度的情况下对拓扑状况进行实时捕捉,在节点运动速度较高时,容易存在信噪比难以控制的缺陷,因此聚合时间要高于本文算法。
图4 聚合时间测试Fig.4 Aggregation time test
2.2 热点显示时间
图5为不同算法的热点显示时间测试结果。由图发现,本文算法热点显示时间要显著高于 CLM算法及H-EGTC算法。原因是本文算法采用的基于矩阵方式的轨迹划分能够显著提高热点捕捉效果,搜寻热点仅需要通过排序机制由高到低进行直接搜寻,有效降低了搜寻过程的复杂程度,因此热点聚类的效果更好。此外,本文算法在搜寻过程中能够根据角度估计实现精确定位,捕捉热点的能力较强,可在高强度信道噪声干扰环境下进行热点聚类,具备很强的聚合能力。而CLM算法通过预设连通度阈值方式进行热点搜寻,当仅当聚类低于连通度阈值时才能进行热点搜寻,效率较低;H-EGTC算法主要通过检测拓扑联通方式进行热点搜寻,没有深入到信号发射层次进行热点聚类,容易因信道噪声污染而导致热点显示异常,因此显示性能要低于本文算法。
图5热点显示时间测试Fig.5 Hotspot display time test
2.3 搜寻失误率
图5为不同算法的搜寻失误率仿真结果。根据图中数据发现,本文算法搜寻热点过程中的失误率始终要低于对照组。这是因为本文算法采用轨迹划分方式能够直接对热点进行显影,提高社区节点匹配热点的效率,能在较短时间内对热点的精确聚合。另外,本文算法的轨迹划分方式主要基于矩阵形式,只需要进行简单匹配就能迅速实现对热点的匹配,使其搜寻失误率处理较低的水平,且搜寻过程中热点显示时间及聚合时间也较好,能够在高干扰环境下实现对热点的精确搜寻,降低搜寻失误率。而CLM算法搜寻热点是按照初始设定的连通度阈值进行搜寻的,难以适应热点性能的动态变化,使其匹配效果不佳。H-EGTC算法需要周期搜寻机制进行热点搜寻,难以在搜寻过程中进行抗噪处理,因此搜寻失误率要高于本文算法。
图6 搜寻失误率测试Fig.6 Search error rate test
2.4 能耗
图6为不同算法的能耗测试结果。依图可知,本文算法能耗最低。原因是本文算法采用的轨迹划分方式除了能够直接对热点进行显影之外,其使用的矩阵分割方式还能够在确保搜寻正确率的情况下迅速实现热点捕捉,具有聚合时间短的特点,因此聚合过程中的能耗较低。CLM算法采用的阈值初始设置方式无法动态实现热点精确捕捉,因此具有能耗较大的特点;H-EGTC算法采用周期搜寻机制,其搜寻难度随着热点搜寻失误的增加而增加,难以将能耗控制在较低的水平。因此,两种对照组算法的能耗均要高于本文算法。
图7 能耗测试Fig.7 Energy consumption test
3 结束语
针对当前网络社区聚类算法具有聚合收敛度较低,热点显示困难,能耗水平难以控制等不足,提出了一种基于热点度轨迹显影机制的网络社区聚类算法。主要通过信号抽样方式构建热点信号节点接收矩阵,并使用正交分割方式进行轨迹显影,能够显著提高热点捕捉效率,大大提高聚类生成质量,且具有能耗较低的优势。
下一步,将考虑到本文算法在物联网领域运用的一些困难,如难以适应自组织方式组织基于区块链分叉方式的能耗结算模型,拟采用基于二叉树方式的分叉机制进行连通度建模,提高算法在高强度能耗条件下对物联网环境的适应能力,增强本文算法的实际部署价值。