APP下载

基于约简策略与自适应SVDD的无线传感网络离群检测方法*

2017-09-22李光辉

传感技术学报 2017年9期
关键词:离群约简无线

魏 畅,李光辉

(1.江南大学物联网工程学院,江苏 无锡 214122;2.江苏省无线传感网高技术研究重点实验室,南京 210003;3.物联网技术应用教育部工程技术研究中心,江苏 无锡 214122)

基于约简策略与自适应SVDD的无线传感网络离群检测方法*

魏 畅1,3,李光辉1,2,3*

(1.江南大学物联网工程学院,江苏 无锡 214122;2.江苏省无线传感网高技术研究重点实验室,南京 210003;3.物联网技术应用教育部工程技术研究中心,江苏 无锡 214122)

无线传感网络经常被部署于条件恶劣、无人值守的环境中,受到恶劣天气、软硬件故障、能量不足或者恶意攻击等因素的影响,传感器节点感知数据的缺失或错误难以避免。因此,传感器数据流的离群检测对于提高系统可用性至关重要。提出一种基于约简策略与自适应SVDD(Support Vector Data Description)的离群检测方法(RASVDD),该方法首先使用基于马氏距离标准的方法约简数据集,有效地减少了训练样本;然后利用基于数据分布密度准则和数据流时间相关性自适应更新决策模型。针对Intel Berkeley数据集及SensorScope System数据集的仿真实验表明,RASVDD的离群检测正确率TPR(True Positive Rate)平均达98%,误报率FPR(False Positive Rate)平均仅为1%,并且与传统的SVDD算法相比,RASVDD 决策模型训练时间减少了20%以上。

无线传感网络;数据约简;SVDD;离群检测;仿真

21世纪电子信息和无线通信技术取得了巨大发展,使得由高灵敏且低能耗的传感器节点组成的无线传感网络逐渐应用于实际生活的各个领域。与传统网络相比,传感器节点具有很强的资源限制,在能量、内存、计算能力和通信带宽方面都存在很大的局限性。传感器网络经常被部署在恶劣环境下,传感器数据流的质量不可避免地受到恶劣天气、软硬件故障、能量不足或者恶意攻击等因素的影响[1]。针对传感器数据流进行离群检测,不仅有助于对传感器网络健康状况进行检测与故障修复[2],而且能够及时有效地为用户提供其感兴趣的事件,这对于保证传感器网络的数据质量和科学决策具有重要意义。

在无线传感器网络中,某些传感器节点观测值显著偏离于正常模型或者预期结果,通常被称为离群(outlier)数据[3]。近年来,国内外学者对无线传感网络离群检测方法进行了深入研究[4-5],这些方法大致可分为基于统计的方法、基于最近邻的方法、基于聚类的方法、基于分类的方法、基于谱分解的方法等类型[6-7]。由于SVDD算法在二分类方面的性能优势,已被一些学者引入到传感器网络离群检测领域。SVDD由Tax[8-9]等人首次提出,是对SVM(Support Vector Machine)进行推广的算法,其基本思想是寻找到一个最小圆使所有目标类均可以落入该圆内,该圆的边界即为决策边界,用于区分离群点和正常点。SVDD和SVM相似,需要求解二次优化QP(Quadratic Programming)问题,因此其时间复杂度为O(n3),空间复杂度为O(n2),这样高的计算复杂度难以适用于资源受限的无线传感器网络。因此,许多学者研究了如何优化SVDD算法的性能,例如,孙文柱等[10]采用K-mean聚类方法确定样本聚类中心,并对所有样本依其聚类中心距离排序,而后由外向内等间隔依次选取样本构成约减核矩阵,对数据集进行约简。Hu[11]利用邻居节点间角度和密度的关系,实现寻找样本模型的决策边缘,以此来约简训练集样本。梁锦锦[12]和谢迎新[13]考虑到决策边界仅由少量分布在样本集边缘的数据决定,采用衡量中心点和其余点的欧氏距离,约减距离较大的样本点。Platt[14]和Fan[15]提出SMO_SVDD思想,用来优化训练规则,其利用违背KKT(Karush-Kuhn-Tucker condition)条件的Lagrange乘子两两进行优化,直到所有乘子都满足KKT条件,此时所得乘子为QP问题的最优解。Liu[16]和周胜明[17]集中于寻找一个与决策模型相似的超球或超椭球替代决策函数,有效地将决策复杂度降低为O(1),但该决策优化方法对不规则模型的性能较差。对于无线传感器网络,除需考虑上述问题外,还需注意其随时间不断变化的数据流[1],若使用一次训练的方法,随着数据流的变化,决策模型的准确性会逐渐降低。针对以上问题,本文提出了一种基于约简策略与自适应SVDD的无线传感器网络离群检测方法(RASVDD),该方法不仅可以节省决策模型的训练时间,而且能够有效提高离群检测的准确率。

1 预备知识

1.1 SVDD算法原理

给定一个包含n个数据点的数据集X={x1,x2,…,xn},SVDD的核心思想[8-9]是找到一个以a为圆心,R为半径的最小圆,该圆能够全部或尽可能多地包含X中的数据点。故该优化问题可以描述为:

(1)

式中:a为圆心;R为半径;ξi≥0为松弛变量;C>0为惩罚因子,用于实现圆的大小和包含样本数间的折中。SVDD的几何模型如图1所示,图中黑色点为集合X中的数据样本。

图1 SVDD几何模型

上述优化问题可通过Lagrange乘子法求解,构建Lagrange方程:

(2)

式中:αi≥0,γi≥0,分别令L关于R,a,ξi的偏导数为零,可得:

(3)

将式(3)代入式(2)中得:

(4)

然而,该方法只对输入空间为类圆形的数据集具有较好的性能。当输入空间为非圆形分布时,该方法不能达到理想的性能,故引入核函数来改善算法的适用性。找到一个合适的映射φ将输入样本xi映射到一个高维的特征空间φ(xi),在高维空间找到一个超球体尽可能多地包围输入空间的点。故式(4)中的内积(xi·xj)可以使用核函数K(xi,xj)替换。本文选用高斯核函数:

(5)

此时,式(4)可以转化为Lagrange对偶问题:

(6)

式(6)为典型的二次优化问题,其目标集合α=(α1,α2,…,αn)可以被分为三类:αi=0,落在圆内的正常数据点;0<αi

f(xi)=sgn(‖φ(xi)-a‖2-R2)

(7)

由式(7)可得:当f(xi)≤0时,xi被分类为正常数据点;当f(xi)>0时,xi被分类为离群数据点。

1.2 基于SMO的SVDD算法原理

SVDD算法需要求解二次优化问题,因此其时间复杂度为O(n3),空间复杂度为O(n2),难以适用于资源受限的无线传感网络。文献[14-15]研究了SMO(Sequential Minimal Optimization)算法在SVM中的应用,其基本思想是:如果所有Lagrange乘子都满足此优化问题的KKT条件,则此时的乘子为问题的最优解,因为KKT条件是Lagrange对偶问题(6)的充分必要条件。否则,从样本集中选择两个乘子,固定其余乘子,针对这两个乘子构建二次规划问题,该问题可通过解析方法求解。SMO算法将原问题不断分解为子问题并对子问题求解,进而达到求解原问题的目的,如此能大大提高算法的计算速度。下面介绍SMO_SVDD算法工作集乘子选择策略及Lagrange乘子优化策略。

1.2.1 工作集乘子的选择策略

根据KKT条件得:当αi=0时,‖a-φ(x)‖2R2。由上述情况可得:当αi>0时,‖a-φ(xi)2‖≥R2;当αi0)≥(g(xi)|αi

xs=argmax(‖c-φ(xi)‖2|αixt=argmin(‖c-φ(xi)‖2|αi>0)

(8)

若KKT条件成立,则有g(xt)≥g(xs),故在算法迭代过程中都有g(xs)>g(xt)+δ。

1.2.2Lagrange乘子的优化策略

(9)

令αt=ζ-αs,得:

(10)

对式(10)中的αs求二阶导数,得:

(11)

(12)

2 基于约简策略与自适应SVDD的无线传感网络离群检测方法

传统的SVDD是一种优秀的二分类算法,但应用于资源受限的无线传感网络时,其计算复杂度偏高。为降低计算复杂度,提高离群检测的准确率,本文提出了一种基于约简策略和自适应SVDD的传感网络离群检测方法(RASVDD),该方法包括基于马氏距离标准的训练集约简策略和基于数据分布密度的自适应离群检测机制,适用于低密度非均匀部署的无线传感器网络。

2.1 训练集的约简策略

原Lagrange对偶问题的解具有极大的稀疏性,因此有效并完整地选择与边界相关的子数据集,即求解α>0的点,对于整体训练性能的提高非常关键。受文献[12-13]的启发,本文采用基于马氏距离标准的策略约简数据集,用以缩短决策模型训练时间。

马氏距离由印度统计学家Mahalanobis P C提出,是一种有效地计算两个未知样本集相似度的方法,由于其考虑了各属性间的联系,故相对欧式距离有明显优势。另外,由于高斯核函数的映射过程很好地保留了邻居间的相互关系,故约简数据集可在样本空间进行,不必映射到高维空间。

对于给定的训练集Train={X1,X2,…,Xn},任一数据样本Xi={Xi1,Xi2,…,Xid},其中d为样本包含的属性个数。μ={μ1,μ2,…,μd}为每个属性的数学期望所构成的向量,Σ为协方差矩阵。计算公式如下:

μj=E(Xij)i=1,…,n;j=1,…,d.
Σij=cov(Xi,Xj)=E[(Xi-μi)(Xj-μj)]

(13)

定义1样本点与训练数据集数学期望间的马氏距离MD(Xi):

(14)

本文使用定义1作为衡量标准,约简训练集中与决策边界无关的样本点,约简策略算法如表1所示。

表1 基于马氏距离标准的约简策略算法

2.2 自适应检测机制

考虑到真实部署的无线传感网络受自然环境影响较大,其数据流的演变过程具有一定的随机性,若采用一次训练的方法进行离群检测,决策模型的鲁棒性和泛化能力将会随着时间的推移逐渐退化。为了解决该问题,本文提出了一种基于数据分布密度的自适应离群检测机制(ASVDD),使其能够随着传感器数据流的演变过程自动更新决策模型,从而提高传感网络离群检测的准确率。

2.2.1 数据流的滑动窗口模型

ASVDD使用滑动窗口模型处理传感器数据流[18],其特点在于处理数据窗口的大小固定,滑动窗口的终点始终为当前时刻,即加入新数据的同时移除旧数据。滑动窗口可以保证模型训练一直使用最新的传感数据,使得决策模型与当前数据分布情况保持高度一致,能够有效提高检测效率。

如图2所示的滑动窗口模型,其中窗口大小为n,即滑动窗口buffer中存储有n个数据。若在t-1时刻buffer中存储数据{Xt-n,Xt-n+1,…,Xt-1},则在当前时刻t时,buffer中将移除Xt-n,并加入当前时刻数据Xt,此时buffer中存储数据{Xt-n+1,…,Xt-1,Xt}。在本算法中,对于离群值采用直接移除不加入滑动窗口的方式。

图2 滑动窗口模型

2.2.2 基于数据分布密度的决策模型更新准则

决策模型更新准则是有效提高检测效率的关键,Zhang[7]论文中采用基于离群点的更新准则,即当出现离群点则更新决策模型,但该算法仅考虑离群点的出现不能充分说明决策模型更新的需要。故本文提出基于数据分布密度的更新准则,依据数据分布密度判断决策模型是否需要更新,保证算法更新及时有效。

如图3所示,为SensorScopeSystem数据集2号节点2007年9月15日归一化后的温度和湿度数据,采样周期为2min,其中红色点为6点到9点的数据分布情况,蓝色点为18点到21点的数据分布情况。图3(b)为图3(a)投影到Y(温度)轴和Z(湿度)轴后的图像,由图3(b)可以清楚的看到在该时间区间样本点的空间分布情况。

定义2空间域Ω的数据分布密度ρ是指Ω中包含的数据样本个数Num与Ω的面积S之比:

ρ=Num/S

(15)

图3 不同时间段数据分布情况

将上述数据空间划分为4个子空间域section1~section4,各个子空间域在时间段6点到9点和18点到21点的数据分布密度如表2所示。

表2 不同时间段数据分布密度

ASVDD更新准则为:当Δρ超过阈值τ时应更新决策模型使其与当前时刻正常数据流分布情况保持一致。故构建一个随数据分布密度特征变化的SVDD分类面,即能够有效地完成决策模型的自适应更新,ASVDD算法步骤如下:

Step 1 将数据空间划分为m个子空间域,即section(1),section(2),…,section(m);

Step 2 计算训练集样本在各个子空间域中的数据分布密度,记为ρ_old;

Step 3 计算当前时刻数据所属子空间域section(i),i=1,2,…,m,更新数据分布密度,记为ρ_new;

Step 4 计算Δρ=|ρ_new-ρ_old|;

Step 5 若Δρ≥τ,则使用当前滑动窗口buffer中的数据更新决策模型,并把此时的ρ_old更新为ρ_new,继续执行step3;若Δρ<τ,继续执行step 3。

综上所述,本文提出的RASVDD离群检测算法如表3所示。

3 仿真结果及其分析

为了验证本文提出的RASVDD算法性能,使用国际通用的无线传感网络数据集Intel Berkeley及SensorScope System完成了仿真实验。实验是在Intel(R)corei3双核CPU,主频3.6 GHz,内存4G,操作系统Window 7环境下进行的,编程语言采用MATLAB 2014a。在相同的实验环境下,分别实现了RASVDD算法、基于SMO的SVDD算法(以下简称为SVDD),以及Zhang[7]的AOD算法,并进行了实验结果的比较。

3.1 数据集

Intel Berkeley数据集来自于部署在Intel Berkeley实验室中的无线传感器网络,该网络包含54个MICA2传感器节点,采样周期为30 s,运行周期为2004年2月28日到2004年4月5日,每个节点采集的数据包括温度(Temperature)、湿度(Humidity)、光照(light)及电压(voltage)4个属性。本文选取1号传感器节点2004年2月28日到2004年3月2日全天的温度、湿度采样数据作为本实验数据集。SensorScope System数据集来自于部署在瑞士和意大利之间Grand-St-Bernard山峰的2 400 m处的无线传感器网络,数据从2007年9月开始采集。每个节点采集的数据包括环境温度(Ambient Temperature)、地表温度(Surface Temperature)、日光照射(Solar Radiation)、相对湿度(Relative Humidity)等属性。本文选取2号传感器节点2007年9月15日到2007年9月18日的环境温度和地表温度采样数据作为实验数据集。表4列出了本文实验所用的4个数据集。

表4 实验所用数据集

3.2 性能评价指标

对于二分类问题,可将样本根据其真实类别和决策模型检测类别的组合划分成真正例(true positive,TP)、假正例(false positive,FP)、真反例(true negative,TN)、假反例(false negative,FN)4种情形,其可用“混淆矩阵”来说明[19],如表5所示。

表5 分类结果混淆矩阵

本文利用TPR(True Positive Rate)、TNR(True Negative Rate)、FPR(False Positive Rate)、FNR(False Negative Rate)作为衡量着指标,其计算公式如下:

(16)

(17)

(18)

(19)

3.3 约简策略的对比试验

为验证本文提出的基于马氏距离标准的约简策略在决策模型训练时间上的性能,分别使用SVDD算法和RASVDD算法在不同规模数据集上做训练,并用训练时间即决策模型形成所用时间作为衡量指标,结果如图4所示。由图4可得,RASVDD算法在训练时间方面有明显优势,相对SVDD算法训练时间总体减少20%以上,在训练数据样本增多时,优势更为明显。这是由于RASVDD算法利用马氏距离的标准有效地删减了训练集中与决策无关的冗余数据,故RASVDD算法在训练决策模型时,省去了训练冗余数据的时间,提高了决策模型的训练速度。

图4 SVDD算法和RASVDD算法在不同规模训练集上的训练时间

3.4 离群检测算法性能的对比试验

为验证RASVDD算法性能,分别在上述4个数据集上对算法进行对比,由表6~表9可得,RASVDD算法考虑了自然环境的多变性,采用基于数据分布密度的自适应检测机制,在数据流发生变化时通过更新准则及时有效地更新了决策模型,其TPR平均达98.52%,FPR平均仅为0.61%,而SVDD算法的TPR平均仅为59.68%,而FPR平均高达35.8%,由此可得RASVDD有效改善了SVDD不能自适应更新的问题,表现出了优于SVDD的良好检测性能。由表6~表8可得AOD算法在数据集Ⅰ,Ⅱ,Ⅲ上均表现出良好的检测性能,TPR达97%以上,但由表9可得其在数据集Ⅳ上TPR大幅下降,仅为18%,这是由于数据集Ⅳ在数据流未出现离群点前数据分布便发生了变化,AOD算法更新准则没有检测到数据流变化未及时更新决策模型,而RASVDD算法更新准则是基于数据分布密度,故在数据集Ⅳ上也保持了良好的检测性能。综上,对比AOD算法和SVDD算法,RASVDD具有更好的离群检测性能。

表6 IBRL_1数据集性能测试结果

表7 SensorScope_1数据集下性能测试结果

表8 SensorScope_2数据集下性能测试结果

表9 IBRL_2数据集下性能测试结果

图5 SVDD算法和RASVDD算法的ROC曲线

图5为ROC(Receiver Operating Characteristic)曲线,其纵轴为TPR,该值越高越好,横轴为FPR,该值越低越好。这两个指标相互制约,若算法对离群数据敏感,则TPR会较高,但FPR也会相应地升高。在理想情况下,当所有的离群样本均被检测为离群,正常样本均被检测为正常,此时TPR为1,FPR为0;在TPR达到1时,算法对离群数据灵敏性的提升只能导致正常样本被检测为离群,此时TPR为1,FPR不断增大;在最极端情况下,全部样本均被检测为离群,此时TPR为1,FPR也为1。在对不同算法性能进行比较时较为合理的判断依据是比较ROC曲线下的面积[19],即AUC(Area Under ROC Curve)。图5为SVDD和RASVDD的ROC曲线,由图可以明显看出SVDD的ROC曲线被RASVDD的曲线完全包住,因此RASVDD拥有更大的AUC,故RASVDD的性能优于SVDD。

图6给出了训练集样本取值为[100,300,500,700,900,1100]时,RASVDD、SVDD训练集样本数和TPR、FPR的关系。

图6 训练集样本数对检测算法性能的影响

从图6(a)可以看出,SVDD的TPR存在很大的波动性,随着样本数的增加,其TPR会逐渐降低。这是由于在训练样本较多时,SVDD算法将训练集内的数据全部判断为正常。例如:训练集样本包含全天所有时刻的数据,进行在线检测时,若在凌晨时刻出现正午时刻的数据,其应该被判断为离群。但由于SVDD决策模型中含有全天候的数据,而且检测算法没有使用自适应更新机制,SVDD算法通常会将该离群数据判断为正常数据,即造成误判,故在样本数增加时,其TPR会降低,而RASVDD根据数据分布密度自适应更新了决策模型,故其TPR对训练样本数变化不敏感。从图6(b)可得SVDD在训练集样本小于300时FPR高达45%以上,而RASVDD的FPR始终低于20%。这是由于在训练集样本较少时,SVDD算法将训练集以外的数据全部判断为离群点。例如:训练集中只含有凌晨时间段的数据,SVDD决策模型会将正午时刻的正常数据全部判断为离群点,而RASVDD更新准则会根据数据分布密度的变化情况,及时更新决策模型,所以训练集样本数的变化对RASVDD的FPR影响较小。

4 结论

本文针对无线传感网络离群检测提出了RASVDD算法,其主要特点有:利用基于马氏距离标准的方法对训练数据集进行约简,删减了与决策无关的数据样本,使训练时间减少的前提下,避免了准确率的损失;针对无线传感网络数据流会随时间发生不定变化,本文使用了基于数据分布密度的自适应决策模型更新机制,使决策模型随数据流变化自适应更新,提高了离群检测算法的准确率。在真实数据集下的仿真实验证明了RASVDD与以往同类算法相比,对无线传感网络离群检测有更好的分类效果。本文算法是针对非均匀部署的低密度无线传感网络而设计的,着重利用节点数据流自身的时间相关性进行离群检测。在今后的算法研究中将考虑同时利用节点间的时空相关性,以便进一步提高检测精度,并降低算法复杂度。

[1] Zhang Y,Meratnia N,Havinga P. Outlier Detection Techniques for Wireless Sensor Networks:A Survey[J]. IEEE Communications Surveys and Tutorials,2010,12(2):159-170.

[2] 单亚峰,汤月,任仁,等. 基于邻域粗糙集与支持向量极端学习机的瓦斯传感器故障诊断[J]. 传感技术学报,2016,29(9):1400-1404.

[3] Chandola V,Banerjee A,Kumar V. Anomaly Detection:A Survey[J]. ACM Computing Surveys,2009,41(3):1-58.

[4] Zhang Y,Hamm N A S,Meratnia N,et al. Statistics-Based Outlier Detection for Wireless Sensor Networks[J]. International Journal of Geographical Information Science,2012,26(8):1373-1392.

[5] 任倩倩,李建中,程思瑶. 无线传感器网络中可容错的事件监测算法[J]. 计算机学报,2012,35(3):581-590.

[6] Zhang Y,Meratnia N,Havinga P J M. Distributed Online Outlier Detection in Wireless Sensor Networks Using Ellipsoidal Support Vector Machine[J]. Ad Hoc Networks,2013,11(3):1062-1074.

[7] Zhang Y,Meratnia N,Havinga P J M. Ensuring High Sensor Data Quality Through Use of Online Outlier Detection Techniques[J]. International Journal of Sensor Networks,2010,7(3):141-151.

[8] Tax D M J,Duin R P W. Support Vector Domain Description[J]. Pattern Recognition Letters,1999,20(11-13):1191-1199.

[9] Tax D M J,Duin R P W. Support Vector Data Description[J]. Machine Learning,2004,54(1):45-66.

[10] 孙文柱,曲建岭,袁涛,等. 基于改进SVDD的飞参数据新异检测方法[J]. 仪器仪表学报,2014,35(4):932-939.

[11] Hu C,Zhou B,Hu J. Fast Support Vector Data Description Training Using Edge Detection on Large Datasets[C]//International Joint Conference on Neural Networks. IEEE,2014:2176-2182.

[12] 梁锦锦,刘三阳,吴德. 一种约减支持向量域描述算法RSVDD[J]. 西安电子科技大学学报(自然科学版),2008,35(5):927-931.

[13] 谢迎新,陈祥光,余向明,等. 基于快速SVDD的无线传感器网络Outlier检测[J]. 仪器仪表学报,2011,32(1):46-51.

[14] Platt J C. Fast Training of Support Vector Machines Using Sequential Minimal Optimization[M]. MIT Press,1999:185-208.

[15] Fan R E,Chen P H,Lin C J. Working Set Selection Using Second Order Information for Training Support Vector Machines[J]. Journal of Machine Learning Research,2005,6(4):1889-1918.

[16] Liu Y H,Liu Y C,Chen Y J. Fast Support Vector Data Descriptions for Novelty Detection.[J]. IEEE Transactions on Neural Networks,2010,21(8):1296-313.

[17] 周胜明,曲建岭,高峰,等. 基于HE-SVDD的航空发动机工作状态识别[J]. 仪器仪表学报,2016,37(2):308-315.

[18] 金澈清,钱卫宁,周傲英. 流数据分析与管理综述[J]. 软件学报,2004,15(8):1172-1181.

[19] 周志华. 机器学习[M]. 北京:清华大学出版社,2016:33-35.

魏畅(1993-),女,江南大学物联网工程学院硕士研究生,主要研究方向为无线传感网络离群检测,weichang92@126.com;

李光辉(1970-),男,通信作者,教授,博士,博士生导师,主要研究方向为无线传感器网络、无损检测技术等,ghli@jiangnan.edu.cn。

OutlierDetectioninWirelessSensorNetworksBasedonReductionStrategyandAdaptiveSVDD*

WEIChang1,3,LIGuanghui1,2,3*

(1.School of IoT Engineering,Jiangnan University,Wuxi Jiangsu 214122,China; 2.Jiangsu High Technology Research Key Laboratory for Wireless Sensor Networks,Nanjing 210003,China; 3.Research Center of IoT Technology Application Engineering(MOE),Wuxi Jiangsu 214122 China)

Wireless sensor networks are often deployed in the harsh and unattended environment,and the sensor data loss or error usually happens for the sake of bad weather,hardware or software fault,energy dissipation or the adverse attack. Outlier detection of the sensor data streams is critical for improving the system’s availability. In this paper,an outlier detection method(RASVDD)based on the data reduction and adaptive SVDD is proposed. RASVDD uses the Mahalanobis distance criterion to reduce the data set and the training samples,and then the data distribution density criterion and the temporal correlation of data stream are applied to update the training model adaptively. The simulation results for the Intel Berkeley dataset and the SensorScope System dataset showed that,RASVDD had an average true positive rate of 98% and an average false positive rate of 1%,and reduced the model training time more than 20% compared to traditional SVDD.

wireless sensor network;data reduction;SVDD;outlier detection;simulation

项目来源:国家自然科学基金项目(61472368,61174023);江苏省重点研发计划项目(BE2016627)

2017-03-19修改日期:2017-05-15

TP274.2

:A

:1004-1699(2017)09-1388-08

10.3969/j.issn.1004-1699.2017.09.015

猜你喜欢

离群约简无线
一种基于邻域粒度熵的离群点检测算法
《无线互联科技》征稿词(2021)
基于二进制链表的粗糙集属性约简
无线追踪3
基于ARM的无线WiFi插排的设计
基于粗糙集的不完备信息系统增量式属性约简
一种PP型无线供电系统的分析
一种相似度剪枝的离群点检测算法
实值多变量维数约简:综述
基于模糊贴近度的属性约简