多映射数据结构位置指纹库滤波算法
2017-03-17陈戈珩谢泽亮
陈戈珩, 谢泽亮, 李 寻
(长春工业大学 计算机科学与工程学院, 吉林 长春 130012)
0 引 言
随着各种大型商场、车站等大型建筑物的建立,人们对精确室内定位服务的渴望也越来越强烈,但是由于GPS定位对室内环境具有较大的局限性,其中包括了室内环境对GPS信号的遮蔽,导致GPS定位精度大幅下降,难以在室内定位的过程中有所作为。
在对室内定位主流研究方向中,根据定位时所需信息的不同分为测距无关(range-free)和基于测距(range-based)两大类。其中基于测距算法首先得到了研究人员的重视,基于测距的研究方法主要是通过信号的各项特征值,以及信号的衰减模型来量化信号源AP(Access Point)与接收设备的距离,主要算法有AOA、TDOA、TOA、AOA与TDOA混合定位[1-4]以及RSSI等[5-7],但在室内定位的研究过程中,研究人员发现除了利用信号的强度RSSI(Received Signal Strength Indication)进行定位研究外,其他的定位算法都需要使用到额外的硬件,AOA算法需要陈列天线,TOA和TDOA需要高精度的时间同步,而且基于室内复杂的信号传播环境,TOA和TDOA以及AOA都不适用于室内定位的研究。随着WiFi技术的逐渐普及,WiFi室内定位技术成为当今室内定位研究的热门方向,其原因有两点:第一,WiFi室内定位技术无需额外的硬件设备,现在人们使用的所有移动设备都配有WiFi模块,大大节约了定位成本;第二,WiFi热点现如今已经覆盖人们生活的主要场景,利用WiFi进行室内定位具有较高的可行性。
在研究WiFi室内定位技术的过程中,基于位置指纹的定位方式是实际测试中精度最高的方式[8],位置指纹室内定位分为离线(off-line)阶段和在线(on-line)阶段两个过程。在离线阶段,通过wlan无线网络接入点,可以轻松获取相关AP的信息,将这些信息如相位、信号强度作为接收信号的特征值,通过把当前位置坐标作为标签值,可以构建离线数据库。在线阶段,通过无线接入点可以获得接收信号的信号特征值,通过与离线数据库各项数据的匹配得到最相似的位置数据,从而估算出当前位置的具体坐标。
在离线阶段需要建立完整RSSI信号分布图(Radio Map),通过规划和测量选取目标参考节点,从而将待定位区域完整地覆盖。在构建RSSI信号分布图的过程中,每个目标参考节点都对应着一定数量的AP信号强度值,每个AP节点之间互相独立,将每个目标参考节点的坐标以及信号强度值存入离线数据库,但是由于WiFi信号的时变性以及室内环境的复杂性,如人体遮挡以及干扰,存入离线数据库过程中往往伴有噪声,使得离线数据库在线过程中并不能与当时的信号分布相匹配,从而影响在线阶段的匹配过程。
1 多映射数据结构的数据库滤波算法
由于每个AP节点互相独立,所以在构建离线数据库的时候需要对每个AP节点进行单独的分析与数据采集。同一AP距离下RSSI值的变化如图1所示。
在同一距离下,对同一AP(同一MAC地址)进行RSSI信号值的采样,发现RSSI信号值会随着采样时间进行跳变,这种跳变是难以预测的,所以在构建离线数据库的时候,通常情况下会对采样的RSSI信号强度值进行滤波处理。
对采集的RSSI一维向量{rssi1,rssi2,rssi3,…,rssij}进行均值滤波:
(1)
图1 同一AP距离下RSSI值的变化图
将得到的结果存入离线数据库,并对整个数据库做邻域滤波[9-10],以降低噪声。
但是在线匹配过程中,邻域均值滤波的效果并不明显,究其原因,邻域均值滤波只能对已经新建完毕的信号强度分布图进行滤波,这种滤波时小范围降低节点的噪声,而当在线过程中,进行采样信号值与离线数据库进行匹配时,采样信号通常伴有噪声,这样必须把采样信号也进行滤波才能与离线数据库相匹配。由于AP的独立性,所以需要对每个AP节点进行单独的分析,对5组MAC地址AP节点的RSSI值采样如图2所示。
图2 不同AP的RSSI值采样序列
对采集的结果进行数据统计,如图3所示。
图3 RSSI值数据统计表
从图3发现如下规律,RSSI值的信号波动经常会呈现出区域回归状态,即RSSI值的波动在固定值中跳变,且具有上限和下限,极少情况下会出现RSSI值超出上限和低于下限,且RSSI值的波动较准确满足正态分布。针对以上情况,文中给出一种多映射数据结构的数据库滤波算法,以适应高精度定位的需要。
在对指纹定位算法构建离线数据库的阶段,针对RSSI信号呈现的正态分布,采用针对信号的高斯滤波,以滤出RSSI信号非常规的跳变,对于每个坐标每一组AP的RSSI接收值则有:
(2)
(3)
(4)
式中:μ----测试组所有RSSI值的平均值;
σ----测试组所有RSSI值的标准差。
将大概率出现的信号值,即概率密度分布满足0.3≤f(x)≤1的值取出。
经过高斯滤波之后得到关于高斯滤波之后的RSSI信号值,高斯滤波主要是滤除游离在信号上限和信号下限的异常信号,高斯滤波之后的样本集合为:
(5)
针对采样信号的概率将信号进行排序,得到排序后的RSSI序列:
(6)
(7)
式中:pthreshold----筛选的概率门限;
np(xi)----当前概率RSSI值出现的次数。
通过将信号的概率进行排序,将概率出现次数最高的数据与当前数据量总和进行比较,如果大于概率门限,则保留当前筛选之后的RSSI信号值;如果小于概率门限的信号值,则将下一组RSSI值累加当前的RSSI值与当前数据量总和进行比较,并与门限概率进行判断,直到大于门限概率。将筛选的数据存入离线数据库得到同一AP不同坐标离线数据库,如图4所示。
图4 同一AP不同坐标离线数据库示意图
图中离线RSSI数据集对于同一个AP节点每个参考位置所对应的RSSI都不是一一对应的,通过多组RSSI值同时对应一个坐标,之后将所有AP数据采集完毕得到离线数据库存储结构,在线阶段中,无线设备每次将采集的信号与离线数据库做匹配时,同一位置都会有不同向量组将与之匹配,离线数据库结构见表1。
表1 离线数据库结构
(X1,Y1)位置对应的RSSI组合应为(-71,-75,-53,-36),(-73,-75,-53,-36),(-77,-75,-53,-36)等18种,单一坐标对应多个离线数据集且RSSI组合的排序是根据信号高斯概率来分布的,在线过程中,首先进行匹配概率最高的,以此来缩短在线阶段样数据与离线数据库匹配的效率。
2 实验与分析
给出的算法在实验室中进行实际验证,对WiFi中RSSI信号的采集使用了NativaWiFiApi接口读取笔记本无线网卡中所有AP的RSSI信息,首先对同一位置坐标采集所有AP节点的RSSI信号值,遍历所有AP节点,对每个节点中的RSSI数据进行高斯滤波得到其概率分类,并进行频数排序,接着对每个概率分类运算得到其频数概率,将频数概率与门限频率进行比较,高于门限频率,则代表滤波结束,将数据存入数据库,低于门限频率,则累加下一组概率的频数,再与门限频率比较,直到高于门限频率,则整个滤波过程结束,具体流程由图5所示。
图5 基于多映射方法的指纹库滤波算法的实现流程
实验结果通过均方根误差(RMSE)来比较邻域均值滤波算法与多映射滤波算法,结果如图6所示。
图6 算法均方根误差图
多映射数据结构能够有效降低WiFi信号时变的影响,减小定位的误差,很好地维持离线数据库与真实环境的拟合度,将平均均方根误差(RMSE)由3.3缩减为1.4。
3 结 语
针对传统离线数据库以单向量形式构建位置标签所产生误差过大的情况,基于针对WiFi信号时变以及位置指纹定位的特点,给出了一种多映射数据结构的数据库滤波算法,通过高斯滤波筛选出频数,并设置门限概率进一步筛选出所需的RSSI标签值,以多个RSSI标签值映射同一个位置标签,以笔记本为实验设备通过无线网卡的API接口采集实验数据。通过与均值邻域滤波进行比较,证明多映射数据结构能够有效降低误差,提高离线数据库与真实环境的拟合度,大概率避免传统离线数据库以单向量形式构建位置标签所产生误差过大的情况,有效降低了WiFi信号时变对离线数据库构建的影响。
[1] Kong F, Wang J, Zheng N, et al. A robust weighted intersection algorithm for target localization using AOA measurements[C]// Advanced Information Management, Communicates, Electronic and Automation Control Conference. IEEE,2017.
[2] 孔范增,陈国军,郑娜娥,等.基于射线跟踪的TOA定位算法的GDOP研究[J].信息工程大学学报,2017,18(1):35-39.
[3] 周恭谦,杨露菁,刘忠,等.基于TDOA定位的基站布设对模糊区分布及定位精度的影响分析[J].海军工程大学学报,2017,29(1):96-101.
[4] 赵宏旭.基于TDOA的Chan算法和Taylor算法的分析与比较[J].电子世界,2017(9):176-177.
[5] 罗炬锋,付耀先,王营冠.基于RSSI测距的WLS定位算法[J].华中科技大学学报:自然科学版,2011,39(11):34-38.
[6] 孙顺,董凯,修建娟,等.基于CWLS的多运动站TDOA/GROA辐射源定位算法[J].中国电子科学研究院学报,2016,11(5):540-546.
[7] 孙佳,胡明,赵佳.K-means初始聚类中心选取优化算法[J].长春工业大学学报,2016,37(1):25-29.
[8] Brunato M, Battiti R. Statistical learning theory for location fingerprinting in wireless LANs[J]. Computer Networks,2005,47(6):825-845.
[9] 刘伟嵬,颜云辉,孙宏伟,等.一种基于邻域噪声评价法的图像去噪算法[J].东北大学学报:自然科学版,2008,29(7):1033-1036.
[10] 王民,文义玲.常用图像去噪算法的比较与研究[J].西安建筑科技大学学报:自然科学版,2010,42(6):895-898.