APP下载

基于位置大数据的数据挖掘的分析研究

2018-05-31崔蓓蓓

关键词:特征提取预处理轨迹

崔蓓蓓, 何 伟

(1.徽商职业学院,安徽 合肥 231201;2.安徽水利水电职业技术学院,安徽 合肥 231603)

0 引 言

移动位置服务(LBS)融合行为、时间和空间三大要素,将移动计算、无线定位和地理空间信息处理技术融合发展。随着数字移动信息的发展,Android系统的普及,使LBS获得了更大的发展空间。位置数据从研究设计到数据采集、数据处理、数据计算、数据存储以及数据可视化等构成一套完整的技术体系和方法。

1 位置大数据处理及分析

1.1 位置信息的预处理

位置信息的预处理主要是对地图数据信息和位置轨迹信息的数据进行预处理,进而通地图和轨迹数据的进行挖掘分析和建模。地图的预处理首先是将连续的地图区域用网格化分区、位置密度分区或参考点分区等方法进行离散化R={r1,r2,…,rn}。及将连续的位置数据离散某一时刻的位置坐标,例如p为单个位置记录,其移动目标o的位置坐标为,p的移动轨迹可以通过1个5元组表示为p=,其中v为移动速度,S代表状态信息。S可以有多个取值即Si(i=1,2,3,…),如果用户在社交网络或是其他媒体上主动分享自己位置数据,可以将与位置相关的媒体数据记为I,上述公式既可变换为p=。而一般又能将移动目标oi的第j条位置记录记为pj。

1.2 数据位置信息提取

(1)个体位置信息特征提取。位置大数据是以诸多对象的位置移动轨迹、区域活动特征的集合,在研究其总体特征提取过程,不妨以单个移动对象为观察对象,提取个体在一段时间内的移动行为规律特征,如在1条路径中发生状态转换的概率期望等。相对于大数据个体位置数据具有稀疏性,针对位置大数据整体的混杂性和单一数据的稀疏性,以单一移动对象O为研究目标时,其对象O具有独立性、随机性、周期性和转移性。随机性给位置数据分析增加了难度,本文位置熵(Location entropy)研究其随机性。Px为访问一个位置的随机变量,移动对象Oi共访问了||r||个不同的位置区域,其随机熵有:Hi=Hi(px)=log2||r||,统计移动对象在各个位置区域R={r1,r2,…,rn}上出现的概率,记为{pr(r1),pr(r2),…,rr(r||n||)},而位置熵为HR=Hi(Px|R))=-∑RPr(rj)log2Pr(rj)。如果考虑到移动对象Oi位置记录的时序性,traj=,||traj||表示轨迹上位置数据p的数量,称为轨迹长度。位置时序熵可表示为:H3=Hi(Px|traj)=-∑tr⊆trajlog2Pr(tr),由香农定理可知信息冗余性,概率大的信息特征表示为该信息出现的机会比较大。

(2)区域静态特征提取。如图1所示,将位置信息在地图空间上的映射进行具体区域划分,R可划分为n个位置区域R=(r1,r2,…,rn),空间的时域作为另一特征分量,将时间划分为固定时间片TS=(t1,t2,…,tm),根据位置和时间特征进行局部特征提取,抽象出特征分量τ可分解为r,φ,其中φ=<φS,φmp,φd>,将位置特征进行时间方向上的立体化,从而通过提取将位置信息数据化,更便于对其数据分析。

图1 位置数据的全局模型

(3)位置数据的降维。通过上述分析位置数据除具有数据冗余性的特点,因此在对位置数据进行处理过程中应减少特征的冗余度,通过精简数据获取全局模型,其常用的降维方法有介数降维和依主分量降维。ri和rj为同一特征路径上的传播点,这两个节点为一特征的共生关系,表示为ξij>0,这两个节点称为原始介数,原始介数将两者共同承担的特性分别重复运用到各自节点特征,造成特征的重复和高估。将ri节点信息删除,保留rj节点信息后,位置信息并未受到影响,即节点rj对ri有可替代作用,不影响位置数据的建模,但减少了数据的冗余度。如果ξij<0说明ri和rj相关度较低,rj不可替代ri。

2 LBS位置数据的现实意义

基于位置的服务将移动设备利用GPS或通信网络定位技术获取当前的位置信息,获取无线网络是哪个的某项服务,早期LBS系统主要用于在特殊情况下的快速定位,以实施救援,如美国的E911系统和欧洲的E112系统,随着web2.0技术的普及,国内外的社交网络允许用户参与并共享自己的位置数据,如Facebook、YouTube和国内的腾讯公司等。如图2所示,随着技术的发展,LBS将在智能交通、智能救助、医疗定位等领域发挥更重要的作用。

图2 LBS系统的架构

3 结束语

随着移动通信技术的发展,移动定位技术和地理信息系统(GIS)的缺字愈加广泛,移动互联网已渗透到人们生活的各个层面。移动位置服务从单一业务模式发展到综合应用,如LBSNS、移动共享单车、网约车、社区交往等。4G时代的来临,LBS大数据将与GPS进行无缝对接,形成新的发展格局,在LBS带来便利的同时,也带来了很多安全问题,这也是LBS研究的另一重要领域。

[参考文献]

[1] Guo C, Liu JN, Fang Y, Luo M, Cui JS. Value extraction and collaborative mining methods for location big data [J].Ruan Jian Xue Bao/Journal of Software,2014,(4):713-730.

[2] Pan G, Qi GD, Wu ZH, Zhang DQ, Li SJ. Land-Use classification using taxi GPS traces. IEEE Trans[J]. on Intelligent TransportationSystems,2012,(1):113-123.

[3] 乔少杰, 李天瑞, 韩楠,等. 大数据环境下移动对象自适应轨迹预测模型[J].软件学报,2015,(11): 2869-2883.

[4] 丁亮,钮心毅,宋小冬.基于移动定位大数据的城市空间研究进展[J].国际城市规划,2015,(4):53-57.

[5] Jiang B, Yao X. Location-based services and GIS in perspective. Computers[J].Environment and Urban Systems,2006,30(6):712-725.

猜你喜欢

特征提取预处理轨迹
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
解析几何中的轨迹方程的常用求法
污泥预处理及其在硅酸盐制品中的运用
轨迹
轨迹
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于Daubechies(dbN)的飞行器音频特征提取