APP下载

基于粒计算的大数据空间行为可视化技术仿真

2021-11-17

计算机仿真 2021年3期
关键词:粒度可视化空间

郭 亮

(赣南师范大学,江西 赣州 341000)

1 引言

大数据是指融合多种来源,并以多元化的形式存在的庞大数据组,具有数据量大、增长速度快以及结构多样的特点,大数据包含的数据信息具有时效性。通过对海量大数据的存储、检索、通信、处理等操作,能够得到更加权威的研究结果,同时可以制定出有针对性的发展策略[1]。大数据涉及的领域逐渐向人们的日常生活靠近,能够储存人们的日常空间行为数据。空间行为指的是人们在日常生活中发生的行为动作,包括空间移动行为、社交行为、语言行为等。长期研究发现大数据空间行为以数据的方式呈现不够直观,为解决该问题,相关学习提出要对空间行为大数据进行可视化处理,并以DAG图的方式呈现用户的空间行为。可视化技术执行过程需要使用代码程序,由于用户需求不同所以需要用户自行开发,但并不意味着用户要进行源代码开发,而是在工作空间内上传JAR包。

文献[2]提出基于CiteSpace的大数据空间行为可视化技术,以时空知识图谱及内容知识图谱分析为主要研究方法,基于信息可视化软件CiteSpace,对大数据空间行为进行可视化比较和分析,提出粒计算解决框架,分析了深度学习与粒计算的逻辑关系,提出深度学习本质上是多粒度计算,可以用深度学习引导在大数据处理中形成数据粒和功能粒的最优结构,讨论了量子比特编码与粒计算的关系,提出用量子比特编码有可能降低大数据问题的规模和复杂度。但该方法仅能为大数据空间行为可视化技术提供理论知识,缺少实际应用。文献[3]提出基于SuperMap的大数据空间行为可视化技术,以海量时空点数据为例,采用预处理可视化方案,设计并实现了一套高可扩展的分布式可视分析框架。基于SuperMap技术,还原空间行为,得到可视化结果。但该方法只能处理部分信息结构简单的数据,对于结构复杂、冗余度高的数据无法进行准确的可视化处理。

由于大数据与空间行为都属于瞬时行为,要求可视化技术要保证可视信息的实时性,为此需要在传统可视化技术的基础上对大数据空间行为可视化技术进行优化与改进。本研究引入粒计算方法,其基本单位为粒,是论域中的子集、类、簇以及元素通过功能标签、不可区分性以及相似性和功能标签而形成的集合。集合的一个子集、系统的一个模块等都是粒。将粒计算的构建与分解原理应用到大数据空间行为的可视化技术中,能够提升技术速度,实现可视化技术的优化。

2 大数据空间行为可视化技术设计

大数据空间行为可视化技术的思想为:将大数据空间行为的数据信息通过数据挖掘、粒计算处理以及变换、编码等过程转换为图像数据[4]。具体的设计过程如图1所示。

图1 空间行为可视化技术流程图

空间行为数据一般采用矢量数据模型来表示,矢量数据模型由点线面三个基本元素单位组成,用来表示空间行为中的实体。

2.1 空间行为数据挖掘

空间行为数据包括社交行为数据、逻辑语言行为数据和空间移动行为数据。挖掘空间行为数据的步骤为空间行为数据准备、数据挖掘、数据表述和数据评价四个阶段[5],其过程如图2所示。

图2 数据挖掘一般步骤

在按照上图步骤挖掘大数据空间行为数据的过程中,首先设定数据挖掘的最小支持度为s,最小置信度为C0,进而得到候选项集,如果该集合的支持度大于等于最小支持度,那么就称之为频繁项集[6]。对数据库中的大数据进行扫描,直到不再产生新的候选项集为止。

按照上述数据挖掘步骤对社交行为数据进行挖掘,将社交数据、话题、命名实体及其关联定义为层次语义模型,将每一条消息定义为一个节点,自然划分话题不相同的消息,将划分结果定义为:

∏={n:n∈VT}

(1)

式中n表示的是空间行为数据中的消息数据,VT为相同话题的消息集合。对划分遍历后得到的聚类图用矩阵向量来表示,图形表达式如式(2)所示。

AG=〈VT,ET〉

(2)

式中ET表示命名实体分类关系。按照相同的挖掘方法挖掘空间行为中的逻辑语言行为和空间移动行为大数据,聚类融合空间行为数据,输出最终的挖掘结果,实现空间行为数据的挖掘。

2.2 基于粒计算的空间行为数据可视化处理

基于粒计算进行空间行为数据的可视化处理,首先需要标准化数据格式,将不同的空间行为数据类型转换成为统一的格式,设融合的大挖掘数据原始序列的表达式为

X(0)=(x(0)(1),x(0)(2),…,x(0)(n))

(3)

设D1为作用于x(0)的算子,X(0)经过算子D1作用后可以得到式(4)中的序列[7]

XD1=(x(0)(1)d1,x(0)(2)d1,…,x(0)(n)d1)

(4)

式中单位元素的计算公式为:

(5)

式中λ为加权变换算子系数,其取值为0<λ<1。由此建立加权变换方程如下

x(0)(k)+ax(1)(k)=b

(6)

式中,a为微分变量,其对应的微分方程可以表示为

(7)

式中,t代表微分作用系数,求解上述微分方程的响应函数,如式(8)所示

(8)

则挖掘原始数据的响应序列为

(9)

通过滤波处理、坐标变换、几何变换、线性分割等步骤,借助粒计算中的粒构建和分解原理,从粒度空间优化和多粒度联合计算两个方面,实现粒计算的预处理[8]。具体的处理过程如图3所示。

图3 粒计算的空间行为数据可视化处理框架图

2.2.1粒度空间优化

针对空间行为问题性质以及计算过程的约束条件,在问题大数据的多粒度表示空间中选择合适的粒层。通过对空间行为推测出满意解的粒度,再对本身的粒度进行求解。解的粒度与问题粒度之间的映射关系为MPS,问题的粒度比解的粒度更粗,从而得到特定粒度上的解。在大数据空间行为问题的求解过程中,所要计算出的空间行为可视化数据处于核实的粒度层次上,在这个过程中所处理的信息粒的粒度称为计算粒度[9]。从解的粒度到计算粒度之间存在着映射关系,可以表示为MSC。根据MPS和MSC,能够得到空间行为问题粒度与计算粒度存在的映射关系,用MPC表示,因此粒度空间优化就会转换为求解MPC的过程,如图4所示。

图4 问题粒度到计算粒度的映射求解过程

按照图中的映射求解流程,得出粒子空间的优化结果,并将空间行为大数据输入到该粒度空间中。

2.2.2多粒度联合计算

多粒度联合计算是指将求解空间行为大数据的过程,依次分配到数据表示的多个粒度层中,从而形成多个子任务,协同每一个粒度层次上相对简单的部分,以此完成复杂问题的求解[10]。图5当中存在两条模糊规则的推理系统,对每一个粒层中的功能计算其隶属度等。

图5 多层粒度的模糊推理计算示意图

图中Ai与Bi分别为多层粒度中的单位粒子,那么映射关系可以通过式(10)来计算。

(10)

ωi=μAi(x)×μBi(x),i=1,2

(11)

其中μ为计算模糊系数。根据若干较低层次的粒层,输出高层次的计算结果,完成粒计算的可视化处理。

2.3 空间行为轨迹变换

将大数据中的空间行为数据信息转换为图形的表示方式,首先要变换空间行为轨迹,此过程分为两个步骤,分别为空间行为轨迹生成和轨迹变换[11]。空间行为轨迹生成需要计算行为距离,同时判断空间行为的方向。在进行距离与方向的计算时需要遍历空间内的每一个节点,路径的缓冲区相交得到空间行为集合L,那么其距离总长度也为L,其中每两个节点之间的长度系数为κ,则空间行为的整体方向值计算公式如下

L=κ1α1+κ2α2+…+κnαn

(12)

其中每一个空间段的方向角为αn,计算得出方向角的值与距离长度值,最终得到空间行为轨迹变换结果。

2.4 输出可视化绘制图像

将转换完成的空间行为以对应的绘制图像的形式输出,图像的绘制过程如图6所示。

图6 绘制过程流程图

首先绘制变换数据的底图信息,按照对应空间行为配置信息以及元素,实现大数据空间行为的可视化。接着按照空间行为的聚集程度,将数据全部绘制在画布上,并使用不同的颜色来表示。对数据中的每一个粒子元素做一个缓冲区,缓冲区的像素值与到元素的距离成反比,也就是逐渐递减,递减函数可通过式(13)来计算

(13)

通过式(13)得出的每一个结果都包含着该像素的颜色信息,此时画布中的所有像素都有不同的alpha值。将透明度转换为色彩纸,根据alpha值的不同,将当前的alpha的值对应的RGB值赋予到像素[12]。

3 仿真分析

为检测粒计算下的大数据空间行为可视化技术的有效性,需要设计仿真对可视化技术的结果进行分析。为了保证仿真变量的唯一性,在仿真过程中选择相同的大数据空间行为数据作为仿真的仿真数据。通过搭建可视化技术应用的处理仿真平台,对输入的空间行为数据进行可视化技术处理,并对结果进行具体分析。

3.1 搭建可视化处理仿真平台

由于采集实际空间行为数据不可控因素较多,因此直接调用数据库中的数据信息,并搭建仿真环境,在仿真环境下对空间行为信息进行可视化处理。

仿真环境主要由物理设备层、软件环境层、业务逻辑层、服务层以及应用层五个部分组成。其中物理层能够为整个可视化技术的物理硬件提供支持。在物理层上安装服务器、CPU处理器以及存储器等硬件设备。利用服务器强大的运算处理能力,为上层所有功能计算提供支持。软件环境层,即为可视化技术处理层,提供可视化数据处理平台最基本的软件支持。而业务逻辑层、服务层及应用层,主要支持可视化技术的正常运行以及后期维护处理,保证空间行为可视化技术在仿真过程中可以正常使用。

3.2 设立仿真对照

为了凸显设计出的粒计算下大数据空间行为可视化技术的有效性,在仿真中将传统的可视化空间行为处理技术作为仿真对照。仿真中两种可视化技术处理的仿真空间行为数据相同,以此保证仿真变量的唯一性。

3.4 仿真结果与分析

将两种空间行为可视化技术作为仿真环境中的软件环境层,将相同的空间行为数据输入到仿真环境当中。分别使用两种技术对其进行可视化处理,在数据输入时启动时间计,直输出空间行为可视化图像后,计时结束。记录计时器显示的时间数据,该数据即为可视化技术处理所消耗的时间,对两种技术的仿真结果进行对比分析。

路线创建过程如图7所示。

图7 大数据空间行为轨迹创建过程

设置像素点的圆半径以及模糊度,使其携带新的颜色值,重新在画布上绘制图像,并将大数据空间行为的可视化绘制图像输出,输出结果如图8所示。

图8 大数据空间行为可视化输出结果图

在上述实验结果的基础上,下面对提出方法的稳定性进行实验验证。将传统方法作为实验对照,随着大数据空间行为挖掘时间的增加,输出方法挖掘稳定性,实验结果如下:

图9 稳定性对比

图9对比了两种方法的应用稳定性,从该实验结果中可以看出传统方法的稳定性波动较大,最高波动达到±1.5%,该范围的稳定性无法满足实际应用要求。相比之下,研究方法的稳定性波动范围±0.5%,说明该方法具有更好的稳定性,这大大增强了方法的应用性能。

除方法的稳定性之外,随着待挖掘行为数量的增高,其可视化处理的时长也是衡量方法有效性的关键性参数。经过仿真过程,得出有关于空间行为可视化技术的执行时间结果,如表1所示。

表1 实验对比结果

从表中的数据结果可以看出,传统可视化技术的平均消耗时间为0.5秒/kB,而设计出的可视化技术的平均消耗时间仅为0.02秒/kB。随着处理数据量的增加,两种技术的可视化处理速度也在发生变化,当空间行为数据量达到1GB时,使用设计出的粒计算可视化技术相比于传统的可视化技术可以节省大约873.8秒,且经过处理与计算发现,两种可视化技术的处理准确率与输出结果的质量相近。因此可以得出结论:当得出近似相同可视化处理结果时,使用粒计算可视化技术可以节省大量的处理时间。

4 结束语

通过分析使用粒计算处理大数据空间行为,研究大数据空间行为和粒计算领域的相关基础,为实现空间行为的可视化处理,因此提出基于粒计算的大数据空间行为可视化技术,将实现的可视化技术应用到实际的研究工作当中,在保证可视化质量的前提下,可以节省大量的处理时间,希望这种基于粒子计算的大数据处理方式,可以对研究着提供一些有益的借鉴和帮助。

猜你喜欢

粒度可视化空间
自然资源可视化决策系统
超重力场中煤泥颗粒沉降规律研究①
思维可视化
空间是什么?
创享空间
基于知识图谱的我国短道速滑研究可视化分析
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
情感粒度
油田碎屑岩粒度分布情况测定中激光粒度分析仪应用的价值