APP下载

基于独立区域划分和压缩感知的数据融合方法

2019-08-22张素智陈小妮

计算机技术与发展 2019年8期
关键词:信息熵重构矩阵

张素智,杨 芮,陈小妮

(郑州轻工业学院 计算机与通信工程学院,河南 郑州 450001)

0 引 言

随着信息技术的迅速发展,大数据、云计算、深度学习等新技术相继出现,人们对信息数据的需求量与日俱增,数据维度和样本规模也在逐渐增加。在进行数据处理分析时,仅面向单一的数据是远远不够的,需融合多层次多领域的数据来扩大数据处理的范围。如何对这些高维数据进行处理[1],从而降低数据量以获取价值信息,是亟待解决的问题。由于各类数字化的信息数据量非常大,未经过压缩和预处理的数据难以直接使用,因此,数据融合及压缩技术成为当前研究的重点。

数据融合是一种新兴信息处理技术[2],通过基于特定规则进行优化整理、综合分析以完成所需的估计和决策。数据融合通过采集并融合以数据、信号、图像等多种形式存在于传感器中的信息,得到比各个单独的输入数据更多的信息。近年来,压缩感知理论[3]逐渐成为数据融合中的研究热点。文献[4]对压缩感知和分布式压缩感知(DCS)的有效性进行验证,证明CS和DCS方法比无线传感器网络中的变换编码及基于模型的自适应传感提供更高的能效。文献[5]表明压缩感知方法能有效减小网络传输数据量并加快传输速度,与常规方法DANP(数据采集和无处理方法)和DATC(数据采集和变换编码方法)相比,采用压缩感知能显著地降低网络能耗并延长稀疏信号的网络寿命。文献[6]基于贝叶斯推理提出状态监测的两阶段数据融合方法,通过将来自单独状态监测系统的数据组合起来用于工业机器,可提高整个机器健康评估的可靠性。通过将CS理论应用于数据融合,可以有效地改进传统信息处理的局限性。如文献[7]基于压缩感知理论提出采样点少且结构简单的图像融合方法,可在未获取全部采样点的情况下进行融合,降低了计算复杂度,且明显使得融合的图像质量更好。文献[8]提出基于压缩感知和活动轮廓的多焦点图像融合方法,对比传统的CS图像融合方法,该方法在主观视觉和客观评价指标上有更好的融合效果。但其对于不同压缩采样矩阵的应用研究较少,且融合规则应针对测量值的特点进行有效设计。

文中提出一种基于独立区域划分和压缩感知的数据融合方法。首先通过压缩感知进行数据采样以提高采样效率,并对数据集按规则进行区域划分和负载均衡计算,对划分后的数据集采用基于信息熵的压缩感知系数融合方法。实验表明该方法降低了算法的计算复杂度,具有较好的稳定性和融合效果。

1 CS数据表示

压缩感知理论旨在从数据本身的特性出发,找寻并去除数据中隐含的冗余度,从而达到压缩的目的。在传统信号处理中,压缩感知要求传感器以远低于Nyquist的速率[9]进行信号采样。一般来说,如果信号是可压缩或稀疏的,即可用与变换基无关的观测矩阵将变换所得的高维信号映射到低维空间上,之后采用求解优化方法从投影中以较高的概率对原始信号进行重构。这些理论的创新,有效地推动了基于压缩感知的数据融合方法的发展。

对于长度为N的离散信号f(f∈RN),其变换域为Ψi(i=1,2,…,N),对信号变换可得:

(1)

其中,f表示时域中的信号;Ψ是N×N维稀疏矩阵;x是表示变换系数的向量。如果x仅有K个非零值(其中N≫K)或在排列顺序后按指数级递减且逐步接近于零,则称f在Ψ上K稀疏。

在数据处理过程中,CS的先验要求为信号是否能稀疏表示。若信号能被压缩,并可由测量值y∈RN重构,则:

y=Φf=ΦΨx

(2)

其中,Φ{Φi,i=1,2,…,M}是M×N维(M

x'=argmin‖x‖l1

(3)

最后,通过x'求初始信号f:

f'=Ψx'

(4)

2 基于独立数据区域划分的数据融合方法

压缩感知理论常用在信号的采集及重构上,然而在面对大规模数据集时,运算量较大,难以处理。因此采用分区域压缩感知技术,先对数据集进行分区划分处理,然后对每个子区域数据集分别进行观测与重构,再采用重构算法整合恢复后的各个子区域。

2.1 数据采样

无线传感网络一般由大量的传感器节点组成,这些节点具有信息采集、处理和控制的能力[12]。假设某无线传感器网络拥有N个节点,每个节点在一周期内采集的数据为ti,i=1,2,…,n。整个无线传感网络数据可构成一个矢量,即

T=[t1,t2,…,tn]T

(5)

如果需要得到完整的信息,应采集信号T的N个采样的样本,并通过压缩感知方法获取的信号变换系数α(‖α‖≪N)来恢复完整的无线传感信号。

由于T通常较大,可能包含数千个无线传感的节点数据,采用压缩感知能有效减少信息采集量。对一个信号T,若存在变换域Ψ,使得T能在Ψ上q稀疏表示,则

Ψ=[ψ1,ψ2,…,ψq]T

(6)

无线传感网络的数据采样表示为:

(7)

其中,P为T的稀疏表示。

压缩感知利用高斯随机采样矩阵Φ,对传感节点上的数据进行采样,综合上述,经压缩采样取得的测量值为:

yi=φTi,i=1,2,…

(8)

其中,φ={φj,i}为采样矩阵,矩阵中的元素满足独立同分布的特性,其方差为1/M。

2.2 非规则区域数据划分

2.2.1 独立区域划分

按照划分准则进行区域划分,将采样数据动态分组成多个独立的相关自包含数据区域,以消除数据耦合性,使得同一区域中的数据具有较高的相似度,不同区域中的数据间不相关。根据近邻数据思想,按规则聚类,形成近邻动态区域。

(1)对于待聚类的点迹集合U={U1,U2,…,Un},元素两两之间距离为:

dij=d(ui,uj)=‖ui-uj‖,i,j=1,2,…,n

且i≠j

(9)

(2)在计算过程中,从U中找出与ui距离小于阈值T的各元素形成初始簇Ci:

Ci(ui)={um|dim

(10)

其中,T为提前设定的距离阈值,文中设为20。则聚类划分为C(u)={Ci(ui)|i=1,2,…,n},其划分数目为n个。

2.2.2 负载均衡

根据独立区域划分得到的分区大小通常不相等。因此,为实现负载均衡[13],对聚类结果C(u),将其大致分为d份,分别记为Pc,P={Pc|c=1,2,…,d},并行节点数k,采用基于区域计算负荷的均衡划分方法。

(1)各节点的计算量为:

(11)

(3)依次从有序集合P'的两端取元素,组成k个子集M={Mi|i=1,2,…,k},满足:

(12)

文中将样本数据进行近邻数据区域划分,并对划分后的各区域子集设置标号矩阵为{A1,A2,…,Ak}。假设两个区域集的标号矩阵分别为A1和A2,则联合矩阵为:

A=NA1+A2

(13)

其中,N=N1N2,N1和N2分别表示2个样本数据集的划分数量,N表示2个样本数据集划分的所有可能,因此N为一个足够大的整数。联合区域矩阵可以保证不同的数据集具有相同的划分标准。

2.3 数据融合

通过划分,得到的划分集为Mi(i=1,2,…,k),为了更加精确地得到数据轨迹,需要对数据进行融合。采用基于信息熵[14]的CS系数融合方法,计算两个类的信息熵:

(14)

其中,pk为随机变量M在信号中出现的概率。

联合信息熵为:

(15)

互信息(MI)为:

(16)

对两个类M1,M2,其各自的权重计算系数为:

(17)

(18)

根据独立区域划分,两个区域集的联合矩阵A的融合权重为:

k∈{1,2}

(19)

其中,δ(x)表示单位冲激函数,定义为:

(20)

假设2个样本数据集相应的区域集测量值分别为y1和y2,则每个区域集融合后的测量值为:

y'=ω1y1+ω2y2

(21)

基于压缩感知的数据融合算法具体步骤如下:

(1)使用压缩感知方法进行数据采样。通过高斯随机观测矩阵对数据的稀疏表示形态进行测量,得到测量值{y1,y2,…,yn};

(2)对采样数据集按规则进行独立区域划分,计算负载均衡,并对区域集设置联合矩阵。

对待融合的划分后数据集{M1,M2,…,Mk},计算两个样本类的信息熵、联合信息熵和互信息,获取权重融合后的测量。

3 实验与分析

3.1 实验数据

为了衡量算法的优劣,采用文献[15]中的实验数据,使用三个热电偶对恒温箱进行温度检测,六次的观测值如表1所示。

表1 温度传感器的观测值(温度设定900℃)

3.2 融合结果与分析

为了验证算法的精度,分别采用平均值方法、文献[15]中的可靠性算法、文中方法对表1中的观测数据进行融合,得到的融合结果如表2所示。

由表2的融合结果可以看出,文中方法的多次观测值都较接近于实际值,且对比三种方法的绝对误差和,平均值方法为16.433 3,可靠性算法为16.308 9,而文中方法的误差和远低于前两种方法,为12.222 0。因此,文中方法具有一定的优势。

表2 三种融合方法的融合结果对比

为了进一步验证算法的稳定性,使用Matlab仿真软件模拟10个传感器对900 ℃恒温箱随机观测100次的实验,并对采样获取的数据采用三种方法进行融合实验,其绝对误差对比如图1所示。

图1 三种融合方法的绝对误差对比

由图1中三种融合方法的绝对误差曲线变化可知,文中方法的绝对误差曲线整体上位于平均值方法和可靠性方法曲线的下方,且误差曲线变化较为平缓,而平均值方法和可靠性方法的误差曲线波动较大,且误差值相对较高。因此,文中方法具有一定的稳定性,融合效果较好。

4 结束语

在数据融合中,压缩感知理论的出现推动了传感器中数据信号处理的发展。文中运用压缩感知理论的思想,提出基于独立区域划分和压缩感知的数据融合算法,对数据采样获取测量值后,通过独立区域划分样本集,并计算互信息融合权重,最后采用压缩感知系数重构方法获取融合后数据。

实验结果表明,文中算法具有较好的稳定性和融合效果。

猜你喜欢

信息熵重构矩阵
基于信息熵可信度的测试点选择方法研究
“双减”能否重构教育生态?
长城叙事的重构
基于干扰重构和盲源分离的混合极化抗SMSP干扰
近似边界精度信息熵的属性约简
用四维的理念重构当代诗歌
多项式理论在矩阵求逆中的应用
基于信息熵的承运船舶短重风险度量与检验监管策略研究
信息熵及其在中医“证症”关联中的应用研究
矩阵