APP下载

移动环境下多情景源用户情景序列的提取

2015-01-01刘明伟张晓滨杨东山

西安工程大学学报 2015年6期
关键词:情景概率矩阵

刘明伟,张晓滨,杨东山

(西安工程大学 计算机科学学院,陕西 西安710048)

0 引 言

随着移动智能终端的智能化和普及化,越来越多移动用户的实时信息被用作移动推荐服务的基础数据源.移动智能终端中种类繁多的传感器是收集大量信息的重要工具,通过获取用户实时的情景信息,可为移动用户提供多情景源情景数据序列.

HMM模型起初被广泛应用于模式识别研究领域,之后被引入到预测分析.文献[1-2]利用HMM模型对传感器信号进行建模,评估有效剩余寿命,进而判定系统状态,实现诊断和预测.文献[3]将嵌套的HMM模型引入用户网络流量预测分析中,用于监控设备.目前,HMM模型主要是对单一信息源进行信息的挖掘和获取,对于从多情景源信息获取用户情景序列的研究尚处于探索阶段.在用户情景序列提取推荐方面,文献[4]在社交网络技术分析中引入基于遗忘曲线的协同过滤推荐算法.文献[5]为研究社会网络中用户间的关系,提出了基于社会网络分析的协同过滤算法的改进方法.文献[6]提出了基于用户偏好的自动分类的社会媒体数据推荐算法,但其算法比较复杂,可扩展性存在问题,性能会越来越低.也有一些研究[7-11]为改进现有算法的不足,优化情景生成的序列,从不同方面用不同方法提高算法的实用性、灵活性和有效性.然而,这些算法仅仅考虑了影响移动环境中用户个性化推荐服务的几个客观因素,而对于用户自身因素并未考虑,忽略了用户自身因素对用户情景序列结果的影响.

因此,文中通过获取移动智能终端的传感器信息,提取用户的身体健康状态信息作为用户多情景源数据,利用笛卡尔乘积对多传感器获得的多情景源信息进行融合[12],并用HMM模型提取用户隐含的情景数据序列.

1 HMM模型

HMM模型的双重随机过程,不仅能反映用户观测状态的随机性和隐藏状态的关联性,而且还可以体现出隐藏状态和观测状态间的转换过程[13].在某个给定的时刻,给定状态的转移概率只取决于系统在上一时刻所处的状态.通过马尔科夫过程,决定每个输出值的概率,依据产生的观察序列挖掘出潜在的隐藏信息[14].HMM模型λ可以用5个元素来描述,即λ=(S,O,A,B,π),包括2个状态集合和3个概率矩阵.参数设置如下:

(1)隐含状态序列S= {S1,S2,…,Sn};

(2)可观测状态O= {O1,O2,…,On};

(3)隐含状态转移概率矩阵A,其中Aij=P(Si|Sj),1≤i,j≤N;

(4)观察状态转移概率矩阵B,其中Bij=P(Oi|Sj),1≤i≤M,1≤j≤N;

(5)初始状态概率矩阵π= (p1,p2,…,pn).

2 多情景源环境下用户情景序列的提取

HMM模型通常是从单一情景源信息中提取隐含状态序列,对于从多情景源信息中提取用户情景状态序列不太适用[15].传统模糊理论用隶属度表示传感器信息的不确定性,然后利用模糊变换进行数据处理.对于两个模糊集合A′= {a1,a2,…,am}和B′= {b1,b2,…,bn},它们之间的模糊关系定义为这两个集合之间笛卡尔乘积的一个模糊子集,模糊关系可用矩阵表示为

其中,μij表示二元组(ai,bj)隶属于该模糊关系的隶属度,且0≤μij≤1.在应用于多传感器信息融合时,A′看作是传感器集合,B′看作是所有决策的集合,RA′×B′中μij表示单个传感器i推断为决策j的可能性[16].

对于特征集X= {x1,x2,…,xn}中,任一模式类ωj,令μj:X→ [0,1],μi(xj)(i=1,2,…,n)表示用单个特征值来衡量模式在ωj类中的隶属度.则从特征集X={x1,x2,…,xn}的角度来衡量模式在ωj类中总的隶属度就为

其中,μj(xi)∧πj(xi)表示特征xi对于模式为ωj的贡献程度.可以看出模式在ωj类中的总隶属程度是由模式特征集中贡献最大的单个特征决定,而直接忽略其他特征对决策的影响.

移动环境中,多情景源下获得的传感器信息具有离散性,且它们之间并没有直接关系,需要对用户在多情景源下不同传感器获得的数据信息进行融合处理.文中提出一种基于多传感器同时为对象ωk推断为决策j的可能性的方法.对于多情景源下的传感器信息,用RC×D表示传感器C通过获得的所有信息产生所有决策D的集合,RC′×D表示为另一个传感器C′通过获得的所有信息产生所有决策D的集合.根据传统模糊理论将C和C′做笛卡尔乘积C×C′,则RCC′×D表示两个传感器通过将获得的信息共同作用后产生所有决策D的可能性.

RCC′×D就是两个传感器同时对D作用产生的模糊集,可将其看作HMM模型里对应的的状态转移集R,对应的状态转移概率矩阵A.在t时刻,HMM模型在隐含状态为Si和输出观察序列为O={O1,O2,…,OT}下的最大概率记作δt(i),隐含状态序列的路径记作ψt(j),记录该路径上状态Si的前一个状态.多情景源用户情景数据序列提取方法如下:

HMM 模型表示为:λ= (S,O,A,B,π)

用户情景数据序列表示为:Q= {q1,q2,…,qT}

用户情景数据序列提取方法参数如下:

S为表示隐含状态序列,记作S= {S1,S2,…,Sn};

O为表示观察状态序列,记作O= {O1,O2,…,On};

A为表示隐含状态转移概率矩阵,记作Aij=P(Si|Sj),1≤i,j≤N;

B为表示观察状态转移概率矩阵,记作Bti=P(Ot|Si),1≤t≤T,1≤i≤N;

π为表示初始状态概率矩阵,记作π= (p1,p2,…,pn).

输入:隐含状态转移概率矩阵A,观察状态转移概率矩阵B,初始状态集合list,count=1,发生概率最大的隐含状态序号max-node,隐含状态发生最大的概率max-v;

输出:多情景源用户隐含状态序列及对应的概率值.

算法描述:

result[0][i]=p1*b[i][j]//初始化,根据初始状态序列中首个状态发生概率,计算出对应的所有可能的隐含状态的概率

for(i=1;i≤n;i++)

{for(j=0;j≤n;j++)

{tmp=result[i-1][0]*a[0][j]*b[j][list[count]]//根据初始状态提取出的首个隐含状态及概率,进行归纳计算,提取出初始状态序列中剩余所有可能的隐含状态

for(k=1;k≤n;k++)

{tmpcpr=result[i-1][k]*a[k][j]*b[j][list[count]]//以此类推,计算出所有隐含状态可能出现的概率

if(tmpcpr>tmp)

max-v=result[i][k];

max-node=k;//标记出最有可能发生的隐含状态序号及发生概率

count+=1;{//比较每个观察状态对应的所有隐含状态发生的概率}

printf("%d%d%f\n",i+1,j+1,result[i][j])}}};

printf("Pmax=%f\n",max-v);//输出隐含状态概率矩阵、隐含状态的最大概率

for(k=n;k>1;k--)

{printf("step%d:%d\n",k,max[k][max-node]+1);

max-node=max[k][max-node];}//倒序输出初始状态序列对应的最大概率隐含状态序列

通过反复利用HMM模型,并有效结合改进后的方法即可从多源信息中提取到更多有价值的信息.在移动环境中,传感器获取的信息是离散的、大量的,并且它们之间没有直接的关联.通过对来自不同传感器的数据信息进行分析与综合,对被测对象产生统一的最佳估计,这样就可以使综合信息在准确性、可靠性及完备性等方面较其中任何单个传感器有明显提高.由于传感器所提供的数据信息有一定的模糊性,因此多情景源数据融合的过程实际上是一种非确定性推理与决策的过程.

3 实验分析

实验在移动环境下,通过用户的移动智能传感器,实时获取用户体温、天气状况、用户位置等信息.设置实验参数:初始化用户体温状态序列O1={低烧,高烧,正常},天气状态序列O2={阴天,雨雪,晴天}.隐含状态序列:身体隐含状态集合S1={健康,亚健康,疾病},情绪隐含状态集合S2={高兴,伤心,无聊},推荐情景集合S3={看书,打球,做实验}.初始状态转移概率矩阵π1,π2,π3和π4,隐含状态转移概率矩阵A1,A2和A3,观测状态转移概率矩阵B1,B2,B3和B4.

实验表明,移动环境下对用户多情景源数据进行融合,将多情景源用户情景数据序列进行笛卡儿乘积形成一个综合的观测情景状态序列,并多次迭代使用HMM模型,提取出移动环境下隐含的多情景源用户的情景状态序列.通过表1比较不同传感器提取的情景序列结果可知,当用户身体健康处于高烧状态且天气状态为雨雪时,经多情景源信息融合方法提取的结果较单一的传感器提取的情景序列结果更具有实际意义,有效地为移动用户在多情景源中提供情景状态序列信息,并用于未来智能家居、智能汽车、智能商店等研究领域,对移动用户进行个性化情景服务推荐.

表1 不同传感器提取的情景序列对比Table 1 Comparison of context sequence extracted by differext extracted

4 结束语

在移动智能生活中,从用户大量信息中提取有价值的信息为移动用户提供情景序列服务,已逐渐成为一种趋势.针对从不同传感器获取到的用户情景数据序列信息,文中运用笛卡尔乘积将多传感器信息数据融合,并结合HMM模型提取更多有价值的信息用于用户推荐服务.随着移动互联智能终端的发展,用户的实时移动信息急剧增多,将多情景源信息高效融合,为用户推荐更满意的个性化服务仍需进一步研究.

[1] BRUCKNER D,VELIK R.Behavior learning in dwelling environments with hidden Markov models[J].IEEE Trans on Industrial Electronics,2010,57(11):3653-3660.

[2] ATHANASOPOULOU E,LI Lingxi,HADJICOSTIS C N.Maximum likelihood failure diagnosis in finite state machines under unreliable observations[J].IEEE Trans on Automatic Control,2010,55(3):579-593.

[3] XIE Yi,HU Jiankun,XIANG Yang.Modeling oscillation behavior of network traffic by nested hidden markov Model with variable state-duration[J].IEEE Trans on Parallel and Distributed Systems,2013,24(9):1807-1817.

[4] 于洪,李转运.基于遗忘曲线的协同过滤推荐算法[J].南京大学学报,2010,46(5):520-527.YU Hong,LI Zhuanyun.A collaborative filtering recommendation algorithm based on forgetting curve[J].Journal of Nanjing University,2010,46(5):520-527.

[5] 冯勇,李军平,徐红艳,等.基于社会网络分析的协同过滤推荐方法的改进[J].计算机应用,2013,33(3):841-844.FENG Yong,LI Junping,XU Hongyan,et al.Collaborative recommendation method improvement based on social network analysis[J].Journal of Computer Applications,2013,33(3):841-844.

[6] 贾大文,曾承,彭智勇,等.一种基于用户偏好自动分类的社会媒体共享和推荐方法[J].计算机学报,2012,35(11):2381-2391.JIA Dawen,ZENG Cheng,PENG Zhiyong,et al.A user preference based automatic potential group generation method for social media sharing and recommendation[J].Chinese Journal of Computers,2012,35(11):2381-2391.

[7] 郝杰.大规模多用户 MIMO系统导频波束形成预编码算法及仿真[J].西安工业大学学报,2015,35(6):506-510.HAO Jie.Pilots beamforming for massive MIMO system[J].Journal of Xi′an Technological University,2015,35(6):506-510.

[8] 孙冰怡,吕巍,李文洋,等.基于智能手机传感器和SC-HMM算法的行为识别[J].吉林大学学报:理学版,2013,51(6):1128-1132.SUN Bingyi,LYU Wei,LI Wenyang,et al.Activity recognition based on smart phone sensors and SC-HMM algorithm[J].Journal of Jilin University:Science Edition,2013,51(6):1128-1132.

[9] GU Tao,WANG Liang,WU Zhanqing.A pattern mining approach to sensor-based human activity recognition[J].IEEE Transactions on Knowledge and Data Engineering,2011(9):1359-1372.

[10] 张亚明,刘海鸥.面向云环境的移动信息服务情景化协同过滤推荐[J].情报学报,2014,33(5):508-519.ZHANG Yaming,LIU Haiou.A contextualized collaborative filtering recommendation model for mobile information service in cloud environment[J].Journal of the China Society for Scientific and Technical Information,2014,33(5):508-519.

[11] 许道宝,陈志平,于冠,等.基于 MGARCH 模型的情景树生成算法[J].工程数学学报,2014(3):435-453.XU Daobao,CHEN Zhiping,YU Guan,et al.Scenario tree generation algorithms under MGARCH models[J].Chinese Journal of Engineering Mathematics,2014(3):435-453.

[12] 孔金生,李文艺.基于模糊集合的证据理论信息融合方法[J].计算机工程与应用,2008,44(20):152-154.KONG Jinsheng,LI Wenyi.Evidence theory information fusion method based on fuzzy set[J].Computer Engineering and Applications,2008,44(20):152-154.

[13] JOHANSSON M,OLOFSSON T.Bayesian model selection for Markov,hidden Markov,and multinomial models[J].IEEE Signal Processing Society,2007,14(2):129-132.

[14] AWD M A,KHALIL I.Prediction of user′s web-browsingn behavior:Application of Markov model[J].IEEE Systems,Man,and Cybernetics Society,2012,42(4):1083-1142.

[15] 宋玉琴,朱紫娟,姬引飞.多传感器信息融合的智能故障诊断[J].西安工程大学学报,2014,28(5):568-573.SONG Yuqin,ZHU Zijuan,JI Yinfei.Intelligent fault diagnosis strategy of multi-sensor data fusion[J].Journal of Xi′an Polytechnic University,2014,28(5):568-573.

[16] PEDRYCZ W,HIROTA K,SESSA S.A decomposition of fuzzy relations[J].IEEE Systems,Man,and Cybernetics Society,2001,31(4):657-663.

猜你喜欢

情景概率矩阵
情景交际
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
石化企业情景构建的应用
楼梯间 要小心
初等行变换与初等列变换并用求逆矩阵
矩阵
矩阵