用户对移动网络服务偏好学习技术综述
2013-10-26孟祥武史艳翠王立才张玉洁
孟祥武,史艳翠,王立才,张玉洁
(1.北京邮电大学 智能通信软件与多媒体北京市重点实验室;2.北京邮电大学 计算机学院,北京 100876)
1 引言
随着“三网融合”和物联网技术与应用的飞速发展,移动通信网络在与传统互联网逐渐融合的过程中,对传统互联网信息服务进行了延伸,可以为移动用户提供比传统通信业务更加丰富多彩的移动网络服务。与此同时,由于智能移动设备、传感器和射频识别的日益普及,信息资源的获取和推送可以发生在“任何时间、任何地点、以任何方式”,为移动用户提供无处不在的移动网络服务已经成为可能[1]。然而,随着移动网络服务的日益涌现及其广泛应用,移动网络服务类型和信息内容的增长将逐渐超出人们所能接受的范围,加之移动设备的界面显示、终端处理、输入输出等能力有限,将导致严重的“移动信息过载”问题[2],为移动用户带来极为沉重的信息负担,移动网络服务及其运营资源利用率也将受到严重影响。
现在与未来通信服务研究的目标是面向复杂、融合、协作的网络环境和泛在的移动网络服务提供环境,不断发现和满足移动网络用户的个性化需求及其变化,为其提供实时、准确的个性化服务[3]。用户偏好是提供个性化服务的关键所在,为了确保最终提供的移动网络服务能真正满足移动用户的需求,获取实时准确的移动用户偏好已成为移动网络服务研究领域的关键问题之一。
目前,国内外尚未有详细而全面介绍移动用户偏好学习技术研究成果和发展趋势的综述论文。鉴于移动用户偏好学习技术的重要学术研究意义和实用价值,笔者通过跟踪研究,总结现阶段该领域的研究成果、存在的问题,并对发展趋势进行展望。
一个完整的移动用户偏好学习过程包括数据收集、移动用户偏好表示、移动用户偏好学习以及移动用户偏好评价4部分,因此本文安排如下:第1节主要介绍移动用户偏好的背景和意义;第2节介绍移动用户偏好学习所需数据以及现有获取移动数据集的方法;第3节介绍移动用户偏好的表示方法;第4节介绍移动用户偏好的学习方法,包括获取技术以及自适应更新方法;第5节介绍移动用户偏好的评价方法;第6节对移动网络服务中用户偏好学习技术研究领域有待深入研究的难点和发展趋势进行展望;第7节为结束语。这样的划分可以使相关研究人员明确自己的研究是处于移动用户偏好学习的哪个过程。其中,移动用户偏好表示、移动用户偏好学习和移动用户偏好评价是通过阅读文献,总结现有的常用方法。
2 移动网络服务中移动用户偏好学习的相关数据
随着3G网络的普及以及智能移动手机功能的不断完善,移动用户不仅可以通过语音、短信、飞信等方式进行通信,而且手机还提供了拍摄、视频录制、音乐播放、网页浏览、下载应用软件、GPS(global position system)定位等功能[1,4]。因此,可以根据用户自身信息、用户使用的移动网络服务(包括使用次数和频率)以及相应的上下文信息,例如时间、地点、周围人员等[4~6]学习移动用户偏好。
2.1 移动用户偏好相关数据采集
1) 移动用户信息
移动用户的人口统计学数据(如年龄、职业、收入、性别等)是学习移动网络服务中移动用户偏好的主要数据来源之一[7~9]。这些信息通常由移动用户入网注册时填写,也可以根据一些机器学习或者数据挖掘技术推理获取(如可以在移动用户授权许可范围内根据身份证信息获取其籍贯信息、通过移动用户购买行为预测其收入信息、通过移动社交化网络挖掘移动用户的工作/教育背景等)。它们从概貌层面对移动用户进行刻画,相比传统互联网用户信息来讲,具有明确的移动用户标识,更加真实可靠。此外,还可以通过某些方式获取移动用户的其他信息,这对于特定的移动网络服务来说是十分重要的,例如通过GPS或基站定位系统获取移动用户的地理位置信息或者移动用户轨迹,有利于为移动用户提供基于位置的服务,也有利于各种移动网络服务提供商提供地理信息系统方面的服务[10~12]。
2) 移动用户使用移动网络服务的行为信息
移动用户使用的移动网络服务包括2部分:基本业务和增值服务[13]。基本业务主要是指通过语音方式进行的交互行为。移动网络中用户的联系人一般是家人、朋友、同学、同事等。通过用户的通话行为以及时间和位置上下文信息可以推导出移动用户之间的社会关系[14~16]。分析通信行为构建的移动社会化网络,对学习移动用户偏好、提供移动社交化网络类服务来讲十分重要。文献[17]通过分析移动电话数据获取移动用户之间关系的动态变化。移动用户使用增值服务的行为主要是指短信、彩信、彩铃、在线浏览、下载游戏、电子书/音乐/电影等多媒体信息、应用软件以及收发邮件等[5,13]。这些行为信息主要通过移动用户行为日志直接或者间接获取,并利用移动用户行为挖掘方法来处理。
3) 移动上下文信息及上下文用户行为信息
与传统互联网相比,移动网络服务中用户偏好受周围上下文因素的影响更明显。例如,有些用户在工作时间喜欢使用语音方式进行通信,在公共场所喜欢用文本方式进行通信,如邮件、短信等[5];有些用户喜欢在乘坐地铁时通过移动终端浏览网页、看电子书、听音乐、看电影、玩游戏,有些用户喜欢在晚上使用移动微博服务等。移动网络中涉及的上下文包括时间、位置、周围人员、社会关系以及用户情绪[5,18~22]等信息,这些信息可以通过传感器或者安装在移动终端上的软件直接或者间接推理获取。由于移动网络中用户行为很大程度上受上下文影响,记录上下文相关的移动用户行为对移动用户偏好的学习十分重要。
2.2 移动网络服务中典型数据集
目前包含用户使用移动网络服务以及相应上下文的公开数据集比较少,因此可以采用以下3种数据集学习移动用户偏好。
1) 真实移动数据集
目前,真实的移动数据集主要是通过志愿者或者移动运营商获取[2,5,14~17],但这些数据集出于对用户隐私的保护公开的比较少。MIT Reality Mining[14]数据集是目前公开的包含上下文信息和用户使用移动网络服务行为的一个数据集。该数据集是麻省理工学院多媒体实验室在 2004年收集的用于社会感知计算的数据集,包括94个用户从2004年9月到2005年6月共9个月的通信行为、周围人员信息、位置信息、手机状态、用户使用的服务以及相应的时间信息。但该数据集只有 94个移动用户的行为信息,而且移动用户被局限在特定区域,因此研究的结果不具有普遍性。Nokia研究中心[15]对MIT数据集进行了扩展,增加了志愿者的人数以及使用时间,但该数据集考虑到用户隐私问题目前还没有公开。SUMATRA数据集[23]主要用于研究移动用户行为轨迹和用户社区挖掘计算,包含180多万条移动用户的通话行为和位置信息。目前,由于成本问题对于小型实验室来说,采集丰富的包含上下文信息关联移动用户行为的数据集仍然比较困难。
2) 半模拟移动数据集
上述真实数据集是针对特定的用户偏好学习采集的,所采集的数据量比较少或者不全面。当通过这些数据集学习移动用户偏好时,只能得到用户对部分通信服务或者增值服务的偏好。一个比较常见的数据集构建方法是:在原有真实数据集基础上,按照预先设定的合理规则增加移动用户数量、使用通信服务、增值服务等的行为信息[24~26]。例如,可以对MIT数据集进行扩展,通过分析MIT数据以及调研学习的合理规则可以将 MIT数据集扩展为包括几百甚至几千个移动用户行为的数据集。
3) 仿真移动数据集
仿真移动数据集主要是根据调研得到的各种规则以及实验需要仿真生成的数据[6,27~29]。文献[27]中通过仿真数据获取移动用户偏好,并将其应用在移动服务选择机制中。仿真数据集的优点是可以针对具体问题生成需要的数据集,与获取真实的数据集相比,仿真数据集操作简单、获取成本低。但仿真数据集对移动用户的分布以及使用行为是按照设定的规则产生的,因此存在局限性[30]。但目前由于公开数据集比较少,在参考已公开的数据集以及相关调查研究的基础上生成仿真数据集是小型实验室进行研究的一种可行方法。
3 移动网络服务中移动用户偏好表示方法
与传统互联网相比,在移动网络中移动用户偏好学习将面临动态多样的移动网络环境和泛在的移动网络服务提供环境,而且受上下文因素的影响更加明显。为了提高移动用户偏好获取的准确性,文献[31]将上下文引入到用户偏好建模中,文献[30]对上下文感知推荐系统进行了综述性分析,其中涉及上下文用户偏好提取、基于上下文感知的移动网络服务推荐等。将上下文信息引入移动用户偏好学习后,其表示方法需要进行相应的扩展以适应移动网络对移动用户偏好学习的要求。通过阅读文献总结,本文主要介绍常用的几种表示方法。
3.1 基于向量空间模型的表示方法
向量空间模型(VSM, vector space model)是常用的移动用户偏好表示方法。该方法将移动用户偏好表示为n维特征向量{(t1,w1),(t2,w2),…,(tn,wn)},向量的每一维由一个关键词及其权重组成,权重表示移动用户对某个移动网络服务感兴趣的程度。当移动用户偏好不受上下文影响时,可以直接采用该方法进行表示。文献[32]通过向量空间模型表示短消息,并将其应用在短信检索中。当移动用户偏好受上下文影响时,需要从影响移动用户偏好的各种关联因素角度出发对表示方法进行扩展,构建一个包含用户、移动网络服务、上下文信息、用户偏好信息的多元组[5,6,10,18]。
基于向量空间模型的表示方法具有直观、简单、扩展性良好,能反映不同概念在用户偏好中的重要程度,便于展开数学计算的优点,可应用在支持向量机[33]、贝叶斯分类[20]方法中。但这种表示方法较少考虑影响用户偏好获取的各种因素之间存在的层次关系,在应用时可能出现偏差。
3.2 基于评分矩阵的表示方法
用户—项目评分矩阵是一个二维矩阵,矩阵中的元素表示用户对给定项目的量化偏好/评分。当移动用户偏好不受上下文影响时,可以直接采用用户—项目评分矩阵进行表示[2,25]。当移动用户偏好受上下文影响时,矩阵需要扩展为用户—项目—上下文多维度评分矩阵[27]。
该表示方法简单易懂,主要应用在协同过滤计算方法中。缺点是当引入上下文后,矩阵由原来的二维矩阵扩展为多维矩阵,加剧了矩阵的稀疏性,降低了移动用户偏好获取的精确度。所以采用该表示方法获取移动用户偏好时,需要解决数据的稀疏性问题。文献[27]通过引入移动用户之间的信任度来缓解矩阵的稀疏性问题。
3.3 基于神经网络的表示方法
基于神经网络的表示方法用网络状态表示用户偏好。网络状态由网络输入状态、网络输出状态以及输入与输出之间的连接状态组成。当移动用户偏好不受上下文影响时,可以直接用该方法表示;当移动用户偏好受上下文影响时,需要对输入状态进行扩展[12,19,34]。文献[34]中通过将上下文信息添加到输入向量对原有表示方法进行扩展。
然而,基于神经网络的表示方法依赖于用户偏好学习过程中所采用的神经网络类别和算法,其适用范围较窄且表示不易被理解。
3.4 基于本体的表示方法
本体由实体、属性、关系和公理组成,可以表示丰富的概念和实体之间的关系,可以在特定域内对数据信息进行一致性理解。研究人员考虑到本体在概念、领域知识表示方面的诸多优点,通过建立本体域,以期比较丰富、完整地表示移动用户偏好,并进一步精确地获取移动用户偏好[35]。上下文是在对数据信息一致理解的基础上,考虑不同使用者、不同应用场景所导致的对数据及其数值上的理解差异,文献[36]将本体和上下文进行集成化,并应用在决策信息系统中。文献[37]将上下文引入到本体中来表示移动用户偏好,并应用在移动网络服务选择中。
引入本体来表示用户偏好的最大好处在于能够实现知识的重用和共享。但是这种表示方法的缺点是:本体的构建成本太高。本体的设计在很大程度上依赖于研究人员的知识和经验,特别是当定义域很大时,本体设计的有效性更加难以保证。
4 移动网络服务中移动用户偏好学习技术
4.1 常用的移动用户偏好获取技术
1) 基于贝叶斯分类器的移动用户偏好获取技术
贝叶斯分类器是一种用于分类的概率方法。该方法首先计算用户对给定项目属于某个类的概率,然后根据概率将项目进行分类。其优点是需要较小的内存空间,响应时间比较短。当移动用户偏好不受上下文影响时可以直接采用基于贝叶斯分类器的用户偏好获取技术得到移动用户偏好;当移动用户偏好受上下文影响时,需要对其进行改进。文献[20]在判定移动用户偏好类别时,将上下文作为一个条件添加到条件概率计算中,以提高移动用户偏好获取的精确度。文献[38]将上下文、服务内容和用户偏好作为显著变量引入到贝叶斯网络模型构建中。
2) 基于神经网络的移动用户偏好获取技术
神经网络具有自学习和自适应能力,能够通过调整权值适应环境的变化。当移动用户偏好不受上下文影响时,可以直接采用该技术获取移动用户偏好;当移动用户偏好受上下文影响时,需要对输入向量进行扩展[12,19,34]。文献[12]将时间、位置等上下文信息引入到人工神经网络的输入向量中。文献[19]将设备信息、用户信息和服务信息作为神经网络的输入信息。
3) 基于关联规则的移动用户偏好获取技术
关联规则通过在数据集中找出具有用户给定的最小支持度和最小置信度的项目来产生关联规则。由于移动终端输入能力的限制,移动用户反馈的信息比较少,鉴于关联规则方法在获取和推理项目关联性方面的优势,有些研究人员将其引入移动用户偏好获取过程以获取一些新颖性的用户偏好。Apriori算法是一种经典的关联规则方法。文献[13]通过 Apriori算法挖掘移动网络中增值业务之间的关联性以获取移动用户对移动增值业务的偏好。当移动用户偏好受上下文影响时,需要对关联规则进行扩展。文献[28]采用Apriori算法挖掘在上下文约束下移动用户偏好之间的关联性,在挖掘关联规则时把相应的上下文看作频繁项来处理。
4) 基于决策树的移动用户偏好获取技术
决策树是以实例为基础的归纳学习算法,其优点是建模速度快。文献[39]中为了降低移动用户的流失,通过C5.0决策树算法挖掘移动用户对通信服务的偏好信息。当移动用户偏好受上下影响时,需要将上下文添加到决策树中。由于移动网络服务对上下文比较敏感,而上下文类型和属性之间的关系可以利用层次化树来表示,使得决策树模型较适合用于与上下文相关的移动用户偏好获取中。文献[11]中采用决策树算法获取移动用户对多媒体信息的偏好,在构建决策树时,将上下文信息当作属性作为树的节点,在进行分类时,从根节点比较相应的上下文以及移动用户偏好的其他属性。
5) 基于支持向量机的移动用户偏好获取技术
支持向量机(SVM, support vector machine)可以解决小样本、非线性和高维度等问题,在分类方面可以获得比较好的精确度。文献[33]提出了上下文支持向量机(C-SVM),通过将上下文信息添加到支持向量的特征向量中来实现对支持向量机的扩展。但支持向量机的训练时间比较长,因此Suykens等[40]人修改了SVM的损失函数和约束条件,使训练转换为线性问题,由此构建的最小二乘支持向量机(LSSVM, least squares support vector machine)不仅保持了标准SVM的泛化能力,而且可直接用于多分类问题。借鉴文献[33]的方法,文献[41]对LSSVM进行了扩展,将上下文添加到LSSVM中。目前,在移动网络中基于上下文最小二乘支持向量机(C-LSSVM)的移动用户偏好获取技术的研究比较少,鉴于其在分类精确度和响应时间方面的优势,在今后的研究中,可以尝试通过C-LSSVM技术来获取移动用户偏好。
6) 基于本体的移动用户偏好获取技术
除了在概念表示方面的优点,本体还具有很强的推理计算能力,并被广泛应用于移动用户偏好获取中。在移动网络服务环境下,大多数移动用户偏好获取技术没有考虑移动用户历史行为的语义信息,为了解决这个问题,研究人员对基于本体的移动用户偏好获取技术进行了广泛研究[35~37]。与传统互联网相比,为了精确地定位移动用户偏好,移动网络中在构建本体库时,除了服务本体库、用户本体库外,还增加了上下文本体库。其中用户、服务以及上下文之间的联系通过推导规则产生。文献[37]提出了一个基于本体的框架用来发现大多数与用户偏好以及设备能力相关的服务,文中采用了W3C发布的本体,其丰富的数据信息可以完成个性化移动服务的发现以及自适应学习等。
4.2 移动用户偏好自适应学习技术
在移动网络中,由于移动用户和移动网络服务数量比较大,因此采用4.1节提出的技术重新获取移动用户偏好的响应时间会随时间的迁移,越来越大。借鉴文献[42]中的方法,可以将移动用户行为数据存储在不同的数据库中,在修正时只需对临时移动用户行为数据库中的移动用户偏好进行学习。移动用户偏好自适应学习技术主要包括显性自适应学习技术和隐性自适应学习技术2种。
4.2.1 移动用户偏好的显性自适应学习
显性自适应学习根据移动用户的显性反馈信息更新移动用户偏好,例如移动用户对移动网络服务的评分[2,26,28,43,44]。但在移动网络中,由于移动终端输入能力的限制,显性的反馈信息比较少,因此更新后得到的移动用户偏好的准确性比较低。
4.2.2 移动用户偏好的隐性自适应学习
隐性自适应学习通过机器学习对移动用户的行为(使用服务时长、频率、上下文等)进行学习来更新移动用户偏好[26,45]。随时间迁移,移动用户偏好只有部分发生变化,因此在学习时只需对发生变化的移动用户偏好进行学习。为了获取实时、精确、无冲突的移动用户偏好,需要解决3个方面的问题。
1) 检测移动用户行为的变化
在移动网络中,由于移动用户偏好受上下文影响比较明显,因此,在判断移动用户行为是否发生变化时,首先需要确定移动用户偏好受哪些上下文影响。文献[46]根据上下文约束下用户使用服务的波动率来确定用户行为受哪些上下文影响。在确定了上下文信息后,可以根据移动用户对服务使用的相对变化量来判断移动用户对该服务的偏好是否发生变化。
2) 修正上下文约束下的移动用户偏好
当移动用户偏好发生变化时,需要对其进行修正。当对移动用户偏好进行修正时,可以根据 4.1节中介绍的偏好获取技术对发生变化的移动用户偏好进行重新学习
3) 解决上下文移动用户偏好冲突
修正后的移动用户偏好可能与原有移动用户偏好发生冲突,为了解决冲突问题,可以借鉴文献[43]的方法,为每个移动用户偏好设置一个可信度,当移动用户偏好不发生变化时,置信度增加,否则减小。当置信度为0时,将相应的移动用户偏好删除;对于新学习得到的移动用户偏好赋予默认的初始值。当新学习得到的移动用户偏好和原有移动用户偏好发生冲突时,比较其可信度,选择其中可信度最大的偏好作为移动用户偏好。
4.3 移动用户偏好的应用
根据本节中提到的移动用户偏好学习技术,移动用户偏好学习能够回答类似于下面的问题,例如:1)根据用户的通话习惯,可以获取移动用户对移动套餐的偏好;2)根据用户当前的位置信息,可以预测移动用户当前需要的移动网络服务[2,10];3)根据与用户使用网络服务相似的其他用户(即近似邻居)的偏好,可以预测移动用户对未使用过的移动网络服务的偏好[10,25,26];4)根据移动用户的轨迹以及移动用户使用移动网络服务的历史行为,可以预测出用户在下一时刻可能使用的移动网络服务[47,48];5)根据用户的好友关系和位置信息,可以挖掘用户想知道附近有哪些好友的偏好[49,50];6)根据用户使用移动手机的行为,可以获取移动用户对移动终端软硬件的偏好,例如拍照、听音乐、看电子书、闹钟等[5]。
5 移动用户偏好的评价指标
为了确保移动用户偏好的准确性,需要对学习得到的移动用户偏好进行评价,目前通过实验的方法,根据平均绝对误差(MAE, mean absolute error)、准确率、召回率、F指标等来评价学习得到的移动用户偏好。
1) 平均绝对误差
MAE是评价学习得到的移动用户偏好的常用指标,用来度量学习得到的移动用户偏好值与实际的移动用户偏好值的平均绝对误差[24,27,51,52],其计算公式如下:
其中,ui表示实际的移动用户偏好值,表示学习得到的移动用户偏好值。
2) 准确率和召回率
准确率和召回率是评价信息获取系统常用的评价指标[6,22,25,52]。准确率的计算公式可表示为
其中,N1表示学习得到的移动用户偏好正确的数量,N2表示学习得到的移动用户偏好的总量。召回率表示学习得到的移动用户偏好正确的数量与系统中实际的移动用户偏好的数量的比值,计算公式为
其中,N3表示系统中实际的移动用户偏好的数量。
3) F指标
由于召回率经常和准确率一起使用,为了能同时准确观察召回率和准确率,Pazzani M[43]等提出了F指标,其计算公式为
文献[25,52]中使用F指标来评价获取的移动用户偏好,由于F指标将准确率和召回率综合考虑,因此能更好地衡量系统的性能。
4) 响应时间
本文的响应时间不包括收集数据、数据传输、移动用户偏好传输等所花费的时间。这里的响应时间主要是指学习移动用户偏好所花费的时间。由于移动网络的特点,需要及时地为移动用户提供满足其个性化需求的移动网络服务[10,13,22,28,31,32]。例如,当移动用户在电影院附近时,移动用户想知道新上映的电影信息,如果移动用户没有及时收到信息,则可能选择其他娱乐活动,这对服务提供商来说是不利的。因此需要移动用户偏好学习的响应时间要比较小。
5) 其他评价指标
上述的评价方法主要是通过客观的计算对学习得到的移动用户偏好的准确度进行评价。但一个好的移动用户偏好学习技术不仅要有较高的准确度,还需要好的移动用户满意度。用户对系统的满意度不仅表现在系统获取的偏好信息准确度高,还表现在新鲜性、意外性、多样性、用户对系统的信任度等方面[52]。为了提高移动用户对偏好学习系统的信任度,可以给出获取偏好的方法或原因。Amazon在向用户推荐书籍时会给出为什么推荐这本书,例如用户买过同一个作者的书,用户的好友买过这本书等。移动用户偏好学习系统在给出移动用户偏好时也需要给出相应的理由。但关于信任度、新鲜性以及意外性的研究比较少,没有定量的计算标准。目前,移动用户满意度主要通过用户对偏好学习系统的显性评分得到。
文献[35]中将客观评价与主观评价结合起来使用。文献[10]则通过志愿者的主观评价来判断系统提供的服务是否满足移动用户的需求,测试时要求移动用户对学习得到的每项移动用户偏好进行满意度评价,通过最终的满意度来判断系统是否能很好地满足移动用户需求。
6 移动网络服务中移动用户偏好学习技术研究发展的难点与热点
目前,移动用户偏好学习技术已经在学术界得到了广泛的研究。随着 3G、4G的普及以及移动终端设备的改进,移动用户可以更方便地获取各种信息,因此移动网络服务中的移动用户偏好学习显得越来越重要。尽管已经存在很多学习移动用户偏好的技术,但移动用户偏好学习仍有一些值得研究和探讨的领域,归纳起来大概有以下几个研究难点。
1) 数据集的获取。目前公开的数据集比较少,研究人员使用的真实数据集是志愿者或移动运营商提供的。通过志愿者获取数据集的成本比较大,例如智能手机的成本。移动运营商一般只给与其合作的实验室提供数据集。因此希望本领域的研究人员能够公开已获取的数据集以便为更多的研究人员提供研究的依据。
2) 移动用户偏好学习的形式化分析和验证。目前关于移动用户偏好学习的合理性主要是通过实验方法进行验证的。偏好获取技术受参数、阈值、数据集等的影响,而实验时参数、阈值的选择方法主要根据经验值、多次实验等方法选取,因此得出的实验结果的说服力比较弱。为了提高移动用户偏好学习技术合理性验证的说服力,需要对选取的用户偏好获取技术、相关参数、阈值给出合理的形式化分析。移动用户偏好获取技术的合理性主要包括时间复杂度和准确性分析;参数、阈值的合理性分析主要是指给出选择参数或阈值时所遵循的定理、准则或实际需要。
3) 隐私与安全问题。隐私问题一直是用户最敏感的话题。现有的方法是通过分析移动用户行为来学习移动用户偏好,在学习的过程中可能涉及移动用户自身的信息,例如移动用户的年龄、性别、周围人员以及活动等。研究如何精确学习移动用户偏好的同时又能对移动用户信息进行保密也是进一步研究的方向。
研究热点归纳起来有以下几个。
1) 适合移动网络的移动用户偏好获取技术。目前关于移动用户偏好获取技术的方法主要是一些分类算法,这些方法在互联网中可以获取令人满意的结果。但由于移动网络的实时性以及移动终端输入输出能力有限,对用户偏好获取技术提出了更高的要求,因此需要对原有方法进行改进或寻找更适合移动网络需要的移动用户偏好获取技术。
2) 对学习得到的移动用户偏好的评价。现在对学习得到的移动用户偏好的评价主要是针对其获取的准确性进行评价。为了真正满足移动用户的需求,还可以考虑根据移动用户的满意度、移动用户偏好的新鲜性、覆盖率、多样性、意外性等更多的角度去评价学习得到的移动用户偏好。
3) 更细致地挖掘上下文之间的关联。移动用户周围的物理上下文、社会上下文之间有着密切的关系,现有的移动用户偏好获取技术将各种上下文假设为独立或者简化了上下文之间的关系。如何更精确地确定各上下文之间的关系也是进一步研究的方向。
7 结束语
移动网络以及移动终端软硬件的发展,可以使移动用户更便捷地访问信息,使用移动网络服务。但同时也为移动用户偏好学习带来了新的挑战。本文将移动用户偏好学习技术的研究进展和趋势进行归纳、总结和预测,并介绍给信息科学工作者,希望促进此领域及其相关研究在我国的发展。
[1]KWOK R.Phoning in data[J].Nature, 2009, 458(7241):959-961.
[2]CHIU P H, KAO G Y M, LO C C.Personalized blog content recommender system for mobile phone users[J].Int’l Journal of Human-Computer Studies, 2010, 68(8):496-507.
[3]TUZHILIN A.Personalization:the State of the Art and Future Directions[M].Business Computing, Handbooks in Information System,2009.3-44.
[4]杜一, 田丰, 戴国忠等.一种移动环境下的用户模型[J].软件学报,2011, 22(2):120-128.DU Y, TIAN F, DAI G Z, et al.A user model based on mobile environment[J].Journal of Software, 22(2):120-128.
[5]DO T M T, DANIEL G P.By their apps you shall understand them:mining large-scale patterns of mobile phone usage[A].Proc of the 13th Int’l Conf on multimodal interfaces[C].Alicante, Spain, 2011.353-360.
[6]JEMBERE E, ADIGUN M O, XULU S S.Mining context-based user preferences for m-Services applications[A].Proc of the IEEE/WIC/ACM International Conference on Web Intelligence[C].Silicon Valley,USA, 2007.57-763.
[7]SHINTARO O.Exploring gender effects in a mobile advertising context:on the evaluation of trust, attitudes, and recall[J].Sex Roles, 2007,57:897-908.
[8]GOKUL C, JAN B, DANIEL G P.Mining large scale smartphone data for personality studies[J].Personal and Ubiquitous Computing, 2011.1-18.
[9]BRDAR S, ĆULIBRK D, CRNOJEVIĆ V.Demographic attributes prediction on the real-world mobile data[A].The Workshop on Mobile Data Challenge 2012 (by Nokia)[C].Newcastle, UK, 2012.
[10]LI X Y, MI Z C, ZHAN Z M.A location-aware recommender system for mobile shopping environments[A].Proc of the 2nd Int’l Conf on Information Science and Engineering (ICISE)[C].Hangzhou, China,2010.1709-1711.
[11]CHEN N, CHEN A.Integrating context-aware computing in decision support system[J].Lecture Notes in Engineering and Computer Sci-ence, 2010, 2180(1):359-364.
[12]QUSAY H M, EYHAB A M, WANG Z X.Design and implementation of a smart system for personalization and accurate selection of mobile services[J].Requirements Engineering, 2007, 12(4):221-230.
[13]YAO X L, SHU H Y.Study on value-added service in mobile telecom based on association rules[A].Proc of the 10th Int’l Conf on Software Engineering, Artificial Intelligences, Networking and Parallel/ Distributed Computing[C].Dezhou, China, 2009.116-119.
[14]EAGLE N, PENTLAND A, LAZER D.Inferring social network structure using mobile phone data[J].Proc of the National Academy of Sciences (PNAS), 2009, 106(36):15274-15278.
[15]NIKO K, JAN B, OLIVIER D.Towards rich mobile phone datasets:lausanne data collection campaign[A].Proc of the ACM Int Conf on Pervasive Services (ICPS)[C].Berlin, Germany, 2010.
[16]SHI Y C, MENG X W, ZHANG Y J.A trust calculating algorithm based on mobile phone data[A].Proc of the IEEE Global Telecommunications Conference, (GLOBECOM)[C].California, USA, 2012.2036-2041.
[17]CESAR A H, SICKERT C R.The dynamics of a mobile phone network[J].Physica A:Statistical Mechanics and Its Applications, 2008,387(12):3017-3024.
[18]王立才,孟祥武,张玉洁.移动网络服务中基于认知心理学的用户偏好提取方法[J].电子学报, 2011, 39(11):2548-2553.WANG L C, MENG X W, ZHANG Y J.A cognitive psychology-based approach to user preferences elicitation for mobile network services[J].Acta Electronica Sinica, 2011, 39(11):2548-2553.
[19]EYHAB A M, QUSAY H M.A context-aware service discovery and selection mechanism using artificial neural networks[J].Int’l Journal of Intelligent Systems Technologies and Applications, 2009, 6(1):144-156.
[20]TOON D P, TOM D, LUC M.Extending the bayesian classifier to a context-aware recommender system for mobile devices[A].Proc of the 20105th International Conference on Internet and Web Applications and Services [C].Barcelona, 2010.242-247.
[21]MALLIKHARJUNA R N, NAIDU P M M, SEETHARAM P.An intelligent location management approaches in GSM mobile network[J].International Journal of Advanced Research in Artificial Intelligence, 2012, 1(1):30-37.
[22]YAN T X, CHU D, GANESAN D.Fast App launching for mobile devices using predictive user context[A].Proc of the 10th international conference on MobiSys[C].Lake District, UK, 2012.113-126.
[23]LAM D, COX D C, WIDOM J.Teletraffic modeling for personal communications services[J].IEEE Communications Magazine, 1997,53(2):79-87.
[24]KARATZOGLOU A, AMATRIAIN X, BALTRUNAS L.Multiverse recommendation:N-dimensional tensor factorization for contextaware collaborative filtering[A].Proc of the Recsys[C].Barcelona,Spain,2010.79-86.
[25]SU J, YEH H, YU P.Music recommendation using content and context information mining[J].IEEE Intelligent Systems, 2010, 25(1):16-26.
[26]LINAS B.Context-Aware Collaborative Filtering Recommender Systems[D].Italy:Free University of Bozen, 2011.
[27]王玉祥,乔秀全,李晓峰.上下文感知移动社交网络服务选择机制研究[J].计算机学报,2010, 33(11):2126-2135.WANG Y X, QIAO X Q, LI X F.Research on context awareness mobile SNS service selection mechanism[J].Chinese Journal of Computers, 2010, 33(11):2126-2135.
[28]HONG J Y, SUH E H, KIM J Y.Context-aware system for proactive personalized service based on context history[J].ACM:Expert Systems with Applications, 2009, 36(4):7448-7457.
[29]KUO M H, CHEN L C, LIANG C W.Building and evaluating a location-based service recommendation system with a preference adjustment mechanism[J].Expert Systems with Applications, 2009, 36(2):3543-3554.
[30]王立才,孟祥武,张玉洁.上下文感知推荐系统研究[J].软件学报,2012, 23(1):1-20.WANG L C, MENG X W, ZHANG Y J.Context-aware recommender systems:a survey of the state-of-the-art and possible extensions[J].Chinese Journal of Software, 2012, 23(1):1-20.
[31]STEFANIDIS K, PITOURA E, VASSILIADIS P.Adding context to preferences[A].Proc of the IEEE 23rd Int’l Conf on Data Engineering[C].Istanbul, Turkey, 2007.846-855.
[32]WU W, JU Y C, LI X.Paraphrase detection on SMS messages in automobiles[A].Proc of the IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP)[C].Dallas, TX, 2010.5326-5329.
[33]KENTA O, SHINSUKE N, JUN M.Context-aware SVM for context-dependent information recommendation[A].Proc of the Int’l Conf on Mobile Data Management[C].Nara, Japan, 2006.109-112.
[34]GUI F, MALEK A, NAPHTALI R.A contextualized and personalized approach for mobile search[A].Proc of the 2009 International Conference on Advanced Information Networking and Applications Workshops[C].Bradford, 2009.966-971.
[35]GOENKA K, ARPINAR I B, NURAL M.Mobile web search personalization using ontological user profile[A].Proc of the 48th Annual Southeast Regional Conference[C].Oxford:MS, USA, 2010.1-6.
[36]刘栋,孟祥武,陈俊亮.上下文感知系统中的规则生成与匹配算法[J].软件学报, 2009, 20(10):2655-2666.LIU D, MENG X W, CHEN J L.Algorithms for rule generation and matchmaking in context-aware system[J].Journal of Software, 2009,20(10):2655-2666.
[37]NIAZI R, QUSAY H M.An ontology-based framework for discovering mobile services[A].Proc of the 7th Annual Research Conf on Communication Networks and Services, CNSR'09[C].Moncton, NB,Canada, 2009.178-184.
[38]XU J J, LIAO S Y, LI Q D.Combining empirical experimentation and modeling techniques:a design research approach for personalized mobile advertising applications[J].Decision Support Systems, 2007,44(3):710-724.
[39]INDRANIL B, CHEN X.Hybrid models using unsupervised clustering for prediction of customer churn[J].Journal of Organizational Computing and Electronic Commerce, 2009, 19(2):133-151.
[40]SUYKENS J A K, VANDEWALLE J.Least squares support vector machine classifiers[J].Neural Processing Letters,1999.293-300.
[41]史艳翠,孟祥武,张玉洁等.一种上下文移动用户偏好自适应学习方法[J].软件学报,2012,23(11):2533-2549.SHI Y C, MENG X W, ZHANG Y J.Adaptive learning approach of contextual mobile user preferences[J].Journal of Software, 2012,23(10):2533-2549.
[42]SARAH M, ELIZA P, NICK T.Adapting pervasive environments through machine learning and dynamic personalization[A].Proc of the International Symposium on Parallel and Distributed Processing with Applications[C].Sydney, NSW, 2008.395-402.
[43]PAZZANI M, BILLSUS D.Learning and revising user profiles:the identification of interesting web sites[J].Machine Learning, 1997, 27:313-331.
[44]OURDIA B, LYNDA T L, MOHAND B.Dynamically personalizing search results for mobile users[J].Lecture Notes in Computer Science,2009, (5822):99-110.
[45]SARAH M, ELIZABETH P, NICK T.Implicit adaptation of user preferences in pervasive systems[A].2009 Fourth International Conference on Systems[C].Gosier, Guadeloupe, 2009.56-62.
[46]WANG L C, MENG X W, ZHANG Y J.New approaches to mood-based hybrid collaborative filtering[A].ACM CAMRa’10[C].Barcelona, Spain, 2010.28-33.
[47]WANG J J, BHASKAR P.Periodicity based next place prediction[A].The Workshop on Mobile Data Challenge (by Nokia)[C].Newcastle,UK, 2012.
[48]GAO H J, TANG J L, LIU H.Mobile location prediction in spatio-temporal context[A].The Workshop on Mobile Data Challenge (by Nokia)[C].Newcastle, UK, 2012.
[49]SYMEONIDIS P, PAPADIMITRIOU A, MANOLOPOULOS Y.Geo-social recommendations based on incremental tensor reduction and local path traversal[A].Proc of the 3rd ACM SIGSPATIAL International Workshop on Location-Based Social Networks[C].Chicago,Illinois, USA, 2011.89-96.
[50]XU B, CHIN A, WANG H.Using physical context in a mobile social networking application for improving friend recommendations[A].IEEE Int’l Conf on Internet of Things, and Cyber, Physical and Social Computing[C].Dalian, China, 2011.602-609.
[51]SHI Y C, MENG X W, WANG L C.A heuristic approach to identifying the specific household member for a given rating[A].ACM CAMRa’11[C].Chicago, Illinois, USA, 2011.47-52.
[52]刘建国,周涛,郭强.个性化推荐系统评价方法综述[J].复杂系统与复杂性科学,2009, 6(3):1-9.LIU J Q, ZHOU T, GUO Q.Overview of the evaluated algorithms for the personal recommendation systems[J].Complex Systems and Complexity Science, 2009, 6(3):1-9.