基于用户兴趣挖掘技术的移动校园信息推送系统研究与探索
2014-12-13黄蓉
黄蓉
摘 要:本文主要从分析现有的校园信息发布平台出发,围绕个性化主动信息推送这一目标,研究及探索一种基于移动网络和用户兴趣挖掘技术的校园信息推送系统。针对不同的用户订制个性化的服务策略和功能模式,并通过分析用户信息和浏览行为以及用户信息订阅来构建用户兴趣模型,主动将用户可能感兴趣的信息推送给他们,并对推送结果进行反向跟踪,实现信息的“推”技术,以此构建一个全新的校园信息推送服务系统,达到信息的主动投放和精确获取的效果。
关键词:校园信息推送系统;兴趣挖掘;移动终端;Android
中图分类号:TP319 文献标识码:A
1 引言(Introduction)
校园信息发布平台[1]是校园信息化建设的核心内容之一,通常用于发布学校内部各行政机构、院系部门、课程平台、学生社团的相关信息,有利于职能部门工作的开展和信息公布,并能有效促进学校与社会的信息交流。一个全面、快捷、个性化的校园信息平台能让师生实时关注、参与、发布校园信息,如:会议、活动、讲座、展览、比赛、实习、求职等,让师生充分利用好身边的资源,为工作学习带来便利,并根据自己的兴趣和爱好,结交兴趣相投的朋友,使校园生活充实起来,同时能有力提高校区管理和服务水平,提升学校的社会竞争力和知名度。
随着互联网时代的逐步深入,移动互联网蓬勃发展,移动终端设备不断普及,传统的校园信息发布形式已经不能满足当今智慧校园“任何时间、任何地点、任何方式”的信息发布要求,同时,目前校园的信息平台通常只是在Web上将信息内容进行简单的按时间或者分类展示,用户被动浏览的信息不一定与用户兴趣相关,不容易取得用户的共鸣、信任与支持,用户必须能够准确地表达自己的信息需求,才能获得所需的信息,这样势必制约了用户获取信息的兴趣和能力;另一方面,移动设备性能和移动互联网带宽及流量的限制也要求减少无效信息的发送。在此背景下,个性化移动信息推送服务[2]应运而生,和传统“人找信息”的方式不同的是,它提供给用户一种新的服务模式以解决“移动信息爆炸(过载)”[3]的问题。因此,研究并设计一种基于兴趣挖掘技术[4]的移动校园信息推送系统对校园信息化建设都有着重要的意义。
本文主要从分析现有的校园信息发布平台出发,围绕个性化主动信息推送这一目标,构建基于移动网络和用户兴趣挖掘技术的校园信息推送服务系统。智能推送服务系统基于移动终端,方便随时随地访问,并能通过用户信息订阅以及分析用户信息和浏览行为来获得用户的兴趣,主动将这些用户可能感兴趣的信息推送给他们,达到信息的主动投放和精确获取的效果。
2 问题的由来(Origins)
目前,国内校园信息发布、宣传、获取、沟通、共享的各种渠道与平台普遍存在不足,已有的校园信息发布平台一般仅基于Web,虽然Web有其信息量大、不需安装的优点,但会受到时间、地点的限制,获取信息不及时;而使用手机访问院校Web,也有界面呈现不友好、操作不方便等缺点;其他移动通信常用解决方案如SMS、微信,虽然使用简单,但又具有信息量小,功能不能个性化订制,且需依赖服务提供商等局限,不能使用户真正享受到快捷准确的信息服务,不能满足校园信息平台主动投放和精确获取的服务要求。
主动信息获取方式很多,目前应用最广泛的是推送技术[5]。推送技术,最早由PointCast Network公司在1996年提出,推出目的是为了提高计算机网络的信息获取效率。作为一种高效快捷的主动信息获取方法,推送技术是解决信息爆炸问题的有效途径,并为信息服务的智能化、个性化及主动性提供了新的方向。自此,国外各机构就开始研究如何利用推送技术更好地满足用户的个性化信息需求问题,研究基于个性化用户需求的信息分析、筛选和过滤技术,并且开始将Push技术应用于Web信息主动推送服务。Push技术的应用研究涉及个性化产品推荐、信息导览与检索、信息推荐系统、信息共享平台、移动平台推荐服务等众多领域。
国内对Push技术的研究虽然起步较晚,但从2004年至今的十年间,国内有关Push技术的文献就涌现了近2000篇,其中有相当大的部分是对Push技术的理论和应用的研究。最近五年,研究主要集中在信息检索、电子商务个性化服务、WEB目录推荐、图书馆个性化主动服务以及手机等移动终端推荐服务的Push技术等领域,尤其是移动推荐领域,通过获取和预测移动终端用户潜在偏好及兴趣来过滤不相关的信息,为移动终端用户提供能满足其个性化需求的信息,逐渐成为缓解“移动信息过载”的有效手段,获得越来越多的关注。其优势在于:①提高消息准确率。消息推送技术可以有效控制搜索的广度和深度,查找、过滤类似消息和无关消息,提高消息服务的准确性。②节省查找时间开销。在移动网络环境下,网络情况不稳定,用户的时间被切割成“碎片”,很难保证查找消息的时间,利用消息推送技术可以有效减少获取消息的时间,避免无目的性的点击查询。
③推送和保存的消息形式多样。可以推送各种图像、小程序、音频、视频等,并且可以文本文件的形式保存在用户设备。④提高消息推送效率。消息推送服务器可以针对用户兴趣对推送消息进行智能识别和预测,按照用户兴趣模型自动筛选、搜集信息,定期向目标用户主动发送满足不同用户兴趣的信息。
在关注信息推送技术优点的同时,本文通过研究分析发现:信息推送技术在信息服务的实际应用中仍然存在信息过载情况严重、个性化程度不高等有待解决的问题,还需对其进行完善和优化。目前,国内外针对推送技术具体方法及其改进策略的研究主要集中在Web挖掘技术、RSS推送技术、Agent推送技术、基于网格的信息推送技术和协同过滤(Collaborative filtering)推送技术。但就目前推送技术的应用现状而言,上述多数推送技术的个性化程度不强,难以满足用户有针对性的推送要求,具体表现在订制信息时要求用户具有专业的知识背景,用户只有能准确地表达自己的信息需求,才有可能获得准确的相关信息,这样往往制约了用户获取信息的兴趣和能力,因此以上技术在信息服务中均表现不佳。endprint
近年来,针对用户兴趣建模的相关技术已逐渐成为信息推送服务系统中最关键也是最需解决的研究内容,如何进一步挖掘用户可能兴趣,关注用户潜在需求已经成为数据挖掘领域的研究热点。2012年,由王微微等人提出的基于用户行为的兴趣度模型,可以利用期望最大化算法并结合用户兴趣,实现用户聚类,以此创建用户兴趣度模型,进而对用户进行个性化信息管理[6];赵妍、赵学民在《基于CURE的用户聚类算法研究》中提出可以根据用户兴趣的主要特征,提取元素的显著属性进行预聚类,为小类合并提供合理的初始类集,达到聚类降维的效果[7]。虽然这些聚类算法在个性化推荐应用中表现出较好的效果和质量,但是这些用户模型的建立都是基于传统互联网,由于移动用户与传统互联网用户相比面临着更加融合、复杂、协作的移动网络环境和泛在的移动信息提供环境,只有在充分、准确提取和预测移动用户在移动网络环境下对各种类型移动信息内容的偏好后,才能有效的生成移动推荐[8]。因此,尽管移动推荐系统的基本思想与传统互联网推荐系统相似,仍需着重考虑移动网络环境给推荐系统带来的影响,如:移动推荐系统中用户移动性强,移动信息推荐需求受上下文影响很大;且移动设备屏幕小、处理能力差、输入受限;无线网络带宽窄、稳定性不佳等因素使其对信息准确度和实时性的要求更高,从而使得适应传统互联网的用户推荐方法并不能直接应用到移动推荐系统中,在此方面还有许多工作需要研究和解决。
3 技术分析(Technical analysis)
目前关于信息推送和用户兴趣模型建模技术的研究不少,但却没有一套完整的、成熟的技术体系,导致在此基础上的应用不多,特别是将移动信息推送和用户兴趣挖掘技术相结合的研究更是少之又少,需要进一步的研究。
根据以上分析,本文提出了基于用户兴趣挖掘技术且适用于移动网络的个性化信息推送模型,并以此为基础提出个性化信息推送服务框架,针对不同用户设计个性化的服务策略和系统,通过分析用户信息和浏览行为以及信息订阅来获得用户的兴趣,主动将这些用户可能感兴趣的信息推送给他们,并对推送结果进行反向跟踪,实现信息的“推”技术,以此构建一个全新的校园信息推送服务系统。
本文通过深入研究并借鉴国内外校园信息平台已有的研究成果,理论结合实际,在现有研究工作的基础上,开发个性化校园信息推送系统,探索和研究校园信息平台的新思路、新方法,将根据移动互联网中校园用户兴趣的各种特点,深入研究移动信息推送服务中用户兴趣管理和兴趣更新的难题,并结合数学建模技术,构建用户兴趣更新模型和用户兴趣管理模型,建立适用于移动互联网的基于用户兴趣挖掘技术的校园信息推送模型,最终研究设计出基于移动终端的个性化校园信息推送系统原型,对研究成果进行测试、验证,并调优。
4 基于用户兴趣挖掘技术的移动校园信息推送系
统设计(Design of mobile campus information
push system based on user interest in mining
technology )
4.1 移动校园信息推送系统总体架构设计
在充分对移动校园信息推送系统的业务需求、网络需求进行综合分析后,本文研究的移动校园信息推送系统总体架构采用C/S架构,分为客户端和服务器端。
客户端需安装移动校园信息推送APP应用软件,应用基于Android平台和应用程序框架进行开发,分为展示层、业务层和持久层。展示层主要负责调用视图展示系统中定义的各类信息;业务层主要提供接收、存储、维护服务器端推送过来的信息,并提供对各类信息的查询、维护和简单的业务逻辑功能;持久层提供各类推送信息、多媒体资源和日志记录等的持久化存储功能,提供数据、文件的通用访问接口。
服务器端则包括信息的检索、维护、信息推送和权限控制等关键业务功能,采用成熟的开源框架进行开发,分为业务层、服务层、数据层三层架构。业务层提供信息检索、信息分发、信息维护、信息下载、信息内容过滤等服务;服务层为业务层提供支持,提供信息分发、信息维护、权限管理和各类推送方式接口,是信息推送系统的核心,负责收集用户使用习惯、分析用户兴趣、信息维护、推送方式选择等核心服务;数据层提供资源目录、基本信息、用户订阅信息、权限和日志数据的持久化存储和文件和数据库访问接口。
客户端和服务器端之间通过Socket或HTTP方式连接,客户端用户登录后,系统记录用户的连接信息,并定时向客户端发送保活连接信息,直至客户端退出。无线通信网络主要由移动通信基站(如3G、4G网络等)和Wi-Fi网络提供通信功能。
4.2 消息订阅及推送机制研究
用户兴趣模型建立的一个主要依据就是用户对消息的订阅列表。用户订阅列表建立在服务器中系统创建的消息分类数据结构基础之上,消息分类数据结构在系统初始化时即被创建,在服务器运行期间可以动态新增、删除、修改、移动和管理消息分类子项。订阅的内容包括用户消息和系统消息。系统消息是系统强制要求用户订阅的内容,普通用户不能随意删除或修改该消息,订阅规则由各部门相关管理人员根据实际需求制定及调整,根据规则推送消息;用户消息则是用户根据兴趣自行订阅相关内容。不论是系统消息还是用户消息在申请时都必须对订阅用户权限级别进行审核,如果经审核发现订阅内容要求权限高于申请人员的已有权限,系统将提示用户没有订阅权限,不予执行此次订阅要求。
消息推送机制包括消息推送和消息反馈两个阶段。推送阶段有人工消息推送和系统消息推送方法实现,人工消息推送是指管理人员人工选择推送内容和方式将消息推送到指定的接收端;系统消息推送是服务器将处理过的消息按要求自动推送到接收端。其中系统推送方式是指服务器根据消息的时间要求和重要程度来智能选择推送方式,以此来保障消息的实时性和准确性要求,实现推送效率最优。消息按重要程度分为高优先级、中优先级和低优先级三个层次;消息的实时性要求分为紧急、一般、不紧急三个层次。endprint
消息反馈阶段可以保证重要消息能够安全及时被推送到指定客户端,采取消息跟踪反馈机制实现,流程如下:
(1)首先,每当服务器端发送一条消息到客户端,先根据消息的重要程度进行判断,如果是重要消息,则开始跟踪,并启动一个计时器进行计时。
(2)客户端收到消息后立即将一条反馈消息发还给服务器端。
(3)如果服务器端在计时器超时前接收到客户端的反馈消息,则终止计时,并将反馈消息存储到反馈消息表中。
(4)如果服务器端超时仍未收到反馈消息,则重新发送该条消息到客户端,重启计时器,重复步骤(3),同时令发送失败计数器加1;如果计数器大于4,系统则认为该客户端不可达,停止发送此消息到该客户端,同时将未成功发送消息存到表中。
通过该消息跟踪反馈机制,系统能够清楚知道重要消息的发送情况,有利于保障实时性和管理人员后阶段行动安排。
同时,为了提升消息推送的准确度,推送之前系统先对消息进行过滤,消息过滤模块的主要功能就是针对不同用户特征,综合多个制约因素对推送消息进行筛选和过滤。本文中消息过滤主要参考因素包括用户的兴趣订阅列表、系统订阅规则、用户当前上下文、所属部门及职务和当前位置等。
4.3 用户兴趣挖掘算法研究
如何针对不同用户特征定制个性化服务,挖掘用户感兴趣的偏好是最有效的手段,通过用户兴趣挖掘,建立用户兴趣模型,不仅可以保障推送到用户的消息的精确度,而且可以发现潜藏兴趣。用户兴趣分为显式兴趣和隐式兴趣:
I=X+Y
公式中:I表示用户所有兴趣,X表示用户显式兴趣,Y表示用户隐式兴趣。
其中,显式兴趣较易获得,我们可以先根据不同用户对各种类型消息的订阅列表取得用户感兴趣的消息清单,然后统计每位用户对不同类型消息的访问次数,并进行排名,序号靠前的就是用户相对比较感兴趣的消息类别。虽然我们可以通过上述计算求得用户的显式兴趣,但如何发掘用户的潜在兴趣仍是研究的难题。数据挖掘技术中的聚类算法可以通过分析一类用户群体的共同特征,以此获得某个特定用户的隐式兴趣。
聚类算法的实现原理是在数据库中创建用户访问记录表,用户的所有访问记录全部存储在此表中,表结构参见表1。
表1 用户访问记录存储结构表
Tab.1 User access records storage structure
主键 用户ID 信息分类ID 访问次数 访问时间
但是,当用户数量庞大,系统使用时间较长时,访问记录表将变得非常巨大,需要按时间周期分成不同子表,每个时间周期对应一张子表,本周期内的所有用户访问记录都保存在这张子表中,系统按时间检索不同子表,从而有效提高检索速度。
系统定期分析此时间周期的用户访问记录子表,挖掘用户潜在兴趣。主要步骤如下:首先构建用户相似度矩阵进行聚类。用户相似度算法可以反映两个用户的相似程度,系统着重考虑此时间周期内的用户相似度,同时兼顾前一时间周期的用户相似度,通过加权求和得出用户总体相似度,计算公式如下:
式中:—当前两个用户间的相似度,—两个用户的访问相同链接次数,—两个用户所访问的链接的总数。
由此可以得出多个用户的相似度矩阵如下:
系统将用户访问记录分割成以T为时间间隔的表中,为了保持数据的连续性和提高系统处理效率,系统只生成最近时间间隔T内用户间相似矩阵,然后与上一次最新用户间相似矩阵加权求和,取得最新的用户间相似矩阵,数学表示为:
式中:—最新的用户间相似矩阵,—上一次最新用户间相似矩阵,—最近时间间隔T内用户间相似矩阵。
在加权求和时,如果某用户被删除,将中矩阵对应的行和列删除;如果添加新用户,则在矩阵的行和列尾部添加相应的行和列,新加项的初始值均为0,后续再根据访问情况进行修改,求得用户的相似矩阵后,再通过用户浏览路径算法对用户进行聚类。本文中,由于采用了分时间周期加权求和的方法,避免了聚类算法每次对所有的用户来求用户间相似矩阵的问题,时间开销大大减少。
5 结论(Conclusion)
本文通过研究移动信息订阅和信息推送机制以及基于聚类算法的用户兴趣挖掘和服务器端混合信息过滤技术,设计并实现一个基于用户兴趣挖掘技术的移动校园信息推送服务系统,并在已覆盖Wi-Fi等移动互联网的校园区域内进行测试,对系统功能进行测试验证。系统能过滤用户感兴趣的信息,提高信息推送的质量和准确度,减少无关信息推送到客户端;同时能通过数据挖掘技术,进一步发掘用户潜在兴趣,从而获得更好的用户体验。本文的研究是对现有信息推送技术的优化和改进,在传统的基础上,结合数据挖掘技术和用户模型管理,建立一套适合移动网络的混合型信息推送系统,结合用户身份信息、用户订阅的主题、用户所属的任务信息、用户所在位置等信息,通过数据挖掘获取用户潜在兴趣,解决用户模型的更新问题,是对现有信息推送技术理论的有力补充与完善,同时,虽然本文是围绕校园信息推送系统进行研究,但是研究构建的基于用户兴趣挖掘技术并适用于移动网络的个性化信息推送模型同样适用于其他应用领域,如:移动新闻信息推送、移动旅游信息推送、移动电子商务个性化服务等。因此,研究完成后,研究成果将具有广泛的项目应用前景。
参考文献(References)
[1] 王晨辉.基于Android平台校园信息发布系统[J].数字技术与
应用,2010,(08):123.
[2] 孟祥武,等.移动推荐系统及其应用[J].软件学报,2013,24(1):
91-108.
[3] 王立才,孟祥武.移动网络服务中基于认知心理学的用户偏好
提取方法[J].电子学报,2011,39(11):2547-2553.
[4] 林霜梅,等.个性化推荐系统中的用户建模及特征选择[J].计
算机工程,2007,33(17):196-230.
[5] 廖轶宸.基于移动网络的混合型信息推送系统的研究[J].计算
机工程与设计,2012,33(8):3268-3273.
[6] 王微微,夏秀峰,李晓明.一种基于用户行为的兴趣度模型[J].
计算机工程与应用,2012,48(8):148-151.
[7] 赵妍,赵学民.基于CURE的用户聚类算法研究[J].计算机工
程与应用,2012,48(11):97-101.
[8] 宋乐怡,熊辉,张蓉.下一代移动推荐系统[J].华东师范大学学
报(自然科学版),2013,5(3):37-45.
作者简介:
黄 蓉(1981-),女,硕士,讲师.研究领域:移动计算,通信
工程.endprint
消息反馈阶段可以保证重要消息能够安全及时被推送到指定客户端,采取消息跟踪反馈机制实现,流程如下:
(1)首先,每当服务器端发送一条消息到客户端,先根据消息的重要程度进行判断,如果是重要消息,则开始跟踪,并启动一个计时器进行计时。
(2)客户端收到消息后立即将一条反馈消息发还给服务器端。
(3)如果服务器端在计时器超时前接收到客户端的反馈消息,则终止计时,并将反馈消息存储到反馈消息表中。
(4)如果服务器端超时仍未收到反馈消息,则重新发送该条消息到客户端,重启计时器,重复步骤(3),同时令发送失败计数器加1;如果计数器大于4,系统则认为该客户端不可达,停止发送此消息到该客户端,同时将未成功发送消息存到表中。
通过该消息跟踪反馈机制,系统能够清楚知道重要消息的发送情况,有利于保障实时性和管理人员后阶段行动安排。
同时,为了提升消息推送的准确度,推送之前系统先对消息进行过滤,消息过滤模块的主要功能就是针对不同用户特征,综合多个制约因素对推送消息进行筛选和过滤。本文中消息过滤主要参考因素包括用户的兴趣订阅列表、系统订阅规则、用户当前上下文、所属部门及职务和当前位置等。
4.3 用户兴趣挖掘算法研究
如何针对不同用户特征定制个性化服务,挖掘用户感兴趣的偏好是最有效的手段,通过用户兴趣挖掘,建立用户兴趣模型,不仅可以保障推送到用户的消息的精确度,而且可以发现潜藏兴趣。用户兴趣分为显式兴趣和隐式兴趣:
I=X+Y
公式中:I表示用户所有兴趣,X表示用户显式兴趣,Y表示用户隐式兴趣。
其中,显式兴趣较易获得,我们可以先根据不同用户对各种类型消息的订阅列表取得用户感兴趣的消息清单,然后统计每位用户对不同类型消息的访问次数,并进行排名,序号靠前的就是用户相对比较感兴趣的消息类别。虽然我们可以通过上述计算求得用户的显式兴趣,但如何发掘用户的潜在兴趣仍是研究的难题。数据挖掘技术中的聚类算法可以通过分析一类用户群体的共同特征,以此获得某个特定用户的隐式兴趣。
聚类算法的实现原理是在数据库中创建用户访问记录表,用户的所有访问记录全部存储在此表中,表结构参见表1。
表1 用户访问记录存储结构表
Tab.1 User access records storage structure
主键 用户ID 信息分类ID 访问次数 访问时间
但是,当用户数量庞大,系统使用时间较长时,访问记录表将变得非常巨大,需要按时间周期分成不同子表,每个时间周期对应一张子表,本周期内的所有用户访问记录都保存在这张子表中,系统按时间检索不同子表,从而有效提高检索速度。
系统定期分析此时间周期的用户访问记录子表,挖掘用户潜在兴趣。主要步骤如下:首先构建用户相似度矩阵进行聚类。用户相似度算法可以反映两个用户的相似程度,系统着重考虑此时间周期内的用户相似度,同时兼顾前一时间周期的用户相似度,通过加权求和得出用户总体相似度,计算公式如下:
式中:—当前两个用户间的相似度,—两个用户的访问相同链接次数,—两个用户所访问的链接的总数。
由此可以得出多个用户的相似度矩阵如下:
系统将用户访问记录分割成以T为时间间隔的表中,为了保持数据的连续性和提高系统处理效率,系统只生成最近时间间隔T内用户间相似矩阵,然后与上一次最新用户间相似矩阵加权求和,取得最新的用户间相似矩阵,数学表示为:
式中:—最新的用户间相似矩阵,—上一次最新用户间相似矩阵,—最近时间间隔T内用户间相似矩阵。
在加权求和时,如果某用户被删除,将中矩阵对应的行和列删除;如果添加新用户,则在矩阵的行和列尾部添加相应的行和列,新加项的初始值均为0,后续再根据访问情况进行修改,求得用户的相似矩阵后,再通过用户浏览路径算法对用户进行聚类。本文中,由于采用了分时间周期加权求和的方法,避免了聚类算法每次对所有的用户来求用户间相似矩阵的问题,时间开销大大减少。
5 结论(Conclusion)
本文通过研究移动信息订阅和信息推送机制以及基于聚类算法的用户兴趣挖掘和服务器端混合信息过滤技术,设计并实现一个基于用户兴趣挖掘技术的移动校园信息推送服务系统,并在已覆盖Wi-Fi等移动互联网的校园区域内进行测试,对系统功能进行测试验证。系统能过滤用户感兴趣的信息,提高信息推送的质量和准确度,减少无关信息推送到客户端;同时能通过数据挖掘技术,进一步发掘用户潜在兴趣,从而获得更好的用户体验。本文的研究是对现有信息推送技术的优化和改进,在传统的基础上,结合数据挖掘技术和用户模型管理,建立一套适合移动网络的混合型信息推送系统,结合用户身份信息、用户订阅的主题、用户所属的任务信息、用户所在位置等信息,通过数据挖掘获取用户潜在兴趣,解决用户模型的更新问题,是对现有信息推送技术理论的有力补充与完善,同时,虽然本文是围绕校园信息推送系统进行研究,但是研究构建的基于用户兴趣挖掘技术并适用于移动网络的个性化信息推送模型同样适用于其他应用领域,如:移动新闻信息推送、移动旅游信息推送、移动电子商务个性化服务等。因此,研究完成后,研究成果将具有广泛的项目应用前景。
参考文献(References)
[1] 王晨辉.基于Android平台校园信息发布系统[J].数字技术与
应用,2010,(08):123.
[2] 孟祥武,等.移动推荐系统及其应用[J].软件学报,2013,24(1):
91-108.
[3] 王立才,孟祥武.移动网络服务中基于认知心理学的用户偏好
提取方法[J].电子学报,2011,39(11):2547-2553.
[4] 林霜梅,等.个性化推荐系统中的用户建模及特征选择[J].计
算机工程,2007,33(17):196-230.
[5] 廖轶宸.基于移动网络的混合型信息推送系统的研究[J].计算
机工程与设计,2012,33(8):3268-3273.
[6] 王微微,夏秀峰,李晓明.一种基于用户行为的兴趣度模型[J].
计算机工程与应用,2012,48(8):148-151.
[7] 赵妍,赵学民.基于CURE的用户聚类算法研究[J].计算机工
程与应用,2012,48(11):97-101.
[8] 宋乐怡,熊辉,张蓉.下一代移动推荐系统[J].华东师范大学学
报(自然科学版),2013,5(3):37-45.
作者简介:
黄 蓉(1981-),女,硕士,讲师.研究领域:移动计算,通信
工程.endprint
消息反馈阶段可以保证重要消息能够安全及时被推送到指定客户端,采取消息跟踪反馈机制实现,流程如下:
(1)首先,每当服务器端发送一条消息到客户端,先根据消息的重要程度进行判断,如果是重要消息,则开始跟踪,并启动一个计时器进行计时。
(2)客户端收到消息后立即将一条反馈消息发还给服务器端。
(3)如果服务器端在计时器超时前接收到客户端的反馈消息,则终止计时,并将反馈消息存储到反馈消息表中。
(4)如果服务器端超时仍未收到反馈消息,则重新发送该条消息到客户端,重启计时器,重复步骤(3),同时令发送失败计数器加1;如果计数器大于4,系统则认为该客户端不可达,停止发送此消息到该客户端,同时将未成功发送消息存到表中。
通过该消息跟踪反馈机制,系统能够清楚知道重要消息的发送情况,有利于保障实时性和管理人员后阶段行动安排。
同时,为了提升消息推送的准确度,推送之前系统先对消息进行过滤,消息过滤模块的主要功能就是针对不同用户特征,综合多个制约因素对推送消息进行筛选和过滤。本文中消息过滤主要参考因素包括用户的兴趣订阅列表、系统订阅规则、用户当前上下文、所属部门及职务和当前位置等。
4.3 用户兴趣挖掘算法研究
如何针对不同用户特征定制个性化服务,挖掘用户感兴趣的偏好是最有效的手段,通过用户兴趣挖掘,建立用户兴趣模型,不仅可以保障推送到用户的消息的精确度,而且可以发现潜藏兴趣。用户兴趣分为显式兴趣和隐式兴趣:
I=X+Y
公式中:I表示用户所有兴趣,X表示用户显式兴趣,Y表示用户隐式兴趣。
其中,显式兴趣较易获得,我们可以先根据不同用户对各种类型消息的订阅列表取得用户感兴趣的消息清单,然后统计每位用户对不同类型消息的访问次数,并进行排名,序号靠前的就是用户相对比较感兴趣的消息类别。虽然我们可以通过上述计算求得用户的显式兴趣,但如何发掘用户的潜在兴趣仍是研究的难题。数据挖掘技术中的聚类算法可以通过分析一类用户群体的共同特征,以此获得某个特定用户的隐式兴趣。
聚类算法的实现原理是在数据库中创建用户访问记录表,用户的所有访问记录全部存储在此表中,表结构参见表1。
表1 用户访问记录存储结构表
Tab.1 User access records storage structure
主键 用户ID 信息分类ID 访问次数 访问时间
但是,当用户数量庞大,系统使用时间较长时,访问记录表将变得非常巨大,需要按时间周期分成不同子表,每个时间周期对应一张子表,本周期内的所有用户访问记录都保存在这张子表中,系统按时间检索不同子表,从而有效提高检索速度。
系统定期分析此时间周期的用户访问记录子表,挖掘用户潜在兴趣。主要步骤如下:首先构建用户相似度矩阵进行聚类。用户相似度算法可以反映两个用户的相似程度,系统着重考虑此时间周期内的用户相似度,同时兼顾前一时间周期的用户相似度,通过加权求和得出用户总体相似度,计算公式如下:
式中:—当前两个用户间的相似度,—两个用户的访问相同链接次数,—两个用户所访问的链接的总数。
由此可以得出多个用户的相似度矩阵如下:
系统将用户访问记录分割成以T为时间间隔的表中,为了保持数据的连续性和提高系统处理效率,系统只生成最近时间间隔T内用户间相似矩阵,然后与上一次最新用户间相似矩阵加权求和,取得最新的用户间相似矩阵,数学表示为:
式中:—最新的用户间相似矩阵,—上一次最新用户间相似矩阵,—最近时间间隔T内用户间相似矩阵。
在加权求和时,如果某用户被删除,将中矩阵对应的行和列删除;如果添加新用户,则在矩阵的行和列尾部添加相应的行和列,新加项的初始值均为0,后续再根据访问情况进行修改,求得用户的相似矩阵后,再通过用户浏览路径算法对用户进行聚类。本文中,由于采用了分时间周期加权求和的方法,避免了聚类算法每次对所有的用户来求用户间相似矩阵的问题,时间开销大大减少。
5 结论(Conclusion)
本文通过研究移动信息订阅和信息推送机制以及基于聚类算法的用户兴趣挖掘和服务器端混合信息过滤技术,设计并实现一个基于用户兴趣挖掘技术的移动校园信息推送服务系统,并在已覆盖Wi-Fi等移动互联网的校园区域内进行测试,对系统功能进行测试验证。系统能过滤用户感兴趣的信息,提高信息推送的质量和准确度,减少无关信息推送到客户端;同时能通过数据挖掘技术,进一步发掘用户潜在兴趣,从而获得更好的用户体验。本文的研究是对现有信息推送技术的优化和改进,在传统的基础上,结合数据挖掘技术和用户模型管理,建立一套适合移动网络的混合型信息推送系统,结合用户身份信息、用户订阅的主题、用户所属的任务信息、用户所在位置等信息,通过数据挖掘获取用户潜在兴趣,解决用户模型的更新问题,是对现有信息推送技术理论的有力补充与完善,同时,虽然本文是围绕校园信息推送系统进行研究,但是研究构建的基于用户兴趣挖掘技术并适用于移动网络的个性化信息推送模型同样适用于其他应用领域,如:移动新闻信息推送、移动旅游信息推送、移动电子商务个性化服务等。因此,研究完成后,研究成果将具有广泛的项目应用前景。
参考文献(References)
[1] 王晨辉.基于Android平台校园信息发布系统[J].数字技术与
应用,2010,(08):123.
[2] 孟祥武,等.移动推荐系统及其应用[J].软件学报,2013,24(1):
91-108.
[3] 王立才,孟祥武.移动网络服务中基于认知心理学的用户偏好
提取方法[J].电子学报,2011,39(11):2547-2553.
[4] 林霜梅,等.个性化推荐系统中的用户建模及特征选择[J].计
算机工程,2007,33(17):196-230.
[5] 廖轶宸.基于移动网络的混合型信息推送系统的研究[J].计算
机工程与设计,2012,33(8):3268-3273.
[6] 王微微,夏秀峰,李晓明.一种基于用户行为的兴趣度模型[J].
计算机工程与应用,2012,48(8):148-151.
[7] 赵妍,赵学民.基于CURE的用户聚类算法研究[J].计算机工
程与应用,2012,48(11):97-101.
[8] 宋乐怡,熊辉,张蓉.下一代移动推荐系统[J].华东师范大学学
报(自然科学版),2013,5(3):37-45.
作者简介:
黄 蓉(1981-),女,硕士,讲师.研究领域:移动计算,通信
工程.endprint