基于矩阵分解的养老文化产品推荐
2019-03-20卫雨婷
卫雨婷,刘 军
(安徽工程大学 人文学院,安徽 芜湖 241000)
随着经济社会的进步与发展,我国公共医疗的水准不断提高,导致人口老龄化的速度愈来愈快。2017年社会服务发展统计公报数据显示,截至2017年底中国60岁及以上老龄人口达24 090万人次,占总人口的17.3%,其中65岁及以上老龄人口达15 831万人次,占总人口的11.4%。由此可以预见,人口老龄化和高龄化将会为中国社会带来巨大的养老压力。
中国政府多年来关心与重视老龄事业,近年来,我国用《中华人民共和国宪法》做基础,《中华人民共和国老年人权益保障法》做主体,不断完善老龄法律法规政策体系框架,这使得老年群体的合法权益得到保障,并在一定程度上使老年人的获得感和幸福感得到了提升。然而,法律法规在保护老年人物质财富的同时,却忽略了老年人的精神财富。习近平总书记对此提出:“要着力营造全社会在政治上尊重、思想上关心、生活上照顾、精神上关怀老同志的良好氛围”,使老同志“始终保持政治坚定、思想常新、理想永存”[1]。这强调了文化养老的新模式,使得文化养老逐渐成为养老产业发展的趋势,养老文化产品逐渐成为潮流。
老年人对文化养老需求的快速增长催生出大量的养老文化产品,老年人主体的多样性以及养老文化产品的差异性,使得养老文化产品的推荐问题越来越被学术界和产业界所关注。构建一种科学合理的养老文化产品的推荐模型,不仅能为老年群体提供符合他们需求的产品信息,满足他们的兴趣爱好,同时可以为企业标记目标客户,有助于提高企业推广的准确度,降低运营成本。因此,提出运用矩阵分解算法建立养老文化产品推荐模型,科学分析老年群体行为,发现其中的信息关联,预测潜在客户的需求,从而有针对性地为老年用户群体推荐其感兴趣的养老文化产品。
1 理论回顾
目前,养老文化产品推荐研究多集中在个性化产品推荐和推荐方法领域。在个性化产品推荐方面,S Meng[2]等提出一种关键词感知服务推荐方法,利用关键词表示用户的偏好,并利用协同过滤生成建议,对用户进行个性化推荐。X Chen[3]等提出一种基于协同过滤算法的Web服务推荐系统以帮助用户选择质量好的服务,这个系统利用位置信息以及QoS来收集用户和服务,然后根据聚类的结果对用户进行个性化推荐。曾子明[4]等针对用户的兴趣爱好会随着时间的变化而发生改变的这一特点,构建了以用户兴趣爱好的变化为参考对象的数字图书馆知识推荐模型,研究和设计了个性化的知识推荐服务系统。谢琪[5]等区别于以往的评价相似性方法,选择定义了一个群体中心来代表群体,从而来计算服务群和用户群之间的相似度。李玲[6]等以微博为数据收集目标,对社交网络中大量的用户数据进行收集、分析和处理,从而发现用户的兴趣偏好,对用户进行个性化的服务推荐。此外,S Deng[7]、G Kang[8]、王海艳[9]、刘树栋[10]、张佩云[11]等学者也做了相关研究。
在推荐方法研究方面,Gai Li[12]等提出了“成对概率矩阵分解模型”概念,利用逐点随机梯度下降的方法优化了成对概率矩阵分解模型。 Hamidreza Koohi[13]等提出在模糊聚类的基础上基于用户的协同过滤推荐,针对不同聚类方法的性能进行评估。黄创光[14]等提出在不确定近邻的基础上进行协同推荐,使得推荐效果更好。王晓耘[15]等提出在粗糙用户聚类的基础上进行协同过滤推荐,引入粗糙集的概念,利用修正过的余弦相似度的绝对差值进行用户间关系的判断,提高推荐精度。魏童童[16]等引入了兴趣时序这一概念,在采集数据的时候,越接近采集时间的兴趣偏好点击拥有越大的权重,从而考虑到了推荐的时效性和准确性。此外,YB Wang[17]、熊忠阳[18]等、傅鹤岗[19]等、高全力[20]等学者也对此方面进行了相关的探讨与研究。
综上所述,很多学者在个性化产品推荐研究领域做出了有益探索,研究成果也被广泛应用到各行各业中。但目前在养老文化产品推荐方面的研究较少。因此,在前人研究的基础上,选择矩阵分解算法对用户特征进行判断,并融入用户偏好这一因素提升推荐的准确度。最后通过实证分析进一步检验了方法的有效性。
2 问题描述
实际上,在做商品推荐时,主要可以利用的数据有两类,一是用户对商品作出的隐式反馈数据,二是用户对商品作出的显式反馈数据。在进行个性化推荐时,隐式反馈数据尤为重要,隐式反馈数据通常指用户对商品所进行的浏览、购买情况等数据,这类数据潜在地反映了用户对商品的喜好与兴趣需求,且不需要用户花费额外的精力即能在某种程度上反映用户的偏好,数据多且全。而用户访问商品之后,对商品做出显示反馈,包括对商品进行评分、标签商品特点以及表达商品体验感受等的这一类明显表达用户对商品喜好程度的数据,称为显示反馈数据。相较于隐式反馈数据,显示反馈数据对用户的真实喜好进行了更好的反应。但实际上,很少有用户会对商品进行评级和标签,这就使得显示反馈数据少且较难获得。
基于此,围绕显式反馈数据,针对养老文化产品的推荐问题,根据老年用户对养老文化产品的评分,推荐其可能感兴趣的养老文化产品。选用一种融入用户偏好的矩阵分解推荐算法,在普通的正则化矩阵分解算法的基础上融入目标用户的用户偏好,建立一种科学的推荐模型,从而对目标用户所做的项目评级进行建模,通过刻画数据下的用户特征计算用户偏好,最终对目标群体进行产品推荐。
3 模型构建
3.1 数据表示
当把评级矩阵R进行转置后,通过矩阵分解的主成分分析,可以获得项目的典型属性信息,因此设为一个n×k的矩阵T,其中项目属性用s表示,有属性用1表示,无属性用0表示,因此集合S是由k个项目属性组成的{s1,s2,s3,…,sk}。
3.2 矩阵分解算法
(1)
特征向量Pu,Qi可以通过损失函数进行优化,如下:
(2)
(3)
(4)
Pu←Pu+μ(Δu,iQi-λPu),
(5)
Qi←Qi+μ(Δu,iPu-λQi),
(6)
3.3 基于用户偏好矩阵分解算法
为了保证矩阵在分解过程中既能保持全局优化,同时又能体现用户偏好特征的正确性。文中用一个m×k的矩阵M来表示用户偏好,根据用户评级矩阵R和项目属性矩阵T计算出用户的偏好,并将其融入矩阵分解的个性化推荐模型中,利用降维优化目标函数,从而实现预测用户评级数据的结果,其具体过程如下所示:
(7)
(8)
式中,Mu,t表示用户u对项目的属性偏好,结合用户偏好,把用户特征矩阵P和用户偏好矩阵M进行线性相加,得到式(9)的矩阵分解模型:
(9)
再加入用户相似性优化损失函数,计算Pu和Qi,其中,F+(u)是u的入度用户集合,即与u最相似的前t个用户集合,如式(10)所示。
(10)
最后,运用梯度下降法最小化式(10),其中,F-(u)是u的出度用户,得到:
(11)
Qi←Qi+μ(Δu,i(αPu+(1-α)Mu)-λQi),
(12)
3.4 实例分析
文中数据选自美国GroupLens项目组公开的数据,选自700个用户对9 000部电影进行的评级,数据集中共有700个评分和1 300个标签,平均每个用户分别对20部电影做出了评价。
实验通过余弦相似度计算用户相似性,参数α分别取0.3,0.5,0.7,0.9;t分别取3,5,10,15,20进行计算,最终得出α=0.7,t=10时,结果最优,此时,参数μ=0.000 1,λ=0.03,β=0.001。
最后,通过计算均方根误差(RMSE)和平均绝对误差(MAE)来对比正则化矩阵分解算法与融入用户偏好的矩阵分解算法的结果,从而验证算法的有效性。误差越小,预测精确度越高,算法也就越有效。其检验结果如图1所示。
图1 均方根误差(RMSE)与平均绝对误差(MAE)对比图
根据以上对两种算法的均方根误差(RMSE)与平均绝对误差(MAE)结果对比显示,文中所利用的融入用户偏好的矩阵分解算法得出的误差较小,因此可以认为,融入用户偏好的矩阵分解算法的预测效果较优于正则化矩阵分解算法。
4 结论
将个性化推荐系统应用在养老文化产品推荐领域是一项新尝试,该方法对潜在老年用户的需求进行预测,为老年用户选择养老文化产品提供了有价值的参考意见,降低了选择的盲目性,为老年用户带去了很大的便利,但是由于其技术算法不成熟,其中也同样存在着许多问题。文中提出了一种基于融入用户偏好的矩阵分解算法推荐系统,不仅考虑了全局最优,同时也保持了用户正确的偏好信息,准确判断了数据中用户的相似性,并通过实证分析与误差对比证实了该方法的准确性和可行性。但也存在不足,文章实验数据来源于美国GroupLens项目组网站,仅选取电影产品,应用范围存在局限性。不同的环境下,老年用户的行为存在不同,今后的研究还需针对不同环境下的老年用户进行特征分析,从而进行更精准地推荐。
另外,实证分析结果也进一步表明养老文化产品推荐可以为老年人选择养老文化产品提供很大的便利,降低选择的盲目性,从而获得更好的服务质量;对于养老文化产品生产者来说,准确地向消费者推荐合适的养老文化产品可以有效节约生产成本;而对于老年群体的消费者个人来说,精准的养老文化产品推荐充分考虑到了他们的喜好和需求,为其带去更好的养老服务体验。