一种基于用户购买葸向的个性化推荐模型
2016-01-24安政磊姚文斌
安政磊++姚文斌
摘要:伴随随着互联网技术的发展,020餐饮领域发展迅速,然而平台同质化严重,个性化推荐已经成为提升用户体验和提高运营水平的一种主要方式。而传统的协同过滤方法在数据稀疏的情况下,用户推荐准确率不高。本文研究基于020餐饮行业背景,研究用户的行为对购买意向的影响,综合考虑购买行为、评价行,为等多种用户行为,判断用户的兴趣点,从而确定用户的购买意向,提出一种基于多种用户行为的购买意向模型。基于此提出基于购买意向的推荐方法。最后通过与传统基于用户的协同过滤算法进行比较,确定了本文推荐方法的有效性。
关键词:行为分析;个性化推荐;协同过滤;推荐模型
中图分类号:TP391.3
文献标识码:A
DOI:10.3969/j.issn.1003-6970.2015.12.019
本文著录格式:安政磊,姚文斌.一种基于用户购买意向的个性化推荐模型[J].软件,2015,36(12):80-82
0 引言
近两年来,随着瓦联网的发展,020餐饮领域已经成为一种重要的商务模式。在丰要大城市中迅速的扩展开来。与此同时,其中的推荐系统却没有跟随发展,多数平台还停留在用户丰动获取商品信息的时代。这些平台同质化严重,全都标榜以用户为中心,然而由于原始的建站思路,并没有完全应用好快速发展的计算机技术,导致发展上的瓶颈。
各种推荐系统层出不穷,推荐机制复杂多变。协同过滤算法已经被广泛的应用到各个推荐系统,但随着用户数量的增加和站点内容结构的日益复杂,协同过滤技术的一些缺点逐渐暴露出来,首要问题就是稀疏性,随着用户和项目的数量的增长,用户相似性矩阵也会急剧扩大。在维度巨大的相似矩阵并且用户参与度不是很频繁的情况下,推荐的可信度随之降低。
目前多数协同算法研究和应用都集中在传统的电子商务,对于基于餐饮行业的协同过滤算法的推荐研究较少。协同过滤算法的研究目标丰要是商品。本文针对餐饮行业的特点,研究的丰要原子单位是餐厅,考虑不同用户行为对用户的购买意向的影响,基于用户的购买意向设计推荐算法,提高推荐准确率。
1 用户行为的研究分析
1.1 购买行为分析
相交于传统电子商务的购买数据,020餐饮行业的购买行为确实不少,但是对于准确的分析用户购买意向和购买行为之间的关系这项复杂的工作来说,在数量上还是有一定差距。而用户的购买行为是用户对某商品研究的结果,因此,用户必然在前期进行过一系列与该商品相关的用户浏览行为,可见用户的购买行为还和用户的浏览行为紧密相关。为此需要建立基于PV兴趣统计出的用户购买行为模型,基于用户的兴趣发现用户的购买意向。分析步骤如下:
Stepl:根据日志文件中浏览记录的定义找到所有餐厅访问的记录,过滤没有餐厅的浏览记录。同时,从数据库获取用户的购买记录。这两种记录作为本次分析的依据。
Step2:针对以上数据,统计每个餐厅的访问次数和购买次数。两种数据对用户的购买意向的影响的程度显然不同,为了融合两种数据,为购买数据进行加权分析,餐厅的购买数据加倍,将数据整合在一起。
Step3:根据商品的被访问时间和餐厅商品数量,来确定用户对某商品的购买意向。公式如1-1所示。
ti表示用户浏览餐厅时间,Ci表示餐厅的商品数量。而现在多数平台还有其他查看商品的具体信息的弹出框页面以及能够查看单独商品评价和评分信息等。但是这些信息不具有代表性,所以行为分析时也对这些行为进行忽略。
1.2 评价行为分析
评价行为是用户购买意向的直接反馈,不仅是对本次购物感受的表达,还能够据此对用户未来的购买意向作出判断。可以通过对用户评价的情感分析,获取用户的购买意向。
Stepl:建立基本语料库,选取常见情感表达词语,根据知网的基础语料分析库,将这些情感表达词语分别按照褒义词和贬义词的分别放到positive和negative两个集合中。
Step2:短语或句子分词。对于020餐饮行业来说,这个领域内的表达情感的词语是有限的,且本文只针对用户的感情词汇进行处理。这样对评价样本进行分词,达到能够满足区分用户情感趋向的程度。采用字符匹配算法来进行分词。
Step3:词语分类。为了构造用户评论的短语模型,需要对分词进行词性分析,明确评价信息中的名词、形容词等词性区别。
Step4:构造评价内容的短语模型。
Step5:计算短语的情感值。采用统计学方法,计算一个短语模型在positive和negative集合中的文本出现次数,分别结尾GNumber和BNumber。情感值计算公式1-2所示。
Step6:根据用户评价内容分词,采用单词匹配分析算法,按照公式1-3计算整个评价内容的购买意向值。
2 基于购买意向的推荐模型
2.1 购买意向模型
对用户行为进行分析,根据上节所述的用户购买意向和用户的购买行为以及用户购买意向和评价行为的关系计算用户的总体购买意向值。需要分别计算每个用户对每个餐厅的购买意向值并求意向值之和,意向值之和定义为T。
T-upi+S
(1-4)
将购买意向值T作为计算用户相似度的指标。
2.2 基于购买意向的推荐模型
基于用户购买意向模型中用户购买意向的变化,构建基于购买意向的推荐模型。
(1)循环更新待推荐用户的购买意向值。
循环所有餐厅,通过购买行为计算当前用户u对第i个餐厅的购买意向度定义为Tupi(u,i),通过用户评论计算出当前用户u对第i个餐厅的购买意向值Ts(u,i),计算用户对该餐厅的购买意向总和,记为T(u),更新当前用户u对该餐厅的购买意向值。
(2)选择该用户u的购买意向最强的10个餐厅作为用户u的向量。作为和其他用户进行比较相似度的来源。采用余弦相似度进行用户相似度的比较,选择m个相似用户,根据普通协同过滤算法,根据待选集合中用户对餐厅的购买意向,得到中间推荐结果L1。
(3)对于选择出来的10个餐厅,从高到低分别附上10到1之间的权重,根据数据库内定的餐厅类别进行如下分析:1)统计每个类别的餐厅个数;2)将每个类别餐厅的个数和每个类别中权值最大的餐厅的权值相乘得到各个类别的一个值;3)在该类别中选择2k个同类餐厅作为中间推荐结果L:
(4)将中间推荐结果L1和L2求交运算,当最终结果不到k个时,从L2剩余结果中在随机补选儿个,得到k个最终推荐结果
3 实验对比分析
3.1 实验对比标准
本文的丰要目的是为了完成用户的推荐工作。针对推荐工作,有常用的两个评价于段,分别是召回率(3-1)和准确率(3-2)。
其中Tn代表数据集合中用户u喜欢的物品的集合,Rn代表向用户推荐的物品集合。
3.2 实验分析
根据以上模型和算法步骤,根据用户日志文件和后台数据库提供数据,设置取相似用户数量取值范围为[50,100],实验结果如图l所示。
实验结果表明,基于用户协同过滤算法和购买意向模型差距不是十分大,在开始时两者儿乎准确率同等大小。并且随着召回率的增加,两者的准确率都在降低。区别是基于用户的协同过滤算法在开始时下降明显,而后者下降不是很明显,出现这样情况的原因可能是,基于购买意向模型的推荐算法综合考虑了用户的购买行为、浏览行为、评价行为对用户的购买意向的影响,从而能够比基于用户的协同过滤算法在推荐任务上完成地稍微好一点。
4 结论
协同过滤技术已经被广泛应用,但有很多还停留在最简单的基于用户的协同过滤,随着用户行为种类和数量的不断增多,这些隐藏的行为比显示的行为提供更多有关用户购买意向的信息,然而很多现有的用户网络行为却被推荐系统忽视。针对以上问题,本文从用户行为角度出发,并且抓住常见的隐式行为,分析用户行为和用户购买意向的关系,进而根据用户行为建立用户行为和用户购买意向的整合模型,根据这个模型设计出一套用户推荐算法,经实验证实,该方法虽不能极大提高推荐效果,但确实在某些情况下提高了召回率和准确率,为了更好地优化推荐效果,还应该继续研究基于用户行为的购买意向的优化计算方法。