基于社会网络协同过滤的社会化电子商务推荐研究*
2014-09-29琚春华鲍福光许翀寰
琚春华,鲍福光,许翀寰
(1.浙江工商大学现代商贸研究中心 杭州 310018;2.浙江工商大学计算机与信息工程学院 杭州 310018;3.浙江工商大学工商管理学院 杭州 310018)
1 引言
随着电子商务市场的迅速扩大、网络零售交易量的激增,一些网络交易平台纷纷为其用户提供各种推荐或者行为决策支持。同时,社会化媒体的出现、崛起并且迅速发展,不仅建立了消费者之间跨越时空的沟通,而且让消费者可以参与媒体信息的制造和分享。在传统的电子商务推荐模型中,主要通过销量排行、信用排行或者价格排行等进行简单的推荐。那么由社会化媒体构建的社会关系网络对消费者网上商品的选择和网络行为是否具有重要的影响以及会产生怎样的影响都值得进一步研究。
截至2013年12月,中国网民规模达6.18亿人,其中,网络购物用户规模达3.02亿人,即时通信网民(包括QQ、微信、旺信、易信等应用)规模达5.32亿人次,即时通信使用率为86.2%[1]。即时通信服务一直是网民最基础的应用之一,但是其一般不直接创造商业价值,更多的是在此基础上提供增值服务和应用。然而,通过这种即时通信服务建立起来的社会关系网络是相对稳定的,社会网络关系(socialnetwork relationship,SNR)强度也相对较高。研究如何有效利用社会化媒体构建的社会关系网络来实现有效的商品推荐具有十分重要的理论和实践意义。
2 基于社会关系网络的推荐系统研究
随着社会网络关系的不断复杂化,传统的依赖于单因素影响形成的用户相似度或商品相似度的推荐方法已不能满足推荐系统在精确度和多样化方面的要求。人们逐渐发现商品是否符合用户的实际需求或者是否推荐成功,除了基于商品本身的特征外,还受社会网络关系的影响。商品本身的特征是指商品的固有性质,即不同领域差异性的集合。该特征构成影响消费者偏好差异的主要因素。社会网络关系包括用户对某商品的评论、朋友之间的互动等因素。事实上,很多用户更加信任来自朋友的推荐,而非机器通过单因素计算出来的推荐结果。基于上述原因,构建一个融入社会网络关系的电子商务推荐系统是十分必要的。
2.1 在线社会化关系网络
社会关系网络是指由一群相对独立而又相互影响的个体及它们之间的关系组成[2]。随着社会化媒体和网络应用的迅速发展,线上的社会化关系网络也得以在很短的时间内构建,并迅速壮大。社会网络的联系,使得社会心理学中的羊群效应(群体行为)对社会化电子商务产生了现实的影响。一些研究表明,社会网络对电子商务有着重要的影响。这种影响常常是指人们的行为、态度和信仰会努力向所处的社会系统靠近。社会影响理论通常被称为跟随大多数可获得的意见,而进行选择的简单行为[3]。
社会化电子商务正在以一种新市场浪潮的势头向人们靠近。有学者研究认为商品本身的质量和社会关系网络的支持是影响消费者参与社会化电子商务的重要动机[4]。然而,比较之前的相关研究发现,基于在线社会网络协同的电子商务推荐的研究和应用较少[5,6]。
2.2 推荐模型与方法
随着互联网的发展与电子商务的广泛应用,推荐模型和方法已经引起了学术理论界和实践应用界的广泛关注。推荐的目的是在网络信息过载的今天,选择合适的信息和商品给合适的目标用户[7]。现有的推荐模型和方法的相关研究主要分为以下3类[8]。
·基于内容的推荐机制,根据用户历史的购买偏好,推荐相似的商品。
·协同推荐机制,根据相似用户的普遍偏好推荐项目或商品。协同推荐机制计算的是用户的相似性而不是商品的相似性。
·混合推荐机制,结合基于内容推荐和协同过滤推荐的优点,利用基于内容的推荐获取用户历史网络行为和数据,同时利用协同过滤机制分析相似用户的普遍共同偏好。
虽然这些相似性计算方法和推荐机制在一定程度上改善了应用环境以及突破了一些新的需求。但是,在社会网络关系的环境下,这些方法都存在着一定的应用局限。传统的基于内容的推荐机制或基于用户协同的推荐机制已不能满足推荐系统在精确度和多样化方面的要求。在目前复杂的社会网络关系环境下,用户会更偏向信任自己的朋友,这样在网络上搭建起来的社会网络会对推荐产生极其重要的影响。因此,构建一个融入社会网络关系的电子商务推荐方法和模型是本文的立足点。
2.3 推荐系统
自从1995年,卡耐基梅隆大学的Robert Armstrong和斯坦福大学的Marko Balabanovic等在人工智能协会上分别推出个性化导航系统Web Watcher和个性化推荐系统LIRA以来,国内外研究和实践人员纷纷对不同的推荐服务进行了研究。目前的信息推荐系统分为非个性化商务推荐系统、基于项目属性的推荐系统、基于历史行为的推荐系统、用户相关性协同过滤推荐系统、基于项目相关性的协同推荐系统和基于多种方法的混合推荐系统等[9]。本文研究的系统属于基于多种方法的混合推荐系统。
影响推荐系统服务质量的关键是用户的兴趣偏好模型的构建。目前已有的用户兴趣偏好模型研究包括用户对特定项目的特定评论方式、基于情境的用户偏好分析、基于用户标签的研究等。1999年Dey和Abowd定义了情境的概念,用来描述所处的环境特征和本质[10]。2012年张海燕等研究了基于社会标签的推荐系统,用户之间可以通过标签进行标记和选择[11]。2013年北京邮电大学的孟祥武等对移动网络环境下的推荐系统关键技术与应用进行了分析和综述[12]。上述推荐系统中相关用户模型的构建虽然考虑了多因素的影响,但是未考虑社会网络关系对用户模型的影响。张佩云等将社会网络融入个性化需求的可信服务推荐中,一定程度上改善了推荐的准确度[13]。本文在社会网络关系相关研究的基础上,将社会网络关系强度、兴趣偏好强度和商品流行性与声望强度3个关键因子融入用户兴趣模型之中,构建基于社会网络协同过滤的社会化电子商务推荐系统。
3 社会化电子商务推荐框架
随着社会化媒体和网络的迅速发展,用户之间所建立的社会化关系网络及其在该关系网上进行的交互评论等都会对网络消费和行为产生重要的影响[14,15]。所以,要设计一个在社会化关系网络下的电子商务推荐系统,应该合理考虑以下3个关键因素:
·网上商品与服务本身的属性特征与关系;
·在线社会化关系网络;
·在关系网上进行的关注、购买与交互评论等。
针对上述3个关键因素,本系统模型需要设计3个分析模块,分别是社会网络关系强度分析模块、兴趣偏好强度分析模块、商品流行性与声望强度分析模块。
图1为基于社会网络协同的电子商务推荐模型。
3.1 商品关联性与流行性
图1 基于社会网络协同的电子商务推荐模型
一般而言,一件商品的流行性和声望越高,其推荐成功的可能性就越大,就越有推荐的价值。如图2所示,可以用来衡量或影响商品流行性和声望的主要因素包括销售量(近一个月的销售量)、用户反馈(好评率、差评与描述评价)以及其竞争商品的实力(竞争商品的流行性与声望或者在同类中的排名)。在本研究中,商品流行性与声望是一项多因素融合的特征。不同因素对商品流行性与声望的影响程度是不同的,因此,计算商品流行性与声望PRs的表达式为:
其中,xij表示不同商品i的各个指标数值,wj表示不同指标因素j的权重。
图2 影响商品流行性与声望的主要因素
3.2 社会网络关系相似性与交互性
社会网络关系相似性与交互性分析是研究当前社会化网络下的用户行为的重要方面。用户所处的社会网络中的关系及其强度都会影响用户的网络行为。社会网络关系是相对稳定的,社会网络关系的交互性是动态的[16]。
社会网络关系可以定义为:
其中,U={u1,u2,…,um}表示社会网络中的用户集,NU×U表示用户集间通过联系建立的网络。P=Pu1∪Pu1∪…∪Pum,Pui表示用户ui在网络关系之间发表的评论、留言、标签以及涉及ui的交互内容等的集合。
社会商品关系(social commodities relationship,SCR)可以定义为:
其中,A={a1,a2,…,an}表示平台上的网络商品集合,NU×U∈U×A表示用户和商品之间的关系网络(包括购买、评价等)。
用户之间的社会关系(social relation,SR)是一个与社会相似度(social similarity,SS)、 社会互动度(social interaction,SI)以及社会群组(socialgroup,SG)有关的函数。
其中,wi表示各个影响因素的权重,SS(ui,fj)表示用户ui与其好友fj之间的社会相似度,SI(ui,fj)表示用户ui与其好友fj之间的社会互动度,SG(ui,fj)表示用户ui与其好友fj之间的社会群组相似度。
用户ui与其好友fj之间的社会相似度SS(ui,fj)是一个关于用户购买相似度SimB(ui,fj)和评价相似度SimE(ui,fj)的函数。
其中,用户购买相似度SimB(ui,fj)计算式如下:
评价相似度SimE(ui,fj)计算式如下:
用户ui与其好友fj之间的社会互动度SI(ui,fj)是一个关于互动量和互动内容领域的函数:
其中,Interac(ui,fk)哿Pui表示相关内容领域的互动量;F(ui)表示用户ui的好友集合。
用户ui与其好友fj的社会群组相似度SG(ui,fj)是一个关于好友相似度SimF(ui,fj)和群组关系β的函数:
其中,F(ui)表示用户ui的好友集合。
计算了用户ui与其好友fj的关系强度SR(ui,fj),那么用户ui在该社会网络关系中的商品关系网络推荐度可以表示为:
其中,fj∈F∩A(ak)表示正好购买过商品ak的用户ui的那一部分好友。
3.3 用户兴趣偏好
根据用户的关注、收藏、购买、评价等历史网络行为,分析用户的网购偏好,包括品牌偏好、价位偏好和对卖家的信用要求等,进而推荐适合不同用户的社会化网络商品。例如,某产品属于某一特定的品牌,属于某一特定的价位区间以及卖家当前的信誉等。用户在网络平台上筛选某一产品,势必会考虑这些因素,但是每个用户的偏好或者阈值都存在差异。可以通过分析用户历史网络行为,计算其对某类产品的兴趣程度、偏好需求以及特征偏好权重。
用户 ui对品牌 cj的偏好程度 BP(ui,cj)为:
其中,ak表示用户曾购买的商品,Sum(ui,cj)表示用户ui购买商品属于品牌cj的总和,count(ui,cj)表示用户ui购买的商品ak属于cj则计为 1,否则计为 0。
用户对商品ak的价位偏好度PP(ak)为:
其中,pik表示商品ak的实际价格,Max(pk)表示商品ak在网络平台上的最高价格,min(pk)表示商品ak在网络平台上的最低价格。
用户ui对商品ak的信用偏好度SC(ak)为:
其中,SCik表示商品ak的卖家信用等级,max(SCk)表示商品ak在网络平台上的卖家最高信用等级,min(SCk)表示商品ak在网络平台上的卖家最低信用等级。
计算用户ui对商品ak的兴趣偏好程度IPs(ui,ak),可以表示为:
4 实验分析
实验数据说明,淘宝和天猫平台上的网络交易量大,但是,目前在该平台上的社会网络关系并未建立(阿里旺旺、旺信以及来往上的好友关系并不明确,更不强烈)。然而,在QQ和微信平台上虽然已经构建起强大且广泛的社会网络关系,但在该平台上的网络交易和支付却还未流行。而且,阿里巴巴集团和腾讯集团之间的合作在目前来看是不太可能的。因此本文实验数据来自与QQ群和微信群都有密切联系和交互的网络用户在淘宝和天猫平台上的网络行为数据,共采集126个用户在2014年1月1日-5月10日的网购与评价等行为数据。实验数据商务网购分布情况如图3所示。
社会网络关系基本属性与网购量的相关性见表1。
表1 社会网络关系基本属性与网购量的相关性
从126位参与的用户中,选择了10位用户参与了AHP(层次分析法)权重的设定,指标体系和权重结果见表2。
表2 根据AHP获得的各个指标的权重
图3 实验数据网购分布情况
利用所采集的126位用户在2014年1月1日-5月10日的网购行为数据,将每位用户在2014年1月1日-3月31日的网购行为作为训练数据,在4月1日-5月10日的网购行为作为验证数据。分析每位用户在4月1日-5月10日的网购情况是否出现在通过本文设计模型计算的推荐列表中。本文分别以推荐前10项和前20项为例,进行推荐成功率分析。各种推荐策略的平均推荐成功率如表3和图4所示。利用AHP将社会网络协同推荐体系指标综合的推荐策略效果最好,分别在 “推荐前10项”和“推荐前20项”的情况下,推荐成功率为10.71%和8.73%。单独采用社会网络关系强度进行推荐效果较差,可能的原因主要是网购本身是基于用户自身需求的。总体来看,推荐前10项的成功率大于推荐前20项的成功率,所以,推荐的项目数会影响推荐效果,前面几项推荐的成功可能性更大。
表3 各种推荐策略的平均推荐成功率
利用AHP将社会网络协同推荐体系指标综合的推荐策略和利用算术平均将社会网络协同推荐体系指标综合的策略的比较如图5所示。前者略优于后者,但是区别相对较小。原因在于AHP确定的指标权重相对平均,导致这两种策略推荐的结果比较相似。
5 结束语
随着社会化媒体的发展和各种网络应用的社会化,越来越多的网络互动建立起了社会关系网络。这些社会网络关系必然对网络产生影响,那么如何利用社会网络关系进行电子商务的社会化推荐有着重要的理论和实践意义。实验结果验证社会网络关系会对其中成员的网购等网络行为产生影响,而且网购行为往往是多因素造成的,单因素推荐效果远远比综合指标的推荐效果差。本文构建了社会网络关系强度、兴趣偏好强度和商品流行性与声望强度3个关键因子,每个一级因子又由若干个二级因子构成。本文构建的基于社会网络的电子商务推荐策略的效果比其他单因素推荐策略好且稳定,具有很好的实际应用效果。
图4 各种推荐策略的平均推荐成功率
图5 每个用户的推荐成功率情况
1 中国互联网络信息中心.第33次中国互联网络发展状况统计报告.http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201403/t20140305_46240.htm,2014
2 Ni Y,Xie L,Liu Q Z.Minimizing the expected complete influence time ofasocialnetwork.Information Sciences 2010,180(1):2514~2527
3 Klein A,Bhagat P.E-commerce:evidence on a new virtual commerce platform.Journal of Business Research,2010,4(1):107~124
4 Liang T P,Ho Y T,Li Y W,et al.What drives social commerce:the role of social support and relationship quality.International Journal of Electronic Commerce,2011,16(1):69~90
5 赵华,林政,方艾等.一种基于知识树的推荐算法及其在移动电子商务上的应用.电信科学,2011,27(6)
6 陶彩霞,谢晓军,陈康等.基于云计算的移动互联网大数据用户行为分析引擎设计.电信科学,2013,29(3):30~35
7 Li Y,Lu L,Feng L X.A hybrid collaborative filtering method for multiple-interests and multiple-content recommendation in E-commerce.Expert Systems with Applications,2005,28(1):67~77
8 Jeong B,Lee J,Cho H.Improving memory-based collaborative filtering via similarity updating and prediction modulation.Information Sciences,2010,180(1):602~612
9 琚春华,鲍福光.基于情境和主体特征融入性的多维度个性化推荐模型研究.通信学报,2012,33(9A):17~27
10 Pan W K,Yang Q.Transfer learning in heterogeneous collaborative filtering domains.Artificial Intelligence,2013,197(1):39~55
11 张海燕,孟祥武.基于社会标签的推荐系统研究.情报理论与实践,2012,35(5):103~106
12 孟祥武,胡勋,王立才等.移动推荐系统及其应用.软件学报,2013,24(1):91~108
13 Ranganathan C,Ganapathy S.Key dimensions of business-toconsumerweb sites.Information&Management,2002,39(6):457~465
14 张佩云,陈恩红,黄波.基于社会网络面向个性化需求的可信服务推荐.通信学报,2013(12):49~59
15 Hsia T L,Wu J H,Li Y E.The E-commerce value matrix and use case model:a goal-driven methodology for eliciting B2C application requirements.Information&Management,2008,45(5):321~330
16 DeMeo P,Nocera A,Terracina G,et al.Recommendation of similarusers,resourcesand socialnetworksin asocialinternetworking scenario.Information Sciences,2010,181(1):1285~1305