基于“点击流数据”的电子商务用户行为分析研究综述
2016-12-28詹明君陈晓璇广东工业大学管理学院
詹明君 陈晓璇 肖 祺/广东工业大学管理学院
基于“点击流数据”的电子商务用户行为分析研究综述
詹明君 陈晓璇 肖 祺/广东工业大学管理学院
点击流数据的出现和研究为电子商务组织的个性化服务的优化提供了支持。现有的点击流数据在电子商务上的研究多集中于对电子商务用户的行为的建模,希望从中理解电子商务用户的行为,以优化自身的决策。本文使用内容分析法,主要详细地回顾了点击流数据文献中关于电子商务用户行为的研究,补充完善了现有的基于点击流数据关于电子商务用户行为的文献综述,将基于点击流数据如何分析电子商务用户行为的研究文献分成两大部分阐述:电子商务用户浏览路径分析和用户动态转换行为,并对点击流数据在电子商务用户行为研究上的局限性和未来的研究趋势作了预测和展望。
电子商务;点击流;用户行为;动态转换;预测和展望
1. 引言
伴随着信息技术的快速发展,互联网使得实时、低成本以及隐性地收集用户个人活动的详细信息成为了可能。点击流数据成为了一种研究网上消费者的新范式[1]。点击流数据以一个完整,及时和精确地方式捕获了各种各样的信息。这些数据覆盖了用户的行为,例如浏览的路径,购买的产品和点击的广告,这为研究者们和从业者们尝试去了解用户作出的选择行为提供了很大的帮助。许多研究者已经探究了来自于销售单一类型产品的网站的点击流数据,例如汽车产品和书籍等。相对于获取单一类型的网站点击流数据,从综合性的电子商务网站上收集到的点击流数据将会远比这类数据复杂。电子商务网站的数据通常会封装一个人的行为历史的相当多的细节信息,而且这过多的细节信息会使得数据集本身庞大而冗杂,导致了数据挖掘上的困难,因而点击流数据的复杂性让学者们止步难前,因此,厘清点击流数据在电子商务网站用户行为研究的发展和现状,不仅对于往后电子商务网站用户行为的研究,对于其他领域的研究也都具有非常重要的意义。
本文系统地回顾了点击流数据和电子商务的发展相关关系。在这个基础上,本文详细地梳理了当前点击流数据在电子商务应用中的不足,并提出即时地感知用户的兴趣的重要性,引出优化个性化服务的方向,有助于学术领域和实践领域系统地把握已有的研究成果,并在此基础上开展进一步的研究。
本文的结构安排如下:第二部分对电子商务网站上的点击流路径进行分析;第三部分对电子商务网站上的用户购买转换行为进行分析;第四部分综述电子商务用户的兴趣挖掘和聚类算法研究;最后是总结与未来研究展望。
2.电子商务网站的点击流路径分析
2.1 电子商务网站的分类系统
电子商务的成功离不开大量数据的支持。任何公司或者组织的成功必然离不开决策的正确性,而点击流数据就是这种正确性决策最可靠、最有效的数据基础。当前的电子商务网站如同雨后春笋,正因为意识到了点击流数据所蕴含的巨大能量,使得如何更有效地利用点击流数据已经成为了现代商业竞争优势的必备利器。
在线商店运用多种信息如人口特征,购买历史等来寻找消费者。如今数据越来越多,而对于点击流数据的利用并不充分,点击流数据不仅提供了用户在浏览网页时的页面顺序信息,还提供了他们阅览时的路径信息。
在人机交互的角度,考虑用户在电子商务网站的目的,文献[2]提出了一个分类方案作为电子商务网站的一个通用的分类系统。点击流数据会潜在地成为一种非常充裕的数据资源的原因是每一个URL的全文或者HTML内容都是已知的。使用分类系统是为了侧重于对应每一页浏览的页面的类别。每一个页面都被分类为七个类别中的一个:主页,帐户,分类,产品,信息,购物车,订单,以及进入/退出页面。主页是一个通用的新任务的起点。帐户页面是用来登录,地址变更,以及查看订单状态的。分类页面呈现的是商品、类别或者是搜索结果的列表。产品页面包含了详细的产品信息,产品的描述,价格信息,可用性和产品评论。购物车页面是用于加入或删除产品的,以及输入购买信息。订购页面是表示一个已经下单的确认页面。进入/退出页面表示一个时间段的开始或结束。但是这种分类系统会覆盖了页面内容的其他信息,没有考虑到广告、图形和文本信息等其他信息。
2.2 基于用户路径的分析模型
路径信息可能包含了一个用户的目标、知识以及兴趣等信息。路径从一个新的视角来预测消费者行为,具体而言,路径对事件的次序进行了编码,为购买作准备,而不是单独地寻找一个购买的场合。大多研究的分类方式是较为粗糙的,仅对用户的目标明确与否进行区分,但是这也暗示了根据一个用户的路径可以得知这个用户的目标,并有可能预测未来的行为。
前人的研究中的选择模型来从路径中提取信息。但是没有考虑准确性和连续性属性。文献[3]对对应于网页组任务的结论进行了建模,确实考虑了一些连续的信息,但他们通过任务对应页面的收集来对页面层的行为进行建模,因而信息并不详细。文献[4]借鉴了过去的工作提出了一个新的选择模型,考虑了准确性和连续性。特别地,他们还构建了一个统计模型,访问者在浏览网站的时候,它可以分析他们逐页的浏览情况,并将自身的自回归多项式概率模型与多元多项式模型和潜在组模型进行比较。
文献[5]对用户的浏览路径进行了马尔科夫描述,用类别的首字母作为缩写简洁地表示路径。例如,字符串“HCPE”(Home,Category,Product,Exit)表示一个用户从主页开始搜索一本书,转到分类页面去查看结果,在考虑了个人产品后停留产品页面,结束这个时间段。其中,此文通过假定一个用户没有浏览任何页面持续时间为20分钟来表示时间段的结束。但是并没有对一个时间段间隔的定义作出较为合理的解释,因为这将会导致用户的浏览路径变得不一样;并加入了一个混合的过程,消费者的模型参数可以在一个时间段内切换,以表明浏览行为有可能由于消费者当前目标或心情而千差万别并突然转变。
文献[4]提出的统计模型可以对未来的路径进行概率评估,包括用户是否会进行购买,并可以普遍用于预测网站上的任意路径。例如,哪一类用户更有可能会去浏览另一个产品的页面,或者在接下来的五个点击内就完全离开这个网站了?并且这个模型可以被用于网页设计和设置营销混合变量,例如,如果知道一个用户在这个网站购买的可能性较少,可以在页面中通过加入有帮助的链接来动态地改变网站的设计;而对于有可能购买的用户来说,网站可以变得更简化。另外,使用这个模型的预测可以改善购买转换率,它可以大幅提高运营利润。但是他们只是单纯地去了解序列信息的作用,所用数据为期1个月,并通过传统的分类方案进行分析,这可能会导致研究结果不具备代表性。而该文提出的自回归性可能提供了未来优化此类概率模型研究的一个有趣的方向。
当然网页设计有很多方面,广告和促销是这个问题的重要元素。路径分析并不是否定或者取代研究这些方方面面问题的需要。但对于购买行为的预测能力因导航路径能反映用户目标而得到改善。结合消费者行为的结构模型可能会对路径信息有更好的使用。
3.电子商务网站的动态转换行为
3.1 动态转换行为定义
购买转换指的是,网页浏览者在一个网上零售商处浏览期间进行购买的百分比。这是一个电子网站的成功的一个关键指标,因为它提供了访问者转变为消费者的一个度量。尽管电子商务的发展快速,网上购买转换率仍然很低。一些大型的网上零售商如Amazon.com,等的购买转换率的范围在1~2%。电子商务的管理者们希望了解影响了购买转换率的因素,以及如何通过动态地适应消费者的行为表现来提高他们的购买转换率。
网上购物与线下购物的差异中最突出的特点是访问虚拟商店所需的低廉交通成本。在线下购物行为的研究中,构建消费者商店选择和购买决策模型的一个重要部分是从一家店去到另一家或多家店的成本(包括有形成本和心理成本)。与此相反,客户访问在线商店网站实际上是无成本的。这对观察到的行为有不少的影响。首先,因为成本要低得多,网上购物者更可能会没有目的地访问一间商店。在线下购物环境中,购物者仅仅是花费时间和精力去拜访商店就会产生成本,他很少会空手回来。因此,我们注意到网上购物的转换率很低。第二,访问网站的低成本使得购物者可能会推迟购买的决定然后下次访问再购买。相反地,在线下购买环境中,由于再次访问的经济规模非常有限,所以购物者可能会急于完成购买以避免产生更多的交通费用。由于这些原因,我们更可能会看到在线购物者为了一个购买决策多次访问同一家商店,即使是为了较低参与度的购买决策。
3.2 动态转换行为的影响因素
文献[6]构建了一个概念化框架,在框架中购买概率是访问效应和购买阀值效应的结果,但他们主要的研究焦点是对购买前考虑时间的影响因素的描述性分析,没有对购买的转换行为进行考虑。文献[7]通过购买基数概率、对购买有正面效应的访问、对购买的负面购买阈值效应、访问效应和购买阈值的差异性、随着时间变化的效应和从不购买的浏览者这六个部分构建了个人层面的转换行为概率模型。类似于文献[8]的模型,Moe等人使用倾向基数和增量效应来表示访问净效应,该模型明确提出了购物者差异以及随着时间的动态变化。这个模型对转换行为提供了一个更为有效和有用地检测手段,但是其忽视了每次访问中发生的不同的活动,如访问序列,人口统计特征和网站设计等因素。
当消费者熟悉了新的环境时,他们会累积更多的经验,从而减少需要累积足够多的信息去购买的访问量。然而同时这些用户受到商店的影响就会越少,因此需要增加说服他们去购买的访问量。访问效应和购买阀值的大小可能会随着消费者在购物环境下的购物经验而变化。例如,在同个网站的重复访问会对购物减少影响,因为消费者有可能习惯了环境的刺激。购物阀值可能会减少,因为消费者在重复购物中获得了熟悉感,或者购物经历是舒适的,因此在将来再次购买的可能性会更高。在另一方面,有些人在早期的访问就有可能性会购买(也许是为了体验这个购买过程是怎样的),但是随着购买次数的增加,新鲜感会消退,他对购买的抵触情绪有可能会增强;这似乎暗示了感知用户兴趣变化的重要性。
4. 结论与展望
本文使用内容分析法,详细地回顾了关于电子商务用户行为的研究,补充完善了现有的基于点击流数据关于电子商务用户行为的文献综述。在这些文献的基础上,本文系统地回顾了点击流数据和电子商务的理论和发展,阐述了电子商务网站的浏览路径分析;并对其用户的购买转换行为进行分析;同时,本文详细地梳理了感知用户的兴趣的重要性。这为学术界和实践界系统理解已有研究成果提供了有效的帮助。
由于点击流数据自身的海量性和复杂性,当前学者们对其在电子商务用户行为的研究还是很不完善的。第一,对于时间段间隔的定义还存在着争议;第二,电子商务的其他分类方案可能会改变现有研究模型的预测准确度;第三,现有的研究虽然能够分析用户的浏览路径,但用户兴趣的动态性变化,并不能针对地对用户提供更优质的个性化服务。
综上所述,未来的研究可以从以下几个方面探讨和阐述电子商务用户的行为如何能在点击流数据的支持下得到更深入的分析。
1. 更合理地定义时间段的间隔,即搜索周期。许多的研究对于时间段的间隔的定义都不一致,例如15分钟,20分钟等。没有一个通用的标准将会使得收集到的数据分析结果有差异,我们难以分析这些差异造成的影响。因此,后续研究应当结合时间段即搜索周期的合理定义,防止错误的数据分析,以便得到更为优化的研究结果。
2. 重视其他的电子商务分类系统开发。现有研究多使用由文献[2]提出的一个电子商务网站的通用分类系统,或增加其分类,或减少其分类。但是这种通过页面分类来抽象化网页的行为,会导致关于页面内容的图形和文本信息的损失。因此,其他的分类方案可能会改变现有研究模型的预测准确度。而局限于通用分类系统的原因,对于这个问题的探讨在目前的研究是比较缺乏的。
3. 感知并挖掘用户即时的意图。对电子商务用户的浏览路径进行分析即是为了捕捉用户的内心活动。在电子商务企业的角度,留住老客户,发觉潜在新客户是他们的目标,而在用户的角度,如何能从中获取自己希望得到并对之满意的服务是他们的需求。因此,感知用户的动态兴趣,并及时地推荐或获取更优质的服务是未来十分重要的方向。
最后值得一提的是,从综合性的电子商务网站上收集到的点击流数据将会远比现有的单一类型研究数据复杂。如何能有效地收集并利用这些点击流数据也是一个难题。相信如何利用点击流数据为电子商务用户即时提供更有效地个性化服务是未来研究的重要方向,这不仅是电子商务企业,也是用户们希望看到的。
[1] 李双双, 陈毅文, LiShuangshuang,等. 点击流:一种研究网上消费者的新范式[J]. 心理科学进展, 2007, 15(4):715-720.
[2] Redish, Janice (2002), “Information-Rich Web Sites: Challenges and Opportunities”, www.redish.net/cmu.pdf. Last accessed October 2002.
[3] Sismeiro, Catarina and Randolph E. Bucklin (2003), “Modeling Purchase Behavior at an Ecommerce Website: A Conditional Probability Approach”, Anderson School at UCLA, Working Paper.
[4] Montgomery, A.L, et al., 2004. Modeling online browsing and path analysis using clickstream data. Marketing Science 23 (4), 579—595.
[5] Cadez, Igor, David Heckerman, Christopher Meek, and Padhraic Smyth (2000), “Visualization of Navigation Patterns on a Web Site Using Model Based Clustering”, Technical Report MSRTR- 00-18, Microsoft Research.
[6] Putsis, William P., Jr., Narasimhan Srinivasan. 1994. Buying or just browsing? The duration of purchase deliberation. J. Marketing Res. 31(August) 393—402.
[7] Moe, W.W., Fader, P.S., 2004. Dynamic conversion behavior at e-commerce sites.Management Science 50 (3), 326—335.
[8] Schmittlein, David C., Donald G. Morrison. 2003. A live baby or your money back: The marketing of in vitro fertilization procedures. Management Sci. 49(12) 1617—1635.
国家自然科学基金资助项目(71671048) 。