基于大数据的网络用户行为分析
2014-10-22左军
左军
摘 要:大数据的数据分析应用改变了人们的生活,同时深入影响了企业商业模式的创新。本文阐述了大数据的概念和特征,分析了大数据对于网络用户行为的影响,并对基于大数据的网络用户行为分析模式进行了实证研究。
关键词:大数据;网络用户行为;数据分析
中图分类号:TP311.13 文献标识码:A1 引言(Introduction)
互联网和云计算技术的飞速发展,促使行业应用产生的数据呈爆炸性增长,数据量的快速增长标志着人类已经从信息时代步入大数据时代。目前,百度的总数据量已超过1000PB,每天需要处理的网页数据达到10PB—100PB;淘宝累计的交易数据量高达100PB;Twitter每天发布超过2亿条消息;新浪微博每天发帖量达到8000万条;中国移动单独省份的电话通联记录数据每月可达0.5PB—1PB;单独省会城市公安局道路车辆监控数据三年可达200亿条、总量120TB。据世界权威IT信息咨询分析公司IDC研究报告预测:全世界数据量未来10年将从2009年的0.8ZB增长到2020年的35ZB(1ZB=1000EB=1000000PB),10年将增长44倍,年均增长40%[1]。大数据悄然地改变着我们的工作和生活方式,同时对于企业经营运作模式的创新更是一个机遇和挑战。
2 大数据概述(Summary of Big Data)
2.1 大数据的定义
大数据的概念出现较早,2008年,美国《Nature》杂志在Google成立10周年时出版了“Big Data”专刊,该专刊主要探讨未来大数据的处理技术和问题,并对大数据与一些行业可能存在的关系进行了介绍[2]。2011年5月,麦肯锡咨询公司发布了名为《大数据:创新、竞争和生产力的下一个前沿领域》报告,报告中表示大数据已经成为现代社会必备的生产要素,数据与各个行业的密切相关,大数据将促进未来生产率的提升。
但是,对于大数据的具体概念,行业研究者和学者给出了不同的定义。维基百科对大数据的定义为:大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、管理和处理的数据集[3]。美国权威IT研究与咨询顾问公司Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。可见,大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
2.2 大数据的特点
对于数据的特点,IBM总结为3V,即Volume(海量性)、Variety(多样性)和Velocity(高速性)。随着对大数据的研究的深入,IDC将IBM提出的3V进行了发展,提出4V特性,Volume(海量性)、Variety(多样性)、Velocity(高速性)、Value(价值性)。
(1)海量性,就是数据体量巨大。从TB级别,跃升到PB级别。
(2)多样性,就是数据类型繁多。如网络日志、网络新闻、网络购物和地理位置服务等都可以产生大量的文字、视频、图片和地理位置等各种类型的数据信息。
(3)高速性,即处理速度快,大数据技术可从各种类型的数据中快速获得高价值的信息,这一点也是大数据技术和传统的数据挖掘技术的本质不同。
(4)价值性,只要合理利用大数据,并对其进行正确和准确的分析,将会带来很高的价值回报。
3 分析网络用户行为的必要性(Analysis of the
necessity of network user behaviors)
网络用户行为是指用户在使用网络资源时所呈现的规律性。这通常是通过对有关用户使用网络资源的数据进行记录、统计和分析所得出。用户在使用网络资源时,用户行为可以分为信息查询行为、沟通交流行为、休闲娱乐行为、电子服务行为和电子商务服务行为等许多方面。互联网技术和大数据技术的发展,使用户对网络服务质量的要求逐步提升,网络服务提供者提供服务的方式也逐渐走向科学,通过对网络用户行为的分析和规律总结,可以将这些规律与产品或服务的经营策略相结合,发现目前经营服务中的问题,并为进一步提高服务质量和经营策略的制定都有非常重要的意义。
4 大数据与网络用户行为分析(Big Data and the
analysis of the network user behaviors)
4.1 网络用户行为的界定
从大数据的视角进行网络用户的行为分析,首先要重新界定网络用户行为的组成。
(1)用户群特征分类。对网络用户群进行分类,不同于以往的单一根据年龄或职业等进行分类,要从不同维度,先测得用户的行为数据之后,在进行细化分类。
(2)用户对产品的使用率。对于网站类产品,主要有网站的点击率、访问量、访问率、点击量、页面停留时间、访问模块数等;对于网络购物类产品,包括访问量、访问率、咨询率、转化率、二次购买率和推荐率等;对于移动应用类产品则体现在下载量、使用频率和使用模块数等。
(3)用户使用产品的时间。就是用户每天在什么时候会使用该产品,比如对于微信的公众号信息推送模式,就必须了解大部分用户会点击打开该公众号内文章的时间,以避免对用户的打扰,提高推送信息的到达率。
4.2 网络用户行为分析方式
收集到了网络用户行为的大数据之后,需要对用户进行分析,主要分析方式有以下几种:
(1)以数据分析为导向。以数据分析为导向是指在大数据分析过程中,通过收集相关数据做出下一步用户推荐服务等设计。如电子商务网站上的相关推荐和你可能喜欢等,这些数据可以微精准营销提供数据支撑。
(2)以产品设计反馈为导向。以产品设计反馈为导向是指通过数据监测、挖掘、收集、整理和统计用户数据,为产品设计或改进服务的大数据分析。如收集用户属性和用户习惯数据,用户属性是用户的基本信息字段,包括性别、年龄、地域和网龄等传统信息,倾向于用户群体分类;用户习惯包括用户的访问偏好、访问时间、流量习惯等。endprint
(3)以用户调查为导向。以用户调查为导向,倾向于基础数据的分析,如用户基本动作分析可以从用户在网站或页面的停留时间、访问量和用户活跃度等方面入手,通过对用户的使用频率进行分析,可以得出为什么用户喜欢使用该产品的这个功能。
4.3 实证研究
目前,对于网络用户行为分析应用主要集中在电子商务领域,在电子商务领域用户信息行为的数据量极大。据电子商务行业的用户行为分析公司的不完全统计显示,用户在购买产品之前,平均要浏览与该产品相关的5个网站和36个页面,同时产生在社会化媒体和搜索引擎上的交互行为也多达数十次。电子商务领域的基于大数据的用户行为分析,可以帮助电子商务企业更好地为用户开展售前、售中和售后服务。
本文以国内的某团购网站为例,分析该网站在网络用户行为分析中的大数据应用。该团购网站的移动端APP主界面配置的服务主要有:搜索服务、LBS(基于位置的服务)、产品服务分类和猜你喜欢等。其中的猜你喜欢属于推荐服务类是根据用户的以往购买行为和区域特点进行的精准推荐服务。下面以一名用户的使用团购APP为例,进行用户行为分析。
用户的购买前行为信息,可以反映出用户的购买心理和购买意向。用户A在打开团购APP的100次中有78次直接选择了主界面的美食分类,10次选择今日新单分类,9次选择电影分类和3次选择KTV分类。在进入美食分类后,用户A直接选择了智能排序中“离我最近”选项有52次,人气最高有10次,评价最高有10次,价格最低6次。用户A在选择“离我最近”的选项中,有40次在同一地点,有8次在另一个地点,有4次在其他不同位置。用户A在选择了“离我最近”之后筛选出附近的美食,在该页面平均停留320秒,之后才会在美食下的菜系分类中进行二次筛选。在菜系筛选中,用户A选择火锅14次、川湘菜15次、西餐10次、京菜鲁菜15次、烤肉烤鱼11次和中式烧烤8次等。用户A在点击某款美食打开团购详情时,在团购详情页面平均停留20秒、在图文详情平均停留28秒,评价页面平均停留90秒。用户A在78次浏览美食分类中,有16次购买行为,在16次购买行为中,从打开团购APP到下单购买时间为78秒。
通过对用户A在团购APP中的行为数据分析与其他用户对比可知,用户A使用团购APP的主要目的为浏览美食和团购美食,用户A口味倾向传统鲁菜菜系和川菜菜系,在进行选择餐饮商家的时候,倾向于选择距离自己位置近或者住宅附近的商家,用户A对价格不是特别敏感,更加注重商家位置,其次是人气和口碑,用户A在具体进行商家选择时,更加注重其他用户的评价,但是一旦决定购买,下单购买行为较快。所以,对于此类用户,团购APP在主界面中的“猜你喜欢”中展示的信息应为美食类,且距离该用户常用位置近的鲁菜和川菜美食,这样能提高用户的体验和消费次数,同时在支付环节应尽量选用成熟的第三方交易平台,能使该用户支付行为更加果断。
5 结论(Conclusion)
综上所述,大数据技术和互联网用户行为分析日益密切融合,将传统的产品设计、营销和经营管理彻底改变。大数据作用的日益凸显更要求互联网企业和传统企业能够正视大数据的作用,对大数据的应用要结合自身情况,切不可盲目跟风。
参考文献(References)
[1] 黄宜华.深入理解大数据:大数据处理与编程实践[M].北京:
机械工业出版社,2014.
[2] Nature.Big Data [EB/OL].[2014-08-31].http://www.nature.
com/news/specials/bigdata/index.html.
[3] Big data [EB/OL].[2014-08-31].http://en.wikipedia.org/wiki/
Big data.
作者简介:
左 军(1958-),男,本科,讲师.研究领域:计算机网络安
全,数据库及其应用技术,多媒体信息处理.endprint