基于大数据平台的用户画像与用户行为分析
2018-05-15谢康吴记肖静华
谢康 吴记 肖静华
中共十九大报告指出,创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。同时指出,推动互联网、大数据、人工智能和实体经济深度融合,在中高端消费、创新引领、绿色低碳、共享经济、现代供应链、人力资本服务等领域培育新增长点、形成新动能。当今,互联网、大数据、人工智能等新一代信息技术与实体经济深度融合,构成中国实施创新驱动发展战略的重要组成部分,是当前中国“大众创业、万众创新”的主战场。近年来,中国政府先后出台中国制造2025、“互联网+”行动计划等多项促进新一代信息技术与实体经济深度融合形成创新驱动的政策措施,从而对中国企业创新模式的创新提出了新要求。在众多的企业创新模式中,基于大数据平台的企业与用户互动创新逐渐成为企业产品创新的主流创新方向之一。
在互联网非大数据环境下,企业产品创新主要通过与领先用户交流合作、市场调研、问卷调查、街访、数据库数据采集等手段获取用户需求。其中,探讨领先用户特征,激励领先用户参与产品创新成为非大数据环境下企业与用户互动创新的重要手段①,由此构建用户需求分析模型来剖析需求点和变化方向。在互联网大数据情境下,电商平台、社交平台形成的大数据为企业分析用户需求提供了新资源,这种新资源改变了传统用户需求分析模式,形成了基于大数据平台的用户画像和用户行为分析。
基于大数据的用户画像与用户行为分析,离不开对用户知识抽取方法的探讨和应用。目前,自然语言处理、语义web、机器学习、知识工程、知识发现、文本挖掘等方法,构成基于大数据平台的用户画像与用户行为分析的基本技术方法。本文不对上述方法做深入分析,而是对互联网大数据环境对企业与用户关系的影响、基于大数据平台的用户画像分析和用户行为分析进行具体探讨,为构建大数据驱动的企业与用户互动创新方法研究提供初步的理论基础。
一、大数据对企业与用户关系的影响
在互联网环境下,用户对企业管理的参与度不断加深,社会媒体形成的大数据改变了以往的商业模式和运作模式②③,通过大数据了解和分析用户需求变化,与用户高频互动成为开放式创新的主要方向之一。这种趋势的增强源于互联网、大数据极大改变了企业与用户的关系。首先,互联网环境为企业提供了将用户更高效地纳入创新过程的条件,企业通过建立开放式创新的模式为用户创造价值;其次,互联网大数据通过用户广泛的信息增权提高了用户的议价能力,促使用户对企业产品研发等形成重要影响;最后,互联网不仅使用户与企业实时互动成为可能,同时促进各类虚拟社群的兴起,使企业与用户的互动方式发生本质变化。
互联网大数据环境下,企业与用户价值创造关系的改变主要体现在企业角色变化、用户角色变化和价值创造方式变化三个方面,即企业成为为用户解决问题的服务提供者,用户成为与企业共创价值的价值合作者④,如部分凭借知识贡献或特殊魅力发挥创新影响力的意见领袖或领先用户,与企业共同研发创新。同时,互联网环境下价值创造是互动形成的,价值由受益者决定。企业与用户价值创造关系和方式的改变,促使传统研发模式转型为大数据驱动的企业与用户互动创新模式。一方面,企业利用互联网技术形成新的创新模式,如基于社交网络的创新外包等,另一方面,企业利用互联网大数据增强研发能力,如提高用户参与频率和参与质量、精准锁定领先用户等,形成与用户互动创新的动态能力。
概括地说,互联网大数据对企业与用户关系的影响,体现在改变企业与用户的连接和交互关系,使企业与用户的价值交换结构和权重发生变革,宏观上促进了信息化与工业化的深度融合⑤,微观上将企业与用戶互动创新从非大数据驱动转变为大数据驱动。在大数据驱动情境下,企业对用户及行为特征的刻画,主要依赖于基于大数据平台的用户画像和用户行为分析。
二、基于大数据平台的用户画像分析
就广义而言,用户可以指购买消费品的消费者,也可以指购买工业品的供应链企业。本文讨论的用户聚焦于消费者。但是,与非大数据情境下的消费者用户主要指购买或使用企业自身产品的用户含义不同,大数据情境下的企业“用户”具有全体特征,不仅包括企业自身的消费者,也包括购买或使用竞争产品的消费者,及市场上所有潜在消费者,甚至包括跨行业的所有潜在消费者。因此,基于大数据平台的用户概念,外延扩展到全体用户。从价值共创视角来看,基于大数据平台的用户是由其价值提供和价值共创的结果来决定的,而不是由是否购买企业产品或是否参与企业某项活动来划分的。
用户画像就是将用户信息标签化,通过收集和分析用户的基本特征、社会属性、生活习惯、消费习惯等数据,抽象出一个虚拟用户的特征全貌,从而帮助企业全方位、多层次地了解用户行为特征,把握用户行为方向⑥。目前,建立用户画像成为大数据驱动的用户行为分析的流行方式之一,通过对用户标签化,构建数据模型来探讨“全样本”用户的行为特征,正成为互联网环境下企业产品研发创新与营销创新的趋势。从技术管理角度来看,基于大数据平台的用户画像构造分为三步,第一步是搭建用户画像技术架构,如数据整理、平台和应用等;第二步是用户画像数据分类;第三步用户画像构建,包括精准识别用户、动态跟踪用户行为轨迹、结合静态数据评估用户价值、确定用户标签与权重、不同群体优先级排列等⑦。
综合上述讨论及我们对企业大数据用户画像构建的实地调研,可以认为,基于大数据的用户画像有两个基本要点,一是通过将市场中的用户特征按不同层面、不同维度赋予不同的标签体系,再通过需求将不同标签组合形成的情境化用户特征,构成用户画像分析的基本逻辑。因此,基于大数据的用户画像分析,就是按用户标签化降维、按需求进行标签重组、按特征筛选标签、投放市场验证、根据反馈大数据修正标签,及迭代完善知识库的步骤来完成的(参见图1);二是基于大数据的用户画像是一个用户画像集,从不同维度可以构建用户基本属性画像、用户行为特征画像、用户产品特征画像、用户互动特征画像等,如从用户对产品的系列偏好、功能偏好、外观偏好、体验偏好,及工艺偏好等维度构建用户产品特征维度模型,形成对用户产品特征画像的刻画。例如,Kim & Park(2017)结合文本挖掘和案例推理技术的算法,对苹果App Store评论数据进行分析,实现产品创新机会和对标产品的识别功能。
由用户画像生成逻辑可以看出,基于大数据平台的用户画像有三个主要特征:
一是用户画像是一个虚拟化的用户全集的概念,是真实用户某个层面、某个维度特征的数据化重组后的虚拟体现,因此,用户画像刻画的用户特征,不再是单个用户的个体特征,也不是全体用户的平均化特征,而且根据企业需求形成的特定用户群体特征,我们称为情境化用户特征。因此,可以基于用户画像构建千人千面的用户;
二是用户画像反映了情境化用户的大概率行为,不代表情境化用户的全局性必然行为。基于大数据平台的用户画像通过对用户属性或维度的标签化和结构化,形成对用户行为的分层分类分析,而不是用户数量之间的统计分析,代表了情境化用户的一种全局性大概率行为特征。诚然,通过对用户画像集的持续迭代,知识库的持续迭代等工作,可以提高对情境化用户行为概率的判断水平。因此,可以基于用户画像进行用户行为分析;
三是用户画像是一个具有向量特征的结构化和半结构化数据集,可以构建出反映某种兴趣、情绪等心理特征的情境化用户。借助深度学习等人工智能方法,能够刻画出具有智能特征的自我演化新用户,即现阶段真实市场中可能不存在的情境化用户。企业对此类虚拟用户特征的分析,可以从中寻找到创新产品市场培育的领先方向。因此,可以基于用户画像进行市场培育方向的先导分析。
三、基于大数据平台的用户行为分析
在用户画像构建和分析基础上,根据企业需求可以对基于大数据平台的用户行为进行分析。从技术角度看,基于大数据平台的用户行为,指通过页面之间的路径关系分析、频道关联分析、最终转化率分析、热点分析,及访问兴趣分析等途径,识别用户行为的群体特征,从中挖掘群体用户在某个节点的异常行为,触发产品研发或优化需求(胡宇辰和郭宇,2013)。从管理角度看,基于大数据平台的用户行为,指基于大数据用户画像的行为特征,如参与动机、参与行为和参与结果等,或用户交互特征、用户产品使用率和使用时间等。在大数据用户行为知识抽取中,用户情感倾向性抽取对于用户行为分析尤为关键。例如,Lin et al.(2017)收集eWOM评论数据并通过基于计算机的情感分析方法,对评论词进行情感分类并跟踪词频动态特性来挖掘顾客需求的演变⑧。
基于大数据平台的用户行为分析,首先需要构建用户画像模型。在用户画像模型基础上,对用户行为按不同层面、不同维度进行标签刻画,即用户行为的标签化降维;其次,根据企业需求,通过针对领先用户的知识抽取方法识别出领先用户,企业利用大数据对领先用户进行精准识别,其后对产品研发类型与领先用户类型进行高效匹配,再借助大数据对领先用户的创新或创意进行知识产权或发明权征信查询,明确创新产权。同时,企业通过针对普通用户的知识抽取方法刻画普通用户,并不断优化制度设计激励普通用户持续形成大数据,以利于企业提取更全面的市场消费方向和潮流;再次,基于大数据平台分别构建领先用户行为模型和普通用户行为模型,根据需求将用户行为标签重组,分别提炼出领先用户和普通用户的情境化行为特征,再分别在真实用户群中进行精准验证;最后,反馈市场验证的结果,完善修改用户行为标签,将知识发现成果纳入知识库,形成更高精准度的知识抽取,企业的反馈修正标签又会对真实市场中的用户行为产生影响,促使其迭代形成新一轮的用户大数据。图2勾勒出上述基于大数据平台用户行为分析框架。
要实现上述对基于大数据平台用户行为的更精准分析,一方面需要借助用户画像数据建模、用户行为特征分析算法、用户细分方法、用户行为分析分类模型、用户兴趣与情绪模型,及基于大数据的用户价值评估模型等方法;另一方面,需要将传统的消费者行为理论及方法在大数据情境下进行改造和拓展,将其与基于大数据的用户行为分析方法相结合,引入相关的计量经济学方法进行数据处理和分析,构建面向企业需求的大数据用户分析框架。
图3给出了一种基于大数据的用户行为建模框架。在此,用户行为分析指借助数学方法、统计分析和计算机技术建立和应用数据模型,对企业与用户之间的互动创新活动、关系及其影响的数量规律进行分析。首先,对结构化的企业各种业务数据和非结构化的用户交流数据采用数据挖掘、文本挖掘和社会网络分析等方法进行数据预处理;其次,鉴于采用的分析方法具有动态性、互为因果推断和模型非线性特征,一方面,可采用潜变量曲线增长模型(LGM)、联立方程组(SE)和动态广义矩估计(GMM)等计量分析技术构建企业与用户互动创新的分析模型,分析随时间变化,不同用户个体和群组在互动过程中的变化轨迹,量化企业与用户之间交互影响的大小,另一方面,可采用马尔可夫过程(MP)和蒙特卡洛模拟等仿真分析方法模拟企业与用户互动创新的动态过程,对企业与用户互动过程的发展进行预测分析。
这样,通过将图2的分析框架和图3的分析模型结合起来,可以对基于大数据的用户行为进行分析,或不断完善图3的分析模型,将其分别嵌入图2中的领先用户行为模型和普通用户行为模型中,可以对领先用户和普通用户行为分析进行持续的精确化改进。
举例来说,中国大陆某知名电商淘品牌企业拥有上百万的活跃会员,企业希望通过基于大数据平台的用户行为分析来提高用户购买价值、改善产品创新和设计、发掘潜在的新用户。为此,该企业采集了在线品牌社区、官方新浪微博、微信公众号、App应用等社交媒体平台上企业与用户非结构化的交互数据,并将这些数据与企业内部的结构化的交易记录等相关联,形成用户行为分析大数据。对于非结构化的交互数据,企业通过社会网络分析形成用户之间交互网络属性、用户与产品交互网络属性等特征;同时,采用文本挖掘中的情感分析技术和主题模型分析用户的情感偏好和话题偏好等特征。对于结构化的内部数据,企业采用RFM模型、聚类分析等区分用户购买价值特征、产品偏好特征等。此外,该企业还结合用户人口统计特征采用深度学习、SVM算法等监督学习算法来预测用户的潜在价值和偏好,形成用户的潜在特征。基于这些分析,企业了解并形成了用户基本行为特征集。企业在进行产品促銷和研发过程中,搜寻出产品促销和研发匹配的用户群体,通过该用户群体关联的活动轨迹和偏好属性来更好地设计促销和研发模式。进一步,在改进产品促销策略和产品设计的过程中,该企业还采用双重差分、生存分析等计量模型分析策略改进对用户购买和流失行为的影响,从而验证或完善企业的策略。通过上述方法,企业发现,基于大数据平台的用户行为分析能指导其更好地实施产品研发和营销策略,带来产品销量和用户价值的提升。
四、深度融合趋势下的大数据用户分析
移动互联网、云计算成为推动电商平台和社交平台大数据生成的重要推手,正在迅速崛起的工业互联网、人工智能将成为企业和社会各平台大数据生成的又一重要力量。在互联网、大数据、人工智能等新一代信息技术与实体经济深度融合趋势下,企业创新更加强调对用户需求的精准把握和预测,产品研发创新和营销创新更加依赖基于大数据平台形成的用户分析结果。因此,做好基于大数据平台的用户需求分析,不仅可以对产品创新模式、企业营销模式变革进行持续迭代改进,而且可以有效推动企业互联网转型的管理创新⑨。
深度融合趋势下的大数据用户分析有两个重要抓手,一是需要对大数据用户画像特征进行准确把握,二是需要对大数据用户创新知识抽取方法进行综合应用。目前,如何解决好面向中文自然语言的自动知识抽取方法,构建大数据用户分析的知识图谱,成为基于大数据平台用户分析与知识抽取方法需重点探讨的方向之一,如构建针对产品研发创新和营销创新的知识库或语料库,为企业开放式创新行为提供准确的词汇解释,成为构建大数据用户创新知识抽取方法的关键环节。总之,尽管基于大数据平台的用户画像和用户行为分析还存在诸多挑战,但深度融合趋势下的大数据用户分析,将成为企业乃至社会各行业决策管理的重要基础,成为大数据驱动创新时代“以用户为导向”的新型模式,这是全球大数据经济和管理发展的潮流和方向。
① Von Hippel E and Katz R. Shifting Innovation to Users via Toolkits. Management Science, 2002, 48(7): 821-833.
② 冯芷艳,郭迅华,曾大军,陈煜波,陈国青《大数据背景下商务管理研究若干前沿课题》《管理科学学报》2013年第1期。
③ 徐宗本,冯芷艳,郭迅华,曾大军,陈国青《大数据驱动的管理与决策前沿课题》《管理世界》2014年第11期。
④ Vargo S.L. and Lusch R.F., Service-dominant Logic: Continuing the Evolution. Journal of the Academy of Marketing Science, 2008, 36(1): 1-10.
⑤ 谢康,肖静华,周先波,乌家培《中国工业化与信息化融合质量:理论与实证》《经济研究》2012年第1期
⑥ 亓丛,吴俊《用户画像概念溯源与应用场景研究》《重庆交通大学学报(社科版)》2017年第5期。
⑦ 席岩,张乃光,王磊,张智军,刘海涛《基于大数据的用户画像方法研究综述》《广播电视信息》2017年第10期。
⑧ Lin C, Liaw S, Chen C, Pai M, Chen Y. A Computer-based Approach for Analyzing Consumer Demands in Electronic Word-of-mouth. Electronic Markets, 2017, 27(3): 225-242.
⑨ 吴瑶,肖静华,谢康,廖雪华《从价值提供到价值共创的营销转型——企业与消费者协同演化视角的双案例研究》《管理世界》2017年第4期。
基金项目:国家自然科学基金项目“虛拟品牌社区消费者参与影响及其购买和口碑行为的动态机制研究”(71601190)、国家自然科学基金项目“互联网环境下企业与消费者协同演化动态能力的构建、演进及影响研究”(71771223)阶段性成果。