深度学习值得投资吗
2020-01-08格伦·厄本阿尔乔姆·季莫申科帕拉姆维尔·迪隆约翰·豪泽
格伦·厄本 阿尔乔姆·季莫申科 帕拉姆维尔·迪隆 约翰·豪泽
深度学习在大数据库分析方面的优势越来越明显,它可以从中摸索出规律并得出洞见。不难想象有一天,企业能够广泛整合各种数据库,以更高的水准和更强的分析能力来识别消费者需求,并利用所得信息进行精准的市场营销。
深度学习和普通数据分析究竟有何不同?它是实现了质的飞跃,还只是稍有改进?为了比较两者的作用,作者研究了一个与信用卡市场相关的大型数据库,探寻多层次深度学习模型是否可以比传统模型更准确地预测人们对信用卡的选择。
该数据库源自大型信用卡网络供应商NerdWallet,其中包括点击流、人口统计和广告曝光等相关信息。作者利用这个数据库比较了三种顾客选择信用卡的模型。第一种是简单线性回归模型,第二种是简单的深度学习模型,第三种是简单深度学习模型的加强版。
根据分析,两种基于深度学习的模型都能够比传统方法更准确地预测用户对于信用卡的选择。然而,改进并没有预期的那么大:简单线性回归模型的准确率为70.5%,简单深度学习模型的预测准确率稍高一些,为71.7%,复杂深度学习模型的预测准确率为73%。
既然深度学习对选择预测的改进有限,市场营销部门是否还有必要投资该技术并开发其关键能力?作者认为,和传统的数据分析相比,深度学习带来的预测准确率的小幅提升,在多数情况下不大可能产生足够丰厚的回报,因此不值得大举投资。在试水之前,企业不但要考虑可能的收益,还要考虑执行的风险和成本。
深度学习的主要缺点在于很难确定哪些变量能对消费者的选择产生更大的影响。是信用卡旅行奖励还是低利率?由于变量是通过众多影响选择的潜在层进行处理的,因此很难衡量其中某一个变量的影响。营销经理的直觉判断很难与模型结果相关联,這将使深度学习的实施变得困难。
当然,还有其他因素需要考虑。获取深度学习技术需要成本,实施该技术也需要相关人员,同时还可能导致额外数据成本。除此之外,即使使用当今的快速计算机,深度学习模型也需要大量的计算资源,并且可能需要较长的运行时间。大多数情况下,除非预测准确性的小幅提升能够大大降低成本或增加收益,否则用深度学习取代传统数据分析缺乏充足的理由。
尽管如此,作者仍然认为,某些情况下深度学习前景光明。与传统的线性回归模型相比,深度学习在分析包括图像和非数值数据在内的“丰富”数据库方面具有显著优势。这些丰富数据涵盖了用户生成的所有信息(例如亚马逊评论、Instagram帖子、脸书帖子以及公司网站上的评论),其潜在价值是巨大的。
深度学习特别适合识别异质和非结构化数据中的模式。例如,有一种基于深度学习的模型可以帮助汽车设计师预测消费者对绘图板上的汽车原型有何反应,同时也可产生新产品创意。另一个案例中,研究人员根据客户的新闻消费行为创建了一个模型,以预测他们将来阅读新闻的习惯。最近,企业已经开始使用深度学习来分析消费者在社交媒体上发布的品牌服装图片,同时预测哪些商品的客户退货率最高,哪些优惠券产生的利润最大。
随着基于深度学习的新算法和更丰富的数据库的出现,深度学习有望提供更好的结果。
格伦·厄本 阿尔乔姆·季莫申科 帕拉姆维尔·迪隆 约翰·豪泽
深度学习在人工智能(AI)应用方面正取得令人瞩目的成果。例如,通过苹果手机智能语音助手Siri将人声转换成计算机命令,用户可以获取所需问题的答案,发送个人信息以及在不熟悉的路段寻求导航服务。自动驾驶则解放了人们的双手,虽然目前仅局限于高速公路,但这项技术最终会在城市街道中普及。在生物学领域,研究人员正在为基于DNA的药物研制新分子。
鉴于上述活动都是通过深度学习进行的,许多人都想知道这些方法将如何改变营销的未来。它们将在多大程度上帮助企业设计出可赢利的新产品和服务,从而满足客户需求?
深度学习技术在大数据库分析方面的优势越来越明显,它可以从中摸索出规律并得出洞见。不难想象有一天,企业能够广泛整合各种数据库,以更高的水准和更强的分析能力来识别消费者需求,并利用所得信息进行市场营销。例如,不久之后,被人脸识别出的消费者在采购生鲜食品时,可能会收到根据他们的购买习惯赠送的个性化优惠券。將来,广告也可能会根据消费者的不同个性单独设计,并在他们观看YouTube时实时投放。深度学习还可用于设计产品以满足消费者的个人需求,然后通过自动3D打印系统生产并交付。
不同类型的企业将尝试以各自不同的方式发挥深度学习的作用。汽车制造商可能会利用这一技术瞄准新客户、改进购买流程或针对特定消费者需要的产品功能进行微调。完成上述任务需要凭借海量的相关数据,包括汽车维修数据、消费者对汽车质量和可靠性的评级、机动车注册登记信息、有关购车和用户体验的推特(Twitter)帖子、脸书(Facebook)上向人们展示自己汽车的帖子、制造商的消费者关系管理数据文件以及互联网上的点击。同时,银行可以借助深度学习开发新产品或服务,并定制促销活动。通过分析客户贷款历史、信用卡交易、储蓄和支票账户记录、网站点击量、社交媒体行为、产品评级和搜索历史等数据,银行对某些客户的喜好了如指掌。例如,居住在城市社区中的40岁专业人士最希望从信用卡中获得什么?是旅行奖励?买家保障?现金返还还是低利率?
可以肯定的是,许多管理者已经将数据分析与统计模型和重点数据库相结合,从而追踪品牌绩效、安排促销活动并做出开支决策。那么,深度学习和普通数据分析有何不同?它是实现了质的飞跃,还只是稍有改进?在本文中,我们将参照针对信用卡所做的一项研究来审视这些问题。同时,我们也会讨论这项研究对于数据分析未来发展方向的启示。
尽管我们在深度学习方面仍处于摸索阶段,但现在问这样的问题并非为时过早:与管理者所习惯的现有数据分析方法相比,深度学习究竟能给企业带来什么?它可以提供更好的预测吗?如果不能,如何改进?为了利用其最新和最强大的功能,企业必须在数据和技术方面进行哪些投资?我们的研究表明,尽管深度学习的效果可能不会立竿见影,也不会在每种情况下都能大幅提高预测的准确性,但我们仍有理由对这项技术的应用前景保持乐观。
我们的实验
为了将深度学习与传统的营销数据分析方法进行比较,我们研究了一个与信用卡市场相关的大型数据库,该数据库源自大型信用卡网络供应商NerdWallet,其中包括点击流、人口统计和广告曝光等相关信息。我们想看看多层次深度学习模型是否可以比传统模型更准确地预测人们对信用卡的选择。
能够准确预测顾客的选择是改进决策的第一步。这些决策涉及产品设计、媒体资源分配、产品推广(本案例中的产品是信用卡)以及目标顾客的锁定。想了解人们在选择信用卡时最看重的是什么,就需要进行实验并设计预测模型。直觉告诉我们,与更简单的回归模型相比,深度学习将提供更清晰且更具价值的图景。为了检验这一假设,我们做了一项研究,看看26万名顾客是如何选择信用卡的。这一研究将25个人口因素(包括年龄、性别、家庭收入等一目了然的信息以及信用评分、消费者目前拥有的信用卡和邮政编码等详细分类信息)、每张卡的132个属性(例如利率、是否提供奖励积分、旅行里程数、现金返还以及年度会员卡费和余额转账费)以及每个人申请的卡片都考虑在内。
NerdWallet网站汇总了来自数百家银行大约2,000种不同信用卡的信息和专家评论,以便顾客比较它们的功能,确定哪些属性对自己更重要。用户在线浏览的产品通常会被记录在案。用户点击进去以后,查看更多详细信息或者选择特定卡片进行比较的过程也会被记录在案。用户在NerdWallet网站上确定自己需要哪种信用卡之后,将被引导至相应银行的网站以完成申请。出于研究目的,我们将这一步视为用户做出的最终选择。
我们利用NerdWallet的数据库比较了三种选择模型。(参见副栏“数据分析的技术说明”)第一种是以个人用户人口统计因素和信用卡属性为变量的简单线性回归模型。每一个变量通过方程式都会对消费者选择产生简单而又直接的影响,变量之间没有相互作用。例如,个人客户每消费1,000美元获得的奖励里程数乘以0.058的系数,可能有助于预测消费者是否会选择美国运通经典绿卡。
第二种是简单的深度学习模型,该模型在输入变量和选择概率之间包含了隐藏层。每个输入变量(例如奖励里程)都会和一个潜变量相关联,而该潜变量同时又与选择概率相关联。潜变量没有具体确定,它们是第一级输入变量的组合,同时又与下一级模型的其他潜变量相关联。以此类推,后续的潜变量又是其他潜变量的组合。似乎没必要搞得这么复杂,但深度学习的优势恰恰就在于连接隐藏层中的潜变量,否则就不能称为“深度学习”。我们的模型有三个层次。第一层捕获了观察到的信用卡属性和人口统计因素对一组潜变量的影响;接下来,我们研究了这些潜变量对后续潜变量层的影响。最终,我们希望通过这三个允许复杂交互和非线性的隐藏层,更准确地预测用户对于信用卡的选择。
第三种是简单深度学习模型的加强版,其中因变量是选择概率以及消费者在最终选择时考虑使用的特定卡片。它将购买过程中的详细信息和用户关心的其他信用卡(基于他们的点击流)的详细信息等因素考虑在内。通过将这一额外的考虑步骤添加到购买过程中,我们认为可能会提高基本深度学习模型用户选择预测的准确性。
我们的发现
根据分析,两种基于深度学习的模型都能够比传统方法更准确地预测用户对于信用卡的选择。(参见副栏“深度学习如何超越传统的营销数据分析”)然而,改进并没有我们预期的那么大。
简单线性回归模型的准确率为70.5%。这意味着在70.5%的情况下,我们能够准确预测某位特定消费者对信用卡的选择。简单深度学习模型的预测准确率稍高一些,为71.7%,复杂深度学习模型的预测准确率为73%。
我们曾以为,添加更多潜变量层将大大提高预测的准确率。然而事实并非如此。凭经验优化的线性回归模型同样准确可靠。包括人口因素和信用卡属性在内的众多参数确保了传统方式预测的准确性。
成本與收益
我们的研究是否能够揭示深度学习的潜力?既然深度学习对选择预测的改进有限,市场营销部门是否还有必要投资该技术并开发其关键能力?我们认为,和传统的数据分析相比,深度学习带来的预测准确率的小幅提升,在多数情况下不大可能产生足够丰厚的回报,因此不值得大举投资。在试水之前,企业不但要考虑可能的收益,还要考虑执行的风险和成本。
深度学习的主要缺点在于很难确定哪些变量能对消费者的选择产生更大的影响。是信用卡旅行奖励还是低利率?由于变量是通过众多影响选择的潜在层进行处理的,因此很难衡量其中某一个变量的影响。我们固然可以模拟一个变量中变化的影响,但该影响取决于深度学习模型的复杂结构中使用的所有其他变量的级别。营销经理的直觉判断很难与模型结果相关联,这将使深度学习的实施变得困难。
当然,还有其他因素需要考虑。获取深度学习技术需要成本,实施该技术也需要相关人员,同时还可能导致额外数据成本。除此之外,即使使用当今的快速计算机,深度学习模型也需要大量的计算资源,并且可能需要较长的运行时间。如果要求实时实施,上述担忧将成为深度学习技术中一个实实在在的短板。大多数情况下,除非预测准确性的小幅提升能够大大降低成本或增加收益,否则用深度学习取代传统数据分析缺乏充足的理由。
尽管如此,我们仍然认为,某些情况下深度学习前景光明。正如我们所指出的那样,与传统的线性回归模型相比,深度学习在分析包括图像和非数值数据在内的“丰富”数据库方面具有显著优势。这些丰富数据涵盖了用户生成的所有信息(例如亚马逊评论、Instagram帖子、脸书帖子以及公司网站上的评论),其潜在价值是巨大的。尽管NerdWallet网站包含高度精细的搜索和产品数据,但它的数据服务并没有达到足够丰富的水平,因此其优势也没有得到充分发挥。掌握消费者对信用卡的口头评价可能会提高预测的准确性。
深度学习特别适合识别异质和非结构化数据中的模式。例如,本文几位作者最近开发了一种基于深度学习的模型,以帮助汽车设计师预测消费者对绘图板上的汽车原型有何反应,同时也产生新产品创意。另一个案例中,研究人员根据客户的新闻消费行为创建了一个模型,以预测他们将来阅读新闻的习惯。最近,企业已经开始使用深度学习来分析消费者在社交媒体上发布的品牌服装图片,同时预测哪些商品的客户退货率最高,哪些优惠券产生的利润最大。管理人员可以据此制定更好的产品退货政策以及更有效的折扣策略。我们中一些人的前期研究表明,深度学习可以帮助企业更有效地预筛用户生成的内容,从而将数据分析师的工作重点放在具有高度信息量的评论上,这些评论能够以比传统方法低得多的成本识别客户需求。
深度学习的应用机会层出不穷。它鼓励实验,并使得A/B测试能够根据观察到的结果实时调整。我们已经开发出一种简单的人工智能方法,可以将在线广告的图像和内容与消费者的认知风格相匹配,同时设计实时有效的实验系统,为每组客户灵活获取最佳的广告文案。现有的统计模型能够让公司将广告定位到在线消费者。然而,人工智能系统可以让营销人员根据个人的认知和交流风格定制广告文案,根据他们的视觉偏好自定义图片和图形,同时结合统计数据和其他证据使其决策风格与之相符。这些应用已经取得了良好的成效。随着基于深度学习的新算法和更丰富的数据库的出现,深度学习有望提供更好的结果。
对企业的启示
上述讨论对企业而言意味着什么?根据我们的经验,我们为营销经理总结了以下几条启示。
1.关注未来机会 基于统计的传统系统仍将在营销数据分析中发挥关键作用,但深度学习迟早会改善当前的运营,并为新问题提供解决方案。这方面最有潜力的领域包括更复杂的促销预算和规划、更高级的客户定位以及更完善的新产品开发。
2.创建丰富的数据库 整合多种数据源和数据类型可能会在市场反应分析和营销资源的优化方面取得重大进展。深度学习的最大成本往往涉及数据获取、数据库的创建和维护。在我们针对用户选择信用卡的调查中,超过50%的成本与数据的收集、标记以及清理有关。因此,认为深度学习值得在业务中推广的管理者应该投资于软件,以便从公司网站、亚马逊、推特和Instagram收集消费者评论,以及客户个人搜索和购买决定的点击流记录。
3.通过培训和招新的方式培养能力 想要发挥深度学习的优势,熟悉数据库的全职专家必不可少。他们知道如何最大程度地利用丰富的数据,解决以前从未解决过的营销问题,并发现新的战略视角。处理丰富的数据,需要人工智能方面的高端知识,以及聘请顾问以补充现有内部人员的充足预算。
4.制订实验计划 除了使用深度学习进行更好、更高效的A/B实验,你还可以用它来测试新的营销变量。这方面最大的潜力可能在于,系统性地使用不同变量,展开有针对性的实验,评估反应情况。目前来看最好的做法是对每位用户采用不同的实时刺激,然后通过深度学习方法分析实验结果。
对未来的思考
尽管深度学习的实施需要付出较高的成本,也面临诸多挑战,但它使得分析丰富的数据库和开展实时实验成为可能,我们对它提升营销实践的潜力充满信心。深度学习应用于营销数据分析,可以起到如下几点作用:(1)改善对市场反应的预测,从而帮助实现利润和营销投资回报率(ROI)的最大化;(2)揭示产品开发的新机会;(3)允许更有针对性的产品设计、分销、促销以及媒体优化。尽管旧数据和传统数据分析收益甚微,但在很多新的数据分析应用中,准确性和洞察力的提高将证明在深度学习技术和数据上投资是值得的。