APP下载

用户反馈及声誉对实时竞价广告需求端平台的激励研究

2021-04-19覃朝勇何荟依吴传榕

关键词:竞价声誉欺诈

覃朝勇,何荟依,吴传榕

实时竞价(real-time bidding,RTB)广告是近年来互联网广告发展的最新趋势,是继搜索引擎关键字竞价广告之后出现的一种新兴互联网广告模态。实时竞价通过程序化进行即时拍卖,以每次展示图像或视频的方式拍卖广告资源,利用人群定向技术,在海量网站上,针对每一个用户进行评估并出价,是一种新兴互联网展示广告(display advertising)竞价技术。一旦竞价成功,广告内容就会立刻被传送并得以展示曝光,其中包括目标受众识别、竞价和广告投放在内的全部过程将在浏览器缓冲的10 至100 毫秒内完成,因而称为“实时竞价”[1]。RTB 的出现彻底变革了互联网广告的投放技术和售卖模式,自诞生以来便呈现出井喷式的增长态势。

在实时竞价广告中,需求端平台(demand side platform,DSP)代理广告商进行广告投放活动,广告商作为委托人关注广告效果,DSP 作为代理人关注自身的收益,委托人和代理人利益不一致。由于信息不对称,广告商无法对DSP 的广告投放活动实时跟踪,从而易出现以道德风险为主的机会主义行为,如广告造假、欺诈。百度公司发布的《2015 年的搜索推广作弊市场调研报告》指出在百度公司每天监测的无效广告点击中,人工作弊约5%,机器作弊约49%~65%。2020 年第三方技术公司秒针系统的监测数据显示,中国互联网广告异常流量占比8.6%,欺诈广告联盟的异常点击占比高达17.9%①数据来源:www.199it.com/archives/417057.html.。此现象引起了学术界的广泛关注,部分学者认为,需要从广告参与方不同角度对广告欺诈进行检测,并提出多种检测方法。然而,广告欺诈检测具有一定的滞后性,未能很好地解决广告造假、欺诈问题,需要通过有效的机制来预防。委托代理理论主要研究利益不一致和信息不对称环境下,委托人如何设计最优契约以激励代理人,如柴正猛、付聪结合声誉效应设计供应链金融的激励契约,以防范和化解道德风险和信息不对称等问题[2];肖美丹、任曼琳等以委托代理理论为基础,建立了创新激励机制模型,解决供应链双边创新信息不对称问题[3];陈艳、谢亚雯等通过构建声誉激励与显性激励相结合的动态激励机制,缓解了再制造闭环供应链系统中信息不对称问题[4]129-135。这些研究对于有效解决实时竞价广告中广告造假、欺诈问题具有重要借鉴意义。目前,实时竞价广告中以委托代理理论对DSP 进行约束与激励的研究较少,在信息不对称情况下,如何设计相应的激励机制,约束DSP 行为与减少广告造假、欺诈现象是至关重要的。

本文基于委托代理理论,以单个广告商和单个DSP 为研究对象,建立用户反馈因素显性激励模型、声誉机制与显性激励机制结合的两阶段动态激励模型,探讨激励机制发挥作用的机理和条件,以减缓RTB 中委托代理关系的信息不对称问题,减少广告造假、欺诈现象的发生,促进广告商与DSP 之间达成更为有效的契约。

一、文献综述

从委托代理视角来看,我国互联网广告的实时竞价模式是一种新型广告代理制。柳庆勇等提出,在我国广告代理制中,广告商与广告公司的委托代理关系存在道德风险[5]。随着实时竞价模式的出现,需求端平台(DSP)成为互联网广告的新型代理平台,运用大数据分析等技术服务于广告商[6]。李娟娟等在研究中提出需求方代理平台会将发布商发布的广告印象信息传递给所代理的广告商[7]。在实时竞价广告的代理模式中,由于各方之间存在信息不对称的问题,为获取额外利益,广告造假、欺诈现象频繁发生,如Stone–Gross 和Stevens 等提出由于发布媒体能从曝光机会欺诈中获取收益,互联网出现大量虚假网站以赚取广告费[8]。鞠宏磊、李欢探讨了在实时竞价模式下,DSP 与发布商的交易在AdX(Ad-Exchange,广告交易平台)上以极短的时间完成,造假问题的频繁发生,增加了治理难度[9]。刘梦娟、岳威等在研究中提到,在线广告的各参与方都有可能受利益驱动从事欺诈活动,这已是在线广告产业中一大问题[10]。对于频繁发生的广告造假、欺诈现象,学者们提出多种广告欺诈的检测方法。Abbasi 和Chen 针对曝光欺诈问题,提出一种检测虚假网站的分类器[11]。Perera 和Nenpane 等利用机器学习模型建立分类器来检测欺诈点击[12]。Hu 提出基于回报结算方式来有效预防转化欺诈的方法[13]。

上述文献根据广告造假、欺诈现象提出的检测方法具有滞后性,而广告造假、欺诈现象的产生主要源于广告商与DSP 之间的信息不对称。基于委托代理理论对该问题的研究鲜有报道。柳庆勇从委托代理角度提出广告代理应实行效益分配制,同时满足“激励相容约束”与“参与约束”条件,从而防范广告代理方的道德风险,激励广告代理方提升专业分工、代理服务水平[14]。而在其他领域中,已有较多关于委托代理的研究。姬晓辉、张蒙等以博弈论和激励理论为基础,研究了双重信息不对称情况下电子产品逆向供应链的激励机制[15]。关于服务型制造企业开放式服务创新,和征、张志钊等结合公平理论建立了声誉激励模型[16]。徐延、刘丹利运用博弈论等方法,在激励模型中引入监控机制,扩展了激励机制的理论框架[17]。时茜茜、朱建波等通过构建双重声誉激励与显性激励相结合的两阶段动态模型,缓解信息不对称问题,防范代理人道德风险[18]。

综上所述,在实时竞价广告中,当前的研究集中在广告欺诈的检测方法上,很少基于委托代理理论来研究广告造假、欺诈问题。

二、模型建立与分析

(一)理论分析

信息系统本身具有的反馈功能是信息效果检测的最佳途径[19],实时竞价广告中,广告商以用户反馈来评估广告效果,如广告点击量与广告转化量。广告点击量是指来访用户点击广告的次数,广告商通过广告点击量评估广告效果,并对DSP 进行付费,但广告商无法掌握广告活动的具体信息,无法完全避免点击造假;而广告转化量是指用户在登陆广告商页面上进行进一步的操作,如点击“购买”按钮或其他广告商期望的行为。广告商期望的用户行为包括:在站点上停留足够的时间、浏览网站上的特定页面、在网站上注册或提交订单、通过网站或在线即时通讯工具咨询等。显然,广告转化量是广告商可以观察到的信息,能够更真实地反映广告效果。因此,在广告点击量的基础上,结合广告转化量对DSP进行激励,可以促进DSP 做出有利于广告商的选择,降低道德风险发生的概率。

随着委托代理理论的深入发展,声誉激励理论被引入委托代理关系的研究中,在信息不对称的情况下,声誉等隐性激励能够在多次重复博弈代理关系中激励代理人。法玛等经济学家研究发现,在竞争性的代理人市场上,代理人的市场价值取决于其过去的经营业绩,若代理人以往的经营业绩良好,人们就会对其表现良好的预测,提升其人力资本的市场价值,形成声誉效应,从而达到对代理人激励的效果;相反,形成棘轮效应,从而弱化对代理人的激励效果。Formbrun和Shanly 提到,企业声誉可作为一种明确信号,在约束自身行为的同时能够影响利益相关者对公司的态度和行为[20]。在DSP 市场中,业绩与声誉越好的DSP 更容易被广告商选择并进行长期合作,DSP 会通过提高自身努力水平,在约束自身行为的同时享受建立高声誉所带来的好处。

(二)未考虑声誉机制的用户反馈因素显性激励模型

在实时竞价中,广告商无法观察到DSP 的努力水平,信息不对称会引发道德风险问题。本节以实时竞价广告中单个广告商、单个DSP 为研究对象,以广告点击量作为用户反馈因素,引入广告转化量用户反馈因素作为激励因素,构建信息不对称下的显性激励模型。

为便于理解,本文有以下符号说明。

表1 符号及其意义

本文有如下假设:

假设1:DSP 是风险规避的,广告商是风险中性的。DSP 的风险规避效用函数可用Pratt-A rrow 效用函数表示为u=-eρω。

假设2:广告点击量函数为Q=ka+θ,k是DSP自身能力对广告点击量的影响系数,a为DSP 的努力水平,θ为市场不确定性因素,θ~(0,σ2)①期望标准化,下同。

假设3:DSP 收入函数为S(Q,m)=α+βp(Q+φm)。式中α为广告商按广告曝光次数支付给DSP的费用,β为激励系数,p为每产生一次点击的成本,m为广告转化量,m~(),φ表示DSP 的收入受m的影响系数。

假设4:广告商点击价值函数为T=vQ,v为广告每点击价值。

广告商收益函数为-S(Q,m),广告商是风险中性的,广告商的期望效用等于期望收益,-α+k(v-pβ)a。

DSP 收益函数为(Q,m)-C(a)。由于DSP 风险规避,其确定性等价收入为:

(三)声誉机制与显性激励机制结合的动态激励模型

在用户反馈的显性激励机制模型基础上,引入声誉机制作为隐性激励,构建两阶段的动态激励模型,采用逆向归纳法从第二阶段开始求解,研究声誉机制下的努力水平以及激励系数。

本节同样以单个广告商和单个DSP 为研究对象,在广告商以用户反馈因素激励的同时,DSP 也会为了维持声誉而提高努力水平,即合理契约的达成需要双方的共同努力。考虑声誉因素的模型分为两阶段,DSP 每个阶段的广告点击量函数为:Qt=kat+θ+φmt-1,t=1,2,其中mt-1为上一阶段的广告转化量,假设θ~(0,τσ2),mt-1~(0,1-τ)σ2)。DSP收入函数为S(Qt)=αt+βtπ,其 中πt=pQt,成本函数为。广告商点击价值函数为Tt=vQt。假设DSP 仍然是风险规避的,广告商是风险中性的,贴现率为δ>0。

进一步根据理性预期公式得:

其中,τ为修正系数,反映了Q1中包含有关θ和mt-1的信息;为市场对DSP 第一阶段努力水平的估计值;为市场对DSP 第二阶段努力水平的估计值。

广告商的收益函数为:UG2=T1-S(Q1)+[T2-S(Q2)]δ

DSP收益函数为:V(D2)=S(Q1)-C(a1)+[S(Q2)-C(a2)]δ

DSP 平台的确定性等价收入为:

广告商效用最大模型为:

第一阶段对DSP 的参与约束(IR1)与激励相容约束(IC1)为:

广告商基于DSP 第一阶段产生的广告点击量判断其能力,设置第二阶段激励机制,确保自身收益最大化,即:

DSP 第一阶段的广告点击量决定了其在市场中的声誉,也具备了一定的讨价还价能力,用d表示,d∈[0,1],第二阶段的参与约束为:

其中,(IR3)中的n为确定常数,d为DSP在第二阶段合作中分享的总收益比例,分别表示第二阶段DSP 的确定性等价收入与广告商的期望收益。

根据模型采取逆向求解法得:

第二阶段:

将(18)代入(17)中,得:

第一阶段:

再将(21)代入(20)中,得:

由(20)式可以看出,DSP 的最优努力水平除了第一阶段的激励因素β1,还受到声誉效应和棘轮效应的影响;声誉效应能够强化激励,棘轮效应能弱化激励。声誉效应起激励作用的条件为dv>pβ2。

DSP 的努力水平与修正系数τ呈正相关关系。由(20)式可以看出,在DSP 投放广告前,广告商对其能力进行预估,第一阶段结束后,根据实际的广告点击量修正对DSP 能力的判断,预估的偏差越大,修正的越多,即τ越大,声誉效应与棘轮效应的差越大,DSP 越希望通过提高努力水平改善预期。

DSP 的努力水平与贴现率δ呈正相关关系。由(20)式可以看出,δ越大代表DSP 拥有足够耐心,能够对自身声誉进行长时间等待,声誉效应与棘轮效应的差越大。

DSP 的努力水平与讨价还价能力d呈正相关关系。由(20)式可以看出d越大,DSP 越会通过自身努力水平获取更多市场机会,声誉效应抵消更多的棘轮效应。

DSP 的努力水平与风险规避度量ρ呈负相关关系。由(22)式可以看出,ρ越大,DSP 的风险规避意识越强,不愿意以不确定的广告转化量因素约束自己,从而更不愿意提高自身努力水平。

因此当dv>pβ2时,声誉效应大于棘轮效应,能够实现声誉机制的有效激励,且激励效应随着修正系数τ、贴现率δ以及讨价还价能力d的增大而逐渐加强,随风险规避度量ρ增大而减弱。

(四)模型比较

根据以上模型求解结果,对考虑声誉机制的动态激励模型与未考虑声誉机制的激励模型进行比较。

由(5)、(19)与(22)式可知,当市场不确定性因素的方差足够大时:

市场不确定性因素的方差越大,包含的信息也就越多,修正的越多,在考虑声誉机制的动态激励模型中,方差趋于无穷时,τ越大,1-τ2趋于0,努力水平越高;而在未考虑声誉机制的激励模型中,广告转化量方差越大,趋于0,此时努力水平小于考虑声誉机制的动态激励模型的努力水平。

结论1:当dv>2pβ2且市场不确定性因素的方差足够大时,考虑声誉机制的动态激励模型下两阶段努力水平均高于未考虑声誉机制的激励模型下的努力水平,即DSP 出于自身声誉考虑,会提高努力水平。

该结论充分体现了考虑声誉机制的动态激励模型对DSP 努力水平的激励作用,DSP 为了与广告商达成长期合作,通过提高第一、二阶段的努力水平树立良好声誉,进而降低道德风险发生的概率,减少广告造假、欺诈现象的发生。

由(4)和(18)式可知,当市场不确定性因素的方差足够大时:

同理,此时考虑声誉机制的动态激励模型中,1-τ2趋于0;而在未考虑声誉机制的激励模型中,趋于0,此时激励系数小于考虑声誉机制的动态激励模型的激励系数。

由(4)和(21)式可知:当dv>pβ2时,

结论2:当dv>pβ2且市场不确定性因素的方差足够大时,考虑声誉机制的动态激励模型的激励系数有递增趋势,第一阶段的激励系数小于未考虑声誉机制的激励模型的激励系数,第二阶段的激励系数大于未考虑声誉机制的激励模型的激励系数,即β1<<β2。

该结论说明了考虑声誉机制的动态激励模型对DSP 激励系数的影响,在广告商以用户反馈因素调整DSP 激励系数的基础上,DSP 因考虑自身声誉,进一步提高了激励系数,同样能够降低道德风险发生的概率,减少广告造假、欺诈现象的发生。

通过对(4)和(5)、(17)和(18)、(20)和(21)对比可得:

结论3:当满足dv>pβ2时,声誉效应强化了激励作用,考虑声誉机制的动态激励模型的激励效果优于未考虑声誉机制的激励模型的激励效果。

该结论也表明了两个阶段的声誉机制动态模型中边际效应递减,并且在相同的边际激励系数下,考虑声誉机制的动态激励模型的平均努力水平高于未考虑声誉机制的激励模型的努力水平,即考虑声誉能提高激励效果。

三、数值仿真

本文通过数值仿真进一步验证考虑声誉机制的动态激励模型能有效提高激励强度,实现帕累托改进。根据品友①数据来源:https://www.kaggle.com/lastsummer/ipinyou.及Facebook 数据②数据来源:Facebook ad cost insights -ADCostly.,以及参考其他文献[4]129-135,选取如下一组参数值进行数值实验:每点击成本p=5,每广告点击价值系数v=6,市场不确定性因素的方差σ2=9,成本系数b=1,广告转化量的方差=4,绝对风险规避度量ρ=1,修正系数τ=0.5,贴现率δ=0.5,DSP 第二阶段合作中的总收益比例d=0.3,常数n=1,DSP努力水平对广告点击量的影响系数k=0.9,m对DSP 收入的影响系数φ=1。参数满足dv>2pβ2。

由表2 中数据可知a1>a2>,表明引入声誉机制后,两个阶段的努力水平都大于未考虑声誉机制的激励模型时的努力水平,β1<<β2表明在引入声誉机制后,两个阶段的激励系数呈递增趋势。由数据、1.08>1.06、2.42>1.64可知,考虑声誉机制的动态激励模型的激励效果平均值、广告商与DSP 的平均期望收益都大于未考虑声誉机制的激励模型的激励效果平均值、平均期望收益。考虑声誉机制的动态激励模型第二阶段的努力水平和激励系数的关系如图1 和图2 所示。

表2 两种模型下的结果

图1 反映了不同影响系数k 下激励系数β 与努力水平a 的正相关关系,当广告商对DSP 的激励系数越大,DSP 的努力水平越高,并且在相同的努力水平情况下,影响系数越大激励系数越大。图2 反映了不同影响系数下绝对风险规避度量ρ与激励系数的关系,DSP 的风险规避意识越强激励系数越小,并逐渐趋于0,并且在风险规避度量相同的情况下,影响系数越大激励系数越大。

图1 不同系数下β 与a 的关系

图2 不同系数下ρ 与β 的关系

引入声誉机制后,综合两阶段结果来看,DSP 的努力水平、激励系数、激励效果和广告商与DSP 的平均期望收益都有所提高,即考虑声誉机制的动态激励模型优于未考虑声誉机制的激励模型,实现了帕累托改进。

结论

本文针对广告商与DSP 的委托代理关系中的道德风险问题,在考虑用户反馈因素的基础上,引入声誉机制,构建显性激励与隐性激励结合的两阶段动态激励模型,分析了声誉因素对DSP 的激励机理,并与未考虑声誉机制的激励模型进行比较,得出以下结论:在考虑用户反馈因素的基础上,引入声誉机制能够强化激励,广告商以用户反馈因素激发DSP 提升努力水平,DSP为维护自身声誉自主提高努力水平,与广告商达成长期合作。同时,激励效果也与DSP 的风险规避意识相关,DSP 的风险规避程度越高,激励效果越差,DSP 的努力水平下降;在两阶段动态激励模型中,激励效果随着修正系数、贴现率以及讨价还价能力的增大而逐渐加强,即DSP 的努力水平得以提升;引入声誉机制的两阶段动态激励模型与未考虑声誉机制的激励模型相比,广告商与DSP 的激励效果平均值、平均期望收益均有所增加,实现了帕累托改进,有效防范道德风险,减少广告造假、欺诈现象的发生。

本文的研究只涉及单个广告商和单个DSP的情形,多个广告商和DSP 的激励研究可作为今后进一步的研究方向。

猜你喜欢

竞价声誉欺诈
短期与长期声誉风险的不同应对
Top 5 World
新车售前维修未告知消费者是否构成欺诈
解密主力开盘竞价做假意图
欧洲网络犯罪:犯罪类型及比例
审计师声誉与企业融资约束
审计师声誉与企业融资约束
考虑声誉的企业投资决策模型研究
防范信用卡申请业务欺诈风险的中美对比
中百信网络竞价系统