APP下载

劳务众包任务定价模型研究

2021-07-28唐芊芊

关键词:成功率定价会员

丁 青, 唐芊芊, 田 甜

(湖南财政经济学院 数学与统计学院,湖南 长沙 410205)

0 引言

劳务众包的概念第一次被提出是在2006年,HOWE J[1]将众包定义为“企业借助互联网,将过去由内部员工完成的任务,在众包平台上以自由自愿的形式,交付给特定的大众群体完成”,从国外的Guru,IT-square,o-Desk等,到国内的猪八戒网、阿里众包、京东众包、拍拍赚和微差事等,现阶段众包平台发展已经较为成熟,国内外也有许多学者对其进行了研究。

卢新元等[2]分析得出定价、任务大小及难易程度是影响接包方是否接受任务的主要因素。合理的定价对任务完成率的提高、成本的降低和资源的充分利用,乃至整个众包平台的发展起着至关重要的作用。基于此,有许多学者对任务定价这一因素进行了研究。刘晓钢[3]基于服务定价、在线逆向拍卖等理论,得出任务属性以及市场竞争状况差异会对发包方的定价产生影响。巢时刚[4]通过分析得出,任务定价与会员集中程度呈反比,且与经纬度存在一定关系。这些研究的主要方向均为如何制订一个合理的定价方案使得出包方能以较低的成本得到较高的任务完成率,没能从实际案例和任务数据出发,进行实证分析建立具体的定价模型。张天舒等[5]考虑商家与会员的博弈关系,将任务联合打包,建立了新的定价模型,但其研究未考虑到任务或是网点对会员的吸引力因素。徐芹[6]通过研究“拍照赚钱”平台的商业运行模式,给出了该平台任务的均衡定价策略,并提出了提高任务完成率的捆绑式组合法,不足之处是其模型建立在任务一旦被分配,能够保质保量完成的基础上,而在实际情况下,被分配的任务未完成的情况时有发生。由此可见前人的研究均存在一些不足之处。

在前人研究的基础上,笔者从任务定价、未完成任务、任务打包等方面进行探讨,建立新的定价模型。由于众包被广泛应用在经济、社会的众多领域,而不同类型的平台的定价规律会存在些许差异,故选取其中的拍照赚钱任务平台的定价规律进行研究。

1 劳务众包任务定价模型的建立与求解

要求分析与研究问题[7]附件一中项目的任务定价规律,分析任务未完成的原因,并设计新的任务定价方案,并和原方案进行比较。

1.1 研究已结束任务的定价规律

首先对收集到的拍照赚钱APP数据的历史任务位置进行可视化,得到任务的分布主要是在广州、深圳、佛山、东莞4个地区。由于数据量较大且较为集中,考虑使用聚类分析[8]中的K-means聚类法进行分析。得到的聚类效果如图1所示,图中的特征值X1为经度坐标信息,X2为拍照赚钱众包任务的定价信息,x,y,z轴分别代表纬度坐标、经度坐标以及众包任务定价。

图1 三维聚类效果图Fig.1 3D clustering rendering

由聚类效果图可看出离聚类中心对象较远的任务位置坐标呈现一定的规律,据此,将经纬度看作自变量,任务的价格看作因变量,使用MATLAB对其进行回归,可得表达式

x3i=1 187.7-3.515 9x1-9.150 9x2,

其相关系数R2=0.98。综上可以得到“拍照赚钱”众包任务定价的定价规律:

1)在离聚类中心较近的点遵循着非线性的任务定价规律,主要是由任务的难易程度决定,即与离中心对象点的距离存在一定关系;

2)离聚类中心较远的位置的众包任务定价呈现出线性的关系,如随着位置离聚类点的距离越远,其定价越高,因而大多为较为固定的价格,如 75 元、80元、85元等;

3)定价函数与任务位置的经纬度成反比,即当纬度与经度坐标减小时其定价就会相应地增高。

1.2 分析任务失败的原因

由成功与失败为 0-1 变量,属于定性分析,考虑到数据的随机取样以及样本的回归准确性,本文使用MATLAB对其进行二元定性Logistic回归分析。回归后的函数进行对数变换后的函数为

对于定性的Logistic回归实践而言,P的取值仅有0或1,因此将导致上述函数式失去意义。因此,在应用Logistic回归分析的过程中,通常不是对P直接进行回归,先定义某种单调连续的函数θ,令

θ=P(Y=1|x1,x2,x3),0<θ<1,

故Logistic模型可以变换为

得到Logistic回归后的系数为54.657 4,0.261 5,-0.542 7,0.014 1,分别代表常数项、纬度变量、经度变量、任务定价的相关系数,故其回归方程为

(1)

(2)

Logit(P=1)=54.657 4+0.261 5x1-0.542 7x2+0.014 1x3。

(3)

对模型进行检验后得到的结果与现有数据进行对比可知进行回归分析的误判(差)率为37.8%,推测误差较大的原因可从考虑的因素较少方面着手,但用分析得到的回归方程进行大体的定量分析亦是可行的。

当考虑到收益对于任务成功失败与否的影响时可以考虑单位时间收益与经济学中的机会成本比较,设单位时间收益为B,单个会员的机会成本为C,则单位时间收益与机会成本满足关系式

1.3 建立新的任务定价模型并与原方案进行比较

利用经纬度处理平台对经纬度进行地址转换处理,得到有具体市区的地址样本。使用MATLAB 工具箱中的Classify函数对其分别进行判别分析的训练,最终得到广州、深圳、东莞、佛山4个输出结果,其误差率为0.078 5,因此可认为该判别真实可靠。

将判别分析后的结果进行处理,可以得到上述4个城市的任务成功率以及众包任务定价如图2所示。

图2 各市任务标价平均值以及成功率统计表Fig.2 Statistical table of average price and success rate of tasks in each city

由图3可知,任务的成功率与任务定价必定存在一定的关系,即价格越高,其成功率也就越高。但是定价一味地升高同时会导致成本的提高,并且依据格雷欣法则(格雷欣法则是两种实际价值不同而名义价值相同的货币同时流通时,实际价值较高的货币,即良币,必然退出流通,而实际价值较低的货币,也就是劣币,则充斥在市场内),平台内会充斥着信誉较低的会员抢占优质会员资源的现象,所以一个较为准确的评价标准尤为重要。

基于以上分析,采用以下两个标准作为评判定价方案是否有效,首先在成本不变的情况下,微调划分区域的平均任务定价,将成功率已经比较高的区域的众包任务定价略微降低,而与此同时将成功率较低的区域众包任务定价略微提高。并且观察各自区域的成功率,若某一区域的成功率在其余区域成功率不变的前提下有所上升或是整体的成功率有所上升,可以认为对这一任务定价的方案可行。其次,若将某一区域的平均任务定价降低,其余区域的平均任务定价保持不变,可以得到在这一情况下的成功率,倘若该情况下的成功率不变或是有所增加,可认为在保持成功率不变或是有所增加的情况下,使得平台的成本有所降低,这也是一个较为可行的定价方案。

对会员的分布进行可视化处理可以看出任务分布相对会员分布较为分散,因此可以考虑将会员与任务在这4个区域簇里的密度纳入任务定价的指标体系内。另外,一个地区的会员对于众包任务价格的期望也可以作为一个参考的指标纳入任务价格的决定体系内,于是可以得到改进后的定价模型

x3i=1 187.7-3.515 9x1-9.150 9x2+p0β0i-p1β1i-p2β2i,

其中x1代表纬度坐标,x2代表经度坐标,β0i则代表第i个地区的期望任务定价,β1i代表第i个地区的会员密度,β2i代表第i个地区的任务密度,p0,p1,p2分别代表各自的权重,其中由经济学规律可知当卖方市场比买方市场较发达时,会出现供过于求的情况,从而导致价格下跌,可以得出除p0以外,其余变量都与任务的预定价格成反比。为方便计算,各自的值分别取0.05、0.5、0.15。

将得到的新的定价模型用式(1)对其进行检验,求得符合判断标准下的成功率分别为31%、84%、85%、83%,成功率均比原先的方案要高。

2 多任务打包模型

按照已建立的模型,同样选取具有代表性的且具有一次接受多任务能力的会员去执行打包任务,即选取预订任务限额大于10件的会员,对其作判别分析,将其同样划分为与历史任务位置相同划分的4个行政区域,对上述数据进行一定的处理得到如表1所示的因素指标统计表。

表1 城市各因素统计表/个Tab.1 Statistical table of urban factors/unit

在将上述会员分为4个簇后,可以将“打包”问题简化为4个区域内的任务,由4个区域内的优质会员接受。考虑到简化后的“打包”问题需要对其中的会员簇进行更加具体的分配与排序,可以采用谷歌搜索的PageRank排名算法[8],将划分为4个区域的任务簇与会员簇看作是4个网页,相互之间的PageRank值可以由一个线性加权式决定,即

PR(L1)=γ1E1+γ2E2,

γ1+γ2=1,

其中γ1,γ2分别代表距离远近因素E1和最大预定限额的匹配程度E2的权重,d代表距离的远近,数值1~4分别代表距离最近、距离较近、较远和很远;f代表距离的匹配程度,1~4代表4个区域簇的任务量与所划分的4个会员簇的匹配程度由优转化为差。

利用MATLAB编程可以得到各个区域簇的重要性(权重)为:深圳 0.264 2,东莞0.260 2,广州 0.230 2,佛山 0.245 4。因此对于价格,在原有基础上增加打包因素的定价模型为

P=P0-δ1ωi,

其中δ1代表系数,P0代表原有的定价模型,ωi代表第i年的重要性排序。

通过PageRank算法得到的重要性排序可以得到不同地区簇的定价模型,并对其进行检验可以得到如表2所示的结果。

表2 任务成功率微调前后对比/%Tab.2 Comparison of task success rate before and after adjusting/%

3 多任务打包模型检验

对新任务数据进行判别分析,得到其具体分类,使用已经通过完善的定价模型进行定价并用求得的logistic回归方程对其进行检验,得到深圳市的成功率约为44%,东莞市的成功率为86.1%。由于收集的新项目的数据只有坐标位置,考虑具有模式识别功能的智能算法判别任务成功与否。先用旧项目的数据、各个区域的会员密度以及任务密度等数据对其进行训练,得出的结果几乎都与实际结果相重合,因此可以认为该函数能够较好地模拟预测原方案结果。最终得到深圳市和东莞市的任务成功率分别为24.3%、90%。

4 结论与建议

从最终的对比分析可以发现新的定价模型对于节约成本以及提高任务成功率的效果是显著的,新的定价方案优于原来的方案。

该模型可以推广至其他众包平台,如滴滴打车的定价问题以及相似的问题,甚至是基于地域与环境的产品的定价问题。建议对于众包任务的发布者,收集类似任务在外包市场的报价、众包市场中其他任务发布者的出价,综合考虑当地的经济条件,对三者进行比较后,再决定是否在众包平台发布任务。

发布者可以根据自己的客户完成情况设置一定的奖励机制,用于激励客户的完成任务的积极性,提高客户信誉,从而实现缩短的公司工作周期的“互利双赢”效果。对于众包软件的开发者,平台网站可以将其海量的交易数据进行分类汇总,并用图表的方式展示重要的信息以供任务发布者参考,如任务出价的分布、任务获得参选作品数的分布、任务期限的分布等。

信誉的评价可以从多个方面进行考虑,并赋予一定的权重参数,通过分析,得出如何选取计算得出更合适的值。

猜你喜欢

成功率定价会员
重要更正
成功率超70%!一张冬棚赚40万~50万元,罗氏沼虾今年将有多火?
如何提高试管婴儿成功率
会员之窗
会员之窗
会员之窗
欢迎选购
如何提高试管婴儿成功率
利用Fabozzi定价模型对房地产金融衍生品定价的实证分析
基于分层Copula的CDS定价研究