基于多元回归拟合方法对“拍照赚钱”定价问题的研究
2018-01-20董文兵
摘 要:针对“拍照赚钱”的任务定价的问题,文章运用了多元线性回归、聚类分析等理论和方法,构建了线性多元回归模型,综合运用了MATLAB、EVIEW等软件编程求解,最终查找出了原先的定价规律、部分任务未完成的原因,并制定出了更加合理的定价规律。
关键词:“拍照赚钱”;多元回归拟合;EVIWES;MATLA
中图分类号:F045 文献标识码:A 文章编号:1008-4428(2018)03-38 -02
一、引言
随着网络信息技术的飞跃发展,智能手机普及率越来越高,而基于智能手机存在的手机软件也越来越丰富,并已经进入各个企业家的视野,成为新的经济增长的研究方向。而作为一种自助服务模式——“拍照赚钱”模式就是在这种环境下出现的。有需要的用户可以通过下载并注册该APP软件成为会员。通过这种方式,“拍照赚钱”APP软件将企业与用户紧密地联系在一起。企业将各种商业检查和信息搜集的拍照任务发布在平台上,会员从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金,从而达到一种双赢的局面。相比传统的市场调查方式,自助式移动劳务众包模式可以大大利用闲置的劳务人员,节省调查成本,而且有效地保证了调查数据真实性,缩短了调查的周期,使调研业实现高效率、低成本、规模广的飞跃。由此,“拍照赚钱”APP成为该劳务众包平台运行的核心。而APP中任务的定价方式成为任务是否完成的核心要素,如果任务定价过低,则该项拍照任务会无人问津,信息获取失败,严重的话会导致调研等重大项目执行的滞后。所以,研究该平台的任务定价规律就变得十分必要了。
二、任务定价规律研究
文章对相关数据进行分析,找出“拍照赚钱”的任务定价规律。为此,笔者对已结束项目任务中的数据进行处理,筛选出所有任务完成的数据,选取其中249个数据,然后用EXCLE对选出来的数据和定价进行回归拟合,并对拟合出的定价值进行预处理以及模型的合理检验,从而得出定价规律。
借助EXCEL中数据分析功能对纬度、经度为自变量的数据和定价为因变量的数据进行多元回归拟合,得到了如下的函数关系式(定价规律):
P=-574.375+6.55468X1+4.325699X2
(一)模型合理性检验
标准误差非常小,方程拟合的非常好;X1、X2的T统计量的值分别为1.96795E-05、3.11951E-08、8.535E-06都明显的小于显著性水平0.05,说明定价跟自变量纬度和经度有关。
(二)对Y值进行预处理后的残差分析
先对Y的值进行如下的处理:
经过上述的处理可以得到新的Y值,然后用预测的Y值与处理后的Y值相减得到新的残差值。经处理发现,处理后的残差值要比处理前的残差值总体来说要小,说明模型在经数据处理后要有所改善。
三、任务未完成原因分析
第一点:对会员预定任务限额、预定任务时间、信誉值的关系进行分析,我们可以发现即使信誉值、预定任务限额都很高的会员,但预定任务时间晚,所以会出现这种情况:那些信誉值和预定任务限额都低但预定任务时间早的会员会提前接到任务,但是由于这些会员的信誉比较低,即使能接到任务,但是却没有能力完成,导致“拍照赚钱”的任务完成不了。对于上述得到的定价模型只考虑到了经纬度的影响,没有涉及关于会员主观因素的影响,所以才会出现某些任务没有完成。
第二点:首先运用MATLAB软件绘出所有任务量及会员所在的位置的整体分布图。再对相关数据进行处理,找出一个新的自变量—任务量/用户量,以及一个新的因变量完成率,然后将整个任务量和会员所在位置的区域划分为100个小区间,每一个区间再重新整理出代表每个区间经纬度的平均值,然后用EVIWES对经纬度、任务量/会员量与任务的完成率进行多元回归拟合,得出任务的完成率与经纬度和任务量/会员量有着如下的函数关系:
Y=-57.0864+1.0794X1+0.2888X2+0.3159X3
F统计量对应的P值小于显著性水平0.05,则经纬度、任务量/会员量与任务的完成率相关。且标准误差非常小,说明方程拟合的非常好。又因为经纬度、任务量/会员量对应的T统计量值都大于2,所以经纬度和任务量/用户量都对任务的完成量有影响。会员在接受任务时,没有考虑到每个区域间的任务量/用户量这一因素的影响,所以才会可能导致有些任务没有被完成。
四、新任务定价方案的设计
由于任务定价不仅受任务GPS纬度和经度的影响,还受区域任务可分配率和信誉值的影响。通过对数据分析,经纬度的变化不是很明显,有些任务聚集在一起,而且在一定的区域内,居民的消费水平、物价、收入、交通、天气情况大致不变,而不同的区域其居民的消费水平、物价、收入、交通、天气情况则可能不同,利用地图的检索功能,我们发现这些任务分布在广东省的四个城市,分别为广州市、佛山市、深圳市和东莞市,在这些地区存在明显的差别。我们将区域进行等分,对不同區域的任务的中心位置、区域任务可分配率、区域任务价格均值数据进行多元回归拟合,从而得出新的任务定价方案。
(一)模型准备
观察会员位置和任务位置,以及位置集中情况,为了减少误差,剔除周边的比较分散的点的数据,然后对区域进行等经度等纬度的划分。其次在已结束项目任务数据中筛选出不同区域的数据,计算任务位置经度和纬度均值、任务数以及任务的完成情况和每个区域的定价的平均价格。然后在会员信息数据中,利用函数可以求出不同区域的会员数量。最后把这两份数据整合在一起,观察表中的数据,有单独的数据,而且有些数据组数据不完整,对这些特殊数据进行剔除。
其中,X1为区域内任务位置的纬度均值;X2为区域内任务位置的经度均值;X3为区域内任务数量和会员数量的比值。
(二)模型的建立——基于区域中心点的区域任务定价模型
对位置数据进行了预处理,引入新变量X3,建立新的定价方案,如下:
rY1+sY2+tX3+A=P
其中,Y1为区域内的中心纬度,Y2为区域内的中心经度,X3为任务数量和会员数量的比值;P 为区域内的平均价格;r,s,t为变量前的系数;A为常数。
(三)模型的求解
利用EVIEWS软件对剔除之后的数据进行多元回归拟合,求解出各区域内的价格均值与任务GPS经纬度和任务数/会员数之间存在着如下的函数关系:
3.48Y1+5.41Y2-0.277X3+128.48=P
该多元曲线拟合F统计量的P值小于显著性水平0.05,通过了假设检验,且X1和X23所对应的P值也均小于显著性水平0.05,故知该模型拟合较好。由上述函数中各变量前面系数可知各区域内的P是与任务GPS经纬度之间存在正相关的,即为距离越远价格均值自然就会升高,另外,各区域内的价格均值还与任务数/会员数的平方成负相关,即一个区域内若任务数越多而会员数越小则该区域内的价格均值就越低。该模型与原模型进行比较可知,在加入一定区域内任务数与会员数之间的比值这一影响因素后,我们所拟合出来的模型的标准误差更小,即模型构建合理,所以新的任务定价方案更合理。
五、总结
在对原先定价规律和未完成任务原因研究的基础上,我们加入了任务量/用户量这一新变量,构建了新的模型,从而得出了更为合理的任务定价规律。这种定价规律不仅可以让更多的会员最大可能地接受并且完成任务,也可以使得更多的任务被接受并完成。这种定价规律可以使会员与提供任务者双方都能接受,一方面可以节省企业成本,提高信息获取率,另一方面也可以提高用户的收入水平和生活质量,从而实现了真正意义上的双赢。除此之外,新的定价方案也缩短了调研周期,为调研业的快速发展和企业项目高效的执行率奠定了基础。
参考文献:
[1]孙伟彤,任环宇,姜峰.基于网络流模型的“拍照赚钱”任务定价与分配优化策略[J].中国战略新兴产业,2018,(04):104.
[2]梁晓蓓,黄立霞,江江.众包物流接包方持续参与意愿影响因素研究[J].商业经济与管理,2017,(07):5-15.
[3]张佳彤.打车软件参与下出租车动态定价策略研究[J].唐山学院学报,2016,29(6):78-84.
[4]夏恩君,赵轩维.众包系统中企业众包能力评价指标体系研究[J].科技进步与对策,2016,33(11):108-113.
[5]薛娟,丁长青,陈莉莎,张志武.基于SIR的众包社区知识传播模型研究[J].科技進步与对策,2016,33(4):131-137.
[6]李训,林川,胡明.我国地域关系对审计定价影响的实证研究[J].财经论丛,2013,(02):93-100.
作者简介:
董文兵,女,安徽宿州人,安徽财经大学经济学院学生,研究方向:国民经济管理。