空间众包环境下的任务定价研究
2018-08-30张宇朱佳伟郭珺然
张宇 朱佳伟 郭珺然
摘要:随着移动互联网技术的发展,自助式劳务空间众包平台变得日益盛行。为了解决在空间众包环境下任务位置集中时的最优定价问题,该文考虑任务集中时的打包情况,引入整体自适应打包寻优模型来评估全局任务完成度,最终给出新项目的任务定价方案。
Abstract: With the development of mobile Internet technology, self-service labor crowdsourcing platform has become increasingly prevalent. In order to solve the optimal pricing problem when the task location is centralized in the crowdsourcing environment, this paper considers the packaging situation when the task is centralized, introduces the overall adaptive package optimization model to evaluate the global task completion degree and finally gives the task of new project Pricing program.
关键词:空间众包;任务定价;自适应寻优;最优匹配模型
Key words: spatial crowdsourcing;task pricing;adaptive optimization;optimal matching model
中图分类号:F272.3;TP311 文献标识码:A 文章编号:1006-4311(2018)20-0074-04
0 引言
近年来,互联网的蓬勃发展带动众包应用的兴起,对工业界和学术界等各行各业产生了深远影响,同时,众包作为共享经济的代表,可以使发包方以更短的时间、更低的成本获得更高质量的产出。根据经验表明,“如何吸引更多用户参与”是众包模式当下快速发展的重大挑战。一方面众包任务相比于其他任务通常需要参与者有更多的精力投入编写程序,同时众包也可以充分利用社会资源,节省企业的成本支出,所谓挑战与机遇共存。目前,众包己得到企业界的广泛关注,越来越多项目也开始渐渐倾向于采用众包模式进行项目开发。随着互联网的兴起,空间众包模式已然成为众包发展的新标杆。
空间众包模式的发展合理有效的扩大了电商的营业范围,逐渐形成了一个全新的“无形商品”电子商务运营模式。这种模式迅速的崛起,但是理论研究明显落后于社会实践要求导致这种众包平台在进一步的发展中明显受阻[1,2],所以建立空间众包平台的出价是一种新兴的服务标价模型,它的建立大大丰富了服务标价理论,具有十分强劲的理论實践意义。
1 任务联合打包发布对任务完成情况的影响
针对真实生活场景,根据文献[3]得到广州和深圳地区某一任务的任务及会员信息(任务信息包括:任务位置(GPS)、任务标价、任务执行情况。会员信息包括:会员位置(GPS)、预订任务限额、预订任务开始时间、信誉值)探讨改进影响空间众包环境下的任务分配方案。实际情况下,多个任务可能因位置比较集中导致用户争相选择,此时考虑用户和任务对众包模型的影响。引入众包模型完成度w来评估在特定距离内用户任务完成度,根据用户任务完成度来约束任务众包的规模。
1.1 建立整体自适应打包寻优模型
对于每个用户的主要影响因素为预定任务限额、预定任务开始时间、信誉值。对于每个任务的主要影响因素为确定范围di内用户数量(数量较多情况下构成竞争关系)、确定范围di内用户的预定任务限额、预定任务开始时间、信誉值、确定范围内任务数量。
由于任务定价有相对浮动[1],即表现为某些任务定价较高、某些任务定价较低。因此考虑减少相应任务点值ai,增加相应任务点值bi,即总体转移量为ai-bi。那么打包模型为合并相应任务点,使得任务点内相对价格浮动量为0。同时为考虑用户完成任务便捷性,打包点内任务点尽可能距离较近。分析得到实际情况的某些真实价格数据与预测价格数据较为相近,所以忽略此部分点。同时去除某些稀疏点(即任务点周围具有较少任务点),此时不构成竞争关系,所以不将此类数据打包。
从任务集合T{T1,T2,T3…Tn}中任意选择任务Ti,假设Ti未被打包分配,在距离范围di内寻找未被打包分配的任务Tj,为让用户高效完成任务,总是遵守
完成众包项目完全取决于用户生活方式,故我们无法为用户寻找特定min(Di),但了解到用户活动范围不超过距离δd,因此我们定义δd为用户工作范围,在此范围内寻找全局任务点集合[4]。
为此便确定在距离最小的范围内确定最大任务包使之满足多数用户预定任务限额量需求。由问题一和问题二模型对比得到,随着模型的优化任务价格点将会出现动荡变化,以?鄣表示。为进一步优化模型,要求
同时我们希望此众包任务被尽可能完成,查阅资料得到众包完成度在80%以上,因此我们以80%为阈值来进行扩展众包项目集合,?鄣i表示预定任务限额。
w?叟80%表示可以继续扩张,w<80%时则不能继续扩张。因不同用户具有不同预定任务限额Vi,因此我们需在满足多数用户预定任务限额情况下尽可能扩展任务打包集合,即
1.2 模型求解计算
1.2.1 筛选数据
对任务信息数据进行分析,对分析位置比较集中的任务,筛选掉任务点周围的个数较少的任务同时根据价格对比[3],筛选得到变化除[-1,1]范围内的价格数据变化量。
1.2.2 数据分析与求解
筛选得到任务GPS纬度、任务GPS经度、任务预测价格、任务价格波动等影响因素,采用上述所用数据分析模型,算法流程如图1所示。
分析得到每个任务被选择的概率和各分包处理情况,结果样例如表1所示。
结果得到打包数据中包含3组数据占比较多,且各任务点之间相互距离较劲,由此得到模型分包情况理想。同时求得分包后全局概率为78.09%,即每个任务点被选择的概率,模型较文献[3]完成度72%有很大提高。
2 任务定价方案
为得到新任务定价方案,更新广州和深圳地区新项目任务点的经纬度数据。由已知的会员信息计算出任务距用户距离x1、用户密度x2、用户平均信誉值x3、任务之间距离x4、会员抢单时间x7,然后将新项目任务点的经纬度坐标导入在智能式交互地图中,得到各个任务点的具体地区地址,根据地区地址来进一步确定区域的GDP总值x5、任务点附近的城市道路网密度x6。在得到因素的具体值之后,我们采用第二问模型首先求出各个任务点的初始定价,根据第二问的任务打包模型,我们采用Python编程得到各个打包的价格、个数、位置点,最终将两者整合在一起。
2.1 影响因素数值的分析与计算
2.1.1 用户距离x1
利用SPSS软件,将用户会员的经纬度采用K-means聚类方法进行聚类,得到6个聚类的组员信息和聚类中心的经纬度,我们定义任务点离聚类中心用户的距离为用户距离x1,采用Python语言编程得到新项目各个任务点离用户中心的距离。
2.1.2 用户密度x2
一个任务点周围的用户过多,说明该任务相对被选择完成的可能性高,如果一个任务点周围的用户较少,说明该任务相对被选择完成的可能性低,所以任务点周围的用户密度会对任务定价产生一定的影响。基于此想法,我们定义一个任务点周围一定面积内的总用户个数为用户密度因素,根据用户密度来适当调整定价,采用Python语言编程得到各个任务点周围一定面积内会员的个数。
2.1.3 用户平均信誉值x3
用户的信誉值代表用户能够同时预定多组任务的个数以及接单的快慢,在任务点周围用户平均值较高的情况下,该任务点被选择的可能性会较其他点高,则相应的价格可以适当降低,所以定义任务点周围的用户平均信誉值来为用户质量参数,根据用户平均信誉值来适当调整定价,用Python语言编程得到各个任务点周围一定面积内用户平均信誉值。
2.1.4 任务距离x4
任务之间的距离代表了任务点的密集程度,如果任务之间距离很小,说明该点周围存在很多任务点,在用户选择上,考虑到利益最大,用户可能会同时预定多个任务来完成,则相应的任务点定价需要适当调高来达到用户与任务的供求平衡。我们基于此思想,由于任务与任务之间的距离不能够直观的去度量,我们利用SPSS中的K-means聚类方法将任务总体聚成6类,得到6类别的聚类中心。定义各个任务离任务中心的距离为任务与任务的距离,通过任务距离来適当调整定价,采用Python语言编程得到各个任务点离中心点的距离。
2.1.5 区域的GDP总值x5
一个区域的GDP值代表了该区域的经济发展程度,经济发展程度高的地区,价格需要适当调高才能吸引用户来完成任务,由于区与区之间的GDP存在差异,所以各个任务点所处的区会影响该任务点的定价。我们把各个任务点的地理位置导入Google地图,利用智能交互软件定位出每个位置所属于的城市及区域,采集题中所给任务点经纬度数据,导出了各个任务点所处的地区,通过收集这些行政区域2016年的GDP总量数据资料,使任务点的位置与GDP数据一一配对组合。
2.1.6 任务点附近的城市道路网密度x6
任务点附近的城市道路网密度是指任一任务点周围一定面积下依道路网内的道路中心线长度与依道路网所服务的用地面积之比,利用Python编程,结合Google智能交互软件对每一任务点,及任务点周边道路长度和用地面积的精确定位,任务标价低区对应着交通密集区,把计算得出的每一个任务点道路网密度与该点位置一一匹配组合。
2.1.7 会员选单时间x7
根据附件数据可知,每个会员由于信誉值的高低等其他因素影响,会员预定任务的时间存在差异,如果会员预定任务时间较前,则说明该会员可以提前选择多个任务来进行,如果任务点周围的会员预定时间都较前,该任务点被用户选择完成的概率会较其他任务点高。依据此思想,如果会员预定任务时间相比全体会员平均预定任务时间大,则体现了该用户具有较高的选择权。所以我们定义任务点一定面积内的会员预定时间与总体预定时间的平均值的差值为该任务点周围会员的选单时间。用Python语言编程得到各个任务点周围一定面积内用户选单时间。
利用Python软件,根据模型建立过程中的数值分析,将对应的数值带入影响因素的计算公式,得到任务距用户距离x1、用户密度x2、用户平均信誉值x3、任务之间距离x4、区域的GDP总值x5、任务点附近的城市道路网密度x6、会员抢单时间x7具体数值。
2.2 定价方案的设计
要对新项目给出任务定价方案,结合上述定价模型,首先根据打包定价模型中的约束,筛选出未被打包的即单独发布的任务点。
利用优化定价模型来对这些单独发布的任务点进行定价。然后基于给出的新项目数据我们采用打包定价模型,利用打包定价模型来进行任务的打包处理,得到任务打包的个数,打包的价钱以及包内的任务数,最终完成新项目的整体定价方案设计。
根据整体自适应打包寻优定价模型筛选出未被打包的即单独发布的任务点如表2。
由文献[3],优化定价模型为:
利用优化定价模型来对这些单独发布的任务点进行定价,然后基于给出的新项目数据我们采用打包定价模型,来进行任务的打包处理,得到任务打包的个数,打包的价钱以及包内的任务数,最终完成新项目的整体定价方案设计如表3。
2.3 评价该方案的实施效果
由于需要与与原方案进行对比来评价方案的实施效果,我们首先根据任务点的位置来将原始的827组数据与现有的2000组数据进行最优匹配,是两组数据地理位置尽可能的接近,得到827新项目数据,然后将利用打包定价模型来求出该任务点的可能完成概率,定义当可能完成概率高于平均值时,任务被认定完成。通过比较新项目任务定价方案的完成度与原始方案的完成度来定量的分析新项目任务定价方案的实施效果。
评价新项目任务定价模型的实施效果,需要与原来任务定价方案的数据做对比,由于变量存在七个,我们根据控制变量法的思想,将任务点的位置来将原始的827组数据与现有的2000组数据进行最优匹配,是两组数据地理位置尽可能的接近,得到827新项目数据。然后将利用打包定价模型来求出该任务点的可能完成概率,定义当可能完成概率高于平均值时,任务被认定完成。
通过比较新项目任务定价方案的完成度与原始方案的完成度来定量的分析新项目任务定价方案的实施效果,结果如表4。
最终分析得到新项目任务完成度相比原任务完成度提高了3.64%,说明新项目任务定价方案的实施效果比较好。
3 模型的推广
本文研究了空间众包中的动态任务定价问题。由于移动互联网的自助式劳务众包平台是目前基于“互联网+”平台的O2O(offlinc-to-online)经营模式,因此该平台在市场上具有广泛的应用前景。研究成果一方面可以为企业或项目管理者提供众包项目风险管理的参照和依据,另一方面也是对于众包与实际应用相结合的理论拓展,完善对众包商业模式的理论研究。此定价模型可以广泛应用于社会经济的各个领域内,不仅适用于分析不同位置APP定价高低程度,还可推广运用于出租车资源的“供求匹配”模型,以及国际油价行走趋势研究等定价用户需求关系的情况中。
参考文献:
[1]高铭,王毅.众包项目风险评估模型研究[J].管理现代化, 2016(03):105-107.
[2]孙信昕.众包环境下的任務分配技术研究[D].扬州大学, 2016.
[3]张宇.基于拍照赚钱的任务定价研究[J].价值工程,2018.
[4]宋天舒,童咏昕,王立斌,许可.空间众包环境下的3类对象在线任务分配[J].软件学报,2017(03):611-630.