APP下载

基于位置数据处理的“拍照赚钱”的任务定价

2018-03-21任思源王铎闫佳鹤赵怀志

电子技术与软件工程 2018年2期
关键词:回归分析数据处理

任思源 王铎 闫佳鹤 赵怀志

摘 要 近年来随着移动互联网的发展,移动互联网的自助式劳务众包平台掀起热潮,APP成为此类平台运行的核心,通过研究如何根据收集的位置数据信息对影响因素进行合理性分析并定价,为解决其此类APP定价问题,提供了一条思路。

【关键词】数据处理 K-means聚类 回归分析 打包分配

由于会员是从APP上领取需要拍照的任务,赚取APP对任务所标定的酬金。因此,若APP所给定价不合理,有些任务就会无人问津,从而导致商品滞留。从消费者心理导向考虑定价,若任务量供大于求,为避免因抢单而出现系统崩溃或者最后无人接单的情况,可以适当降低任务项目定价;而若供小于求,可以适当提升定价以吸引会员接单,提高任务完成率。

1 定价策略分析

初始状态,能供给用于定价研究的数据种类极少,对普通运营商而言,开始只能通过任务位置状况而给出定价。通过进行大量市场调研结合定价理论,考虑规定价位区间,此限度内,任务所处位置交通越便利、人口密集程度越高,定价越低;反之,则相对越高。在此定价上运营一段时间后,对已结束项目任务数据(含任务经纬度、定价和完成情况)进行研究,将经纬度数据转化到地图,用Power Map Preview For Excel导出三维图。据热度地图知,相同价位,处于市中心繁华街道等人流量大、交通便利的地方完成情况较偏远些的、人口密度较小的位置更好;样本中总体完成情况较差,已完成任务数仅占发布任务总数62.5%。

根据定价理论结合实际情况,考虑任务位置情况、会员位置、会员与任务相对位置等因素影响;交通情况和高程信息也该作为分支考虑进去,但考虑到GPS更新速度及技术实现的复杂度,故不对其单独研究。实际情况下,多个任务可能因为位置比较集中导致用户会争相选择。因此,可将这些任务联合打包发布。综上,可将任务位置,会员位置,会员与任务相对位置等因素综合起来转化为定价;之后采用打包分配策略优化定价模型。

2 数据处理

2.1 物品位置

将完成任务的项目的经纬度及所给定价提取到新建工作表,由于经纬度是两个值,为方便计算距离,将自变量数目化一,建立极坐标系。根据三维地图找出任务点中心为莲花山旅游景区,确定其经纬度为(N22.97883141215, E113.50445747375)将此值插入Excel表对应任务编号下拉,根据公式对应计算各个任务位置到所取中心点的距离D,将其转至新的工作表整理。Excel通过经纬度计两点间的距离函数公式,以任务位置信息处理为例:D=6371004*ACOS((SIN(RADIANS(B2)*SIN(RADIANS(D2))+COS(RADIANS(B2))*COS(RADIANS(D2)*COS(RADIANS(C2-A2)))其中:B2为会员纬度,D2为中心纬度,C2为中心经度,A2为会员经度

2.2 会员位置和相对位置距离

根据所选中心(N22.97883141215, E113.50445747375),应用经纬度计两点间距离函数公式求解会员到所选中心点距离值,结合2.1,用两点对应相减的绝对值即可求解会员与任务项的相对位置距离。

3 基于回归分析的定价

回归分析在一组数据的基础上研究的问题如下:

(1)建立因变量y与自变量x1,x2,…,xm之间回归模型(经验公式);

(2)检验回归模型可信度;

(3)判断每个自变量xi(i= 1,2,.,.m)对 的影响显著性;

(4)判断回归模型是否适合该组数据;

(5)利用回归模型对y进行预报或控制。

现设y对应X1,X2,X3先分别作出y对X1,y对X2,y对X3的散点图简单判断其关系,同时从全局作出y对X1,X2,X3整体散点图。根据散点图情况设Y=β0+β1X1+β2X2+β3X3,其中:Y=定价类型,X1=任务与中心距离,X2=会员与中心距离,X3=任务与会员相对距离。根据散点图特征选取多元回归分析法,用SPSS求解,发现“会员代表与中心点的距离”的Sig.=0.940远大于0.05,表明Y与X2(会员与中心距离)相关性不大,原因可能是会员离任务较近,接近步行距离,无需考虑其所处地段路况等。故剔除X2再次进行回归分析,可知显著性检验结果与检验统计量比对良好:β0=66.0239,β1=1.449,β3=-0.065 ,据此得到基本回归方程Y=66.0239+1.449X1-0.065X3。

4 基于打包分配策略的定价模型优化

用K-means聚类算法对打包任务位置范围划分。将打包项目物品区域进行划分,标准为各个任务位置点间距离最小和各个聚类的总需求量大致相等。完成打包项目物品区域划分后,对单个聚类进行分析确定打包任务项编号。而为防止多人哄抢打包任务而致单个任务滞留,打包后的任务总定价应在原定价基础下降ε%(此值可以通过BP神经网络算法训练得),算法条件举例说明:若某地附近20个任务,其中10个打包,要保证该处会员单个下10单获利少于打包10个。建模步骤:

(1)找出研究范围中各需求点地理位置坐标;

(2)巧绘研究范围中各需求点地理位置坐标图并对各需求点编号;

(3)捜索出各需求点间最短距离;

(4)收集各需求点历史需量数据,得到平均一天需求量;

(5)根据K-Means++算法对其求解。

配送区域划分的核心思想是把n个任务项目点划分成K个聚类,由于打包分配对时间要求很高,为保证时间窗,聚类的判别准测是使每个聚类中的任务点到该聚类中心的距离最小进行划分处理,输出优化的聚类结果

5 检验成果

用GPS定位新的任务和下单会员的位置经纬度,将之前的数据处理方式编程,加工后带入公式:

Y=66.0239+1.449X1-0.065X3-ξ,其中,

ξ=(66.0239+1.449X1-0.065X3)×ε%

给出新定价,再根据APP数据调查,取同原来等数量样本,规定“完成度=完成的任务项数目/总任务项数目”与原方案对比,发现完成度显著提高

6 结论

基于位置数据处理的 “拍照赚钱”的任务定价,可考虑将物品位置,会员位置,会员与任务相对位置等因素综合起来,将位置经纬度数据转化为相对中心位置距离,通过回归分析来转化为定价;之后采用打包分配策略来优化定价模型。

参考文献

[1]孙振宇.多元回归分析与Logistic回归分析的应用研究[D].南京信息工程大学,2008.

[2]周世兵,徐振源,唐旭清等.K-means算法最佳聚類数确定方法[J].计算机应用,2010,30:1995-1W8.

[3]赵兴龙.基于K-means-遗传算法的众包配送网络优化研究[D].北京交通大学,2016.

作者单位

1.华北理工大学理学院 河北省唐山市 063200

2.华北理工大学数学建模实验室 河北省唐山市 063200

3.华北理工大学机械工程学院 河北省唐山市 063200

4.华北理工大学冶金与能源学院 河北省唐山市 063200

猜你喜欢

回归分析数据处理
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
城乡居民医疗费用的相关性与回归分析
MATLAB在化学工程与工艺实验数据处理中的应用
Matlab在密立根油滴实验数据处理中的应用
基于POS AV610与PPP的车辆导航数据处理
依托陆态网的GNSS远程数据处理软件开发