基于大数据背景下因子分析的出租车司机选择决策策略研究
2020-08-04乌兰蒋伟
乌兰 蒋伟
摘要:出租车对交通行业发展影响深远,出租车是衔接机场与城市交通系统的重要方式。因此研究机场出租车司机的收益和机场管理部门高效管理具有重要意义。我们根据机场客流量变化和司机的收益多少,确定了8个主要影响出租车司机决策的因素。基于因子分析建立决策模型,且数据通过KMO检验。再通过旋转因子可将8个影响因素分为潜在损失,客流数量,预计收益这3个主因子。最后,通过因子分析模型给出选择策略。
关键词:决策模型 因子分析 选择策略
1 引言
如今出租车产业已经成为交通中必不可少的一项服务,对于机场而言更是至关重要。当司机送乘客到机场后将面临两个选择,一是排队等待搭载乘客返回市区。二是直接空载返回市区拉客。两个选择都受各样因素的影响。而机场出租车管理员负责定量放行车辆进入乘车区,并安排定量的乘客上车。
2 模型的建立与求解
2.1 基于因子分析建立的决策模型
因子分析能够在大部分变量中找出具有相关性的隐藏变量。其主要目的是把多数几个无关的变量通过降维技术变成少数几个相关的变量。
2.2 给出租车司机的选择策略
近几年,出租车产业发展一直十分稳定,每个城市都离不开出租车行业的服务。对于机场等较偏远的地方对出租车的需求量更大,且出租车司机为了自身的利益,送客到机场后会面临两个选择。由于影响出租车司机决策的因素具有多样性,所以从中挑选8个具有代表性的影响因素对问题进行分析。为了建立出租车司机的决策模型,根据数据调查和分析,挑选出8个对出租车司机影响较多的因素,分别为:吞吐量(即客流量),飞机到达数量,周边出租车,延误率,大型活动量(如大型演唱会、体育赛事和重大会议等),降雨天数,等待时间,平均行驶里程(如不同月份出于不同目的从机场到企业区、市区和娱乐区的路程不同)。如表1。
通过数据收集,找到了广州市白云机场 2018年12个月份在8种影响因素下的数 据,并进行标准化处理。
(1)判断该数据是否适合进行因子分析
首先对进行标准化后的8种因素及其相关数据做KMO检验,判断该数据是否适 合进行因子分析。
根据KMO的统计值发现,总体值为0.6526,且大部分KMO的统计值在0.6、0.7左右,说明原变量比较适合进行因子分析。
(2)确定提取的公因子数目
可根据特征值大于1和累计贡献率首次达到70%以上来判断。
由表3可知,有3个特征值是大于1的,若按照特征根大于1的准则提取公因子,可以提取3个公因子;且若按累积贡献率首次达70%为准则提取公因子,也可以提取3个公因子。综上所述,提取3个公因子的效果较好。且累积贡献率高达91.88%,说明用这三个主因子解释出租车司机决策已有91.88%的把握。
(3)写出旋转因子模型
旋转因子模型相比因子模型而言,可以更加直观的将多个因子分成少数的几个公因子。
从表4中可以得出,8个影响因素共分為3个主因子:潜在损失因子:等待时间,延误率,降雨天数;客流数量因子:吞吐量,飞机到达数量,周边出租车;预计收益因子:平均行驶里程,大型活动量。
将解释出租车司机决策的3个主因子通过流程图更加直观的表现出来,见下图1。
综合分析机场客流量变化和出租车司机收益等问题,给出出租车司机的决策模型。在模型中,潜在损失由延误率、降雨天数和等待时间决定。若某段时间内降雨天数越多即受坏天气影响越大,其飞机的延误率越高,本应到达的旅客减少,相应司机需要排队等待乘客上车的时间越长。因此当潜在损失因子所占比重较大时,司机应该选择直接空载返回市区拉客,不在机场等待。
在模型中,客流数量由吞吐量、飞机到达数量和周边出租车的数量决定。吞吐量和飞机到达数量可直接反映客流量的多少,其数量越多,出租车司机会在短时间内接到乘客的可能性越高。则当出租车司机前往机场送客时,会选择在机场等待,导致周边出租车的数量增多,但由于客流量所占比重更大,仍会出现“供不应求”的现象。因此当客流数量因子所占比重较大时,司机应该选择排队等待载客返回市区。在模型中,预计收益由平均行驶里程和大型活动数量决定。平均行驶里程会因为目的地的不同发生改变,其里程越长,单位内取得的收益越大。当大型活动次数越多,则某段时间内的客流量越大,对出租车的需求也会越多。因此当预计收益因子所占比重较大时,司机应该选择排队等待载客返回市区。
参考文献
[1]王学民.应用多元统计分析[M].上海:上海财经大学出版社,2017.
[2]胡书文,徐建武.主成分分析和因子分析在中国股票评价体系中的应用[J].重庆理工大学学报 (自然科学),2017,31(05):192-202.
[3]邓义华.多属性决策的灵敏度分析[D].南京:南京理工大学,2003.