基于Logit回归的网约车使用频率影响因素分析
2024-01-02徐笑梅郭贺滨刘奕奕
徐笑梅,李 晋,郭贺滨,刘奕奕
(1.苏州城市学院,江苏 苏州 215104;2.悉地(苏州)勘察设计顾问有限公司,江苏 苏州 215123;3.南通大学,江苏 南通 226019)
1 引 言
网约车凭借用车便捷、支付方便等优势,迅速崛起。然而,其爆发式增长的背后存在着许多问题,极大降低了乘客使用网约车出行的热情。因此,从乘客角度,分析影响网约车使用的因素,理解乘客对网约车的青睐,对提升乘客的消费体验、推进网约车行业改进至关重要。
国内外学者对传统出租汽车行业的研究较多,而对于新兴的网约车的研究相对较少,且大多集中在网约车政策法规和规章制度[1-2]、服务质量和满意度测评方面[3-5],对乘客出行行为的研究相对较少。网约车乘客出行行为研究主要分两大类。一类关注的是网约车和其他出行方式的横向比较,研究用户出行时选择网约车还是其他方式的影响因素有哪些[6-7]。另一类关注的是网约车自身的出行情况,研究影响用户网约车使用或持续使用意愿的因素有哪些[8-9]。乘客网约车出行的意愿往往和实际出行情况存在较大偏差,导致建模结果与实际情况不符。因此,本文从乘客视角出发,基于乘客的网约车实际使用频率,构建Logit模型挖掘影响网约车使用的关键因素。影响因素不仅考虑了前人研究中常见的性别、年龄、收入等乘客社会经济属性,还创新性地引入了网约车服务属性,并在Logit回归前采用因子分析法对其进行降维去噪,从而降低模型复杂度,消除多重共线性影响。
2 影响因素分析模型
2.1 Logit回归
本文采用二元Logit模型挖掘影响网约车使用的关键因素。表达式为
=β0+β1X1+β2X2+…+βmXm
(1)
式中:因变量Y服从二项分布,其分类取值为0,1;P(Y=1)表示Y=1的概率;X1、X2、…、Xm为m个自变量;β0、β1、…、βm为待估参数,参数估计采用最大似然估计法。
首先,确定因变量。选取“乘客网约车周使用频率”为因变量。周使用频率在5次及以下即为“低”,并赋值0;周使用频率在6次及以上即为“高”,并赋值1。其次,确定自变量。自变量包含两部分:(1)乘客社会经济属性(例如性别、年龄、职业等);(2)网约车服务属性(例如司机安全驾驶情况、打车成功率等)。
2.2 模型构建流程
由于网约车服务属性众多,Logit模型会变得复杂不稳定,且各服务属性间可能存在多重共线性,直接带入会影响建模效果。因此,本文采用因子分析法[10]发掘网约车服务属性背后的潜变量,提取公因子来替代原变量进行Logit回归,从而降低模型复杂度,消除多重共线性影响。各公因子可表示成原服务属性的线性组合
Fj=dj1X1+dj2X2+…+djmXm(j=1,2,…,n)
(2)
式中:Fj为因子得分;dji为因子得分系数;Xi为原变量;m为原变量个数;n为公因子个数,n 相关数据通过问卷调查获取。为保证问卷的有效性,还应进行信效度分析。克隆巴赫α系数>0.7,则表示问卷信度良好。效度分析判断标准:(1)共同度大于0.4;(2)累积方差贡献大于60%;(3)题项在对应因子上的因子载荷系数大于0.4;(4)不存在题项与因子对应关系出现严重偏差[10]。 问卷包含3部分:(1)网约车使用频率;(2)乘客社会经济属性;(3)网约车服务属性(分值1~5分别代表用户对指标非常不满意、不满意、一般、满意、非常满意)。问卷采用问卷星平台在线发放,回收有效问卷共计1 464份。网约车使用频率和乘客社会经济属性如图1所示,用户对网约车各服务属性的满意度如图2所示。 图1 网约车使用频率及乘客社会经济属性 图2 网约车服务属性满意度评分 运用SPSS软件进行信度分析,得出克隆巴赫α系数为0.754>0.7,说明信度良好。KMO值为0.866>0.7,Bartlett球形检验p值为0.000<0.05,说明数据可以进行因子分析。变量共同度∈(0.603,0.796),均大于0.4,符合效度要求。提取特征根大于1的公因子,共计3个,特征值分别为3.990、2.667、1.575,方差贡献分别为33.447%、22.116%、11.621%,累积方差贡献为67.184%>60%,符合效度要求。由表1中的旋转后的因子荷载系数可以看出变量在对应因子上的系数最小值为0.723>0.4,且变量与因子对应关系良好,符合效度要求。 表1 因子分析结果 根据式(2)可计算各样本的公因子得分。进行Logit回归时,用公因子得分替代原服务属性数据作为新的因变量。 以“乘客网约车周使用频率”为因变量,以“性别”、“年龄”、“职业”、“月收入”、“是否拥有私家车”、“网约车使用情境”、“网约车出现前的出行方式”、“公因子1(服务)”、“公因子2(诚信)”和“公因子3(效率)”为自变量建立Logit模型,并用最大似然估计法标定参数,结果如表2所示。 表2 Logit模型参数标定结果 似然比检验p值=0.000<0.05,表示自变量系数不全为0。Cox &Snell R方为0.241和Nagelkerke R方为0.327,均大于0.2,说明模型具有较强的解释能力。Hosmer-Lemeshow检验p值=0.759>0.05,表示预测值与观测值没有显著差异,模型拟合度较好。 (1)除了“网约车出现前的出行方式”这一变量外,“性别、年龄、职业、月收入、是否拥有私家车、网约车使用情境、网约车服务、网约车诚信和网约车效率”这些变量都对网约车的使用频率有显著影响。 (2)性别上,男性比女性更有可能高频次地使用网约车。这也许与近些年网约车人生伤害事件多以女性为主有关,降低了女性乘客使用网约车的热情。为吸引女性群体多使用网约车出行,网约车运营公司可考虑实施针对女性乘客的安全保障措施。 (3)年龄上,相比于55岁以上人群,41~55岁人群高频使用网约车的概率更低。而25岁以下和25~40岁的这两类人群相比于55岁以上人群的网约车使用频率没有统计学差异。 (4)月收入上,25 000元以上人群比5 000元以下人群更有可能高频次地使用网约车,而在5 000~15 000元和15 001~25 000元的这两类人群相比于月收入25 000元以上人群的网约车使用频率没有统计学差异。这也许是因为收入低于5 000元时,扣除基本生活花销,所剩无几,此时,乘客出行考虑的更多的是出行成本,从而去选择公共交通;随着收入的不断增加,扣除基本生活花销,有一定结余,出行成本不再是乘客考虑的主要因素,从而去选择价格更高、更舒适的网约车出行。 (5)私家车拥有上,没有私家车的乘客比有私家车的更有可能高频次地使用网约车。尽管网约车出行方便、快捷,但是出行过程不如私家车出行可控,可能会碰到司机有绕路、取消订单、危害安全驾驶的行为,导致有私家车的群体往往更愿意自驾出行。为吸引有私家车的群体多使用网约车出行,网约车运营公司应及时发现运营中存在的问题,对症下药,尽可能提供等同私家车出行的服务。 (6)网约车使用情境上,相比于喝酒应酬,上下班、外出办事和接送孩子的情境更有可能高频使用网约车,这可能是因为喝酒应酬本来发生频率就少,且该群体中有私家车的人往往更多的选择的是代驾。外出游玩和恶劣天气相比于喝酒应酬的网约车使用频率没有统计学差异。 (7)网约车服务属性上,其服务、诚信、效率每提升1个单位,网约车高频使用的胜率将变为原来的1.727 0倍、1.402倍、1.130倍。为吸引乘客多使用网约车出行,网约车运营公司应提出服务、诚信、效率方面的保障措施,尽可能提升这三方面的水平。 以苏州市为例,构建二元Logit模型挖掘影响网约车实际使用频率的关键因素。影响因素不仅考虑了乘客社会经济属性,还创新性地引入了网约车服务属性,并采用因子分析法提取了三个公因子替代原有变量,从而简化模型。模型结果显示除“网约车出现前的出行方式”外,“性别、年龄、职业、月收入、是否拥有私家车、网约车使用情境、网约车服务、网约车诚信和网约车效率”都对网约车的使用频率有显著影响。研究结果既能丰富网约车乘客出行行为理论,也能为管理部门对网约车进行更合理的监管、网约车公司进行更科学的运营提供参考。3 问卷调查与分析
4 Logit模型参数标定与结果分析
5 结 论