基于logistic回归模型的打车软件市场规模影响因素研究
2016-10-21王子葳相雨婷高蕾吕学斌
王子葳 相雨婷 高蕾 吕学斌
摘 要:打车软件的快速发展,将会对传统出租车市场的未来产生重大的影响,甚至会颠覆其原有消费模式,因此竞争激烈。该文从用户角度出发,设计并通过网络发放调查问卷,对打车软件市场规模影响因素进行了调查和数据分析,并以其结果为样本,结合聚类分析方法,通过建立多项有序logistic回归模型,对打车软件市场规模的影响因素进行实证分析。研究表明,各因素中补贴对打车软件使用频率的影响最大。最后对结果进行了现实意义的分析,并就此提出打车软件竞争策略建议。
关键词:聚类分析 多项有序logistic回归模型 打車软件
中图分类号:F275 文献标识码:A 文章编号:1674-098X(2016)03(b)-0080-04
Abstract:The rapid development of the taxi-hailing apps is impacting on the future of traditional taxi market, and even will subvert the original consumption pattern, so the competition is intense. From the perspective of users, questionnaires of influence factors on the size of the taxi-hailing apps market are designed and given out through the network, and the investigation data are analyzed. Based on the analysis results, the clustering analysis method is used, and the orderly multinomial logistic regression model is established to analyze the factors impacting the size of the market taking taxi-hailing apps. Research shows that of all the factors subsidies plays the leading role on taxi-hailing apps use frequency. Finally, the practical significance of the results is analyzed, and then the strategies on the taxi-hailing apps competition are suggested.
Key Words:Cluster analysis;Orderly multinomial logistic regression model;Taxi-hailing apps
近年来,在出租车市场的供不应求及互联网技术的快速发展的推动下,打车软件应运而生。打车软件是一种智能手机应用,乘客可以便捷地通过手机发布打车信息,大大提高了打车效率。iiMediaResearch数据显示,2014年中国移动出行用车平台的用户规模达到2.11亿,而2015年预计将达到2.69亿,同比增长率为27.5%。
打车软件的快速发展和激烈竞争,将会对传统出租车市场的未来发展产生重大的影响,因而引起了许多研究人员的关注。周光伟(2014年)研究认为打车软件对出租车行业并没有颠覆性的影响,只能在出租车行业基本监管体系下有序参与市场竞争[1]。王一帆(2014年)根据ISM解释结构模型分析得出我国应构建出租车行业预约服务与打车软件机构合作的利益协调机制[2]。侯云杰(2015年)则提出应统筹移动软件与市场发展的关系来应对新媒体环境下出租车市场机遇与挑战并存的现状[3]。
目前国内利用数学建模方法对打车软件市场规模影响因素进行分析的研究不多,研究主要集中在分析因为打车软件而激化的各类矛盾,以及针对这些矛盾而提出的解决措施。文章基于问卷调查所得数据,综合运用聚类分析法和多项有序logistic回归法构建关于打车软件市场规模影响因素的模型,并对其判别效果进行分析。
1 研究设计
文章的研究对象是打车软件,研究主要依据江苏省13个市的问卷数据。调查人员采用网上发放问卷的方式进行调查,共收回有效问卷550份。从被调查者的职业来看,学生占66.98%,上班族占22.22%,其他占10.8%,消费主体分布合理,样本具有代表性。调查问卷共包括补贴力度、等待时间、便利性、安全性、广告宣传、接受程度、网络通畅、年龄、收入、使用频率等10个影响因素,各因素的影响度用1~5表示,见表1。
图1~5分别具体展现了打车软件使用频率、补贴满意度、使用打车软件打车等候时间、打车软件是否带来便利、打车软件是否安全的分布。
用户使用打车软件频率分布显示,被调查者中超过3/4使用过打车软件,11.42%的使用者使用频率较高,7.72%的使用者使用频率非常高。在使用过打车软件且被补贴的调查者中,62.65%的人都对补贴表示满意,只有7.1%的人不满意。使用打车软件后等待的时间分布为:约58.33%的用户认为等待时间会减少,只有3.7%的用户认为等待时间反而会增加。打车软件是否带来便利的统计结果为,58.95%的用户认为使用打车软件会更便利,其中17.59%的被调查者认为使用打车软件非常便利,41.36%的被调查者认为使用打车软件较为便利,如在偏僻地方或上下班高峰期时打车更为容易。相反,11.42%的用户认为使用打车软件并没有带来便利。在使用打车软件的安全性的调查中,82.86%的被调查者认为安全,其中认为比较安全和一般安全的被调查者的比例大约各占一半,在37%左右。而剩下的被调查者认为使用打车软件不安全。
2 计量模型分析
2.1 聚类分析
此文选取以上调查问卷结果来分析打车软件市场规模的影响因素。由于变量较多,笔者自行将这些变量分为心理、津贴、有用性、年龄、网络通畅5类。属于心理类变量有:willing,influence;属于津贴类有:allowance,income;属于有用性的变量有:time,convenience,safety;属于网络通畅变量有internet;属于年龄变量是age。提取每类变量样本的样本值,采用K-Means聚类法将样本分为5类。利用SPSS软件最终确定5个类中心,并得到每个类中的样本数量[4]。
2.2 多项有序logistic回归模型
此文以研究以上5类变量对打车软件使用频率的影响来分析打车软件市场状况,而影响使用打车软件频率的因素众多,不能以简单的线性关系描述,因而采用多项有序logistic回归模型[5]。在经典的Logistic回归里,仅考虑是否使用打车软件的概率。引入随机变量Y,Y取0表示不使用打车软件,Y取1表示使用打车软件,Y=1的概率为P(Y=1),影响是否使用打车软件的因素设为X1(心理),X2(津贴),X3(有用性),X4(网络通畅),X5(年龄),所对应的Logistic回归模型为
其中Xi表示影响用户使用打车软件频率的因素。在采用极大似然估计法得到aj和bji的估计值后,就可以计算出具有某一社会经济特征的用户使用打车软件频率的概率,进而分析其影响因素。
根据上述模型,代入问卷调查所统计的数据,利用SPSS 16.0拟合出4个二分类logistic回归方程[7]。
方程在0.1水平下,大部分的系数均显著,说明在0.1的水平下模型拟合较好。其中Money变量最为显著,说明该变量是5个因素中对于模型的影响最大的因素,即打车软件提供的补贴力度和用户收入所构成的新变量Money,对于使用打车软件频率影响最大。
根据表2得到模型似然比检验在0.01水平下显著,说明模型整体性较好,模型拟合结果很好。
3 结语
文章以问卷调查得到的550份有效问卷为样本,以聚类分析为工具,利用多项有序logistic回归模型分别从津贴、心理、有用性、手机网络通畅以及年龄5个方面分析了打车软件使用频率。基于模型估计的结果,得到结论:5个变量中津贴对打车软件使用频率的影响程度最大,即补贴满意度和收入的综合作用对打车软件使用频率的影响最大,而这两个变量中补贴满意度占主导地位,说明了用户对补贴的满意度对软件使用频率的影响最大。文章以使用打车软件频率作为衡量打车软件市场规模的依据,说明了目前打车软件行业主要依靠“双向补贴”方式来吸引用户使用自家打车软件,不断增强他们对打车软件的依赖性以此扩大打车软件市场规模,最终达到盈利目的。
但是仅仅依靠补贴方式来吸引消费者,长此以往并不现实,打车软件公司不可能用无穷无尽的现金流来笼络住消费者的心,因而需要思考补贴之外的新出路。
参考文献
[1] 周光伟.打车软件的应用对出租车行业的影响及对策分析[D].深圳:深圳大学经济学院,2014.
[2] 王一帆.基于打車软件的出租车服务模式优化研究[D].上海:上海交通大学,2014.
[3] 侯云杰.论手机打车软件对市场的影响[J].新闻研究导刊2015(6):1.
[4] 苏理云,陈彩霞,高红霞.SPSS19统计分析基础与案例应用教程[M].北京:北京希望电子出版社,2012:173-240.
[5] 高惠璇.应用多元统计分析[M].北京:北京大学出版社,2013:216-245.
[6] Jason S. Bergtold.The probabilistic reduction approach to specifying multinomial logistic regression models in health outcomes research [M].Journal of Applied Statistics,2014.
[7] 谢龙汉,尚涛,蔡明京.SPSS统计分析与数据挖掘[M].北京:电子工业出版社,2014:231-253.