基于Logistic 回归的公交支付偏好研究

2020-01-08吴迪

焦作大学学报 2019年4期

吴迪

（安徽财经大学统计与应用数学学院，安徽蚌埠233030）

1.背景知识

1.1 产生背景

公交刷卡已经是人们日常出行的高频应用。但是，随着智能手机的普及，越来越多的支付手段可以转移到手机端，同时，实体公交卡在使用的过程中存在着充值不方便、容易丢失、刷卡记录无法查看、跨地区无法使用等问题，现金支付带来很多不便，增加人工成本等，而公交移动支付则可以很好地解决这些问题。

1.2 研究意义

移动支付方便群众公交出行，提高公交服务品质，对打造智慧城市、信用城市和城市发展无疑是有利而无害的。通过对蚌埠市乘车人出行数据的分析，得出该城市乘车人的出行支付偏好，同时通过对移动支付数据的分析和建模，得出在出行支付方面可以以数学的形式更好地展现出移动支付偏好，为第三方支付公司的发展和转型提供分析依据。

2.问卷调查及分析

2.1 问卷的设计

支付方式选择的主体是蚌埠市居民，我们针对居民的年龄（x1）、在蚌埠市住房状况（x2）、每月乘车次数（x3）、学历（x4）、是否有购车打算（x5）、性别（x6）、月消费（x7）、对未来生活质量的预期（x8）、对移动支付的了解程度（x9）、最近一周内移动支付出行的次数（x10）和最近一次乘车支付方式（x11）进行设计问卷，尽量让参与者快速、简洁地完成问卷，得到真实性的答案。（传统支付为公交投币或者公交卡支付，移动支付为手机第三方移动支付。）

2.2 问卷的实施

在蚌埠市社区、学校、人流量比较大的公交站台附近发放问卷，共发放出600 份纸质问卷，其中来自社区居民纸质版102 份，公交站台附近纸质版问卷122 份，在蚌埠市大学城回收纸质版问卷142 份，其他地区（公园、街道等）234份，其中无效问卷29 份，回收有效纸质问卷571 份。此外，利用问卷星软件，从网上回收电子问卷310 份（网上问卷在大学城学生的QQ群或者微信群中发放）。综上，共回收有效问卷881 份。

2.3 变量赋值

变量赋值参考表1。

表1 变量赋值参考表

3.logistic 回归分析

3.1 数据分析

（1）数据预处理。由于数据是通过网上问卷和线下问卷的方式回收得到的，数据类型不平衡，原始数据可能会影响最后结果的准确性。我们对数据进行分层抽样，在传统支付方式中抽取80 组，在移动支付中抽取80 组，最后在剩下的总样本中抽取40 组，最终得到200 组样本。其中有95 个移动支付样本，105 个传统支付样本。

（2）灰色关联度筛选指标。首先，对十个指标进行初步的筛选。虚拟一个最优公交支付偏好因素x0作为参考数列，问卷中的10 个指标xi（其中i=1，2…10）作为比较数列。利用层次分析法确定各指标对应的权重，其中wk（k=1，2…10）为第k个评价指标对应的权重。计算灰色关联系数：