用户支付选择的影响因素
——对中国和美国消费者的实证分析
2021-12-07邱甲贤王震寰李玉卓
邱甲贤,王震寰,李玉卓,童 牧
(1.西南财经大学 工商管理学院 大数据研究院,成都 611130;2.西南财经大学 经济信息工程学院中国支付体系研究中心,成都 611130)
支付作为交易资金转移实现方式,是社会金融经济活动的基础。随着技术的进步和经济的发展,借记卡、信用卡、电子转账、第三方支付等新兴非现金零售支付工具或方式不断出现、发展和演变,对现金、支票等已有支付工具形成了替代。全球支付市场的发展显示,尽管中国非现金支付工具的发展相对于美国、北欧等国家起步较晚,但以银行卡、第三方支付以及移动支付为代表的电子支付工具和方式在近十几年的快速发展,促使当前中国支付领域已领先全球。毫无疑问,支付市场的演化在提高支付效率的同时,也通过渗入到交易场景加深对社会经济金融活动的影响,加剧了银行业、非银行业支付服务机构间的竞合。随着区块链等新兴技术的发展以及央行数字货币(DCEP)的推出,支付工具间的替代和支付市场的演化将进一步加强,支付市场未来发展已成为各界关注的焦点。
支付工具的演替源于市场用户对支付工具的选择,要准确了解支付工具间的替代,需要从微观层面了解影响用户支付选择行为的因素,这不仅有助于了解支付工具市场特征,建立更加完善的支付理论体系,更有助于银行和非银行支付机构推行新支付工具,以及政府合理引导市场竞争和发展。
为全面了解什么因素推动了用户支付工具的选择和转换,国外部分机构对以消费者为主的用户进行了较为全面的调查,如加拿大中央银行的MOP(Bank of Canada Method of Payment Survey)、美国波士顿联邦储备银行的SCPC(Survey of Consumer Payment Choice)和DCPC(Dairy of Customer Payment Choice)。影响用户支付选择的因素包含多个方面,如文化传统、成本、安全、便利、收入、价格、金融资产、网络外部性、技术及支付金额、制度等[1-12]。Schuh 等[6]整体上将这些影响因素归纳为人文地理属性和支付工具特性两大方面。关于人文地理相关的影响因素,实证研究发现,用户的年龄、教育程度、收入、性别、种族、人种、地区文化、工作、婚姻状况等方面会显著影响其支付选择[3-4,6-12]。其中,年龄、婚姻、教育程度和收入被认为是主要的影响因素[3,6-7,9,12]。关于支付工具特征,美国波士顿联邦储备银行的消费者支付研究中心(Consumer Payments Research Center,CPRC)将其分为成本、速度、安装、安全性、支付控制、记录保存、接受程度和易用性8 个方面;加拿大银行在其MOP用户支付工具调研中,将支付工具特征分为易用性、记录保存、成本、风险/欺诈、普遍使用等方面。对于支付工具特征对支付选择的影响,研究认为主要受到支付工具便利性、易用性、成本、安全、速度等特征[1,6,12-14],以及支付工具价格或激励措施[4,15-20]等因素的影响。总结前期研究不难发现,用户支付工具选择和替代受到了个人特征、文化传统、支付工具特征、制度等多方面的影响,这些研究则主要针对如价格或成本[4,15,17,20]、支付场景或金额[1,4,9,21]、时间或速度[5,14]、易用性和安全性[12,14]等特定因素,采取了按经验选取可能对消费者支付选择产生影响的特征构建计量模型进行实证分析。然而,由于影响用户支付选择行为的因素众多,按经验选取特征的方式因为不可避免的主观性,有可能造成重要变量的遗漏。此外,当前研究从不同角度进行分析可得到所选因素所产生的影响,但并没有从大量影响因素中筛选出影响用户支付选择的重要因素。
基于前期研究不足,本文研究目的主要是在众多用户支付工具持有选择行为的影响因素中找出重要因素并分析其影响程度。对此,针对用户支付选择市场特征,构建随机森林模型对影响用户支付工具持有选择的因素进行筛选,然后对筛选后的变量构建二分类逻辑回归模型,分析各因素对消费者对各支付工具持有选择产生的影响。通过对中国CHFS和美国SCPC 数据实证分析结果表明,基于该研究框架能较好地筛选出影响用户支付选择的重要因素,并对实际情况具有较好解释能力。
1 模型构建
1.1 研究框架
影响用户支付选择的因素众多,要找出影响用户支付选择的重要因素则首先需要特征筛选。常用的特征选择方法有Filter、Wrapper和Embedded等3大类。其中,最常用的是基于树的特征选择法,随机森林则为一种非常流行的基于多个决策树的嵌入式特征选择方法,抗噪性强,并可有效避免一般机器学习方法容易产生的过拟合问题。根据本文研究目的及前期支付工具调研的数据集中大多数变量为离散变量的特点,采用随机森林对用户支付持有选择影响因素进行筛选。为进一步分析所筛选因素对用户选择行为的影响及影响程度,前期对用户支付选择的研究表明,用户对单种支付选择行为表现为持有和不持有二分类[1,6,12,14]。因此,采用二元离散选择模型对随机森林筛选变量建立用户持有选择模型,并在此基础上进行变量影响解释和模型检验。研究框架如图1所示。
图1 本文分析流程图
分析流程主要包括:①原始数据预处理,包括了数据缺失值、标准化等预处理;②基于随机森林模型对不同支付工具进行特征筛选;③采用Logit模型对随机森林筛选特征构建用户支付工具持有选择模型,并基于Tonidandel[22]的方法,计算各变量的相对权重值以及同类变量的累积解释度,检验各重要特征对用户持有支付工具的影响程度。
1.2 基于随机森林的特征选择
随机森林是一个包含多个决策树的分类器。该算法结合装袋和决策树,通过随机采样和节点随机选择特征的方式构造决策树集合,再根据投票加总结果对数据进行分类(或者是取平均值进行回归)。基于随机森林的双重随机性所产生的良好抗噪、抗过拟合能力,Genuer等[23]提出通过加入重要变量会显著引起整个模型分类效率提高,而加入不重要变量则不会显著引起模型分类效率提高的思想,将随机森林用于特征筛选。计算流程如下:
算法1随机森林计算特征重要性系数。
输入已经训练好的随机森林T={t1,t2,…,tn}
运算forp=1:Pdo
计算所有决策树的袋外误差OOB1
对特征p进行白噪声化处理
计算所有决策树的袋外误差OOB2
计算OOB1与OOB2的方差
输出特征p的重要性系数VI
end for
输出P个特征各自的重要性系数
Genuer等[23]以迭代方式搜索重要的变量并剔除不重要变量,把引入变量引起的袋外误分率(Out-Of-Bag,OOB)下降程度作为指标,若OOB 下降幅度大于给定阈值,则认为该变量为重要变量,反之则不重要。阈值的计算公式为
式中:pelim为所有变量个数;pinterp为初始变量个数;求和符号表示迭代模型的袋外误分率差分的绝对值之和。
1.3 Logit模型及变量重要性估计
对于某种支付工具,用户具有持有与不持有两种选择。假设影响用户支付工具持有选择Y的因素X=(x1,x2,…,xk)'。用户i是否持有支付工具j的概率为
条件概率pij与影响因素Xij间关系的一般形式设定为
式中:F(·)为特定函数形式;β为参数向量。要保证pij∈[0,1],F(·)需满足服从特定分布随机变量的累积分布函数。常见的二元离散选择模型的分布为Logistic和正态分布。由于Logistic分布相较于正态分布具有更长的尾部和更缓慢的增长,更适合支付市场特征,前期实证分析中的绝大多数文献[12,14,16]采用了Logit模型,此时用户支付选择的概率模型为
转换为表示用户支付持有与不持有概率比的Logit模型:
利用极大似然估计函数求解该方程系数,得到样本是否持有支付工具的概率和分类。如果样本判为持有与不持有的比值大于1,则将该样本判为持有,反之则为不持有。
Logit回归分析中,评价变量的影响往往会采用回归系数。然而,由于实际研究中变量存在相关不能进行精确估计,为进一步分析所选影响因素对用户持有选择预测能力贡献程度,采用Tonidandel等[22]基于相对权重估计法,计算模型变量的相对权重,从而判断其重要性。该方法首先对变量矩阵X进行奇异值分解:
矩阵P为矩阵XX'的特征向量矩阵,矩阵Q为矩阵X'X的特征向量矩阵,对角矩阵Δ为矩阵X的奇异值。进一步,得到正交变量矩阵:
用Z关于Y进行回归分析,由于Z互不相关,故其标准回归系数衡量了Zk对于Y的解释度;用Z关于每一个Xj进行回归分析,同理,其标准回归系数衡量了Zk对于Xj的解释度。以正交矩阵Z作为桥梁,可得
εj是Xj对于Y的解释度。在计算标准回归系数时,由于Logit回归的因变量为0-1分布,其标准系数计算方式和OLS回归有所不同,调整后的系数应为
式中:β为逻辑回归解释变量系数;R2为逻辑回归可决系数;sx为解释变量标准差。计算
可得估计的相对权重值
2 数据预处理和特征选择
2.1 数据来源
根据前期研究文献,到目前为止,全球只有少数机构对用户支付工具选择进行了较为全面的调查。中国虽然还没有类似调研,但中国家庭金融调查(China Household Finance Survey,CHFS)中涉及了家庭支付方式选择、人口信息、历史消费支出、家庭及个人金融等信息。结合数据的可得性,本文选用2017年CHFS数据和美国2018年SCPC数据进行实证分析。SCPC 数据共有3 153个样本和653个变量,CHFS数据分为家庭和个人数据集,将两者连接后生成同时包含个人和家庭特征的“户主变量”,具有40 011个样本和2 836个变量。原始数据集和变量筛选的关系如图2所示。
图2 原始数据集和变量筛选的关系
2017年CHFS对支付方式的调研选项中包括现金、银行卡、电脑支付、移动支付和信用卡;美国SCPC 将零售支付工具分为现金(CSH)、支票(CHK)、汇票(MON)、借记卡(DC)、信用卡(CC)和预付卡(SVC)6种。为保证分析的有效性,排除了数据太有偏的支付工具(如现金(中国和美国持有占比分别为94.4%和98.6%)、美国汇票(持有占比仅为17.4%)等),最终选取中国银行卡、电脑支付、移动支付和信用卡以及美国支票、借记卡、信用卡和预付卡作为分析对象。删除问卷基本信息、变量的标签变量、所有值相同或为空以及缺省值比例过大的变量,最终分别对CHFS 和SCPC 选择出131 和122个相关变量。根据变量的意义,将其分为5类:①人口特征变量;②支付工具特征;③代表消费者家庭财务状况和个人金融行为的金融情况;④历史消费支出(仅中国数据);⑤第三方支付Paypal使用情况(仅美国数据)。部分变量名称和含义如表1所示。
表1 部分变量及含义
相较SCPC,CHFS 数据并没有专门针对支付工具进行相关的调研,因此,没有类似SCPC支付工具特征评价等变量;而SCPC 则没有类似CHFS历史分类消费支出等信息。对此,本文根据各变量的信息进行了分类,如CHFS 调研中涉及的家庭成员之间现金支付(包含给父母、他人现金情况)反映了现金的网络外部性特征,以及对非现金支付服务评价也在一定程度上反映了用户对非现金支付特征的整体评价,并将其划分为支付工具的特征。
2.2 数据的预处理
结合数据特征,主要进行了缺省值填充和数据标准化、分段和One-hot编码等预处理。
(1)缺失值填充。根据数据说明书,主要存在两种缺失值类型:一种是数据搜集过程中产生一般性缺失值NA(Not Available);另一种是问卷中的前提条件没有满足而生成的空值NAN(Not a Number)。NA 缺失值占比小,随机森林算法对于缺失值有很好的抗噪效果,只在Logit模型中去掉包含NA 缺失值的样本。对于一般性的离散缺失值主要采用众数填充;某些分布有偏的连续性变量(如非固定资产价值等)采用均值填充;对NAN 逻辑性缺失值,根据生成规则倒推该变量符合逻辑的值,例如样本不存在贷款,则贷款金额由缺失值填充为0。
(2)数据标准化和离散处理。为消除量纲的影响,对分布接近正态的变量采用z-score标准化方法,对明显有偏连续变量采用对数化处理。此外,为了提高连续变量与因变量的非线拟合程度及提高算法运行效率,对于某些连续变量,如年龄、支付历史特征等进行了分段化和One-hot编码处理。
2.3 基于随机森林的特征筛选
根据Genuer等[23]对随机森林的设参规则,随机特征数设置为总体变量个数的平方根(如≈11)。为确定合适的决策树数量,分析了所选支付工具的随机森林袋外误分率和决策树数量增长关系,如图3所示。
图3 支付工具随机森林袋外误分率和树的数量的关系
树的数量在200以内,中国4种支付工具及美国的支票、借记卡、信用卡对应的随机森林模型袋外误分率和树的数量的关系相似,均呈现下降趋势,然后在树的数量大于50后趋于稳定,美国预付卡的稳定性则较差。根据袋外误分率的稳定情况,美国预付卡随机森林模型决策树数量参数设置为100,其他支付工具均设置为50。以美国支票为例,设置模型参数后重复训练模型50 次,得到每一次训练对应的变量重要性系数,取均值后由大到小排序。结果显示,排序靠前的特征重要性系数下降较快,而重要性排序靠后的变量重要性系数相对更平稳。以前5 个变量作为起点,根据排序后的变量逐步引入变量,得到递归模型的袋外误分率向量和袋外误分率差分绝对值向量。图4所示为美国支票特征筛选结果。
图4 SCPC支票随机森林迭代模型袋外误分率及差分
根据差分-阈值公式,共有13个变量在引入递归模型中的袋外误分率差分大于阈值,即为支票对应的随机森林特征筛选结果。同理可得其他支付工具的筛选变量(结果见表2、3所列变量)。与当前国内外绝大多数相关研究[6,12,14]主要选择人口信息和支付工具自身特征两大类影响因素不同,随机森林筛出影响消费者持有不同支付工具的因素存在较大差异,且由于SCPC 和CHFS 数据集的差异,中国和美国筛选的因素也显著不同。
3 实证结果
尽管随机森林筛选结果在一定程度上反映出影响消费者持有各支付工具的重要因素,但并不能给出更多有效解释信息。对此,进一步构建Logit模型分析这些因素的影响程度。
3.1 样本不平衡处理及模型评价
对于Logit模型,样本不平衡会影响模型结果的有效性。CHFS中银行卡、电子支付、信用卡和移动支付持有与否的比例分别约为1∶3、1∶9、1∶5和1∶3,SCPC中支票、借记卡、信用卡和预付卡比例分别约为5∶1、4∶1、4∶1和4∶3。因此,除美国预付卡外,需要对其他支付工具进行样本不平衡处理。对比过采样和欠采样两种结果发现,过采样造成的模型正确率显著低于欠采样,同时,考虑到样本数量相对比较充分,最终选取欠采样。Logit模型结果的ROC 曲 线 (Receiver Operating Characteristic Curve)如图5所示。
图5 Logit回归模型的ROC曲线
中国信用卡和美国预付卡相对较差,AUC值均约为0.6,而其他模型的AUC值均在0.8以上。从随机森林筛选情况来看,如果原始数据集中没有包含和目标变量相关的解释变量,那么,随机森林筛选出的变量会使Logit回归模型的分类效果差。这说明,调查所涵盖的变量信息并不能对相关支付工具的持有与否进行良好解释。然而,从模型拟合结果来看,相较于前期Schuh等[6,12,14]对SCPC 数据分析得到拟合值大多约为0.3及以下,本文对美国支票、借记卡和信用卡的拟合值分别达到了0.546、0.430和0.339,说明本文所选变量解释度更高,更为有效。
3.2 模型结果及相对权重值
在回归分析中,评价模型中各变量对因变量的影响通常使用简单相关系数和标准回归系数。然而,由于实际研究中自变量间通常做不到独立不相关,在评价该影响时需要消除变量之间的相关性影响,且无法判断其重要程度,故采用Tonidandel等[22]的方法估计Logit模型中自变量相对权重值,结果如表2、3所示。
表2 中国CHFS 4种支付工具影响因素相对权重值
中国和美国支付工具影响因素及程度结果均较好反映了两国国情和各支付工具的特征,如中国消费者电子支付、移动支付持有主要受到用户对非现金支付的接受程度及网购需求影响;美国信用卡主要受到消费者信用评级的影响;由于中国消费者信用评级相关信息相对缺乏,信用卡持有影响因素则主要反映到年龄信息上;美国预付卡受到网络外部性影响等。5大类因素对消费者支付选择影响程度占比如图6所示。
图6 5大类影响因素解释度累积贡献占比
表3 美国SCPC 4种支付工具影响因素相对权重值
在中国,历史消费支出、支付工具特征、人口信息是主要的影响因素。用户持有银行卡、移动支付解释度最高的因素类型为用户历史消费支出,电子支付为支付工具特征,信用卡为人口信息。银行卡影响因素中,历史消费支出的累积解释度最高,达64.7%,美容支出和娱乐支出是最主要的影响因素;与银行卡类似,历史消费支出对移动支付持有的累积解释度约为62%,但是否网购是最主要的影响因素;由于用户持有电子支付选择影响因素中,非现金支付服务评价的解释度高达63.4%,因而支付工具特征是电子支付持有主要影响因素类型,其次是历史消费支出;信用卡持有影响因素中年龄权重约为65.7%,人口信息特征成为最重要因素类型,其次也是历史消费支出。总体而言,中国CHFS 显示,除了某些个别因素对电子支付、信用卡的影响外,用户历史消费支出是用户是否持有各支付工具最重要影响因素类型,而其中美容、网购、娱乐、通信和网费的支出影响显著。
美国影响消费者支付选择主要的因素为支付工具特征、人口信息和金融情况。支票持有解释度较高的因素为金融情况,累积解释度为47%,支付工具评分、人口信息两类影响因素的解释度分别约占27%和25.7%,学历和家庭总收入是最主要的影响因素;支付工具特征与人口信息对消费者借记卡持有的解释度分别占比37%,消费者工作状态和年龄权重最高,均分别占比超过13%;由于主要受到消费者自身信用评级的影响,金融情况对消费者信用卡持有选择影响权重高达62%,其次是支付工具特征,解释度约为30.7%;相较于其他3种支付工具,由于预付卡使用比例较低,受到双边市场网络外部性的影响,预付卡的接收程度和消费者是否需要硬件接入互联网是影响其持有预付卡的两个最主要因素,权重分别约为11%,因而支付工具特征因素的解释度达到了57%。总体而言,美国信用卡的重要解释因素与能够表明持有人资质、信用、信贷状况等信息的金融情况因素相关性更大,而对于借记卡与预付卡,其重要解释因素与能够代表消费者成本收益的各支付工具便利性、安全性、普遍性、记录性等特征的特征评分相关性更大,其次是代表消费者异质性的年龄、收入等个人人口信息。
3.3 消费者支付工具持有选择的影响因素特点
综合中国和美国消费者支付选择的实证结果可见,代表消费者异质性的人口和金融信息体现了对各支付工具不同程度的影响。此外,尽管中国CHFS数据没有对代表支付工具成本结构的便利性、安全性、获取难易度、支付记录等支付工具各类特征进行调研,但美国SCPC 实证结果显示该类因素对用户支付选择产生了重要影响;美国SCPC 数据没有关于消费者各类消费历史支出类型的详细数据,但中国CHFS数据实证结果也显示了该类因素会影响用户支付选择。下面分别从消费者异质性、支付工具特征和消费支出3个方面分析实证结果的主要特点。
(1)消费者异质性的影响。消费者异质性是指其需求因客户个人偏好、性格、思维方式等的不同而不同,这往往体现于年龄、收入、职业等各方面。结合消费者支付选择影响因素的划分,消费者人口信息和金融情况均可以作为体现消费者异质性的维度。两方面对消费者支付工具选择的影响程度则与支付工具实际需求和特点相关。
与前期研究[3,6-7,9,12]相一致,人口信息特征会显著影响消费者支付工具的持有,而其中代表消费者异质性的年龄、收入、学历和性别是最主要的影响因素。在中国,年龄是影响用户支付持有选择的最主要人口信息,分别对信用卡、银行卡和电子支付产生了较为显著的影响,其次是性别和文化程度等。在美国,学历和收入是影响消费者支票选择的两个最重要影响因素,是否正在求职以及年龄则是消费者持有借记卡的最重要因素。然而,对于信用卡和预付卡而言,年龄和收入等人口信息会影响消费者持有选择,但并不是最重要的。该结果与支付工具实际情况相匹配,由于信用卡的持有需要一定的信用,因而美国实证显示信用评级影响最大,而CHFS调研数据并没有包含该信息。因此,在一定程度上反映用户信用的年龄成为重要的影响因素。该结果显示,在理解消费者不同支付工具选择影响因素时需要结合支付工具特点进行考虑,不同支付用户群体的划分显然需要建立在不同的标准下,应根据支付工具类型和消费者异质性进行深入分析。
(2)支付工具特征的影响。虽然中国CHFS并没有对支付工具便利性、速度等特征进行调研,但中国移动支付和电子支付作为最主要的非现金支付工具类型,代表对非现金支付总体接受程度的非现金支付服务评价对两类支付工具的持有选择影响显著。此外,美国SCPC 结果显示,与前期关于SCPC研究只考虑支付工具自身特征的影响不同,影响某种支付工具持有与否的重要变量,不仅包括该支付工具相关特征,还包括其他支付工具的特征,相互之间的影响关系如图7所示。
图7 美国各种支付工具特征的交叉作用
其中,信用卡、借记卡和预付卡的支付工具特征相互影响明显。从特征类型来看,主要是受到其他支付工具支付记录、便利性、接受程度和安全性的影响:现金、预付卡支付记录性差会提高消费者对信用卡和借记卡的持有;预付卡和汇票的低便利性会提高借记卡的持有;信用卡接受程度的提高会降低借记卡的持有,但借记卡的高接受程度会增加消费者预付卡持有;现金、借记卡的低安全性分别会提高消费者对预付卡、信用卡的持有。此外,由于第三方支付Paypal与借记卡、信用卡和预付卡之间存在竞合关系,使得消费者使用PayPal会增加借记卡和预付卡的持有,同时会降低信用卡的持有。通过该结果可见,用户支付选择受到了支付工具多种特征的影响,且不同支付工具受影响的因素也存在较大差异。与此同时,在讨论某一种支付工具持有与否时,不仅仅要考虑该支付工具本身的特征,还需要考虑其他支付工具特征的影响。
(3)消费支出类型的影响。前期研究发现,在控制人文地理因素的影响后,代表支付工具特征的显性成本的价格和隐性成本的时间、便利性、风险等因素形成的支付工具成本结构会显著影响用户支付选择行为,从而影响用户在不同支付金额范围内(也往往体现为具有不同支付金额范围要求的不同支付场景)偏好使用不同类型支付工具[24]。因此,在支付工具替代方面,大量研究发现,支付场景或金额会显著影响用户支付选择或支付工具间替代[1,4,9,21]。与前期研究相一致,中国CHFS数据中代表支付场景的用户历史消费支出类型对用户支付持有选择产生了显著影响。CHFS数据中23种消费支出类型经过筛选后分为美容支出、网络购物、娱乐支出、教育支出、水电气支出、通信网络支出和网购7大类。其中,与实际情况相符,中国移动支付和电子支付是随着网络购物而出现和发展起来的,所以网络购物是影响消费者移动支付和电子支付的重要因素;作为一种日常消费支出,当前通信费和网费支出往往通过电子支付手段完成,结果也显示,该类支出均会对消费者4种支付选择产生较为显著的影响。较为意外的是,美容支出是影响用户对银行卡、电子支付和移动支付选择的重要因素,分别占比21%、6%和20%的重要性解释度,这可以认为不同于食品、日用品等刚需支出,美容作为非泛用但快速发展的支出类型,在一定程度上会影响消费者对这3种支付的选择。此外,结果还显示,娱乐支出会显著影响用户对银行卡和电子支付的选择,而水电燃料、医疗是用户信用卡持有选择的重要影响因素。
与前期研究对于用户在不同支付金额范围进行不同支付选择的理论假设和实证结果一致[1,4,9,21,24-25],中国实证结果显示,代表支付场景和支付金额差异的支出类型是用户支付选择的重要影响因素。然而,支付工具的多样化发展使得用户消费支出与支付选择的联系变得更为复杂,不仅与支付金额相关,还受到场景支付选择范围限制,以及当前支付作为一种流量入口,支付选择会反过来影响用户消费支出等,这需要对消费支出与用户支付选择之间的作用机制进行进一步探讨和分析。
4 结论
本文构建了一个分析用户支付选择影响因素的研究框架,首先通过随机森林模型筛选影响消费者支付工具选择的因素,然后利用Logit回归分析所筛选因素对用户支付工具选择的影响程度。在该研究框架下,分别对中国家庭金融调查数据(CHFS)和美国波士顿联邦储备银行消费者支付选择数据(SCPC),实证分析了消费者支付选择的影响因素及程度。
尽管受中国和美国实证数据集信息及两国支付工具发展国情差异的影响,两个国家实证结果差异较大,但也得到了与实际情况相一致的结果,较好地反映了两个国家消费者4种支付选择的重要影响因素,并在一定程度上验证了前期相关研究假设和结论。与前期通过经验判断主要选择部分人口信息及支付工具自身特征作为影响因素分析对用户支付工具选择影响的研究及结论相比,本文研究可进一步得到如下几方面结论:
(1)影响用户支付工具持有选择的因素很多,除了年龄、学历等人口信息及支付工具自身特征外,还包括其他支付工具的特征、用户个人及家庭金融情况以及消费支出类型的影响。
(2)对于不同支付工具,由于其实际使用特点差异,影响消费者选择的因素存在较大差异,如在美国,年龄、收入、学历等人口信息是消费者支票、借记卡选择最重要的影响因素;消费者信用是信用卡选择最重要因素;预付卡由于市场使用较少,在双边市场中的网络外部性特征下,市场对其普遍接受程度影响较大。
(3)支付工具之间的替代主要表现为受到支付工具自身及其他支付工具不同特征的影响。美国SCPC数据分析结果显示,现金、预付卡支付记录性差会提高消费者对信用卡和借记卡的持有,信用卡的接受程度提高会降低借记卡的持有等。
(4)消费支出类型会显著影响用户支付选择,如通过中国CHFS数据分析得到,是否网购是影响用户移动支付和电子支付选择的最重要和次要因素,美容、娱乐支出是消费者银行卡选择的两个最重要影响因素等。
(5)对于不同支付工具,消费者支付选择受到的主要影响因素类型存在不同。在美国,支票和信用卡的持有与否最主要受到个人金融信息特征的影响,借记卡的持有选择主要受到人口信息特征和支付工具特征影响;在中国,银行卡和移动支付主要受到消费支出的影响,而对非现金支付接受程度是消费者电子支付选择最主要的影响因素,信用卡则主要受到年龄的影响。根据该研究结果可见,影响用户支付工具选择因素很多,学术研究或业界支付工具推广应结合不同支付工具和消费者异质性特征考虑其重要的影响因素。
本文研究从方法到结论,均是对当前用户支付工具选择研究的拓展。此外,本文的贡献在于相较通过经验判断选择影响因素,基于机器学习模型对特征筛选的结果既保证了模型的有效性,还发现了在前期研究未纳入到模型进行分析的重要因素。该研究不论是对研究支付工具的机构与学者,还是对推广支付工具的机构以及政府制定相关政策均具有一定的借鉴意义。但与此同时,研究也存在不足,主要表现为如下两个方面:首先,对于变量筛选和分类模型,仅使用随机森林和Logit模型对结果进行验证存在一定的不足,因此,采用更多的特征筛选和分类模型进行验证会使结果更严谨。其次,国内外支付工具市场发展显示,中国与欧美支付工具市场存在显著的差异。尽管本文使用了中国家庭金融调查数据进行实证分析,但从美国SCPC结果来看,该数据缺失了如支付工具特征、用户信用等重要信息,且对于支付工具的划分并不严谨,这无疑会在一定程度上影响分析结果。因此,如何对中国市场进行较为全面的调研,并实证分析中国支付市场消费者选择影响因素是本文未来研究的主要方向。