APP下载

基于蚂蚁花呗对大学生逾期还款现状及影响因素的分析

2022-08-29王晓玲赵娇娇李校瑞胡贝贝王志娟

关键词:生活费变量问卷

王晓玲,赵娇娇,李校瑞,胡贝贝,王志娟

(山西大同大学数学与统计学院,山西大同 037009)

依托大型电商平台建立的在线消费金融服务平台不仅具有强大的资本实力,而且具有完备的合法手续,大学生一旦逾期就会产生信用风险。因此,这种普遍和长期的“先消费,后付款”的消费方式所产生的逾期风险,是极为关注的问题。

调查显示,在众多的网络信贷平台中,八成以上的学生使用了蚂蚁花呗和京东白条[1],其中蚂蚁花呗又是大多数学生的首选。所以选择蚂蚁花呗作为在线消费金融服务产品的代表,选取全国范围内的在校大学生为研究对象是极有意义的。将通过问卷调查,了解在校大学生使用蚂蚁花呗逾期还款的现状,并建立二元logistic 回归模型,研究大学生使用花呗发生逾期还款的影响因素,最后针对逾期问题提出相应的对策。

1 文献综述

随着大学生使用花呗购物频率的提高,大学生的消费习惯也在不知不觉中发生了改变,大学生对花呗逾期违约的认知仅停留在产生违约金和手续费上,但对具体的利率水平却很少了解,甚至有些大学生发生了违约行为却仍然不知其具体利率[1]。“蚂蚁花呗”作为新兴互联网便捷信用卡,在引领大学生使用其进行消费的同时,已成为大学生消费支付的重要手段,许多大学生只了解逾期还款会影响芝麻信用但并不了解其对个人征信的影响。因此,使用“蚂蚁花呗”的逾期后果值得大家重视[2]。

根据性别、年级、学校背景、专业分别对大学生使用花呗的购物导向差异做了分析,并据此分析了花呗对大学生的积极影响以及消极影响[3]。其中,积极影响有:解决短期资金需求、积累自身资源价值、提高理财分配意识;消极影响有:较高的逾期费用给自身或家庭带来经济压力、违约历史使个人征信评分降低等。在使用蚂蚁花呗过程中存在不同程度的信用风险问题,因此在还款能力、还款意愿、套现行为、逾期还款等方面对大学生使用花呗存在的信用风险做了分析,并为大学生自身做好贷款规划提出了建议[4]。文献[5]着重分析了大学生使用蚂蚁花呗的原因,通过建立过度花销和花呗逾期的模型,得出过度花销和花呗逾期之间存在相关关系,最后为引领大学生树立正确的消费观提出了建议。从大学生使用蚂蚁花呗的比例,使用的平均额度和每月使用额度等方面对大学生使用花呗进行了分析,发现大学生使用花呗存在消费态度超前、非理性消费、逾期影响征信、个人信息泄露等问题[6]。

上述文献都对大学生逾期还款行为做了分析,目前针对逾期还款行为的研究多集中于现状及相关理论的分析,而这些结论往往带有研究者较多的主观判断,并不能具体详尽地分析大学生逾期还款的影响因素。因此,本文立足于理论分析,采用文献分析和问卷调查的方法,结合当前大学生逾期还款行为的社会背景,了解逾期现状;采用描述性统计分析方法和二元Logistic 回归分析方法,明确大学生使用花呗逾期还款行为的影响因素,进而识别出逾期还款的大学生所具有的显著特征。

2 问卷质量控制与数据处理

在正式调查之前,先选取小范围样本进行预调查,以发现问卷设计中不合理的地方,并在正式调查中予以纠正。预调查实施阶段,采取滚雪球的方式利用QQ、微信等平台转发问卷,共收集问卷112 份,剔除31 份未使用过花呗的问卷,共收集有效问卷81份。正式调查共发放问卷1144份,回收有效问卷817份,有效回收率为71.42%。

对于问卷质量的控制。由于本调查是利用问卷星、微信等网络平台面向广大的高校学生发放问卷,调查者没有机会接触受访者,因此问卷设置了基础信息题目来筛选出符合条件的调查对象。针对问卷中是否使用蚂蚁花呗的问题,设置专项题目,将不使用蚂蚁花呗的同学筛出,回收到的此类问卷不符合本次研究目的,直接删除。为保证问卷质量,防止恶意填写问卷的情况发生,我们利用问卷星平台做了同一个ID 号只能填写一次问卷的设置,同一个ID 第二次提交问卷将被拒绝。

对于数据处理。由于采用了电子问卷调查的方式,避免了被调查者漏答的问题,因此整个问卷不存在缺失及问卷填写不完整的情况。问卷数据直接从问卷星平台导出,无需人工录入,避免了出错的可能,也缩短了项目执行周期。问卷中的第三个问题“您所在的城市”的数据为字符型数据。我们将所收集问卷中的城市根据第一财经《2020 年城市商业魅力排行榜》划分标准进行编码。其中,将一线城市与新一线城市编码为“1”,将二线城市编码为“2”,将三线城市编码为“3”,将四线城市编码为“4”。

3 描述性统计分析

在使用蚂蚁花呗的大学生中,男性为285 人,占样本总量的34.9%,女性为532 人,占样本总量的65.1%,男女比例接近1∶2。大二、大三和大四学生占全部学生群体的比例高达84%,群体分布呈橄榄球式。随着在校时间的增长,这几个年级的学生在兴趣、爱好等方面的投入不断增加,且有更多的社交活动,故开通蚂蚁花呗的学生较多。身处一线、新一线城市的学生最多,占比41%。相比二、三线城市,一线、新一线城市的经济较为发达,身处其中的大学生对理财产品、金融产品的接触更多,对未知风险的承受能力也更强。

选择使用花呗的原因(如图1)中,“消费的时候提供优惠(红包)等”所占的比例最大,“花呗使用范围广泛且知名度高”在选择使用花呗的原因中占次要地位,可以看出蚂蚁花呗的受众度高,大学生对花呗还是比较信赖的。而“受到周围同学、朋友的影响”占比并不是很高,说明大家使用花呗受同伴效应的影响是较少的,对于消费信贷产品的选择有自己的主观认知。

图1 选择使用花呗原因的条形图

根据评级机构公布的数据显示,蚂蚁花呗的逾期率为2.54%,不良率为0.41%,[7]逾期状况直接反映了大学生群体的信誉风险情况。调查显示,大学生群体中逾期的情况并不占主体地位,71.8%的大学生都能够按时还款,但曾出现过逾期情况的大学生也达到28.2%,这说明在大学生群体中逾期的情况虽不占主体地位,但仍不容忽视。

生活费来源直接影响着大学生的还款能力,是他们能够按时还款的重要保障。大学生虽然没有真正迈入社会,但他们的经济来源不止一种,丰富的经济来源可以提高偿还贷款的可能性。图2 的大学生生活费来源可以看出,88%来自父母提供,48%来自奖助学金,41%来自打工兼职,其他仅占5%,虽然在大学生生活费来源中奖助学金与兼职打工也占一定的比例,但由于兼职与学业的时间冲突、社会经验不足等因素,可以看出大学生的经济来源主要依赖父母,几乎无固定收入,还款能力无保障。由图3 可以看出,父母提供的生活费大部分是1 000~2 000 元,这笔费用基本能满足大学生的日常开支,一旦发生逾期还款行为,自己解决的能力几乎为零,这就成为引发信用风险的导火索。虽然大部分同学都能够按时还款,但逾期是在各种因素的推动下发生的,逾期的后果大学生几乎承担不起,所以逾期现象仍不容忽视。

图2 大学生生活费来源柱状图

图3 大学生父母提供生活费柱形图

风险认知是个体在多种因素的影响下对外界环境可能发生的各种客观风险的主观感受与认知[8]。由图4 大学生对使用花呗的风险认知中可以看出,大学生都有一定的风险认知能力,整体态势是良好的。其中绝大部分学生都知道使用花呗逾期还款会产生恶性循环、个人信用损失、产生利息以及心理压力等各种不良后果,由此可以看出大部分学生对花呗逾期产生的后果是有一定认知的,这也使得问卷调查中受访者发生过逾期还款行为的占比不是很多。

图4 风险认知条形图

4 逾期还款的二元logistic回归分析

4.1 Logistic模型理论

Logistic模型主要用于分析个体所面临的二分抉择行为,该抉择行为依赖于个体所具有的一组特征。因此,模型旨在寻求个体的特征与该个体做出特定抉择的概率之间的关系。

设Y代表某种行为是否发生的二值变量,Xi=(Xi1,Xi2,...,Xik)′为其影响因素,则可建立如下多元线性回归模型:

其中,Yi是观测值为1 和0 的被解释变量;Xij为解释变量;βj为待估参数;εi为随机误差。由于被解释变量不满足经典的计量经济学模型所要求的连续变量假设,所以模型的随机误差项具有异方差性,而且模型左右两端变量的取值范围存在矛盾。这两方面的问题导致经典的参数估计方法无效。为了使二元抉择问题的研究成为可能,通过建立随机效用模型将其转化为可研究的二元抉择模型[9-10]:

其中,F(·)表示逻辑分布的累计分布函数,即

则模型(3)即为二元Logistic 模型。利用极大似然估计法估计模型中的参数。

由(3)和(4)可得:

4.2 变量定义

将第i个个体“是否逾期还款”这种二元选择行为表示为因变量Yi,当选择“是”时,Yi的取值为1,当选择“否”时,Yi的取值为0。

接着,考虑自变量的设置。在选取的自变量中有二分类变量即是否题,也有多分类变量,即选项有两个以上。将多分类变量转换成哑变量,指定每一个维度的最后一个变量的分类作为参照。指定年级“研究生”、所在城市“四线城市”为参照组,将年级中的大一、大二、大三、大四以及城市分类中的一线新一线城市、二线城市、三线城市设置为虚拟变量。

在选取的自变量中,多分类变量有每个月做支出计划的频率和每个月由父母提供的生活费,可以假设它们对因变量的数值影响程度是均匀的,每个月做支出计划的频率分为三档,直接赋值为1、2、3;每个月由父母提供的生活费分为五档,直接赋值为1、2、3、4、5。最终选取了12 个自变量构建模型。自变量的具体定义见表1。

表1 变量定义

4.3 模型结果分析

模型的回归结果如表2 中模型1 所示。性别、城市分类和每个月做支出计划的频率三个变量的显著性值均小于0.05,可以预知性别、城市分类和每个月做支出计划的频率这三个变量是解释大学生使用花呗逾期行为的重要影响变量。模型虽然拟合情况较好,但模型中个别变量极为不显著。因此,需要重新筛选变量,再次进行Logistic回归。

最终回归结果如表2 模型2 所示,模型的Cox and snell R2值为0.054,意味着自变量可以解释是否逾期5.4%的原因。Homer and Lemeshow 检验的零假设是模型真实情况和预测情况比较吻合,没有较大出入。由表2 可知,其对应的P值为0.105,所以接受零假设,说明该模型的预测与真实情况没有出入。X1、X6、X8和X9四个变量的P值均小于0.05,说明被调查者中性别、一线新一线城市、三线城市、做支出计划的大学生与是否逾期还款有显著关联。设样本逾期还款的概率为p,由此得出Logistic 回归模型为:

表2 模型结果

模型的最终回归结果中,在5%的显著性水平上,性别通过了显著性检验,系数为0.637,说明在其他条件不变的情况下,大学生使用花呗逾期还款这一行为存在性别差异。从几率比看,可以看出男生逾期还款的概率是女生的1.891 倍,即男生更容易出现花呗还款逾期的行为。

对于城市等级,一线、新一线城市与三线城市的系数为0.543 和0.682,都通过了5%的显著性检验,说明不同的城市对大学生使用花呗是否逾期还款的结果有影响。从几率比来看,一线、新一线城市的大学生逾期还款的概率是四线城市大学生的1.722 倍,一线、新一线城市的大学生更容易逾期还款;三线城市的大学生逾期还款的概率是四线城市大学生的1.977倍,三线城市的大学生也容易逾期还款。综上,一线、新一线城市和三线城市的大学生更容易发生逾期还款。

对于每个月对自己的生活费做出支出计划的频率来说,支出计划的回归系数为-0.436,且通过了显著性检验。可以说明大学生每月做支出计划的频率影响大学生使用花呗是否逾期还款的结果。并由几率比可以看出,每个月“总是会”为自己生活费做支出计划的大学生的概率是“完全不会”做支出计划的大学生的0.647 倍,所以“完全不会”做支出计划的大学生更容易发生逾期还款。

5 结论

5.1 蚂蚁花呗的市场认可度较高,营销策略起主要作用

通过对收集问卷的数据分析,我们获知有62%的大学生都在使用蚂蚁花呗,说明蚂蚁花呗的大学生用户比较多。相当多的一部分大学生选择开通花呗的原因在于“花呗使用范围广泛且知名度高”,可以看出花呗的市场认可度是较高的。另外,问卷调查的结果显示,部分受访者开通花呗的原因在于消费的时候提供优惠(红包)等,并且从花呗营销的量表结果中可以看出大部分人都能注意到花呗的营销优惠从而使用花呗,所以蚂蚁花呗的市场认知率较高,营销策略起主要作用。

5.2 逾期的情况虽不占主体地位,但仍不容忽视

通过调查发现,大部分大学生能够按期还款,原因在于这些大学生的消费观受父母影响、风险认知能力较强、属于有时可以拒绝诱惑,有时乱花钱型人群。但逾期还款的大学生占比约达到28%,大学生逾期还款情况仍不容忽视。大部分大学生的经济来源主要依赖于父母,一旦发生逾期还款行为,自身的偿还能力为零,这就会成为引发信用风险的导火索。

5.3 易逾期人群特征明确

从二元Logistic 回归模型的结果可知,性别、城市等级、做支出计划的频率可以界定易逾期还款人群。男性、在一线、新一线城市和不做支出计划的大学生是容易逾期的人群。

猜你喜欢

生活费变量问卷
发愁
聚焦双变量“存在性或任意性”问题
@大学生每月需要多少生活费?
实话
问卷大调查
分离变量法:常见的通性通法
问卷你做主
不可忽视变量的离散与连续
变中抓“不变量”等7则