卷烟零售户线上“烟商贷”模式的应用与优化
2021-11-09黄培芳蓝小明刘常胜
黄培芳 蓝小明 刘常胜
(中国烟草总公司福建省公司,福建 福州 350013)
1 概述
2020年初,为响应中国烟草总公司关于支持疫后卷烟零售商户复工复产的要求,帮助部分资金有困难的零售客户解决资金周转上的难题,贯彻落实福建烟草商业系统“1234”发展思路和高质量新发展要求,保障卷烟零售商户卷烟货款资金流的充足与稳定,福建烟草协调各合作银行为全省卷烟零售商户提供线上“烟商贷”金融服务,通过在福建烟草公司电脑与手机版卷烟订货系统开发零售商户烟商贷的申请与授权服务入口,为银行提供福建烟草零售商户统一身份验证服务,实现互联网渠道办理全流程自助信用“一键办理贷款”业务,构建起福建烟草卷烟销售的资金闭环。通过搭建福建烟草公司与合作银行的数据通道,在实现“一键办理贷款”的同时,为银行提供零售商户授信后的基本信息,打破了原有的依靠微信或支付宝支付、数据获取难的局面,使合作银行拥有一批稳定且优质的烟商客户。通过烟草搭台,生态合作伙伴唱戏,采用“平台+银行+零售客户”模式,实现烟草零售客户贷款的线上撮合交易,解决零售客户贷款难的问题;打通烟草公司与银行间的信息壁垒,深化跨机构间的业务协同,实现“贷款一网通办、信用一点即查”;以”互联网+”思维为指导,技术与数据赋能,构建一站式烟草零售客户贷款服务体系,创新服务模式,满足了银行放贷的征信需求,令商烟体系内的数据服务社会,产生了良好的社会效益。
2 应用实现
2.1 应用设计
卷烟订货商务平台设置“卷烟快贷”提示模块,有贷款意向的零售商可通过点击按钮,链接进入产品介绍及授权数据推送界面;产品介绍界面向意向客户呈现“卷烟快贷”产品概况,页面底部设置“立即申请”及“不感兴趣”按钮,同时提示客户:如点击“立即申请”,即表示授权福建烟草公司可按照借款人审贷意愿,向建设银行推送贷款申请所需的相关数据;在获得客户授权后,福建烟草公司通过物理专线将如下数据推送至银行:申请贷款对应的烟草专卖零售许可证下,商户在工商实际注册的企业/个体工商户名称及统一社会信用代码(如有)、该零售商户自申请日向前追溯 12 个月的订烟金额(总额或明细)、该零售商户在申请烟草专卖零售许可证时,登记的持证人姓名及身份证、该零售商户最近一次在烟草公司的客户评定等级。银行根据上述数据,为客户计算出相应额度并于申贷页面展示。
图1 “烟商贷”业务流程
2.2 应用效益
项目建成后,率先在农业银行投入使用,并于2020年11月份进行投产验证,12月9日起在全省烟草商业系统进行推广,上线7小时内预授信金额破亿元,仅3天便为3307户卷烟零售客户预授信8.29亿元,其中签约2210户、签约金额达5.6亿元,落地使用1.06亿元。截止目前,全省共有15141个零售客户得到线上授信,授信总额达到27亿余元,额度使用率已达到42.91%,为新冠疫情后资金周转困难的卷烟零售客户提供了资金保障,有效地为其创造了经济价值。同时,多家合作银行的参与,使零售户贷款利率降幅达到31%左右(原经营贷年利率为5.6%左右,现“烟商贷”线上模式贷款年利率为3.85%),全省通过“烟商贷”线上模式贷款的零售客户每年可节约利息费用共计约472.5万元,大大减少了零售客户的经营成本,最大程度地为福建烟草卷烟零售客户创造了经济效益。目前已有农业银行、建设银行、兴业银行等共计5家银行进行“烟商贷”上线试投产。“烟商贷”线上模式充分响应了国家烟草专卖局(总公司)在畅通卷烟零售客户订烟线上贷款渠道方面的号召,进一步增强了烟草企业与各大银行之间的合作,提高了烟草企业的社会影响力。
3 优化设计思路
3.1 改进原因
线上“烟商贷”在当前已投入使用的模式设计上,还存在着一定的不足。首先,在贷款安全方面尚未增加安全保证措施,零售客户的资金偿还能力无法预测,增加了一定的风险;其次,该项目采用了将授信后的零售客户信息直接推送至银行端进行处理的方式,增加了数据泄露的风险,从安全的角度考虑,不是最优的解决方式。因此,本文对如何优化整个“烟商贷”模式进行了研究。
3.2 总体思路
本文从两种角度出发,进一步提出优化解决方案:一是诚信分测算。根据国家局卷烟零售客户数据安全使用的保密要求,优化过程是在贷款发放之前,改变原来直接把零售客户基础数据推送到银行端的模式,通过诚信分模型计算零售客户的诚信分,再将诚信分推送给银行作为授信额度的参考依据,增加了数据使用的安全性。二是用户画像。在零售客户首次贷款之后,结合其经营数据和贷款情况,利用用户画像分析出该用户的贷款相关情况,给银行和烟草公司提供一定的参考依据,银行可以依据该情况做出贷款额度的调整,烟草公司可以依据该情况判定是否增加走访频率,对经营情况异常的客户给予及时的关注和帮助。
图2 优化后的流程图
3.3 模型建设
首先利用系统积累的海量历史数据(客户的订单数据,卷烟的相关属性数据、客户的自然属性、消费者VIP、客户违规违法、市场检查、扫码数据等),基于开源的分布式大数据采集、计算、存储技术Hive+Sqoop+Spark+MySQL,进行数据采集抽取,在此基础上进行数据清洗检查和转换(去除错误或不一致的数据),依次形成基础层,整合层、汇总层。其次对各类指标数据进行归一化数据预处理,利用相关性算法、聚类算法对诚信样本数据、非诚信样本数据,实现特征提取及数据分析,并通过对准确性、直观性的客户标签数据萃取,构建影响因素关系模型,找出影响客户诚信的强相关影响因素,建立分级分类的高精度客户诚信价值评估体系,最后生成目标客户诚信评分。
3.3.1 指标筛选
在卷烟销售环节共有年度订货金额、客户档级、月销售波动率、销售条均价等横向和纵向各种维度的指标。这些指标对诚信评分的影响程度各不一样,为让诚信评分科学合理,我们需要在众多的指标中选择一些核心的、相关性较强的指标来作为诚信评分的核心影响要素,作为诚信分计算的重要参数。在与卷烟零售客户有关的众多指标中,为选择有效的计算指标,我们首先进行数据预处理,并采取相应的相关系数矩阵进行指标相关性分析,并通过指标筛选模型进行定量分析,筛选出五个关键指标。
3.3.1.1 数据预处理
为了便于将来自不同维度的指标数据进行统一计算,首先要对各维度指标的数据进行预处理。针对所选取的年度订货金额、客户档级、月销售波动率、销售条均价等特征数据,剔除数据中的一些缺省值和离群值,再将所选取的数据进行标准化(选取的方法为z-score标准化),整理得到的部分基础样本数据的结果见表1。
表1 数据预处理
对上述数据进行预处理后,不同维度的指标数据被归一到同一个维度,在接下来的诚信分计算模型中可以有效消除比重不平衡的问题。
3.3.1.2 指标相关性分析
根据不同来源数据,利用统计检验方法测试各项数据与客户总贷款数之间是否具有相关性,排除掉显著的非相关项,保留显著项。使用R语言构建相关系数举证,对各个维度的特征做相关系数的计算。将客户依赖的年度订货金额,档级,条均价,订单结算率,专卖诚信分,月均存销比,年度销售额几个重要指标作为自变量,而将授信额度作为因变量进行相关性分析,构建的相关系数矩阵如下:
表2 相关系数矩阵分析结果
从上述分析可以看出,月均存销比与授信额度的相关系数极低,建议剔除,与授信额度存在强相关性的指标有档级、条均价、订单结算率、专卖诚信分;年度订货金额、年度销售额的相关性一般。
3.3.1.3 指标筛选模型
为了能从众多维度中挑选出更合理的维度,我们采用IV值①(Information Value,信息量)来判断。而IV值的计算依赖于WOE②(Weight of Evidence,证据权重),所以需要先计算各个候选维度的WOE值。WOE计算公式如下:
其中,Pyi为i分组中受影响零售户占所有样本中受影响的零售户的比例;Pni为i分组中未受影响的零售户占所有样本中未受影响的零售户的比例;yi为i组中受影响的零售户数量;yT为样本中受影响的零售户数量;ni为i组中未受影响的零售户数量;nT为样本中未受影响的零售户数量。
从公式中可以看到,WOE值越大,这个分组中样本影响的可能性就越大;WOE值越小,这个分组汇总样本影响的可能性就越小。
然后根据标准化后的变量数值选出零售户相关的候选维度,并计算对应的WOE值,详见表3。
表3 WOE值计算结果
根据WOE来计算IV值,公示如下:
得到结果,如表4所示。
表4 IV值测算表
从表4可见,年度订货金额、档级、条均价、订单结算率、专卖诚信分这5个维度变化对整个样本的影响较大。结合相关系数矩阵可知,年度订货金额、档级、条均价、订单结算率、专卖诚信分这五个指标对诚信分影响较大,因此我们选择这5个指标作为衡量零售客户诚信的关键指标。
3.3.2 诚信分计算
其中,n为指标的总数量;ai为指标i对应的权重系数;socrei为指标i对应的分值。根据分析,诚信分各参数值详见表5。
表5 诚信分计算参数
表6 各指标score值取值方式
表7 权重系数
经过数据预处理、标准化以及指标筛选和诚信分模型建立之后,计算出每个授权的零售客户诚信分,将该分数推送至银行端,作为银行确定零售客户授信额度的重要依据。该优化过程改变了原有将零售客户数据直接推送至银行端的做法,能够有效确保零售客户经营数据不泄露,行业重要数据不外流,保障数据安全。
3.4 基于用户画像建立风控模型
基于用户画像,对零售客户的真实经营情况进行精准分析,能够有效降低零售客户向银行贷款的风险。为此,本文对建立风控模型进行了研究,通过对零售客户的真实经营情况进行精准分析,不仅可以为烟草行业预测客户异常经营行为带来参考信号,还能大幅降低银行贷款风险。
3.4.1 使用深度学习模型构建用户动态画像
深度学习遵循的模型思路与机器学习中的有监督学习思路基本一致,均是通过历史数据来预测新数据行为,但深度学习具有两个方面的显著优势,一是比经典机器学习模型预测研判更加精准,二是能适应数据动态变化。由于深度学习模型数学可解释性不强,因此主要借助经典模型,例如CNN、RNN、卷积神经网络、反馈网络等经验网络模型算法。使用的语言框架目前最主流的主要有Caffe、Tensorflow、Torch、PyTorch、PaddlePaddle等。通过深度学习模型算法构建动态用户画像时,根据实际动态数据值,选定框架模型搭建适应烟商贷动态监控需求的网络结构,执行编译过程。将数据分组后,确定好训练次数和交叉验证方式,然后导入数据进行训练过程。完成模型训练后,根据用户新的信息数据,调整预测用户贷款风险和经营状态,根据模型实时预测情况提供预警、调查、叫停和协调银行解决等响应措施,构建动态用户画像监督体系。通过动态监控零售客户经营状态,不仅可以提升烟商贷零售客户整体信誉水平,同时还能有效预测风险,降低贷款风险。
4 结论
本文在原有“烟信通”基础上,创新服务模式,深挖数据价值,运用先进的科技手段,将金融服务深度嵌入卷烟零售商户的日常经营中,进一步打通了全省烟草商业卷烟销售线上工作链条,给烟草行业、零售客户以及银行带来了巨大的效益。从烟草行业角度来看,该项目是烟草行业打破传统、主动适应数字化转型和时代发展需要和行业数字化转型、企业开源挖潜的一项重要创新举措,能为零售客户有效解决资金难、利息高、贷款难、放款慢等问题,在提升效率的基础上,利用企业优势为全省零售客户节约经营成本、创造价值,更好地践行了“以人为本”的经营理念。从零售客户角度来看,该项目极大帮助了一些资金周转困难的零售客户解决卷烟经营上的难题,不仅提高了贷款效率、用款速度,减少了贷款流程,还大大节约了贷款成本。从银行角度来看,烟草行业利率的大幅度降低,不仅没有给其造成损失,反而为其增加了一批从事卷烟经营的优质客户。综上,卷烟零售户线上“烟商贷”模式的应用与优化研究,能够为行业及零售客户以及第三方都带来巨大收益。
注释:
①IV(Infromation Value),信息价值,用来表示特征对目标预测的贡献程度,即特征的预测能力,一般来说,IV值越高,该特征的预测能力越强,信息贡献程度越高。
②WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种编码形式。