大数据在我国征信、支付领域中的应用
2018-11-26吴飞虹
吴飞虹
【摘要】本文从思考大数据在征信、支付领域所具备的特征要点出发,阐述了大数据技术在征信和支付结算领域的现实应用,并针对大数据技术在征信和支付领域所面临的挑战,提出相应的完善路径和对策建议,以促进大数据在征信、支付结算领域的健康发展,提升行业服务竞争力。
【关键词】大数据;征信;支付结算
【中图分类号】F83
近年来,伴随移动互联网的飞速发展,网络应用的日益深化,以大数据、云计算、人工智能和区块链等为代表的信息技术革命,正在为人类各领域带来史无前例的全新体验。在这个大背景下,从公司战略到产业升级,从生产实践到生活方式,从运营管理到国家治理,都将发生本质的变化。数据信息正成为推动经济增长和社会进步的重要资源,就支付和征信领域而言,大数据技术与传统征信和支付的深入融合与实践应用,将进一步完善大数据生态系统,驱动征信支付行业实现整体跨越式发展,为个人、企业和社会创造更多优质增值的行业价值和社会价值。本文从思考大数据在征信、支付领域所具备的特征要点出发,阐述了大数据技术在征信和支付领域的实际应用,并针对大数据技术在征信和支付领域所面临的挑战,提出相应的完善路径和对策建议,以促进大数据在征信、支付结算领域的健康发展,提升行业服务竞争力。
一、大数据在征信、支付领域所具备的特征
自从大数据概念兴起,数据体量就逐年攀升。根据 IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8 ZB,而这个数值还在以每两年翻一番的速度增长,预计到2020年,全球将总共拥有35 ZB的数据量,比2011年增长了近20倍。换句话说,近两年产生的数据总量相当于人类有史以来所有数据量的总和。硕大的数据资产规模与日新月异的信息技术相结合,释放出极具价值的信用数据和支付技术,驱动征信体系的不断完善和支付水平的持续提高。可以说,无论是在数据结构、服务人群及应用场景等外部表象特征上,还是在信用理念、风险评估及技术方法等动态管理特征方面,大数据在征信、支付领域的应用都有效突破了传统征信、支付的瓶颈,实现了跨越式的创新提升,具有截然不同的模式特征:
(一)数据结构的多元化
传统征信、支付数据主要是依附于金融服务机构媒介,从事金融交易活动时所产生的结构化数据。包括客户身份信息、资产负债情况及资金收付等大量历史交易信息,这些数据对客户信用分析判断和风险识别计量等方面具有宝贵的价值。而大数据征信、支付不仅以结构化数据为主,还集合海量非结构化数据,包括视频、音频、图像、文本、地理定位等全方位信息。通过深挖、分析客户支付交易和消费信息等数据,准确把握客户支付习惯和社交行为,全面多角度地反映客户的消费能力和信用状况,起到有效甄别客户和防范风险的作用。
(二)服务人群的广泛化
传统征信主要服务于在央行征信系统、金融机构中持有信用记录的人群,多为政府机关、事业单位及固定职业者等为代表的收入人群。大数据征信则是通过大数据技术捕获传统信用风险评估体系无法覆盖的全部人群,包括自由职业者、小微企业主及农民工等为代表的收入人群。针对授信主体因信贷记录缺失而无法正常获取贷款或者被迫接受高定价的信贷服务困境,大数据征信旨在利用大数据技术重塑信贷发放审核路径,完善传统征信在理念、技术和方法上的不足,提升征信体系的整体覆盖率,降低信贷资金成本。与此相应,传统支付结算主要依赖于商家各自使用的支付渠道,包括微信、支付宝、银联、京东支付、ApplePay等各类支付方式。不同的支付手段仅服务于特定的用户群体,为了吸引客户、满足用户的支付需求,商家不得不开通尽可能多的支付渠道,由此消耗大量的人力、财力和时间。大数据支付则是将众多的支付渠道集成在一个SDK中,运用聚合支付技术,将各类碎片化的支付方式整合成一种支付手段,讓商家一次对接全部支付手段,充分满足不同类型客户的各类支付方式需求。故而,大数据征信、支付覆盖了传统金融服务的盲区,有利于提升资源配置效率,促进普惠金融发展。
(三)应用场景的丰富化
支付和信用是整个金融体系当中最不可或缺、密不可分的两个环节。因为所有的金融交易都有支付,而所有的支付对象与支付目标都有信用评估。所以,如果将支付和征信两个环节的数据源有机结合在一起,就能构建出完整的客户画像和全面的信用评估,拓展出丰富的应用场景。因此,大数据征信和支付结算的应用范围已不单纯局限于银行等传统金融活动,而是以民生服务为出发点,实现跨行业的资源整合和聚合效应。应用场景从经济领域扩展到公众日常生活的诸多领域,涵盖零售、餐饮、住宿、公交等方方面面,包括酒店预订、求职婚恋、租房售车、保险签证等各类信用履约支付生活场景。可以说,丰富的交易场景、便捷的支付流程和人性化的客户体验,推动大数据征信、支付规模化的应用,拓宽应用范围的广度和深度,在市场营销支持、反欺诈、风险监测和账款催收等方面都具有良好的表现,充分满足大众日常生活的需求,这也是技术红利所创造的社会福祉。
(四)信用理念的延展化
传统的征信、支付结算倾向于收集能够反映消费者还款能力的相关数据,比如收入水平、资产信息、负债情况等信息,通过对消费者信贷记录数据的挖掘,以此判断消费者信用状况和还款能力。而大数据征信、支付在传统信用理念的基础上进行了外拓和延展,赋予支付信用经济更广、更新的内涵,即“一切数据皆信用”。它不仅关注反映消费者还款能力的强相关数据,还通过各类弱相关数据的采集和加工,如消费者的消费偏好、性格特征、社交行为、兴趣爱好、支付习惯等信息数据,以此挖掘消费者的潜在信用状况和真实还款意愿。这些非常规数据本真是客观世界的如实反映,是消费者真实社会生活的网络映射。只有考虑消费者这些借款行为背后的线索及线索间的关联性,才能提供深度有效的数据分析,如实反映出消费者的还款能力与意愿,降低支付欺诈率和信贷违约率。
(五)风险评估的全面化
在互联互通信息时代,大数据征信、支付结算的信息来源更为多样和广泛,这些多维度的数据在一定程度上可以反映消费主体的行为习惯、消费偏好以及社会关系等,有利于全面评估消费主体的信用风险。以大数据为基础的新型信用评估模型也摒弃了传统评估模式对历史支付、信贷数据的深度挖掘,更侧重于消费主体实时、动态、交互的信息,以消费主体行为轨迹研究为基础,寻找现有数据间的关联性,以此精准预测其消费意愿、消费能力和消费稳定性,对消费主体的信用状况做出全面准确评估。此外,大数据风险评估模型在传统综合建模的基础上引入机器学习算法技术,生成数以万计的风险变量,再利用身份证模型、预付能力模型、欺诈模型、还款能力模型、还款意愿模型、稳定性模型等不同的预测模型进行分析,从多个评估维度对消费主体的信用支付能力进行评价,评估结果更加全面精准。
(六)技术方法的多样化
大数据征信、支付并没有颠覆传统支付征信的基本职能,而是更加注重大数据技术的创新应用。通过技术手段的持续升级和数据处理能力的不断提升,充分挖掘和分析现有数据资源的广度和深度,研发出高技术含量的产品和服务,满足社会多层次、全方位、专业化的征信、支付需求。具体而言,在数据采集环节,利用网络爬虫、数据全映像等收集技术,抓取获得各种类型的结构化、半结构化和非结构化的海量数据;在数据存储环节,利用分布式文件系统、异构数据的数据融合技术等,将采集到的混杂数据进行存储和调用;在数据分析环节,利用机器学习方法、统计方法、神经网络方法和数据库等方法,从大量、不完全、有噪声和随机的数据中挖掘探索变量之间的相互联系;在数据建模环节,利用决策树、逻辑回归、随机森林、关联规则和聚类技术等多种方法,将线上、线下的数据相融合,勾画出精准的信用评估全景图。
二、大数据技术在我国征信、支付领域的应用情况
随着互联网、云计算的迅速发展,大数据技术得到了日益广泛的应用,这对我国的征信和支付行业都产生了深刻的影响。通过对海量、多样化的数据进行价值挖掘和技术萃取,全方位和多维度地为消费主体“信用画像”,提高了信用评价的全面性和实时性,提升了支付结算的资源配置效率,强化风险管控能力,有效促进了征信、支付行业的创新发展。
(一)大数据技术在征信领域的应用
对于征信行业而言,数据处理和产品形成是征信系统运转的核心。大数据技术的进步不断推动征信数据的可得性,推动传统信用评分模型的升级转变,实现征信数据和征信模型质的飞跃,促使征信行业从最初的定性分析迈入全面量化分析阶段,形成了丰富多样的信用产品和应用场景,重构了社会征信体系。
1.反映电商信用行为的芝麻信用
芝麻信用,是蚂蚁金服旗下独立的第三方征信机构,通过云计算、机器学习等技术客观呈现个人的信用状况,已经在信用卡、消费金融、融资租赁、酒店、租房、出行、婚恋、分类信息、学生服务、公共事业服务等上百个场景为用户、商户提供信用服务。征信数据主要基于阿里巴巴的电商交易数据和蚂蚁金服的互联网金融数据,并与公安网等公共机构以及合作伙伴建立数据合作,数据涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等。芝麻信用以芝麻分来直观呈现信用水平,主要包含了用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度,分值范围从350分到950分划分为5个等级,分数越高代表信用程度越好,违约可能性越低。持续的数据跟踪表明,芝麻分越高代表信用水平越好,在金融借贷、生活服务等场景中都表现出了越低的违约概率,较高的芝麻分可以帮助个人获得更高效、更优质的服务。
2.反映互联网社交行为的腾讯信用
腾讯信用是腾讯征信推出的个人征信管理平台,腾讯信用主要基于历史行为信息,通过采集不同维度的信息,运用大数据、机器学习以及传统统计方法相结合的技术手段,按照“履约、安全、财富、消费、社交”五大指数来客觀反映用户的信用水平,从而得出用户的守信指数。还为用户带来一定的金融特权和生活特权服务,金融特权包括现金借贷、银行办卡和消费分期等服务,生活特权包括信用出行等服务。腾讯征信的数据更多的是社交数据和支付数据,其征信产品主要有两大类别:一类是反欺诈产品,包括人脸识别和欺诈评测。主要服务对象包括银行、证券、保险、消费金融、小贷、P2P等商业机构,它能帮助企业识别用户身份,防范涉黑账户或有组织欺诈,发现恶意或者疑似欺诈客户,避免资金损失。还有一类是信用评级产品,主要为个人提供信用评分和信用报告。
3.反映金融业务数据的前海征信
前海征信是中国平安保险(集团)股份有限公司旗下全资子公司,其数据来源的合作机构近1 500家,覆盖中小银行、小贷、P2P、保险、投资、银行、信用卡、财富管理、众筹等各种类型,其中银行客户达100多家,涵盖股份制商业银行、区域性商行、农商行等,与金融业务相关的数据占比超过60%。从前海征信的业务布局来看,其产品体系以贷前、贷中、贷后来布局,包括欺诈类,信用类等几十款征信产品,为金融机构提供全流程的风控解决方案。此外,前海征信尤其重视互联网金融领域,针对中国互联网金融发展现况,定制了灵活、完整的产品体系,能满足互联网金融机构和传统金融机构各种不同的风控需求。
4.反映借款人风险的好贷云风控
好贷云风控是好贷网和全球最大的个人信用评分机构FICO(费埃哲)共同打造的大数据风控平台,整合征信公司、司法数据、工商数据、消费数据等重要数据源头,构建了金融贷款机构风控所需全行业各领域的风险数据库,全方位有效掌控信贷机构的个人、企业客户的风控数据,形成迄今为止最极致的风险控制和监测体系。好贷云风控整合8大风控数据类别,30个风控识别领域,6 000个识别维度,风险数据库中包括反欺诈风险名单库、重大风险识别名单库、贷款申请记录名单库的数据,合计已超过7 000万条,与央行征信报告有效互补,方便信贷机构从更多角度交叉核验借款人的借款资质和潜在风险状况,协助其大幅提高反欺诈识别和信用风险识别能力,同时结合FICO的信贷决策引擎为信贷机构提供服务。
5.第三方數据服务商的华道征信
华道征信是由深圳市银之杰科技股份有限公司联合北京创恒鼎盛科技有限公司、清控三联创业投资(北京)和新奥资本管理有限公司四家机构共同发起设立的。目前该机构只做个人征信业务,不参与企业征信。华道征信并无自有的数据渠道,其数据来源主要有五个方面:一是来源于广大小微贷机构的信贷数据;二是与公安部建立实时验证的公安司法数据;三是通过亿美软通渠道整合的运营商数据;四是通过新奥能源掌握的居民燃气等公共事业数据;五是与京东等握有大量网络数据的互联网巨头合作采集的网络痕迹数据。相对于其他征信机构来说,华道征信的产品相对较少,主要包括“同业征信联盟”产品,着力于反欺诈;“猪猪分”征信产品,用于了解租房信用。
(二)大数据技术在支付结算领域的应用
对于支付结算行业而言,数据与支付的结合开启了移动支付的新时代。移动支付产品正呈现多元化的发展态势,支付模式多种多样,包括NFC近场支付、无卡支付、二维码支付、声波支付、蓝牙支付以及第三方支付推出的各类外接方案等新型支付模式。从产业上看,移动支付已初步形成三类可信生态圈格局,包括银行主导的手机银行+NFC移动支付生态圈、第三方支付机构主导的包括电商和社交等支付生态圈、以及由运营商主导的依托线下的ATM、POS机与银联合作的NFC移动支付生态圈。从应用上看,移动支付也从原有的单一支付应用向多元化的移动应用发展。
1.反映聚合支付能力的Ping++
Ping++是上海简米网络科技有限公司旗下的聚合支付品牌。作为开发首选的支付聚合平台,为逾万家商户提供支付服务,是TOB领域领先的第三方支付解决方案提供商。其支持的支付渠道包括支付宝、微信支付、银联、Apple Pay、招行一网通、百度钱包、京东支付、易宝支付、Visa、MasterCard、JCB 等;支持的支付场景包括手机 App 支付、移动HTML5支付、线上与线下扫码支付、PC 网页支付、微信公众号支付、微信红包、代付等各类方式。公司在2016年通过了全球最严格支付数据安全认证 PCI DSS 认证,整个交易系统具有极高的安全性和稳定性,对于客户隐私数据有着最高级别的安全保障措施。Ping++ 的大数据增长智能系统,一方面根据用户忠诚度和流失风险精准划分用户群体,快速定位用户激励的最佳时间点,精准计算获客的投入产出比。另一方面,运用直观的关联交易为用户画像,科学衡量用户忠诚度、流失风险和消费能力,并结合消费习惯分析,对用户进行分群和精细化运营。
2.反映支付创新的天天富
优秀的数据分析和运用是支付创新的关键,“天天富”互联网金融服务平台、“全民惠”O2O应用、“大华捷通”电子商务物流平台等,都是银联商务基于大数据的创新应用。成立于2013年的“天天富”平台是银联商务建立的中国首个B2B互联网金融服务平台。平台通过大数据分析商户真实POS交易流水,进行风险评估和综合信用评估后,在650万庞大的中小微商户客户群和金融机构之间搭建的数据信息撮合平台,为客户提供集融资、消费贷、保理、理财、互联网车险等全方位一揽子金融综合服务。截至2017年底,“天天富”已成功为100多万商户及个人用户提供了5 400多亿元的应急资金贷款服务和350多亿元的理财服务,使众多中小微商户以及个人成为了“普惠金融”的实际受益者。其在普惠金融服务领域的创新卓越表现再获业界肯定,荣膺“2017年度最佳普惠金融服务平台”大奖。
三、大数据技术在我国征信、支付领域所面临的挑战
综上所述,结合产业特点和经济发展的社会需求,我国大数据技术在征信、支付领域已经做出了积极的探索,在推动产品、技术、商业模式等方面也积累了一定经验。但是,值得注意的是,大数据作为新兴技术,在实际操作和发展中,仍面临数据资源的开放性不足、数据资源的挖掘深度不够、数据资源的安全性不强等诸多挑战。
(一)数据资源的开放性不足
从数据运用效果看,不同征信机构之间数据的采集和运用标准彼此不同,数据资源共享仍然存在难度。由于不同的大数据征信产品侧重点不同,有的倾向电商信用行为,有的侧重互联网社交行为,有的反映借款人风险等,不同征信信息仅在各家平台内形成了“闭环”流转,难以实现数据信息的自由流动和共享。因此,征信平台彼此之间信息较为分散、不能形成对接,缺乏统一的征信模型和评分标准,容易形成各类“信息孤岛”,难以实现数据的互联互通、共享共利。 和其他大数据行业相比,大数据支付行业则受到更多的行业监管,存在更高的数据壁垒,数据之间的打通难度较高,各数据源之间不能形成合力,使数据的大部分潜力难以发挥作用。因此,未来如何在监管制度之下,通过产品的创新发挥支付、征信数据的更大价值,将是大数据征信、支付行业的重点课题之一。
(二)数据资源的挖掘深度不够
不同的应用对大数据有着不同的理解,大数据技术在征信、支付领域之所以兴起,并不仅仅依靠数据多,技术支撑和算法模型不可或缺。凭借先进的IT技术,大数据将碎片化的信息进行整合挖掘,通过人工智能算法模型在支付、客户与风险之间建立量化关系,由此形成真正有用的大数据。因此,大数据的核心竞争力在于其强大的数据挖掘能力和模型开发能力,将机器学习领域比较成熟的技术创造性地用于传统的征信、支付领域。但就我国目前实际应用结果看,征信与支付领域自身并不缺数据,缺少的是对数据维度和关联度的深度挖掘,并将数据能真正有效的落在应用场景之中。影响的因素中除数据共享局限导致数据采集维度不够宽泛的原因外,还包括数据质量不足、分析速度缓慢等制约因素。一方面数据缺失、数据重复、数据错误和数据格式不统一等数据质量问题,导致大数据技术对数据信息提取失真,容易发生客户系统分析信用错判、误判的现象。另一方面,现有数据的标准化程度较低、分散度较高,数据采集和应用能力难以满足规模化的数据分析要求,不能形成精准、动态的实时响应,大数据技术对数据应用需求处理速度的缓慢性将制约其进一步发展。
(三)数據资源的安全性不强
大数据具有可复制、全流动、高价值等特性,这些特性为数据安全管理带来了新的挑战。一是大数据的来源渠道非常复杂,有来源于政府公开信息的,有来源于市场交易信息的,还有大量社交行为信息。这些信息来源权属不明、规则和标准缺失,普遍存在不可追溯、不可异议、不可纠错,对信息主体的隐私防护带来巨大挑战,侵害信用主体的风险加大。二是在数据采集、数据存储和移动支付过程中,难以完全规避黑客的有意入侵和病毒攻击的威胁,一旦发生数据窃取、数据泄露、数据篡改和智能欺诈的情况,将对消费主体的隐私和权益造成侵害。三是征信和支付机构的数据采集和使用多源于并应用于自身开展的业务,突破了“独立第三方”的边界。在追逐利益的背景下,数据加工分析后所产生的有效性和真实性将难以获得保障,公信力受到质疑。
四、促进大数据技术在我国征信、支付领域发展的对策
虽然大数据技术在征信、支付领域的创新应用为我国经济金融发展带来了全新理念和技术路线,各方机构都在争相布局大数据征信、支付领域,但参与主体往往多是各自为战、难成全局。为了顺应大数据、云计算、人工智能和区块链等技术的快速发展趋势,推动大数据信息更具全面性、多维性和权威性,我们应构建一个面向大众、开放共享、互联互通的大数据征信、支付平台,使得大数据技术真正服务大众、便民惠民,共筑良性的大数据征信、支付生态系统。
(一)完善大数据法规体系和业务监管
“国无法不治、民无法不立”。自2013年起,我国陆续颁布了一系列法律法规,为征信、支付业的健康发展构建了法律制度框架。包括《征信业管理条例》、《征信机构管理办法》、《关于推动移动金融技术创新健康发展的指导意见》以及《促进大数据发展行动纲要》等制度意见的颁布,规范了信息提供者、信息使用者以及征信机构的行为,有利于消费主体的权益保障。但大数据技术在征信、支付过程中涉及更多的是个人隐私保护,需要我们从个人信息界定、信息采集标准、信息使用授权、信用评定告知等方面补充规范,落实信息的所有权、知情权和控制权,严格市场准入机制,建立纠纷解决机制,完善侵权责任追究制度,促进行业健康发展与权益主体合法利益之间的平衡与协调。此外,在业务监管层面,要逐步加快大数据征信、支付应用产品的标准规范,对产品监管体系、范围及程序进行完善和扩充,实施差异化的分类监管和动态监管制度,强化行业自律和量化考核,提升服务的透明度和公正性,推动大数据技术在征信、支付领域的健康、有序和稳定发展。
(二)完善大数据共享机制和技术规范
数据越开放越有价值,数据的关联性越强、应用范围越广,数据创造的价值就越大。因此,加快政府数据资源的整合,推进公共数据资源的开放,将私有大数据变为公共大数据,建立集中统一的大数据库,实现互联互通的大数据系统,已逐渐被各级政府和企业所认识,全球正共享数据开放所带来的社会效益和商业价值。我国政府也着力推动数据开放,一方面国务院在《促进大数据发展行动纲要》中提出,到2018年中央政府层面实现金税、金关、金财、金审、金盾、金宏、金保、金土、金农、金水、金质等信息系统通过统一平台进行数据共享和交换。另一方面,在发改委发布的《国家发展委员会办公厅关于请组织申报大数据领域创新能力建设专项通知》中明确提到要建设大数据流通与交易平台,用以支撑数据共享,为数据使用者提供更丰富的数据来源。此外,要实现关键领域的数据统一,促进层级数据资源的整合,共建互利共享的数据系统,推动大数据标准规范建设是重要抓手。首先,应制定统一数据目录,统一内容和格式标准,规范数据接口和标准,克服数据流动的组织障碍和技术障碍。其次,要加大数据治理力度,运用数据清洗和筛选技术,多维度交叉验证数据的有效性,增强数据的真实性、完整性和准确性,减少信息不对称的发生。最后,在纵向行业数据平台的基础上,开展跨行业、跨领域应用合作,通过映射关联方式构建全方位、全国性的大数据平台,实现数据的“穿透式”管理,形成数据的相互补充和互惠互利,促进大数据技术在社会经济各领域的价值实现。
(三)完善大数据安全防护和产品创新
数据的安全可信是大数据技术应用的底线,也是大数据征信、支付系统得以长久运营的基本前提。加强数据信息的安全防护、确保信息数据的安全可靠成为社会公众最关心的直接利益,也是大数据监管体系最关注的焦点。因此,大数据系统运营保障必须依托安全可靠的操作系统,采取高新技术和分布式数据云的结构确保信息数据存储与传输的安全,及时进行数据脱敏和模糊化处理工作,形成覆盖从数据源头采集到数据存储及模型分析等全流程的安全管控和源头追溯。同时,制定明确的数据安全使用标准,对大数据的使用权限、范围、方式和安全机制等,进行严格的规范化、标准化管理,提高大数据服务安全性,有效防范欺诈风险及其外溢效应。此外,在推动传统征信、支付发展的同时,我们还应开展前瞻性的数据分析研发工作,鼓励大数据技术的协同创新,深入进行传统征信、支付产品与大数据技术的复合创新,深化各类大数据场景的具体应用,为客户提供“支付+征信+数据+产品”的全方位解决方案,实现线上线下两者之间互为表里、相互竞争、相互推动的发展格局,驱动整个征信、支付市场的转型升级。
主要参考文献:
[1]孔德超.大数据征信反思—基于个人征信视角[J].现代管理科学,2017(9).
[2]陈小梅.我国大数据征信业发展实践与完善路径[J].福建金融,2017(12).
[3]张健.大数据征信的创新特点、问题及优化路径[J].电子商务,2018(1).