APP下载

消费信贷市场算法信用评分的消费者保护问题研究

2021-09-22陈晓丽

中国商论 2021年18期
关键词:机器学习算法

摘 要:算法信用评分在消费信贷市场迅速兴起,不仅颠覆了传统信用评分方式、催生出新的金融市场主体、促进消费信贷的普惠性,还对消费者保护尤其是隐私和自主权保护提出了挑战。为了在鼓励消费信贷市场创新与消费者保护之间取得平衡,英国以保护消费者隐私和自主权为导向,通过消费信贷和数据保护等法规来实施消费信贷市场算法信用评分领域的消费者保护。通过归纳总结英国经验,结合我国实际情况提出应完善算法信用评分领域消费者保护工作架构、明确高标准的消费者隐私和自主权保护要求、对消费者数据处理周期实行早期介入和监管、加强数据保护知识公众宣传教育等建议。

关键词:算法;机器学习;信用评分;消费者保护

本文索引:陈晓丽.<变量 1>[J].中国商论,2021(18):-031.

中图分类号:F063.2 文献标识码:A 文章编号:2096-0298(2021)09(b)--04

近年来,在经济社会日益网络化和数字化、可用的个人数据海量增长、机器学习等人工智能技术取得重大进步等因素的推动下,通过使用机器学习等人工智能技术增强或替代人类决策的自动化决策在多个领域的快速发展,典型应用如金融科技公司、信用评级机构将自动化决策集成到消费者信用评分中,使用机器学习等技术分析更广泛的消费者数据尤其是替代数据来评估消费者信用,即称为“算法信用评分”。算法信用评分的兴起及对消费者数据的收集、分析和使用,加剧了消费者保护领域的争议:利好在于可能提高信用评分的效率和准确性、改善以往被边缘化消费者的信贷获得机会;弊端在于有不准确、不透明、对待消费者不公平的潜在风险,尤其是可能损害消费者隐私和自主权。全球主要经济体的监管当局已经关注到消费信贷市场算法信用评分的风险,并在现有法律框架下采取相应监管措施,如英国通过消费信贷和数据保护监管制度予以规制。

1 算法信用评分的兴起及其概念界定

消费者信用评分是依据消费者历史信用表现和具有类似属性的金融交易数据估算消费者信用风险,并根据消费者信用风险运用统计技术对消费者进行分类和排名。传统的信用评分主要运用线性统计方法和固定变量进行计算,能够反映消费者历史信用表现与信用风险之间的统计相关性,但也存在无法获得消费者非金融或非信用数据的局限性。從2000年开始,互联网及移动技术广泛普及、可用的消费者数据大量增长及机器学习等技术进步,再加上大型金融科技公司的崛起,推动了算法信用评分的发展。国外如美国的Lending Club、Prosper、Social Finance等金融科技公司率先将机器学习等技术、替代数据与线上信贷相结合,利用机器学习等技术评估消费者信用风险并开展线上信贷业务。

区别于传统的信用评分,算法信用评分主要有两个特点:一是运用更复杂的机器学习等人工智能技术来分析数据,“算法”即指机器学习甚至深度学习等技术,如随机森林、人工神经网络。二是分析的数据数量和种类更多、更广泛,既有传统的信用数据又有非信用的替代数据,其中替代数据既包括财务数据,如租金、公共事业和手机支付数据,又包括常规数据如受教育和就业历史,还包括非常规的社交和行为数据,如社交媒体、手机使用、健康健身、零售和在线浏览数据,囊括文本、视频、图像、声音等形式。与传统的信用数据相比,替代数据具有结构化低、维度高的特点,算法正是通过解析这种大规模、非结构化、高维度化的数据捕捉非线性关系,找到与消费者信用风险相关的特征和模式并进行评分。

2 消费者保护视角下算法信用评分带来的机遇与风险

2.1 正面影响:促进消费信贷市场的效率和普惠性

一是提高消费信贷市场配置效率。算法信用评分可以通过减少获取消费者相关信息所需的成本和时间、揭示更多与消费者信用风险相关的信息,对信用风险进行更准确的评估,减轻因逆向选择效应造成的市场配置低效率。特别是使用更多类型的消费者行为数据、不断改进的机器学习等技术,更准确地预测消费者在还款期的支出和可支配收入来分析还款能力,有利于改善传统方式下信用不足或无信用的消费者(即被边缘化的消费者)的信贷获得机会。二是由于被边缘化消费者往往属于低收入、受教育程度较低的弱势群体,算法信用评分改善信贷获得机会还有助于提升消费信贷的普惠性。三是更有效地监控消费者贷后行为。在算法信用评分中使用的消费者数据可用于设计更有针对性的惩罚性定价条款或费用豁免,以动态适应消费者贷后行为,有助于减少因信息不对称、道德风险影响而造成的低效率。机器学习等技术和替代数据还可以用于与信贷活动相关的业务并提高办理效率,包括验证客户身份、监控欺诈和洗钱活动等。

2.2 潜在风险:不准确、不透明、对待消费者不公平、损害消费者隐私和自主权

(1)存在评估不准确、不透明的风险。一是因技术原因可能导致评估不准确。算法信用评分高度依赖于数据和机器学习等技术模型的质量及准确性,如果数据不完整、有偏差或不正确,或者模型不能有效分析数据,算法信用评分反而会因评估不准确造成消费信贷市场的低效率。二是评估的准确性需要在更长的经济周期中进一步考验。算法信用评分兴起于2008年经济危机后,众多用于算法信用评分的机器学习等技术模型都是在2008年后相对良性的宏观经济环境中训练出来的,评估的准确性是否受到经济衰退的影响还未可知,需要在更长的经济周期中进一步观察。三是某些用于风险建模的机器学习等技术复杂程度较高,可能影响模型的可解释性和有效验证,影响评估透明度。

(2)存在不公平对待消费者的风险。一是技术原因可能导致消费者被歧视。例如机器学习等技术模型简单的将数据的特定变量与信用风险挂钩,可能导致与变量相关的消费者群体产生不公平的结果;在未经过严格测试结果和根据反馈调整模型参数的情况下,在自然场景下使用机器学习等技术模型有可能强化和延续对部分消费者的歧视。二是有不公平对待消费者的道德风险产生。消费信贷机构和信用评估机构可能过度收集和使用消费者数据;可能通过算法信用评分剥削消费者,如实行价格歧视、利用消费者认知和行为的偏差进行有针对性的恶意营销、针对更加弱势的消费者采取不当债务催收行为、主动避免向被边缘化的消费者提供信贷,进而影响消费信贷市场的分配公平性。

(3)对消费者隐私和自主权构成威胁。一是算法信用评分及所处的自动化决策体系如果遭遇黑客攻击,消费者数据被盗窃、被用于欺诈的风险增大。二是算法信用评分使消费信贷机构和信用评级机构对消费者的洞察力甚于消费者本人在被持续监测分析的情况下可能产生寒蝉效应,形成“所有数据都可能成为信用数据”的认知,影响消费者掌控自身数据并塑造数字身份的权利。虽然有观点认为算法信用评分可改善被边缘化消费者的信贷获得机会、减少过度借贷的风险,消费者让渡隐私和自主权的风险可以被收益所抵消。但考虑到包括算法信用评分在内的自动化决策被广泛运用,对消费者隐私和自主权的系统性、长期性损害很难因收益而抵消。

3 算法信用评分领域实施消费者保护的英国经验

算法信用评分领域的消费者保护问题已引起各国监管当局的关注,其中英国虽然没有出台专门的法律,但有相应的法律规则来规制并由监管机构予以执行,经验相对成熟且具有借鉴意义。

3.1 主要法律规则

英国与算法信用评分领域消费者保护相关的法律规则主要有《消费信贷法》(由英国金融行为监管局进行消费信用监管)《2018年数据保护法》《数据保护一般规则》(由英国信息专员办公室进行数据保护监管)(英国适用于算法信用评分的其他法律规则还包括反歧视、竞争、知识产权和一般消费者法律,本文将分析重点放在相关性最强的数据保护和消费信贷法律规则上。)。《消费信贷法》规定了公平对待客户、行事谨慎专业勤勉、确保产品营销清晰公平和不误导的原则,为监管机构灵活应对消费信贷市场创新的潜在风险提供了法律基础。《2018年数据保护法》和《数据保护一般规则》(虽然英国脱欧过渡期于2020年12月31日结束,欧盟的《数据保护一般规则》仍保留在英国法律体系中并与《2018年数据保护法》一同发挥作用。规定了数据控制者和数据处理者义务、数据主体权利以及有关监管执法权力。数据控制者和数据处理者义务囊括:一是总体数据保护原则,包括数据最小化(数据最小化原则即要求数据是充分、相关且仅限于与目的有关的)和目的限制(目的限制原则即仅出于特定、明确、合法的目的而收集消费者数据,不得以与目的不符的方式处理)。二是处理数据需有经消费者同意或者是满足合法利益的理由。三是当数据处理可能对消费者权利构成高风险时必须执行数据保护影响评估(DPIA)。四是落实经设计或默认的数据保护方式。数据主体权利主要体现为:消费者有权查阅和纠正信用档案中的错误,有权获得自动化决策的存在及逻辑的有关信息,有权反对基于自动化决策作出的决定。

在上述法律规则下,监管机构可以更直接地发现风险和采取监管措施,包括:评估消费者对特定形式的产品营销的反应,以确定是否清晰公平和不误导;要求被监管对象加强个性化的信息披露,或以更有针对性的方式调整消费者选择架构;要求被监管对象针对基于自动化决策的业务系统和流程建立稳健治理和监督安排,如数据质量验证、持续的模型反馈测试、交叉验证和审计等。

保护消费者隐私和自主权是英国在算法信用评分领域实施消费者保护的关键。保护消费者隐私和自主权的涵义比消费者个人数据保密的涵义更为深厚,后者主要是防止非公开的消费者个人数据被披露,而前者通过对收集、分析、使用消费者数据等行为和实施主体进行控制来保护更广义的消费者自主权,即消费者选择和构建自身身份、发展自我决策能力的权利。

3.2 存在不足

一是权力和信息不对称、消费者认知和行为偏差、数据处理负外部性都会导致市场失灵。英国消费信贷和數据保护等法规的前提是消费者可以理性权衡数据所带来的所有潜在危害和利益(包括对自身的长远影响和对其他消费者的系统性影响)并相应行使其权利。然而,实践中存在着诸多阻碍消费者有效行使权利的因素:(1)数据控制者和处理者将数据收集同意条款设置为合同附加条件,消费者没有协商的权力。(2)由于信息过载或受认知限制,消费者难以审查数据收集同意条款并做出明智决定。(3)消费者隐私和自主权被损害的风险具有潜在的、不确定的和无形的特点,消费者往往忽视其严重性。(4)消费者很难理解非结构化、高维度的数据对隐私和自主权的长远影响,也很难内化因使用自身数据而对其他消费者的隐私和自主权造成的不良影响(即数据处理的负外部性)。在自动化决策驱动的消费信贷市场中,这些障碍都会导致市场失灵,表现为消费者在受到长期性、系统性损害的情况下仍然不得不让渡隐私和自主权。

二是监管指导不足进一步削弱法律规则的有效性。《数据保护一般规则》一方面要求数据控制者和处理者履行保护消费者权利的义务,另一方面又赋予其相当大的自主空间。这就要求监管机构必须进行密切监管和有效指导才能确保监管对象履行义务。《数据保护一般规则》规定,当数据处理可能对消费者个人权利构成高风险时,数据处理机构必须履行开展数据保护影响评估、按设计或默认规则履行数据保护的义务。虽然英国出台了《数据保护影响评估指南》,但是既缺乏针对消费信贷领域的数据保护影响评估具体模板,又没有针对消费信贷领域的数据保护设计或默认规则指南,监管机构具体执行存在缺陷。

4 结语

英国在算法信用评分领域实施消费者保护的特点在于:将消费者隐私和自主权保护置于重要地位,隐私和自主权保护的涵义较广,有相应的法律规则且有对应的执法机构。在消费信贷市场逐渐数据化、消费者权利所受影响日益严重的趋势下,英国经验对我国实施消费信贷市场算法信用评分领域的消费者保护具有一定的借鉴意义。我国此领域的法律框架尚处于起步阶段,虽然《民法典》人格权编中规定了涉及隐私权和个人信息权益的内容,但是还缺少最高人民法院相关司法解释指导实践;《中华人民共和国个人信息保护法(草案)》2020年10月才公布,尚未正式出台。因此,对消费信贷市场算法信用评分领域的消费者保护,在借鉴英国经验的基础上还应结合我国实际国情加以改进。

(1)完善算法信用评分领域的消费者保护工作架构。一是金融监管部门应发挥主导作用。《中华人民共和国个人信息保护法(草案)》第六章规定国家网信部门负责统筹协调个人信息保护工作和相关监督管理工作、国务院有关部门在各自职责范围内负责个人信息保护和监督管理工作。消费信贷市场算法信用评分领域的消费者保护属于金融消费者保护的一部分,也是金融监管部门的职责范围,金融监管部门应针对算法信用评分领域制定相应规范,与其他监管机构之间开展更深层次的跨部门合作,并加强对该领域的执法力度。二是鼓励消费信贷行业总结行业内的良好实践经验、制定关于算法信用评分领域消费者隐私和自主权保护的行业指导方针,并纳入消费信贷行业自律机制。

(2)要求消费信贷机构和信用评级机构履行消费者隐私和自主权保护义务。一是要求对算法信用评分进行严格的、持续的模型验证和数据质量验证,以证明将消费者数据用于算法信用评分的合理性(即对信用评分的准确性可产生显著正向作用)。二是硬性限制用于算法信用评分的消费者数据的类型和粒度,如禁止使用具有私密性质、功能丰富的社交媒体数据,强制要求对消费者数据使用去标识化技术。三是要求采取必要的技术和管理措施,如使用各种隐私技术将消费者数据匿名化、限制保留消费者数据资料的时限、以分散式体系结构来处理消费者数据。

(3)对消费者数据处理周期实行早期介入和监管。仅要求消费信贷机构和信用评级机构在进行信用评分时才履行合理性、充分性、相称性的消费者隐私和自主权保护义务是远远不够的,在消费者数据处理周期的早期阶段(即收集、整理环节)就可能发生对消费者隐私和自主权的损害。相比之下,英国的数据保护影响评估规定要求在数据处理周期的早期阶段就要考虑是否对消费者权利构成高风险、必要时按设计或默认规则实施数据保护,这种早期介入和监管的方式明显更有利于保护消费者。因此,监管机构应对消费者数据处理周期实行早期介入和监管,著重明确消费者数据处理者和控制者必须在早期阶段就履行数据保护影响评估、必要时按设计或默认规则实施数据保护的义务。

(4)面向消费者加强数据保护知识宣传教育。网络插件(如广告和Cookie阻止程序)、保护隐私的浏览器、网页浏览设置等隐私增强技术(PETs)可降低消费者隐私和自主权被损害的风险。消费者通过使用这些技术手段对隐私进行自我管理,有助于保护自身权利。上述技术手段的有效性取决于消费者是否采用并适当使用,而金融知识或科技知识水平较低的消费者难以充分认识到隐私增强技术对自身的价值。因此,加强数据保护知识方面的公众宣传教育也是数字化形势下保护消费者权利的必要手段。

参考文献

R.ODwyer:Are You Creditworthy?The Algorithm Will Decide[EB/OL].https://undark.org/2018/05/07/algorithmic-credit-scoring-machine-learning/.

J.Jagtiani and C.Lemieux:The roles of alternative data and machine learning in fintech lending:Evidence from the LendingClub consumer platform[EB/OL].https://doi.org/10.1111/fima.12295.

王怀勇.金融科技的算法风险及其法律规制[J].政法论丛,2021(1):105-116.

周毓萍,陈官羽.基于机器学习方法的个人信用评价研究[J].金融理论与实践,2019(12):1-8.

李自华,张伟,路娟,等.大型科技公司涉足金融领域的机遇与风险[J].金融会计,2020(11):58-66.

吉克克主.大数据背景下金融隐私权保护的困境及出路[J].金融经济,2021(1):38-47.

Research on Consumer Protection Issues of Algorithmic Credit Scoring in Consumer Credit Market

The People's Bank of China Xiangtan City Center Sub-branch

CHEN Xiaoli

Abstract: The rapid rise of algorithmic credit scoring in the consumer credit market has not only overturned traditional credit scoring methods, spawned new financial market bodies, and promoted the inclusiveness of consumer credit, but also posed challenges for consumer protection, especially privacy and autonomy protection. In order to strike a balance between encouraging innovation in the consumer credit market and consumer protection, the UK takes the protection of consumer privacy and autonomy as the guide, and implements consumer protection in the area of consumer credit market for algorithmic credit scoring through consumer credit and data protection regulations. By summarizing the experience of the United Kingdom, this article proposes to improve the structure of consumer protection in the field of algorithmic credit scoring, clarify high standards of consumer privacy and autonomy protection requirements, implement early intervention and supervision of consumer data processing cycles, and strengthen data protection based on the actual situation of China and provide recommendations for public awareness and education on the protection of knowledge.

Keywords: algorithm; machine learning; credit scoring; consumer protection

猜你喜欢

机器学习算法
国际主流轧差算法介绍:以CHIPS的BRA算法为例
Travellng thg World Full—time for Rree
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
机器学习理论在高中自主学习中的应用