李礼辉:如何高效配置数据要素资源?
2024-09-25张明丽
9月5日-7日,由中国金融四十人论坛(CF40)与中国国际经济交流中心(CCIEE)联合主办的第六届外滩金融峰会在上海市黄浦区召开,峰会主题为“应对变化的世界”。全球财经政要、机构高管与学界领袖齐聚外滩,为变化中的世界发展寻求应对之策,探索全球合作与发展的新路径。
在9月6日的分论坛上,中国银行原行长李礼辉介绍,目前中国的非公共数据存在着流通不畅的问题。比如,我们的移动支付的客户数现在差不多9亿多,移动支付的各个平台是数据的主要入口,但现在金融机构和移动平台的数据共享,还没有形成一个比较成熟的模式。
“我们仍存在公共数据的行政部门分隔的问题,还是会影响数据共享、数据价值的发挥。比如,涉及居民和企业的一些数据,分布在金融机构、金融监管、税务、海关、工商管理等不同的部门中,存在行政性的数据分隔,影响了数据价值的开发。”李礼辉说。
同时,“全面提升数据要素生产率,实现数据资源价值的最大化,要求高效配置数据要素资源。由于数据具有不同的所有权归属,数据要素资源的配置也应该采用多元复合的方式。单一的市场化路径或单一的行政路径,都难以达到最优的配置效率。”李礼辉认为。
如何解决数据分隔、数据流动,提升数据品质?围绕数据、智能金融等相关问题,李礼辉接受了《财经》专访。
《财经》:您提到,数据的价值在于其真正成为生产要素。要打破公共数据的行政部门所有制。建立标准统一、互联共享的公共数据应用系统,建立数据共享的征信系统,形成能够支持数字经济发展的基础设施。您认为数据成为生产要素难点在哪?如何打破数据壁垒、实现数据共享?
李礼辉:数据成为生产要素主要面临的难点是“既要又要”两难问题:既要保护数据隐私、保障数据安全,又要促进数据流动、发掘数据价值。
中国依托人口数量、市场规模和移动服务率先发展的优势,在市场交易和公民行为领域已经形成全球领先的数据资源供给格局。海量的市场交易和公民行为数据是中国数字经济、数字金融发展的宝贵资源。
中国这些年一直在推进数据共享。一些省市建立了大数据中心,在数据集中、数据整理、数据挖掘、数据共享方面做了大量工作。例如,福建省的大数据集团全面推进全省数据汇聚共享,建立7000万级个人数据库和800万级企业数据库,建立中小微企业信用数据多维度评分系统,建立交通、气象数据专区,实现数据赋能千行百业,支持和促进了金融业的数字化转型和发展。
尽管如此,我们的数据共享仍然滞后,数据鸿沟依然存在。例如,涉及居民和企业的财务数据和行为数据,分散在金融机构、金融监管、工商管理、税务、海关等不同的局域系统中,共享水平不高,影响数据价值的深度开发。又如,中国移动支付用户规模高达9亿,数字化支付成为主要的数据入口,互联网平台拥有超大规模的个人和企业数据,但互联网平台与金融机构之间的数据关联、数据共享尚未达成成熟的模式,数据价值未能充分发掘。主要原因是,关于保护数据隐私、保障数据安全的制度边界不清晰、不明确,有关行政部门宁可严管、不敢松绑,数据资源生成多、应用少。
因此,打破数据壁垒,需要从制度创新入手。一是明确原则,强调实现保护个人隐私、保护信息安全、发掘数据价值、提升经济效率多重目标的协调统一,不可以偏概全;二是落实责任,要求国家行政部门在各自分管的领域内正确区分隐私保护的边界,正确把握数据安全管控的力度,制定数据共享的行业规范,不可推卸责任;三是在实践中完善,先让数据要素动起来、活起来、用起来,在发展过程中纠偏纠错,逐步完善行业规范,成熟时将行业规范上升为法规、法律,不可止步不前。
在社会信用体系建设中,应该建立跨局域数据共享的征信系统,整合不同部门的数据资源,执行统一标准,采集企业和个人的金融业务、工商登记、税费缴纳、国际贸易、市场诚信等信息数据,注重为小微企业积累信用记录,赋予信用标记,实现信用增值,推进普惠金融业务发展。
《财经》:如何从监管层面化解数据权属不清的问题?
李礼辉:二十届三中全会提出:建设和运营国家数据基础设施,促进数据共享;加快建立数据产权归属认定、市场交易、权益分配、利益保护制度。“数据二十条”要求:完善数据产权结构性分置制度,建立公共数据、企业数据、个人数据的分类分级确权授权制度。
监管层面,一方面要解决公共数据发掘不足、品质不高、开放不力的问题,另一方面要解决企业数据和个人数据权属不清、保护不力、流通不畅的问题。
一是公共数据的发掘、脱敏和开放共享。美国等西方发达国家在知识和学术领域拥有长期发展累积的数据资源优势。中国高品质的文化类、科技类、视觉类数据资源相对短缺,符合AI大模型需求的高品质数据集远远不够。
要加快数据脱敏,扩展公共数据开放应用。对政府行政部门、公共服务机构、社会团体、公益组织等具有公共属性的机构收集和存储的个人信息,进行脱敏处理消除个人和企业的标记。国家建立集中统一的公共数据库和互联互通的公共数据应用系统,打破数据孤岛。公共数据按照“原始数据不出域、数据可用不可见”的要求,以模型、核验等产品和服务等形式向社会提供,加大供给使用范围。应充分挖掘公共数据,将公共数据用于宏观经济管理和规划,用于供给侧和需求侧的结构性改革,用于产业链的布局和流程改进,用于城市智能管理系统,用于普惠金融;同时将公共数据用于生产商的产品和服务优化,用于经销商的采购和物流优化。
要加快公共文档资料的数据发掘,建立专业化的公共数据库。图书馆、高校、科研机构和行政部门拥有大量的公共文档资料,具有文化价值、技术价值和经济价值,应该统筹规划、分门别类、分期分批进行数据化清理,发掘高品质的数据集,充实公共数据库。
二是企业数据和个人数据的确权、保护和共同使用。对各类市场主体在生产经营活动中采集加工的不涉及个人信息和公共利益的数据,应该确认市场主体对该数据的持有权、使用权和收益权。
需要审慎把握边界的,是市场主体在生产经营活动中采集加工的承载个人信息的数据。数据处理者必须按照个人授权和法规许可范围采集、持有、托管和使用数据,完善个人信息保护机制,规范采集使用个人信息行为。同时创新技术手段,推动个人信息匿名化处理,保障使用个人信息数据时的信息安全和个人隐私。
金融业是数据密集型行业,发展普惠金融业务是国家的政策导向。不同金融机构占有数据的数量、质量及其挖掘数据的能力,在很大程度上可以决定一家金融机构经营普惠金融业务的实际能力,包括普惠金融业务的数量和质量、风险成本和经营成本。要加快推进非公共数据按市场化方式“共同使用、共享收益”的新模式,支持金融机构与互联网平台企业、交通运输企业、物流企业、数据分析加工企业、征信机构、行政部门、公共服务机构等“数据大户”建立市场化的数据分享机制,为普惠金融业务提供数据支持,促进金融业为中小微企业提供高效率的金融服务。
《财经》:《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出,建立保障权益、合规使用的数据产权制度。您认为,合理的数据产权制度应该具备哪些要素?如何推进形成这一制度?
李礼辉:“数据二十条”将数据基础制度定义为数据产权制度、数据要素流通和交易制度、数据要素收益分配制度和数据要素治理制度,数据产权细分为数据资源持有权、数据加工使用权、数据产品经营权。
完善的数据产权制度要立足于实现数据要素资源配置的最优化和数据要素价值的最大化。由于数据要素具有不同的性质、不同的所有权归属,实现价值最大化的最佳路径也各不相同。著作数据的价值最大化取决于确权和市场交易,个人数据的价值最大化取决于隐私保护和融合应用,公共数据的价值最大化取决于透明度和资源共享。
建立数字资产市场,有利于完善数据产权制度。数字经济时代需要数字资产市场。数字资产市场包括数字化的金融资产、实体资产和资产化的专利数据、著作数据。
数字化的金融资产可以在数字资产市场中获得认证、定价并进行交易,实现所有权的转让。数字化的实体资产可以在数字资产市场中获得认证、定价并进行所有权或使用权的交易。
资产化的专利数据、著作数据,指符合《专利法》《著作权法》等法律定义的“专利”和“作品”的数字化资产形态,属于知识产权。
具备新颖性、创造性和实用性的发明和创新,可以被授予专利权,专利申请权和专利权可以转让。
作品包括文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果,包括文字作品,口述作品,艺术作品,美术、建筑作品,摄影作品,视听作品,工程设计图、产品设计图等图形作品和模型作品,计算机软件,以及符合作品特征的其他智力成果。著作数据的所有权或使用权,可以在数字资产市场中获得认证、定价并进行交易。
在数字资产市场中,认证是关键环节。应用区块链、人工智能等数字化技术建立数字信任机制,具有超越传统的资产市场的优越性。一是在信任未知或信任薄弱的环境中形成可信任的纽带,节约信用形成所需的时间和成本,加持商业信用;二是在广域、高速的网络中建立可信的认证工具,解决专利和专利权人、著作数据和著作所有者的确权问题,实现数据可信、产权可信、授权可信、合约可信、法人可信。这将有利于充分发掘数据资源的商业价值。
数字化技术的创新和应用正在构建以对等、互信、共赢为特征的分布式商业模式。拥有数据资源优势的一方,与拥有资本、技术、劳动、土地、客户、渠道等要素优势的其他方,可以在资源共享基础上开展多方合作和利益互换,集合比较优势,降低机会成本,通过交换与合作获益。分布式商业可以摆脱传统商业模式下各自利益最大化的局部最优,通过资源协调,创造帕累托最优,追求产业链、供应链各个环节的结构性协调,实现全局优化。
《财经》:您此前提到AI信任和AI安全问题。AI技术广泛应用后,AI产生虚假内容,AI操纵人类行为等问题也相应出现。什么是合理的AI信任制度和AI监管制度?应从哪些方面立法规范?
李礼辉:AI技术创新和应用带来了新的挑战,必须重点管控AI对齐、AI虚假、AI操纵等问题。“AI对齐”是指AI系统的目标必须与人类的价值观与根本利益保持一致,这个概念得到了全球的原则认可。问题在于,人类的价值观和根本利益未必一致,不同实体和群体的价值观和根本利益存在差异甚至冲突。在地缘政治环境中,AI对齐有可能成为霸权国家价值观输出的技术工具。
“AI虚假”是指应用深度学习、虚拟现实等生成类算法制作高仿真的图像、音频和视频,可以模糊真实和虚假的边界,甚至可以对抗通用的技术甄别,已经被用于实施经济诈骗,被用于诋毁个人信誉和企业商誉。
“AI操纵”是指高仿真的图像、音频和视频被用于操弄负面舆情,抹黑政治对手,破坏政治信任,破坏社会稳定,激化社会矛盾。2023年7月18日联合国安理会上,联合国秘书长古特雷斯说,人工智能正在多领域发挥作用,但可能被怀有恶意的人使用,包括将其用于恐怖主义、煽动仇恨和暴力。
为此,我们需要实行安全与效率并重的数字经济治理。
一是严格管控AI虚假与AI操纵。国家建立AI信任制度和AI监管制度,在立法和执法层面明确禁止AI造假和AI欺诈,赋予合格企业AI信任标志;提升深度合成内容鉴别技术,提供对抗AI虚假的公共服务,在国家层级建立预防AI操纵的防火墙。
二是主动参与全球AI标准制定,在“AI对齐”全球制度建设中融入中国因素,抵消西方霸权的负面影响。
三是注意AI软件开源的潜在风险。可信的开源是数字技术创新的可行路径,我们不可能拒绝开源。OpenAI对GPT从开源到闭源应是为保持技术领先,Meta对Llama3开源则是为争夺市场。必须注意的是开源算法与生俱来的系统绑定与技术依赖,一是开源模型的技术天花板难以超越,二是由外国数据预训练的模型未必适应本土需求,三是开源中止可能造成技术断桥。软件开源协作规则包括源代码公开、允许派生作品、维护作者源代码完整性等。在开源格局中,要建立软件安全技术标准和软件审核认证制度,拦截存在安全隐患的开源软件;要加大投入,加大政策扶持,优先研发、优先使用具有自主产权的软件和模型,促进中国软件技术产业的进步与成长。
《财经》:如何用技术完善金融监管?如何系统有效推进数字金融创新、平衡金融领域的创新与风险?
李礼辉:对于智能金融创新,偏于审慎的观点认为,将尚不成熟的人工智能技术投入高风险的金融领域,可能放大现有风险并产生新的风险。我认为,金融业必须重点解决的技术缺陷包括模型歧视、算法趋同、隐私保护薄弱、关键第三方依赖等。模型歧视指模型输出的结果出现对某些群体的集体性偏见、差评和政策限制;算法趋同指在不同机构的量化交易之类的智能金融程序中,由于算法逻辑趋同出现相同的市场趋势预测,执行相同的市场交易策略,导致单边化的市场交易,可能引发暴涨暴跌的市场危机。
智能金融创新必须以金融安全为前提,实现符合伦理标准的金融平等,保障符合安全标准的金融效率,营造符合经济规律的创新模式。
一是行业级垂直模型与企业级垂直模型融合发展。用海量数据预训练行业级垂直模型并持续调优,再根据不同需求调适差异化应用,定制企业级垂直模型,可以有效降低垂直模型开发的边际成本,同时扩展垂直模型的应用范围。金融业涵盖商业银行、保险、证券投资、财富管理等不同领域,同一领域的金融产品、金融服务、金融管理的需求大同小异,采用行业级垂直模型和企业级垂直模型融合发展的技术路线,同时选择适当的商业模式,有利于实现高效率、低投入、个性化的金融创新需求。
二是建设安全高效的智能金融创新制度。过于严苛的监管可能抑制创新和产业发展。可考虑的原则是“高中初小”,“高”是占领技术高地,“中”是全球领先的中国方案,“初”是有能力把风险消灭在萌芽状态,“小”是实现风险概率和风险成本最小化。
这就要求加快智能金融监管创新,节约监管成本和被监管成本。例如,制定法律法规,明确智能金融各参与方的责任边界,包括智能金融监管的基本原则、监管机构的职责和权限、金融机构的智能金融业务规范;建立穿透式、一体化、跨局域的智能金融协同监管系统,实现监管信息共享;建立智能金融技术审核认证制度,完善AI大模型的测试平台、工具、标准和方法;建立智能金融风险分析和监测系统,及时识别、评估并提前预警异常交易和市场操纵,主动预防系统性风险;积极参与构建数字经济国际规则和数字技术通用标准,加强智能金融国际监管协作和交流,在数字经济国际规则建设中争取中国的话语权,在数字技术通用标准建设中争取中国的“定位权”。