知识图谱技术对智能金融的影响研究
2022-12-19仲崇高迟爱宁
仲崇高 迟爱宁
泰州学院,江苏 泰州 225300
0 引言
技术进步可以提升企业生产效率,推动社会经济发展。金融业作为现代经济的核心,一直是各项科技前沿技术研发的积极参与者和受益者。在过去几十年里,技术一直在为金融带来变革。依托这些技术提供、精炼的信息价值、数据价值,金融业经历了20世纪末的全面电子时代到21世纪兴起的互联网浪潮,实现了跨越式发展,形成了互联网金融、金融科技(FinTech)等新的发展模式。另外,也促成了金融各领域与科技各领域之间的合作,并深刻地促进了金融生态圈的生长和发展。目前,人工智能技术(artificial intelligence,AI)成为推动金融业革新的新动力。
2015年,《国务院关于积极推进“互联网+”行动的指导意见》将“互联网+人工智能”列为11项重点行动之一。2016年,“人工智能”一词写入国家“十三五”规划纲要;2016年,《“互联网+”人工智能三年行动实施方案》发布,从鼓励智能制造,逐步扩展到鼓励 AI 进行全面的生态赋能。金融作为人工智能落地的最佳场景之一,成为政府关注鼓励的重点方向。2017年7月20日,国务院发布《新一代人工智能发展规划》指出,人工智能核心产业规模预期到2030年超过1万亿元。万亿人工智能市场将助力金融行业的整体技术更新,促进金融业从传统金融向智能金融发展。
智能金融是人工智能与金融全面融合而产生的新金融服务模式,它以人工智能、大数据、云计算等创新科技为核心要素,在提升金融机构服务效率的同时,实现金融服务的智能化、个性化和定制化。知识图谱是人工智能的主要技术之一,智能金融的发展,需要知识图谱技术的支持。知识图谱的知识提取、融合、分析、推断、决策等功能在大数据、云计算的基础上不断推动金融的智能化发展。
研究人员试图将深度学习技术融入知识图谱技术框架,以知识图谱为代表的符号主义和以深度学习为代表的联结主义,正在走上协同并进的新道路。融入深度学习的知识图谱技术,将为金融业智能化提供更多助力。
目前,国内学者的研究主要集中于金融科技、人工智能在金融中的应用,如金融科技与科技创新的应用[1-2],人工智能与金融科技竞争[3],人工智能与金融革命[4-6],以及知识图谱在金融业的具体场景应用[7-9],少量文献研究了智能金融[10]。本文研究了知识图谱与智能金融的关系,以及融入深度学习技术后的知识图谱对金融业的促进作用。
1 智能金融的逻辑
智能金融的概念是在现代大数据和人工智能技术发展背景下产生的,具备自动化信息处理、辅助决策和部分自决策相结合、自动化执行等特征的金融服务综合应用。智能金融,本质上是人工智能技术驱动的金融创新。从科技角度讲,智能金融的发展,是基于人工智能技术的智能客服、智能风控、智能营销、智能投研、智能投顾等场景的解决方案,人工智能技术能够服务于金融全部业务流程,这也是人工智能能够快速在金融业发展的原因之一。在人工智能技术的运用和大数据的沉淀与挖掘过程中,金融行业的逻辑从标准化、高风险、边界有限向个性定制、安全可靠、场景连接转变,这意味着金融服务的对象更加广泛、金融服务的过程更加安全、金融服务品质更加精细。
1.1 从标准化到个性化和定制金融
智能投顾为客户提供精准定制产品。由于客户的性别、年龄、投资能力等的差异,金融机构的“标准化”产品往往无法满足客户的需求,无法实现客户收益的最大化。智能金融分两步可实现精准定制的逻辑。以智能投顾为例,第一步,精确实现充分了解客户(know your customer,KYC),基于丰富的数据量,人工智能算法可以实现更细的数据颗粒度,将投资者的流动性、负债水平、资金量、储蓄率等数据更细致地融入客户风险偏好、资产偏好中去。第二步,个性定制金融产品。借助人工智能算法,为客户定制适合的金融产品,其收益回报往往更为稳健。
1.2 从高风险到安全可控金融
智能投资量化产品风险。智能投资运用机器学习、量化分析等技术与算法将投资市场上的标的风险进行识别与量化,进而将投资者的资产分散到债券、权益和另类等相关性较低的资产中,使得投资者的资产组合收益来源和波动率来源更为分散,从而有效抵御单一种类资产带来的风险。
1.3 从边界有限到连接金融
智能金融加速了普惠金融的进程,向行业上下游扩展。智能金融已经延伸到传统金融业难以普及到的广大农村地区。以往普惠金融中需要大量人力完成的业务,现已被人工智能及相关技术替代,传统以人力为核心资本以实现普惠金融的逻辑被人工智能改写。
智能金融与不同业态进行组合,这在一定程度上实现了所在行业的上下游扩展。以智能保险为例,人工智能在保险业的运用最早属于金融科技领域,现在应用范围扩大,几乎包含了全部领域,通过将营销、定价、风控、承保、保全以及理赔等内容组合,扩展了保险行业的上下游。
2 知识图谱是金融智能化的基石
作为人工智能的重要分支,知识图谱不仅可以发现数据之间的关系,而且能利用关系进行推理,从而赋予数据更多价值。目前,知识图谱被应用到了搜索、地图、个性化推荐等领域。金融作为一个对数据具有强依赖性的领域,对知识图谱的应用有更切实的需求,已经发展出包括反欺诈、失联客户管理、精准营销、智能搜索和可视化、问答交互在内的多种应用方式。
2.1 知识图谱概述
知识图谱是描述客观世界中实体及其之间关系的一种语义网络,由节点和边组成。知识图谱的发展历程可以追溯到20世纪70年代诞生的专家系统。
知识图谱提供了从“关系”的角度去分析问题的能力,是关系表示最有效的方式之一。如图1所示,在知识图谱中,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。语义类型中最顶层抽象类是实体。其中,实体可分为概念实体和物理实体。概念实体指没有具体实体的对象;物理实体指的客观世界存在的对象。三元组是知识图谱通用的表现形式。所谓三元组,就是由一个表示主语的节点,一条表示谓语的边和一个表示宾语的节点组成一条记录。当围绕着一个主语有很多用三元组表示的关系呈现时,就构建了知识图谱。
图1 知识图谱示意
知识图谱与其他信息源不同之处是它可以由计算机直接访问,而无须任何的人工介入。由于计算机只理解正规的语言,所以知识图谱中包含的信息通常被称为结构化数据,而非结构化数据(如纯文本)只能够被人类理解。从技术层面设计上来说,知识图谱必须考虑两个基本的权衡:一是知识图谱应该具有足够的描述性,以便复杂的知识能够被机器编码;二是这种描述性应该足够的简单,以便计算机能够快速地处理。从领域上来说,知识图谱可分为通用知识图谱和特定领域知识图谱。通用知识图谱包含了大量的现实世界中的常识性知识,强调的是广度;特定领域知识图谱面向特定的垂直领域,强调的是深度。在实际中,知识图谱的应用趋势逐渐从通用领域走向特定领域。不同行业都在关注适合自身的知识图谱技术的应用方式,但目前仍未形成大规模应用。
2.2 知识图谱在金融领域的应用
当前,知识图谱在金融领域的应用仍处于起步阶段,主要应用包括反欺诈、失联客户管理、精准营销、智能搜索和可视化、问答交互。
2.2.1 反欺诈
反欺诈是对包含交易欺诈、网络欺诈、电话欺诈等诈骗行为进行识别的一项服务,而知识图谱的反欺诈计算是对反欺诈分析实时性的体现。知识图谱在金融领域反欺诈方面的应用包括贷前审批和贷中预警。目前知识图谱在金融领域的应用,主要集中在贷前审批管理。在贷前的审批阶段,将借款人的基本信息、消费记录、行为记录、关系信息等整合到反欺诈知识图谱里,比对客户一度、二度关系是否触黑,以及客户消费关联商家是否异常等。同时,利用不一致性检验,对借款人的风险进行分析和评估。例如,当两个借款人填写了相同的电话号码时,这种不一致性就有可能是欺诈行为。
同时,知识图谱还可以有效甄别团体欺诈。甄别团体欺诈的方式有两种:一是根据之前标记的黑名单客户,利用知识图谱确定与其有紧密联系的欺诈用户。二是根据团体欺诈会共享部分信息的特点,利用知识图谱发现不同用户之间的信息关联性,从而识别欺诈团体。
在贷中的交易阶段,通过构建已知的主要欺诈要素(如设备、账号、地域等)的关系图谱,全方位监控借款人的风险数据,对潜在欺诈行为做出及时反应。即使欺诈分子修改了登陆时间和地址之类的行为线索,知识图谱仍然可以挖掘出共用设备、共用IP等可疑特征,从而识别欺诈事件。
2.2.2 失联客户管理
在贷后管理中,知识图谱也发挥着重要作用。当借款人不按时还款并且“失联”时,催收人员的工作难度加大。目前贷后管理对知识图谱的应用,主要是结合借款人授权的通信记录,挖掘与借款人有关系且在相同平台借过款的新联系人,从而重新取得与借款人的联系,提高催收成功率,此技术已广泛应用。同时,各金融机构也在进一步扩充数据维度,如工作单位等。
2.2.3 精准营销
知识图谱在精准营销中的应用有两种形式。一是理解用户。通过知识图谱聚合用户的基本属性,如年龄、学历、消费习惯、搜索习惯等,将这些基本属性加以分类,形成不同的用户标签,展现不同类别用户的身份特质及具体偏好。然后分析客户潜在需求,进行精准推送。二是挖掘潜在客户。基于现有用户的社交网络知识图谱,根据交往方式和频次等社交行为建立关系模型,从而实现潜在用户的拓展。此外,还可以结合所有用户的标签特征,使用社区算法将全局用户细分,识别隐藏在数据深处的价值用户。目前此种形式较为常见,主要是通过借款人之间的推荐关系,挖掘为平台带来大量资金和新客户的推荐人,分析这些推荐人的特征,从而发展新的具有类似特征的客户。
2.2.4 智能搜索和可视化
通过知识图谱,搜索功能可以在语义上扩展更多的搜索关键词,从而获取更全面的信息,通过图谱可视化技术,可以以图形网络的形式展示全方位信息,包括复杂信息和隐藏信息等。
2.2.5 问答交互
知识图谱在问答交互中最常用到的场景是文本客服。首先通过知识图谱创建知识库,在对用户问题进行语义理解和解析后,利用知识库查询、推理得出答案并反馈给用户。通过知识图谱,所有知识点以及连接知识点的边都与问句关联起来,极大地提高了应答的关联性和准确性。
目前虽然知识图谱在金融领域的应用方式多种多样,但是由于应用场景非标准化以及建模较难的原因,导致知识图谱在金融领域的应用还处于初级阶段,尚未形成大规模应用。但知识图谱技术已成为金融科技公司未来技术竞争的关键领域。
3 知识图谱融入深度学习构建知识智能金融
3.1 知识图谱与深度学习的场景应用
国外对于知识图谱与深度学习结合的应用也进行了深入的研究与探索,并取得了很好的效果。例如,2004年在硅谷开始运作的 Palantir,结合客户提供的信息源与公共网络上的事件,提供对海量数据的研究分析,其金融数据分析平台 Palantir Metropolis 可以对金融数据进行复杂搜索、可视化编辑、关联发现等操作。
国内互联网巨头同样在知识图谱与深度学习结合方面进行了研究探索。例如,神马知识图谱已发展为拥有近5000万实体、近30亿关系的大规模知识图谱。百度发布了深度学习平台—PaddlePaddle平台,腾讯公司也发布了DI-X深度学习平台,为用户提供一站式的深度学习服务。
3.2 知识图谱与深度学习助力金融业构建知识智能
在未来的应用中,知识图谱和深度学习将在更多层面形成互补,提升深度神经网络的可解释性,知识图谱技术和方法还将进一步与自然语言处理技术深度融合。知识图谱将帮助金融行业构建有学识的人工智能,走向知识智能时代。
融入深度学习技术的知识图谱,打造知识智能金融,为金融业的高质量服务提供技术支持。①提供更加智能的数据服务。可以为金融问答系统、智能客服系统以及金融智能搜索等业务提供相应的支持,提升金融信息的检索效率,帮助构建知识型的智能金融客服,满足金融业务的实际需求。②帮助解决金融自然语言处理NLP所遇到的技术问题,如实体语义消歧、文本语义理解、文本结构化等。③促进知识驱动的金融决策分析领域深入发展。金融因果关联图谱的精细化构建及深入应用趋势,包括围绕事件构建事理知识图谱、利用事件抽取技术提升新闻事件识别的敏感度、建立事件因果推理知识库、利用事理图谱分析技术对事件影响力传导进行深度分析等。④提升金融预测能力。金融知识图谱在金融预测分析中具有重要的作用,是进行事件推理的基础,可应用于智能投研和智能投顾等领域。例如,当重大事件发生时,可根据产业链图谱推导出未来可能会受影响的公司。⑤让金融搜索更具价值。在智能投研、智能投顾和智能客服等场景,基于深度学习技术的金融问答和语义搜索的技术,不仅使信息获取更加便捷,还可把各方面的相关信息组织成立体化信息,并且能提供一定的分析预测结论。⑥赋能风险评估与反欺诈。风险评估是互联网时代的传统应用场景,是通过大数据、机器学习技术对用户行为数据分析后,进行用户画像,并进行信用和风险评估。引入深度学习技术后,可以进一步提升关系穿透、挖掘的能力,从而侦测欺诈行为,有助于关联交易关联账号识别、信息披露等,在风控领域有较大的应用空间。
4 金融知识图谱的构建与挑战
4.1 金融知识图谱的构建路径
目前,大多金融机构对于数据的应用处于“从信息到知识”的阶段,而知识图谱突破了现有的关系型数据库的限制,从信息中发掘和构建深度的关联,使得信息知识化,提供更加智慧的决策支持。行业或企业知识图谱的建设需要考虑以下3个方面:首先,需要分析行业特点,创建统一的数据模型和视图;其次,要对收集的各类行业数据进行整合,并通过关联计算找出数据间的关系,再使用图数据库保存及展示;最后,建立业务模型对数据进行机器学习,挖掘有价值的信息支撑业务场景。
具体到金融行业,建立知识图谱有3个主要步骤:①从金融机构内部结构化数据、非结构化数据以及互联网采集数据、第三方合作数据中辨别金融实体;②定义并挖掘金融实体间的各种关系,如企业与企业之间的集团关系、投资关系、上下游关系、担保关系,企业与个人之间的任职、实际控制、一致行动关系,从而生成知识图谱;③定义并表达业务逻辑,在知识图谱构建的知识体系中,可以实现各种具体任务,如对企业股权关系、一致行动人、实际控制人等挖掘,担保圈、担保链、担保群挖掘,疑似欺诈交易发现及欺诈团伙追踪发现等,及时发现商机和识别风险传导机制。
此外,金融知识图谱还包含了很多其他的形式,如A股的公司、港股和美股的公司,各种基本面的数据、行情的数据等都在逐渐知识图谱化,还有公告数据、研报数据及工商数据等都是金融知识图谱的分支。
4.2 金融知识图谱构建的挑战
当前,知识图谱在金融业还没有形成大规模的应用,很多仍处于调研阶段,主要原因在于金融机构知识图谱理解不深以及知识图谱本身构建的困难,具体体现在数据的可访问性、数据的可发现性、领域知识的集成以及策略的生成4个主要方面。
以策略的生成为例。现有阶段,机器在业务场景中还无法完全替代人类的作用,而是辅助人类做出价值判断、风险判断,通过过往的案例或者既定的逻辑,为人类推荐可行的策略。具体场景有:在用户交互层面,有意图理解、语言生成、用户画像匹配等;在业务层面,有逻辑生成、投资模型、风险模型等;涉及的数据处理有规则提取、知识库建设,语义检索、逻辑推理等。
在智能金融时代,金融知识图谱构建主要有两个方面挑战。一方面,需要着手进行面向人工智能的大数据治理,在数据层面上通过知识图谱将原有的金融数据再次加工、整理;另一方面,进一步把知识图谱等人工智能技术的服务能力开放给传统的业务系统,进行面向人工智能的服务治理。