APP下载

数据与AI“再造”投资分析

2021-04-16周尚颐博士(ChristineChow)

董事会 2021年3期
关键词:再造报告人工智能

周尚颐博士(Christine Chow)

作为投资专家,我们使用主成分分析(PCA)来识别影响投资组合绩效的关键风险因素。这是与其他技术(例如多因素风险分析或与主成分分析的混合组合)一起使用的传统统计方法之一。在过去30年中,统计分析工具箱已大大扩展。现在,我们有了一个更吸引人的选择,使用机器学习。我们通常称之为人工智能(AI)。

若要使人工智能在投资分析中发挥作用,我们需要三个关键要素:

为什么要使用AI?了解您的问题。用户必须了解他们试图解决的问题,并为每个应用程序设定明确的目标。这是因为AI的核心是优化工作。

我们拥有什么,缺少什么?了解您的数据。找出可用的数据以及需要创建或编译的数据。如果涉及非结构化数据,例如新闻提要或社交媒体帖子和视频,则必须有一种清晰的方法将非结构化数据转换为可用格式。某些任务(如同行基准测试)需要可比较的数据,这正是投资者现在迫切需要的。本文重点介绍了当前关于通用报告准则的争论,并分享行业合作如何超越通用报告,为投资者创建可比可信数据的例子。

怎么做?了解您的算法。一旦获得可信的相关数据,就可以在投资组合管理中应用合适的AI技术。目标可能是最大化关键绩效指标(例如Sharpe比率或Information比率),或最小化风险指标(例如风险价值(VaR),标准差或跟踪误差)。人工智能可以用来构建具模仿全指数性能特征的增强型交易所买卖基金(ETF)。它也可以用于回测和方案分析。

AI并非适用所有的投资分析

并非所有的投资分析都可以利用AI,但是当使用AI时,我们必须首先了解我们要解决的问题并设定明确的应用目标。

例如,“发展业务”不是一个明确的目标,而是“优化销售”。“评估董事会的有效性”不是一个明确的目标,但“最小化连锁董事”却是明确的目标。这是因为从根本上讲,人工智能就是要使用Deisenroth,Faisal和Ong(2020)所著的《机器学习的数学》一书中(图1)所述的一种或四种常用技术的组合来最大化目标函数:

图1:人工智能中的关键优化技术

图2:全面的公司报告

AI可以根据倾向得分找到适合客户购买的投资基金,通过在正确的时间和正确的价格提供相关报价来最大化购买机会。这结合了行为科学和客户细分。即使匿名了个人数据,我们与之互动的每个使用AI进行定位的业务也很可能将我们每个人都归为特定客户类型。亚马逊(Amazon)或网飞(Netflix)等公司多年来已经在其他行业实施了上述做法,它们根据我们的个人资料、过去的购买情况和浏览历史,推荐下一个购买项目或下一部最喜爱的电影。

建立共同的报告标准

有效的预测需要高质量的人工智能分析数据。数据是目前投资业面临的最大挑战。

在英国两年一度的气候与绿色金融监管论坛上,主题演讲者提出的紧迫问题指出了“误导的现实”,即公司信息(尤其是可持续性信息)趋向于不一致。对于财务信息,国际财务报告准则(IFRS)基金会和国际会计准则理事会(IASB)已经建立了描述公司财务业绩和状况的标准化方法,以便公司财务报表在国际范围内易于理解和可比。但是,对于可持续性信息,公司可以选择报告标准和评级,从而导致对绿色清洗和/或可持续发展目标(SDG)清洗的担忧。

投资行业呼吁调整数据定义和报告标准。为此,世界经济论坛(WEF)和影响管理项目(IMP)一直在与从业人员合作,以建立一个全面的报告系统。它发布了一个概念框架,以企业价值和与气候相关的财务披露为例,将关键报告标准整合在一起,包括它们如何相互关联(图2)。

改善公司数据质量的挑战

建立一个统一的报告系统正在进行中。但是,它仅解决了部分但不是全部挑战。

影响报告可信度的深层次问题在于公司级数据的质量。这可能与遗留IT系统中的约束、全球运营中策略应用的不一致以及难以将某些业务活动归类为确定的和独占的存储库有关。例如,Adelphi和ISSESG的《欧洲可持续金融调查》以及欧洲银行基金会(EBF)和UNEPFI的《测试欧盟分类法在核心银行产品中的应用》等报告都提供了实例。

为特定目的标记数据存在操作挑战。例如,银行企业贷款系统往往按部门和行业建立,以适应关系经理团队结构和专业知识。款项用于一般用途贷款或循环信贷并不一定能在系统得到分类。这些问题在EBF和UNEPFI报告中被认为是一些最重大的挑战(请参阅报告第32页和第36和39页的林业案例)。当贷款在集团层面得到批准,资金被分配给多个当地法律实体时,这些挑战就被放大了。

来自机器读取和卫星图像的非结构化数据

除了上述报告和数据系统问题外,投资者还受到更多非结构化数据的轰炸。根據Wikipedia的说法,非结构化数据是指没有预定义数据模型或没有以预定义方式组织的信息。它通常是文本密集型的,但也可能包含日期、数字和图像等数据。

根据NBER的论文《机器倾听时如何说话:人工智能时代的企业披露》(Howtotalkwhenamachineislistening:corporatedisclosureintheAgeofAI),年报越来越多地被机器阅读,用于内容提取和情绪分析。它使用一种通用的人工智能技术,称为自然语言处理(NLP)或自然语言理解(NLU)。在美国,从美国SECEDGAR数据库下载的机器数量占所有下载量的比例,从2003年的39%增加到2016年的78%。考虑到近几年人工智能驱动的网络抓取活动的爆炸性增长,到2021年,这个数字很可能已经显著增加。

数据和分析公司如埃信华迈(IHSMarkit)开发了一个ESG报告存储库平台,由其AI引擎Goldfire提供支持,以组织非结构化数据,帮助公司改进报告并构建可持续发展概况。公司可以上传自己的报告和用户定义的资料。该平台使用NLP将相关信息与报告标准(如GRI(全球报告倡议)、SASB(可持续性会计标准委员会)、TCFD(气候相关财务披露工作组)和UNSDG)相协调。其DigitalGlobe卫星图像服务可提供地理空间数据,以跟踪土地使用情况、检测森林砍伐情况以及监测能源管道状况和传输。

投资者越来越多地使用地理空间数据,来实时或接近实时地监视被投资公司的业务绩效,并提高供应链的透明度。保险公司將地理空间数据用于承保政策、定价以及理赔。平安保险使用NLP技术建立了“绿色清洗”指标,以了解公司气候披露的广度和深度,并将其与公司特征和财务绩效联系起来。TruevalesLab已创建工具和产品来帮助投资者发现隐藏的见解。使用数据和人工智能进行投资分析的复杂性只会增加。使用锚定或官方信息源,每周平均计算以筛选新闻峰值是抵抗错误信息风险的多种方法之一。

决定和创建有用的数据需要行业级的协作

在数据爆炸的时代,决定什么是重要的,以及如何使用这些信息是至关重要的。投资者应该如何应对?采取基于行业的方法似乎是最明智的。

《波塞冬原则》于2019年6月18日在纽约发布,是金融部门和航运业之间达成的一项协议,旨在将国际海事组织(IMO)关于气候变化的政策纳入航运金融决策过程。公司必须遵循所有业务活动的技术指南,包括船型编码系统、特定的碳强度度量标准(即航运业的年度效率比(AER))的计算,以及三种允许的脱碳路径计算方法的选择。签署者,主要是银行内的航运金融实体,仅依靠技术指南确定的数据类型、数据来源和服务提供者进行评估,以确定贷款决定。因此,数据和分析的“价值链”在公司和金融家之间是一致的。

气候变化是一个全球性问题。令人放心的是,《波塞冬原则》的签署国包括发达和新兴经济体的银行——来自欧洲和亚洲。采用行业统一的方法可以使投资者将苹果与苹果进行比较,从而做出明智的投资决策。

结语

可信数据是投资分析中有效应用AI程序的命脉,这仅仅是因为有据可查的“垃圾填埋”现象。一旦质量确保相关数据可用,就可以将合适的AI技术应用于投资组合管理。目标可能是最大化关键绩效指标(例如Sharpe比率或Information比率),或最小化风险指标(例如风险价值(VaR),标准差或跟踪误差)。人工智能可以用来构建具有更少的模仿全指数性能特征的增强型交易所买卖基金(ETF)。它也可以用于回测和方案分析。此类应用程序的详细信息可能需要单独撰写关于“数据与AI‘再造投资组合管理”的文章。

本文作者周尚颐博士(Christine Chow)是伦敦经济学院(LSE)法院和投资委员会成员,国际公司治理网络(ICGN)董事会成员,英国人工智能全党议会小组(APPG)数据治理工作组成员,香港科学技术大学(2014—2016)的金融学兼职教授。本文中表达的观点是个人观点,不代表作者可能以专业或个人身份与之相关的个人、机构或组织的观点,除非明确说明。

猜你喜欢

再造报告人工智能
2019:人工智能
人工智能与就业
数读人工智能
报告
下一幕,人工智能!
互联网思维与传统企业再造研究
报告
报告