关于完全数据驱动化的经济监测预测方法的思考与建议
2019-09-25易成岐刘琦
易成岐 刘琦
以5G、大数据、人工智能等为代表的新一代信息技术革命正在深刻影响着当前经济社会运行的各领域、各方面、各环节,技术变化已然成为推进宏观调控理念变革和方法创新的深刻动因。探索建立一套快速有效、适配变化、智能精准的经济监测预测方法,既是进一步有效提升宏观调控水平的重要支撑,也是政府加快顺应时代变化的历史使命,同时能够为我国实现高质量发展、创造高品质生活、推进高水平开放提供更加强大的驱动力。
以习近平同志为核心的党中央高度重视大数据智能化与经济监测预测相结合的重要工作,并在十九届三中全会上明确指出:“要强化经济监测预测预警能力,综合运用大数据、云计算等技术手段,增强宏观调控前瞻性、针对性、协同性”,将新一代信息技术在经济监测预测预警中的作用提升到了新的高度。本文以实际应用需求为导向,尝试性剖析了当前经济监测预测方法面临的挑战,阐释了完全数据驱动化的经济监测预测方法的总体思路、关键问题和对策建议,以期提供有益思路。
一、复杂经济形态下传统经济监测预测方法面临的四大挑战
(一)时效难:依赖历史统计数据难以实时研判最新态势
现行的经济监测预测方法大多基于历史统计数据进行分析或预测未来的数据变化走势,但此方法往往受制于统计数据的时效性。传统统计数据主要是通过开展经济普查、抽样调查、重点调查、典型调查等手段,利用层层报送数据的方式汇总计算相应宏观经济指标,这种方法最明显的缺陷是具有很强的时滞性。在应对重大突发事件和高频度经济震荡时,传统经济监测预测方法很可能会导致政府决策部门后知后觉,容易造成决策失误等严重后果。
(二)细分难:统计样本的局限性容易导致分析粒度不足
统计样本的数量和样本获取的成本往往成反比,随着统计样本量的增加,统计过程中的时间成本、人力成本和资金成本等均会相应急速增高,因此统计样本的覆盖范围存在一定的局限性。由于传统经济监测预测方法高度依赖统计数据样本,一旦样本出现偏颇,一方面,很容易导致分析预测结果精度不足,另一方面,很难为细分行业及新兴行业的经济决策提供有效支撑。
(三)客观难:人为误报等因素可能会造成结果不够客观
传统统计数据的产生需要大量使用人工进行搜集、加工、上报及汇总,不仅人为参与的程度较深、耗费的时间周期较长,而且统计流程也较为复杂。由于人为参与了全过程中过多环节,无论是出于主观考虑或出现客观失误,都极易发生数据迟报、漏报、瞒报、误报等现象,此时往往会存在统计样本真实性偏差的隐患,如果使用这种存在偏差的数据进行经济监测预测,则会进一步扩大误差范围。
(四)精准难:经济监测预测尚未与最先进技术紧密结合
以经济学家主导的经济监测预测模型拥有相对成熟的经济理论作为支撑,主要包括结构化计量预测模型、非结构化时间序列预测模型和动态随机一般均衡预测模型三类,其能够较好地解释经济社会运行的关键影响因素。但当今世界,全球发展深层次矛盾突出,保护主义、单边主义思潮抬头,多边贸易体制受到冲击,我国经济也由高速增长阶段转向高质量发展阶段,全球经济整体发展环境面临诸多风险和不确定性,面对这一错综复杂的变化,传统计量方法的种种假设也常常不符合当下的经济现实。同时,传统经验理论往往会与现实情况产生一定偏差,传统经济监测预测模型略显乏力。而目前以BERT、XLNet、RoBERTa等为代表的深度学习技术已经在诸多领域展现出超凡的预测能力和实用价值,但是却未能与经济监测预测深度结合。
二、完全数据驱动化的经济监测预测方法总体思路和关键问题
正如前文所论述,基于历史性统计数据去分析或预测未来的数据变化走势会存在时效难、细分难、客观难、精准难等诸多难题。在这种情况下,有效利用微观数据和新型技术手段改进经济监测预测方法,已经成为政府决策者和学术研究界共同关注的热点问题。以微观经济学权威—瓦里安教授为代表的一批顶级科学家指出,以机器学习、深度学习、复杂网络等技术为代表的大数据方法正在改变经济学的研究范式。全球多个顶级期刊也纷纷推出了有关“监测预测”的专题,通过多项研究实践成果解读了新技术对经济社会多方面监测预测的最新研究进展与未来方向,大量理论方法和实践经验已经在一定程度上证明了完全数据驱动化的经济监测预测方法的可能性。
(一)完全数据驱动化的经济监测预测方法总体思路
完全数据驱动化的经济监测预测方法的总体思路如图1所示,可概括为:“N+1+3”,即汇聚N种多源数据、突破一项关键环节和沉淀三种数据资产。
匯聚N种多源数据。要尽可能大范围引入可持续稳定获取的细粒度数据资源,包括但不限于投诉举报、裁判文书、企业关联、房产价格、就业招聘、卫星灯光、专利论文、搜索引擎、道路拥堵、新闻舆情、招标中标、网站运行等相关数据。
突破一项关键环节。在充分吸收国内外经济监测预测理论基础和模型方法精髓的基础上,需要大面积应用机器学习、深度学习、复杂网络、自然语言处理等信息技术。一方面,可以减少人工假设和人为经验的控制程度;另一方面,可以从多源细粒度数据中抽取大量的数据特征,不断尝试数据特征的组合方式,与监测预测目标结果进行自动化碰撞,并根据监测预测效果不断优化调整数据特征及相应算法,最终由机器自动化选择一种最优组合,从而达到经济精准监测预测效果。
沉淀三种数据资产。要以“万物皆数”为指导思想,不断沉淀经济监测预测各环节的过程性数据,利用技术手段加深数据提取的广度和深度,通过实践过程中所沉淀的数据特征库、算法模型库、预测指标库不断倒逼技术方法迭代升级,加快弥合经济监测预测与新技术之间的缝隙。
(二)完全数据驱动化的经济监测预测方法的关键问题
完全数据驱动化的经济监测预测方法需要解决以下三类关键问题:一是数据供给问题。如何实时、快速、准确、稳定地获取散落在社会各处的碎片化微观数据是完全数据驱动化的经济监测预测方法的重要支撑保障,也成为当前关键问题之一。二是特征工程问题。数据和特征决定了机器学习和深度学习的上限,而模型和算法只是尽可能逼近这个上限,因此如何为完全数据驱动化的经济监测预测方法提供尽可能多的特征提取思路是关键问题之二。三是核心技术问题。能否突破跨学科的监测预测核心技术是关键问题也是难点之三,主要包括能够利用到特征提取中的自然语言处理、复杂网络、深度学习等相关技术,如:将高维空间的特征通过映射或者变换的方式转换到低维空间的降维技术、涵盖分类预测及数值预测的机器学习和深度学习技术、将结果化繁为简的数据可视化技术等。
三、加快利用完全数据驱动化的经济监测预测方法的对策建议
(一)加快构建多源数据的实时采集汇聚机制
经济社会是由无数个政府机构、企业、个体、车辆、物品、媒体和各类社会组织等本体共同组成的复杂系统,因此要围绕人、企、车、事、物、地等本体对象,强化对脱敏后数据资源的统一归集和整理,主要包括与企业生产经营过程密切相关的业务流数据、全域商品交易数据、终端车辆定位数据、高分卫星遥感数据、互联网各类数据等相关数据资源。
(二)着重推进重点领域的经济监测预测工作
充分考虑区域协调发展、科教兴国、人才强国、创新驱动发展、乡村振兴、可持续发展等国家重大战略需求,围绕完全数据驱动化的经济监测预测方法的关键环节,加快构建重点领域的特征工程体系、实时动态监测体系、预测预警感知体系和综合研判支撑体系。
(三)开展经济监测预测关键技术的前瞻性研究
有机协同政府机关、高校智库、科研院所、企事业单位、金融机构等,开展经济监测预测关键技术的前瞻性跨学科研究,强化多源异构数据特征与传统统计指标的回归比对和关联分析,形成面向经济监测预测的“政产学研金用”合力。
(四)建立经济监测预测上下联动的工作机制
国家有关部门应鼓励各級政府积极参与完全数据驱动化的经济监测预测应用示范工作,各方共享应用成果,积极宣传展示各级政府部门经济监测预测应用工作成效,为国家层面经济监测预测应用机制快速建立奠定基础。
〔本文系国家社科基金青年项目“使用大数据方法开展社会政策评估的探索性研究”(项目编号:18CSH018)阶段性成果〕
(易成岐、刘琦、李慧颖、任可,国家信息中心大数据发展部干部。聂磊,北京大学信息管理博士研究生)