基于大数据的宏观经济现时预测理论与方法研究
2021-10-08
首席专家吴力波教授 由吴力波教授主持的国家社科基金重大项目“基于大数据的宏观经济现时预测理论与方法研究”(15ZDB148)立足大数据发展时代背景下,考察数据自身发展和演化的特征,全面系统地梳理了宏观经济预测研究中大数据应用的可能性与必要性;在比对国内外相关领域大数据应用的案例、梳理现有机器学习等大数据研究方法的基础上,结合劳动力市场、金融、商品价格、海运和能源等领域的具体应用场景,完成从数据采集、清洗、量化到预测的全环节研究模式的创新和相关指数的产出。2015年立项以来,课题组根据研究方案,开展了丰富的讨论、研究与合作。相继召开了第一届、第二届、第三届上海市大数据社会应用研究会年会,并举办相关学术分论坛进行专家、学者交流与讨论,如“新基建与数字经济创新逻辑论坛”、“青年学者论坛”等;亦定期举办相关学术沙龙,深入探讨大数据社会科学领域的最新进展与可拓展场景;同时,与国内外知名高校团队进行相关主题学术交流,组织课题组研究生参与国内外学术论坛,进行交流与学习。鉴于现有宏观经济预测体系中存在的问题,课题组首先经过文献梳理与调研,形成以下判断:第一,当前宏观经济预测指标体系存在低频、依赖人为调查、局限于传统经济学理论框架而忽视潜在相关关系等问题;第二,宏观经济为复杂动态系统,具有显著非线性、动态、随机性等特征,传统结构化模型、计量模型、时序模型等无法有效适应研究需求;第三,可改进之处应至少包括指标体系更新与重构、预测模型更新与重建两条路径,且从宏观经济调控的主要任务看,劳动力市场、金融、商品价格、海运和能源等领域是目前具备大数据宏观经济预测的必要与可行场景。课题组以此出发,在对过往理论和方法进行梳理的基础上,针对上述应用场景展开研究。在劳动力市场领域,课题组利用手机信令数据构建个体频率分布模型,通过高斯混合模型对手机用户的行为状态予以分类,并延伸至对用户非就业状态的推断与非就业率的计算;同时,针对新冠疫情,经外推对上海市劳动力市场的影响进行预测。在金融领域,课题组使用金融财经新闻文本信息,通过关键词提取和序列标准化处理,构建覆盖日、周、月三个频度,包括贸易、财政、汇率、制造业等多个领域及总体宏观经济政策不确定性指数,满足多维监测要求;在此基础上,设定GDP增速和人民币汇率预测场景,利用多步多元回归、机器学习、混频抽样等方法构建预测模型,并证明上述指数能够提升相关领域的宏观现时预测能力。在贸易领域,基于船舶实时位置数据,利用复杂网络方法和船舶到港、出港的数量及船舶载重等变量,最终实现实时更新、实时预测,并进行进出口短期预测模型实证检验。在商品价格方面,使用线上商品与价格数据,采用FEWS方法构建线上商品物价指数,并证明其对官方CPI指数、M2有提前预测能力。在能源领域,课题组使用企业日度用电数据,运用复杂网络模型构建行业间复杂网络;在此基础上,结合相关外部数据,通过隐马尔可夫模型构建景气指数并对未来进行预测,发现该指数可反映细分行业产值增速变化及未来行业景气程度的变化,并可用于监测行业受外部冲击的影响。