浅谈数据驱动研究范式在经济研究中的变革与创新
2018-05-31许辰迪
许辰迪
摘 要:随着经济社会的不断发展,数据应用也越来越广泛,本文将以经济学研究方法的历史脉络为切入点,浅谈数据驱动研究范式在经济研究中的运用创新,并对未来研究方向提出构想。
关键词:经济研究方法 数据驱动
一、经济学研究范式的概念及演进
在经济学研究中使用的“样例”即为经济学研究范式。著名哲学家托马斯·库恩首次提出了范式的概念。他认为范式应由两个方面组成:其一,范式是由某一个科学共同体的所有成员在某一个特定时期都能接受的一系列基本的理论假设;其二,由上述理论假设解决了的、出现在相关学科教科书上的一系列“范例”或特定科学问题。总的来说,范式是连接科学共同体并且允许常规科学发生的一系列共享的假设和价值观。
世界是不断发展的,研究范式同样也是持续发展变化的,随着新生事物的不断涌现,当固有的研究范式不能指导人们对未来世界进行探索时,其历史地位将得到挑战,新的理论、模型逐步被整理、归纳,再经过人们反复论证后,新的范式得以确立。从经济学研究范式历史脉络来看,基本可以分为思辨(经验)驱动研究范式、模型(实证)驱动研究范式和数据驱动研究范式三大研究范式,它们各自出现在不同的历史时期,在人类社会的发展中,起到了至关重要的作用,尤其是在经济社会中刻上了其深深的烙印。
(一)思辨(经验)驱动研究范式的贡献
思辨驱动研究范式以文字表述为主,它在人类文明尤其是经济社会研究中扮演着举足轻重的角色,并沿用至今。思辨驱动研究侧重于利用纯粹的文字来阐述自身观点,其中大多夹杂了当时学者结合自身生活经验所得出的结论,虽鱼龙混杂,但其中也不乏真知灼见,并且由于文字表达通俗易懂,迅速在社会中引发了激烈的大讨论,有些还被记录整理成册,广为流传。人们现在所熟知的许多经济学经典理论,也多出于此,例如“马太效应”、“看不见的手”等,直至今日仍在经济学理论研究中发光发热。
(二)模型(实证)驱动研究范式的产生
随着经济社会的不断发展,人们越来越意识到,仅仅通过文字描述的经济现象研究远不能满足人们的需求,纯粹使用文字语言逻辑的理论往往存在不说明假定的现象,最后得到的结论也可能出现与假定矛盾的违背,并且文字语言的表达经常出现逻辑混乱和表达错位。不严谨性成为联系经济学模型与实际经济数据的硬伤,经济学发展出现了史无前例的瓶颈期。所幸当时数学与物理学的完美结合让人们看到了希望。数学作为人类思维最伟大的结晶,有着无与伦比的逻辑性和严密性,其表述的清晰严谨性也是自然语言所不能达到的,尤其是在近代以来,数学帮助物理学成为了典范科学,一下拓宽了人们研究经济问题的思路。例如边际革命创始人之一的门格尔的一段话:如果用p记这种物品的价格,用q记对它的需求,那么,q=f(p),dq/dp=f'(p)<0。若我们将这段话转变为纯粹的文字表述,则为一种物品价格越高,与之相应的需求越小(或不再增大),由此,数学的简洁及精准性完全突显出来。从此,相对精确性词汇逐步成为经济学研究的表述用语。
(三)数据驱动研究范式的崛起
隨着历史进程的发展和科学技术的不断进步,人们了解世界、认识自然、研究事物、掌握规律的手段和能力不断提高。从根本上来看,大数据提供了一种新的认识世界的方法,它将世界的本质看成是数据的集合,用数据化思维和先进的数据处理技术去探索数据之间的关系,构筑一个更加透明化、模块化的世界。由于计算机技术的迅猛发展,加之智能优化算法的出现,使得处理复杂多变、体量巨大的数据成为可能,推动了数据驱动研究范式的异军崛起。与时俱进是经济学研究一直保持旺盛生命力的根源,经济学作为重要的社会科学学科,要想继续为人类社会做出贡献,就必须从理论层面作出实质性的革新。
数据大爆炸给经济学研究带来了全新的挑战和机遇,可以说,是数据处理技术的进步直接推动了经济学研究方式的前进。数据驱动研究范式具有思辨驱动研究范式、模型驱动研究范式不可比拟的优势。
二、数据驱动研究范式在经济学方法论中的技术创新
(一)数据处理客观化、精细化
传统的模型驱动研究范式相较于数据驱动研究范式有其天然的劣势。首先,模型驱动研究范式是基于经典的数理统计理论发展而来,而经典数理统计受限于当时统计技术和理念的发展进程,有一个非常重要的前提,以样本推断总体。样本选取的好坏直接影响人们对于整体数据的研判,然而,无论人们如何利用技术手段减小样本选取的随机性,数据分析的误差仍难以避免。其次,传统模型驱动研究范式加以分析、考察的数据,大多是已经被“人为修正”过的数据,如若此,利用该数据所得到的研究结论,其客观性与真实性必将大打折扣,可信度也将打上问号。例如在日常生活中,每当国家相关统计部门发布季度或年度国家统计数据时,人们总会根据自身生活进行对照比较,有时难免会产生些许质疑。反观数据驱动研究范式,得益于现代统计技术和理念的不断发展,相较于之前的研究范式,其拥有得天独厚的优势,摒弃对样本数据的考察,直接从总体数据入手,对整体数据全盘分析,进而得出研究结论,从根本上弥补了传统的抽样方法和其他模型设计的天然缺陷,对数据的应用产生了深远的影响。
(二)增加研究应用普适性
以往的思辨驱动研究范式和模型驱动研究范式,由于所处时代的技术局限性,所做研究往往特殊性显著,又受多种假定限制。正是由于传统模型的多种假定限制,导致模型的适用性性大大减弱,不具备推广的要求。但在大数据时代,由于有足够的变量、足够的数据,数据驱动研究不需要做出过多的假设,突破个体研究的限制,以点及面,由特殊性规律推广到一般性规律,大大增加了研究的普适性,无论从应用层次还是从理论层次,拓宽了人们的研究方向。数据驱动范式摆脱了传统模型与理论框架的束缚,真正实现了“从数据中来,到数据中去”,从实际数据出发,挖掘数据、处理数据、规范数据、总结数据,最终从数据中得到结论,其研究流程由过往的“假设—验证”固有研究范式,变为“发现—总结”,突破了模型驱动前提假定的局限性。
(三)弱化事物因果性,加强事物相关性研究
传统的思辨驱动研究范式和模型驱动范式,往往停留在弄清事物之间的内在联系和作用机制,了解之间的因果关系,但在大数据时代,这样做是远远不够的、是有局限性的。数据驱动研究范式具有较高的 “智能性”,真正将事物置于普遍联系之中,透过数据看本质,大大提升了研究的广度和深度。传统经济学侧重于研究事物的因果关系,但实际结果难以检验,并且没有实际意义。例如在日常生活中,由于汽油价格的上涨,与汽油互为互补品的家用汽车的需求量就应有所下降,汽车价格也会下降,但另一方面,大家都看到了汽车价格的下降,其价格降到自己的心理预期价格,那么人们又都开始增加汽车的消费,在一段时间内又会造成汽车的供小于求,从而导致汽车价格回升,那么如何分析汽车价格的涨跌,若利用传统研究范式,则很难说明。然而,数据驱动研究范式,对海量相关数据深入进行了分析,从中挖掘出汽油与汽车之间的供求影响关系。该研究范式摒弃了传统思辨驱动研究范式的思维方式,弱化了事物的因果关系,而且加强了事物相关性联系研究,从而验证出事物之间的内生性联系。
(四)具有预测学习功能
传统的思辨驱动研究范式和模型驱动研究范式,受限于当时的思维和技术水平,不能进行事前预测研判,对于事物的分析往往扮演着“事后诸葛亮”的角色,具有一定的滞后性。而数据首先具有“实时预测”的特点,所谓“实时预测”,实际上就是利用大数据技术对经济数据进行及时的监测、归集和整理,尽可能缩小可用于预测的信息和需要被预测的内容之间的时间差;其次经济学家利用现代高效的数据处理技术,提取有效信息,摒弃无效信息,排除人为因素干扰,能够对事物进行事前研判,进而对其发展趋势整体把握,具有前瞻性;并且数据驱动研究本身就具有自我学习、自我升级的能力,留有发展冗余,可以进行学科交叉交流,分享新信息,研究新現象,预测新前景,可以进一步拓展经济学理论研究和实际应用的范畴。
三、未来展望
数据驱动研究范式,无论是在经济学方法论的理论研究和实践应用两个层面,已取得了具有历史意义的进步。数据驱动研究范式,在经济学方法论中的应用是分析方法、数据管理和分析策略的完善提升和技术创新,即从基于“正态”均值和标准差的科学研究,转变为基于个体观测值的研究。数据驱动研究范式,将发展成为一门具有独立性、完整性的方法论,是经济学中一次伟大的理论飞跃;将会对经济学研究带来革命性的改变和进步,给研究经济学方法论的准则、基本原理带来质变和量变的双重挑战。
党的十九大胜利召开,标志我国已经迈入从富起来到强起来全面发展的新时代。我们可以乐观地展望,在未来的十年,将迎来数据驱动研究与经济学研究相结合的蓬勃发展期,数据驱动研究范式将会成为研究经济学的主流方法,成为影响和改变我国经济发展政策的主要决策技术手段之一,将有力地促进我国经济社会的全方位全领域发展。从另一个层面说,数据驱动研究的不断深入拓展完善,必将对世界经济学理论研究、对世界经济社会发展起着十分重要的促进推动作用。
参考文献:
[1]阿尔文·托夫勒,《第三次浪潮》,1980.
[2]崔俊富,邹一南,陈金伟,大数据时代的经济学研究:数据驱动范式[J].广东财经大学学报,2016.
[3]黄庆华,陈婉莹,基于互联网金融平台的大数据征信应用研究[J].科技与经济,2017.6.
[4]于晓龙,王金照,大数据的经济学涵义及价值创造机制[J].经济观察,2015.
[5]2017中国大数据产业生态地图暨中国大数据产业发展白皮书,2017.