新数据观与数据决策
2017-11-23韩和元
韩和元
领导力Leadership
新数据观与数据决策
韩和元
决策者和经济学家都必须抛开传统观念的束缚,像数据分析家们那样学会倾听数据发出的声音。
决策的科学化离不开精确的信息。当前,传统数据观和数据方法已成为科学化决策的障碍。决策不科学,必然影响到经济决策的质量,进而影响一国经济治理能力和经济发展。所幸的是,我们如今已处于一个大数据的时代,这为经济治理之变提供了无限的可能。
注水统计与牛鞭效应
上世纪60年代,美国麻省理工学院斯隆管理学院的约翰·斯特曼教授,做了一个著名的试验──啤酒销售流通试验。在试验中,斯特曼将MBA学员们分为四组,分别扮演消费者、零售商、经销商、厂家的角色,并要求任何上、下游企业间不能交换任何商业资讯,只允许下游环节向上游企业传递订单。结果是:在游戏开始阶段,无论是下游零售商、中游经销商还是上游制造商,起初都严重缺货,最后却以严重积货而结束。
更有意思的是,近50年来这个游戏在各著名高校MBA的课堂上,被不同国家、不同种族、不同文化、不同经历的学员们玩过上万次了。不管换上谁来玩这个游戏,最后都会发生相同的危机、产生类似的结果。
宝洁公司也发生过同样的问题。在研究它的拳头产品“尿不湿”的市场需求时,宝洁公司发现了一个颇为怪异的现象:该产品的零售额相当稳定,波动性不大,但在考察订货情况时,发现波动性明显增大。对于这种怪异的现象,调查发现:零售商往往根据对历史销量及现实销售情况的预测,确定一个较客观的订货量,但为确保不至发生断货,他们通常会在该订货量的基础上,做一定放大后再向经销商订货。经销商基于相同的考虑,也会再作一定的放大。订货量就这样一级一级地放大,可怕的市场“泡沫”就此形成。
这一现象引起了美国麻省理工学院福雷斯特教授的兴趣,并将这种需求在信息传导过程中变异放大的现象称之为“牛鞭效应”。在他看来,“牛鞭效应”暴露了信息链中信息传递中的问题。由于信息链中各节点间资讯的不对称,以及各节点间为了追求自身利益的最大化,从而造成资讯在信息链内部传递时失真。正是如此,信息链的长度成为了影响信息失真的一个决定性因素。
科层制管理,职位分等,下级接受上级指挥,且层级多,整个信息的传递就如啤酒游戏一样,一级一级的传递,这就部分地解释了传统统计数据为什么水分那么高了。同时,在传统政绩考核体系下,官员要想戴稳自己的乌纱帽、要想获得晋升,就必须得有硬梆梆的政绩,“官出数字、数字出官”的潜规则便开始大行其道,这就使得在官僚制内部本已失真的信息,在流通中进一步被扭曲了。最近曝光的辽宁经济数据造假案就是典型案例。
上世纪90年代,宝洁公司为防止“牛鞭效应”的再次出现,就试图改变原来的决策模式,变被动等结果为主动介入和挖掘过程。为此,宝洁公司开发了一套销售系统软件。通过这套软件,区域经销商的销售、库存情况,都能了然于心。 并以此为依据,来决定它的销售政策、广告策略、产量和原材料的采购及自动配送。
在大数据背景下,数据来源范围越加广泛,数据采集渠道也更为多样。目前各国的统计数据产生流程,主要是借助于手持数据采集器、管理系统、汇总程序,通过层层汇总上报,然后生成各类数据。而在大数据时代,统计数据生产的方式也必然随之改变,政府的“决策支持系统”在各主要资源和产品交易机构、及商家的交易平台和销售系统中,加入查询、筛选、萃取、导入等一系列智能技术操作端口,以此作为数据入口,来获取所需各种信息。
这种转变有助于防止基层人员,基于利己原则对上报来的信息所做的人为选择;其次在于有助于减少信息传递的层级,杜绝因信息传递层级过多而造成的牛鞭效应。
“数据混搭”与“克强指数”
所谓的数据混搭,就是指不单纯的依赖某一指标,而是多渠道的采集信息,来进行综合反馈。
我们且来举个例子,当你决定买房时,你对开发商给出的天花乱坠的数据,自然有些存疑。为了验证开发商所给出信息的证伪,你可能会于晚上通过亮灯率来判断这个小区的实际入住率。当然,开发商也许比你想象的要狡猾,他早让保安将小区里那些空置房的灯全给打开了。如果你是一个严谨的人,这时你就会去观察他的用水量,毕竟有人住的房子,肯定需要用水的。你还可以观察这个小区的生活垃圾量,这个更不好做假的。通过用电量、用水量,乃至垃圾数量,都可以帮你验证、测算小区的实际空置率情况。这就是数据混搭。
正如李克强曾坦言,他主政的辽宁省的GDP数据不太可靠,他更喜欢通过用电量、全省铁路货运量和新增贷款额三个指标,以此追踪当时辽宁省的经济动向。《经济学人》杂志将李克强所提到的三项指标予以综合,带入一个程式,创造出了一个全新的经济指标,命名为“克强指数”。
相较于GDP这一经济指标,“克强指数”的确有其科学、合理且独到的地方,它更加切合经济发展的实际。这三大指标在统计上也更为简便、快捷,而且易于核实,因而能更加真实、客观、直观地反应经济发展实际,更加贴近百姓的实际感受。
对于克强指数这一经济指标的准确性,《经济学人》杂志表现出了充分的自信,他们在杂志上撰文写道“对于所有那些怀疑中国经济统计数字的人,这个消息应该令他们欣慰。”也正因为这一经济指标的“解释能力强”、“能直观的反映经济实际”,自2010年底正式推出这一指数后,受到包括花旗银行、摩根士丹利等在内的众多国际机构的认可。
但必须指出的是,“克强指数”仍属于“事后指数”,它也有着传统统计方法的固有缺陷——必须等到事件已经实际发生形成结果了,才可能获取相关信息。但无论如何,“克强指数”的兴起传达出一个积极的信号,那就是我们的决策者已不再依赖单个表象的数据指标,他们更关注于经济的内在动力和组织结构,通过这些更细微、更专业的观察,能够更好地把握经济的走向。
数据决策与精准治理
大数据带来的最大变革还在于决策思维、范式和方法的转变。过去,受限于信息技术,决策者们再制定经济决策时往往缺少足够数据的支持,甚至就是那点少的可怜的数据,其本身的真实性和准确性都难以保证,这就使得我们的经济决策不得不取决于决策者的经验和直觉。
这种决策范式,就如黑夜里凭着感觉在悬崖峭壁处前行一样。这就使得整个国家的经济,处于一种随时可能坠入万丈深渊的风险之中。而大数据时代基于全样本数据的决策,无疑将有助于规避这种风险。
苹果公司的创始人史蒂夫·乔布斯与癌症斗争的过程,就值得我们参考和借鉴。在癌症治疗过程中,乔布斯采用了一种与传统治疗截然不同的方式,从而成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。医生能够基于他的特定基因组成,按各基因实际所需的效果精准用药。乔布斯所罹患的胰腺癌死亡率极高,出现症状后患者的平均寿命仅为9个月,而5年生存率更是低至2%以下,乔布斯就是通过大数据技术开发出的个性化药物,将生命延长了好几年。
在大数据时代之前,我们的经济决策多是无差别、简单的一刀切的。与传统癌症治疗方法一样,固然杀死了癌细胞但同时也误杀了许多正常细胞。同样的原理,大数据所提供的高速计算能力,将有助于决策者更加精确而迅速地设计政策方案。“决策支持系统”通过实时监控,能够非常及时的侦知到经济运行过程中的异动,一旦经济运行过程出现异常的苗头,我们只需选定病灶——特定的行业或地区,再根据该行业或地区的特定情况组合,按所需效果进行精准设计。如果经济病变导致政策失效,决策者还可以及时更换另一种政策组合,从而实现整体的精准治理。
也就是说,在大数据时代,决策者们做出的决策,越来越取决于数据及其分析的结果,而不是经验和直觉的主导。在这个全新的时代,决策者和经济学家都必须抛开传统观念的束缚,像数据分析家们那样学会倾听数据发出的声音。可以预见,随着大数据时代的来临,基于大数据的决策手段,必然将由原来的“决策辅助”角色,上升至“决策支持”的高度。
伴随着这种决策范式改变的,是决策流程的再造。随着大数据技术的日益成熟,“决策支持”系统也开始由经济运行信息的“获取—传递—处理—分发”为主要内容和运行轨迹的信息传递流程,向重视大数据处理应用、统一优化管理的经济运行数据的“采集—传递—分析—应用—反馈”的大数据应用流程转变。
决策支持系统通过对海量数据进行开发处理,大幅度提高从海量数据中提取高价值信息的能力,从而实现对经济运行综合态势的实时感知和认知同步,以此来压缩决策和具体政策制定的周期,提高经济治理的快速反应能力,决策层能够及时进行“发现即应变”式的精确应对。
(项目来源:国家社科基金重点项目“国家大数据战略实施的关键路径及其行动策略研究”(15AZD077)。作者为广东省生产力学会副会长)