APP下载

让数据应用回归冷静(一)

2018-03-15胡小明

信息化建设 2017年11期
关键词:数据服务效益决策

胡小明

打开智慧城市的宣传满是数据化的内容,除了大数据就是数据共享、数据重要、重要、最重要。固然数据在智慧城市建设中是重要的,但是一切重要的理念都有边界,讲过头了就会适得其反。数据的作用被捧上天,直接后果是对数据系统的盲目投资,无争论、无批评的投资是浪费之源。

总是说数据共享能带来巨大效益,大数据应用能带来科学决策,但是很难看到实例,更找不到统计数据,找一个大数据决策实现大效益的例子难上加难,而大数据浪费的例子却比比皆是。

大数据应用前景是辉煌的,但是辉煌的前景要靠一步一步如履薄冰地精心积累,不是靠“人有多大胆地有多大产”的逻辑实现的。数据服务目的是推动政府管理的精细化,数据精细化是管理精细化的基石,不能用粗放的习惯去管理以精细化为目标的数据应用,数据应用必须回归冷静。

剔除脱离实际的数据应用目标

期望过高必然会带来问题

数据应用目标一定要实际,不实际的目标是造成数据服务失败的主要原因。信息共享之所以成为电子政务的难题就是高估了信息共享的效益,造成投资过大,实际应用远远达不到预期目标,如果目标实际一些,做能够看得清的数据共享,投资会小得多,也不会因长期不见效益倍受指责。

信息技术并不能保证效益

拥有先进的信息技术并不等于拥有效益,效益的产生需要一连串的配合,新技术只是效益链中的一个环节。没有效益链整体的流畅配合无法形成效益,有效的数据应用时常需要业务流程的重组,效益链也是个系统,仅有技术思维是不足以构建效益链的。

现有信息共享措施并不成功

政府推动信息共享的两大措施是建设政府信息资源目录和信息共享交换平台。两项措施推行近十年依然不是很成功,系统开发推行很吃力,但使用者却不多,政府信息资源目录的主要贡献是使政府数据管理标准化了,但其应用也是门可罗雀,用户不足能使企业关门,政府部门对此却不在意。

信息爆炸降低信息共享价值

信息共享的价值与全球信息化发展密切相关,三十年前计算机数据资源极为稀缺、信息共享渠道极为稀缺,信息共享成为推动数据库应用的旗帜发挥着重要作用;但是在互联网、大数据、云计算普及的今天,数据资源爆炸,共享渠道充裕,信息共享作为口号已经过时了,信息资源也因供应充足而降低了价值,数据应用需要新的口号了。

关注数据应用的效益与成本

数据应用的效益问题

政府数据应用的效益主要是社会效益,社会效益不便于与政府投入成本直接比较,在实际处理中是通过政府价值观来评价的,政府要站在公众的立场上评价政府数据服务的价值,判断该数据服务是否值得投资,而公众是以自己的获得感直接评价政府是否浪费了纳税人的资金。

关注数据应用的机会成本

评价数据服务系统的效益需要扣除成本,如何计算成本?通常只想到会计成本,但是政府领导人主要考虑的是机会成本。机构负责人办事都有优先级,知道什么事情更重要,绝不能让次要的事情来耽误主要事情,机构是否重视数据应用取决于有多少更紧迫的事情,被重大事情压得抬不起头的负责人是不会关注数据应用的,被耽误的最大事情就是数据应用的机会成本。

数据服务有规模才有效益

政府数据应用服务的效益与规模密切相关,大效益就需要大规模,大规模的业务通常是政府对公众的规范化服务,数据应用要尽量与政府大规模服务业务相结合才会有更大效益。用户太少的往往不值得做,中小城市不能照抄大城市的做法,大城市有效益的事情中小城市却可能亏损,为研究人员提供服务的数据系统更应当谨慎,因为此类服务不容易形成业务规模而很难经营。

效益的可持续性问题

要区别是一次性服务业务与长期服务业务。一次性服务效益容易計算,而长期服务业务必须考虑其生存风险,其效益与业务稳定性密切相关,例如信息共享系统的服务能力取决于其数据更新维护的稳定性。影响长期服务效益的关键是业务的可持续性及是否有自适应环境与需求变化的能力,所建系统必须有其生命力,要能在生命期内持续服务,在外部环境变化能够自适应外部变化及需求的调整,数据系统设计不仅要考虑技术问题还要考虑运行与激励机制的问题。

不要高估内部信息共享对决策的贡献

信息共享概念的产生环境

重要概念的产生都有重要的历史背景,每个概念都被打上时代烙印,对概念的理解不能望文生义,离开了历史含义的理解会使概念绝对化而丧失活力。信息共享是从决策需求提出来的,当时是数据资源极为稀缺的时代,增加信息意味着决策质量会提高,信息共享则是增加信息的重要渠道,自那时开始至今政府始终高度重视信息共享。

决策需要的是数据集的信息

信息共享与数据共享是两个概念,信息共享是为决策服务的,使用数据的目的是为了获取信息,进而进行决策;而数据共享只是数据的直接使用,与信息无关,与决策更无关。

政府决策不是对某一具体的事件给出处理办法,而是对普遍性问题制定政策,决策是针对普遍性问题的解决办法,决策者不能依据个别数据决策,而需要以对数据整体的理解决策,即依据数据集包含的信息决策,决策使用数据的目的只是获取数据集所包含的信息,数据资源只用于数据挖掘并不参与决策,参与决策的是信息。

不要指望信息共享会有惊人发现

政府目前所强调的信息共享只是在政府部门间的数据共享,即允许它部门使用本部门存储的数据,部门数据主要是统计数据与业务数据,业务数据是部门业务工作数据处理的实体数据,决策研究并不需要单个的实体数据。决策研究不会只盯住政府内部数据共享系统,研究人员还有许多正式与非正式的信息渠道,如会议、部门汇报、电子邮件、互联网、微信等等,这些渠道可提供更多的内容,部门内部存储数据信息都会不同程度地泄露,使其内容不再有新鲜感,指望从内部信息共享系统有惊人发现很难。

要考慮互联网带来的数据竞争

互联网丰富的信息资源一直在打压政府信息共享系统对决策的价值,政府决策的信息来源是不受限制的,政府内部的信息共享系统始终受到来自外部信息共享渠道的竞争。政府内部信息资源只是领导人关注信息的一部分,更多的信息还需要来自外部渠道,外部信息资源的丰富程度内部系统不可相比,使用的方便性内部系统更不可相比,外部的竞争优势降低了人们对内部共享系统的依赖性。

应把基层业务数据整合作为重点

提取信息与数据处理使用数据模式不同

政府使用数据的业务有两类,一类是要从数据中挖掘信息以便用于决策,这种使用数据的模式称为数据挖掘。数据挖掘只使用数据并不改变原始数据。

另一类使用数据的目的是完成具体的服务操作,这种应用称为数据处理,政府为公众具体的服务离不开对用户数据的处理。业务处理使用数据是工作流程,数据处理结果会生成新的记录,使用老数据按规则生成新数据。

数据挖掘与数据处理对数据质量要求不同

数据挖掘关注的是数据集中所包含的信息,数据只是提取信息的原材料,由于统计分析工具能够过滤异常数据,对于具体数据的精准度并不关注。

数据处理是对用户关联的实体数据的直接操作,数据的精准度非常关键,数据的精准度直接影响服务质量,不准确的数据往往会引起业务处理纠纷,在数据处理流程中只关注具体数据的准确性,没有信息概念。

决策与操作使用数据的不同层次

政府决策并不直接使用数据,数据被用来提取信息,决策依赖的是对数据整体的理解,理解数据是高于数据层次的概念,计算机并没有理解数据的能力也没有信息的概念,信息是人脑才有的概念,是数据层次之上的概念。

政府服务业务处理是直接使用数据,依据具体数据操作,数据处理的方法由系统规定,操作人员没有自由量裁权,系统以形式逻辑的方式处理数据,是对数据的低层次的使用,没有信息概念,基层服务大都是这种模式。

数据服务要向基层倾斜

政府高层从事决策与政策研究是信息层次上的工作,不是IT技术能够承担的,决策与政策研究是人脑才擅长的领域,IT技术除了帮助进行数据挖掘,对决策思维帮助不大,这也是决策支持系统难以推广的原因之一。

政府基层工作主要是业务处理,对数据是直接使用,没有高层次的分析,数据处理方法是形式逻辑可描述的,不需要人脑信息抽象,适合信息技术发挥作用,数据服务向基层倾斜能够获得更大的成果。

大数据应用的优势与局限

政府怎样理解大数据

大数据最初的定义是指“现有的技术不能处理的大规模数据”,在大数据热的驱动下其概念不断扩展,互联网公司认为自己的数据就是大数据;人工智能将经由传感器直接传来的数据统称为大数据;政府官员认为政府管理的数据集中起来就是大数据。现在很多城市都在成立大数据局,这将促使政府将一切数据都纳入大数据的领域,以充分便利用国家支持大数据应用的各种政策优惠。

大数据比抽样调查的优势

对比大数据优势首先是从统计分析的视角开始的,大数据与抽样调查比较,显然全样本的分析要比抽样调查可获得的信息要更多,尤其是小概率环境中的相关关系;大数据对数据中的错误的容忍度要大得多,数据规模越大其对数据的异常值的平滑能力越强,大数据可以发现更多更精细的规律。

数据整合连接的信息价值

信息是连接的产物,数据是静态的连接,连接是动态的数据。要理解一个组织或一个实体最重要的措施是观察其组织连接的结构。城市各视角数据的整合为深入理解城市增加了大量信息。城市的信息空间是一个整体,信息存在于连接之中,将同一实体的多方面属性汇集起来会使人们对该实体产生更完整的概念,这是连接的信息作用,将各部门的信息与地理数据相连接可以形成相应的地理图层信息,借助于地理位置还可以发现不同数据在位置上的相关关系,数据整合的作用就是凸显数据的连接,理解关注对象的整体结构。

大数据应用的局限性

大数据应用给我们带来了发现事物规律的新方式、新工具和观察问题的新视角,其贡献是巨大的,特别是大数据与人工智能的连接更是如虎添翼,人们设想大数据能够全面提升政府的管理水平,实现真正的科学决策、科学管理,甚至实现现代新计划经济。但是这种想法容易高估大数据的能力。大数据可以提升预测能力,但是对于不确定性问题预测依旧是不可能的。大数据能支持决策的范围有限,因为并非所有信息都可数字化,便于大规模收集的数据需要标准化,其范围会比较窄,也即数据规模必须以视野狭窄为代价,大数据适合于局部领域细节决策的优化,并不适合整体目标的大决策,不能盲目夸大大数据应用。

(作者系原中国信息协会副会长,现任中电科新型智慧城市研究院首席顾问)

猜你喜欢

数据服务效益决策
地理空间大数据服务自然资源调查监测的方向分析
草粉发酵 喂羊效益高
莲鱼混养 效益提高一倍
为可持续决策提供依据
决策为什么失误了
冬棚养虾效益显著,看技术达人如何手到“钱”来
果园有了“鹅帮工” 一举多得效益好
如何运用税收大数据服务供给侧结构性改革
基于频繁子图挖掘的数据服务Mashup推荐
一种基于数据服务超链进行情景数据集成的方法*