让数据应用回归冷静(二)
2018-05-15胡小明
胡小明
确定性层次的数据应用
数据应用的不同层次
对数据的使用有两个层次,一种是对数据的直接使用,如数据处理、数据挖掘、机器学习、人工智能等,在这个层次里是机器在使用数据,人脑并不参与,使用数据的逻辑是清晰的,问题是确定性的,这是IT能够发挥作用的层次。
另一种是间接使用数据的模式,要先进行数据挖掘,从中提取出信息,再由人脑利用信息进行决策或进一步研究。信息使用方式是高层次使用数据的方式,是通过人脑完成的,计算机可以处理数据却不能处理信息,利用信息决策是人脑才有的能力。人脑对信息的使用是不确定性问题。
信息技术与确定性问题
信息技术只能解决确定性问题,这是由计算机的原理决定的,计算机软件是一种计算,其结果必须是确定的,信息必须是完备的,计算机只能提高逻辑演算的速度,尽快得出答案,却不能在信息不完备的环境下进行运算。
信息技术适用于成熟规范业务的自动化建设,因为这类的不确定性已经被排除了,效益问题已由甲方承担了,信息系统的作用是提高业务的运作效率,没有人脑参与、没有不确定性,在这种环境下应用很容易成功。
信息工程学是面向确定性的科学
随着信息系统建设而成长起来的信息工程学是解决确定性问题的科学,它要求用户要解决问题的信息是完备的,目标是确定的,这样信息系统就可以准确有效地设计出来,信息工程学解决技术可行性问题。
在信息技术应用中不确定性问题是不可避免的,如效益不确定、用户需求不确定、数据不完备等,这些不确定问题将由甲方负责人来拍板定夺,乙方不必考虑不确定性问题,这种分工有利于乙方专心完成信息系统的建设任务。
业务数据整合是确定性任务
2016年国家发改委等十部委联合提出了“一号一窗一网”,方便公办事。政府公共服务需要对当事人相关实体数据进行处理,但一些数据会分散在不同部门的数据库中,调用不通畅是降低效率的主要原因,政务数据整合共享能够实现以实体标识符到部门数据库实际的统一调用,这是一项目标明确的任务,可以通过专业软件及数据标准化解决。
确定性项目也要有所為有所不为
确定性任务容易实现但不等于有效益,取得效益的关键在于恰当地选择目标,全面推动数据整合共享没有必要,因为不是所有的数据整合共享都有效益,无效益的数据整合共享不必做,即使会计成本划算的项目,也还要看其机会成本会不会耽误更重要的项目。政府经费与人才是有限的,集中力量改进用户规模大的项目往往比多做几个小项目更有益。数据整合共享应当“有所为有所不为”才会有效益,总之确定性项目也不能什么都做,不能一刀切,精心选择目标才能提高效益。
不确定性问题的解决办法
解决不确定性问题的智慧
现实生活中确定性是相对的,不确定性是绝对的,确定性问题有规范的逻辑处理办法,计算机能够处理;不确定性问题没有规范的逻辑处理办法,计算机不会处理。不确定性问题要靠人脑来解决,人脑可以从更高的层次上思考与创新,这是电脑不及人脑的地方。
人脑解决不确定性问题的办法是创新与选择。人脑可以进行概念创新、技术创新,从而提出多种创新方案,借助于决策者的阅历、经验、直觉来评价优劣,选择最好的方案实施。解决不确定性问题没有万无一失的方案,所以决策人必须准备承担风险的能力,这是电脑无法效仿的,因为电脑不懂责任感。
想象力丰富才会有好选择
人们常把技术设计与应用视为智慧,而忽略企业家选择的贡献,实际上选择是更重要的智慧。技术智慧解决的是确定性问题,商业智慧解决的是不确定性问题,技术智慧只考虑技术可行性,商业智慧考虑的是最终效益,效益问题超出了技术思维的能力。技术层次只懂得怎么做,商业智慧懂得选择做什么。技术怎么做可以学习,选择做什么却没有方法可学,只能依赖决策者的想象力与判断力,技术并不保证带来效益,效益来自企业家的勇气与悟性。
设计有生命的运行机制
数据服务系统还有因长期服务而增加的效益不确定性,因为服务环境总是不断变化的,用户需求也会不断变化,设计者不可能设计出长期有效的服务系统,为保证长期效益,设计者需要从更高层次上设计系统,需要设计自适应的机制,能够自动地调节服务功能,适应环境变化确保长久的服务效益。运行机构的激励机制很重要,激励的方向要与整体目标相一致,强有力的激励机制与高效率反馈改进机制形成运行机构的生命基因,确保了数据服务系统的长期效益。
效益层次高于技术层次
数据服务系统建设关键问题是要有效益,没有效益的数据服务不可持续,有效益才会有不断的资源供应,才能使数据服务系统服务持续整个生命期,实现效益的难度高于技术可行性。技术可行性可视为第一层次目标,有可持续效益则是第二层次目标,形成可持续效益的数据服务系统和生态环境是第三层次目标。层次越高不确定性程度也越高,抽象思维层次也越高。
爱因斯坦说过,“不能在产生问题的层次上去解决问题,要在更高层次上寻找解决问题的办法”。善于从更高层次上思维的人视野更广阔、思维更灵活,更有能力克服困难取得成功。
学习企业家的思维模式
技术人员主要面对的是确定性问题,其思维处于系统工程层次,碰到不确定性问题时他们会去请示上级,由上级对不确定的问题拍板定案后,才会继续从事信息工程业务,技术人员只关注系统可行性,其思维停留在确定性层次。
企业家是效益导向,必须正视不确定性问题,没有人能替企业家拍板排除不确定性,企业家必须亲自决策排除不确定性,让部下在确定的环境下工作。企业家是能在不确定性环境下努力推进工作的人,政府的数据系统建设领导人需要学习企业家的勇气、担当能力和创新精神。
数据服务的可测性与公众获得感
数据服务建设不忘最终目标
大数据应用与政务数据整合共享提出的目标是改善政府对公众的服务,目标要更多面向基层面向公众,但是做起来往往会变成面向领导、面向考核机制,这样会大大降低数据服务的效果。因此从更高层次上反思数据系统建设的过程,回到初始的目标,不忘初心非常重要。政府为推动数据建设会制定绩效考核的办法,考核办法应当向最终目标靠近,不要让部门为绩效而绩效,忘记最终目标。
公众获得感的重要性
数据服务系统设计以公众的获得感作为评价标准很必要,这是从服务的最终效果提出的效益要求,超出工程层次的测量标准,其展示的是服务效益。获得感是用户的感觉,是设计者不可控的,与信息系统的工程标准不同,政府自认为设计很好的系统公众若不喜欢就不能说是成功的,公众获得感是不确定性的标准,以公众获得感评价政府工作能够推动政府全面改进工作,并能够提高社会监督效率。
数据服务的可测性与管理能见度
城市数据服务系统与成果的可测性密切相关,一个成果不可测的系统必定是骗人的系统,设计人可以随意夸大其作用而无法证明,这样的系统是不能做的。数据服务系统的效益主要是社会效益,直接测量有难度,利用公众获得感作为社会效益的测量标准能够提高项目测量效果的直观性,这对于城市数据服务建设的可控性是有益的,使测量标准直观化,让系统服务的效果可视化,能够有效抑制虚假的数据服务。
效益导向推动政府数据建设
智慧城市建设中,城市大数据中心已成为标配的技术内容,但大数据中心的发展方向尚不清晰,仅靠领导支持并不能保证可持续,数据中心坚持以效益为导向很重要,要建立简单明确看得见看得懂的评价标准,评价数据服务公众满意度的客观标准之一是用户(包括政府用户与社会用户)规模,政府数据服务宜加强对公众的宣传,改善用户体验,促进用户规模增长,将用户稳定的使用率作为效益导向的指标。
(作者系原中国信息协会副会长,现任中电科新型智慧城市研究院首席顾问)