论大数据时代的政府监管
2014-04-29申孟宜谷彬
申孟宜 谷彬
摘要:政府在“简政放权”的同时如何更好地为社会监管服务是其运行中的难题。本文把大数据与政府监管结合起来,论证了在政府监管中应用大数据的可行性和必要性,从技术层面与体制层面提出了运用大数据的具体方法步骤,以注册登记制改革后工商部门对企业的事中事后监管、高速公路管理以及网络反腐为例设计了大数据应用的实际案例,指出政府监管中使用大数据的难点。
关键词:政府监管;大数据;数字驱动
中图分类号:D63
“把该放的权力放掉,把该管的事务管好”,新一届政府成立以来, “简政放权”步伐迅速,“加强监管”雷厉风行:改变管理方式,加强事中、事后监管,发现问题必须叫停、处罚。那么如何能够在简政放权的同时提升管理效率,提高监管质量,成为了政府运行中的难题。
大数据是治理现代化的一种技术路径,可以依靠海量的数据搜集和精准的数据分析增强决策的科学性,它的到来为解决政府的难题提供了很好的契机。利用大数据可以推动政府管理从传统向现代转型,从粗放化管理向精细化管理转型,从单兵作战型管理向协作共享型管理转型,从柜台式管理向自助式全天候管理转型,从被动响应型管理向主动预见型管理转型,从纸质文书管理向电子政务管理转型,从廉政风险隐蔽型管理向风险防范型管理转型。
一、什么是大数据
大数据来源于英文“Big Data”,顾名思义就是大量数据。早在 20 世纪 80 年代, 美国著名的未来学家阿尔温·托夫勒就曾预言:“如果说 IBM 的主机拉开了信息化革命的大幕, 那么大数据则是第三次浪潮的华彩乐章。”但是,大数据概念受到广泛关注,是直到近几年才有的事情。
目前大数据尚无统一定义,一些比较认可的说法有:麦肯锡全球数据分析研究所提出的“大数据是指大小超出了典型数据库软件工具收集、存储、管理和分析能力的数据集”;美国国家科学基金会(NSF)定义的大数据为“由科学仪器、传感设备、互联网交易、电子邮件、音频视频软件、网络点击流等多种数据源生成的大规模、多元化、复杂、长期的分布式数据集”。从这些说法可以看出,大数据的界定将会随着技术的进步而发生变化。
大数据具有“4V”的特点:Volume、Velocity、Variety、和Value。“Volume”即数据体量巨大,大数据的处理量级已从TB级别跃升到PB级别(1PB=1024TB,1PB的数据如果打印出来将超过3千亿张A4纸),根据国际数据公司IDC发布的研究报告 ,2011年全球创建和复制的数据总量为1.8ZB(约1.8万亿GB),预计全球数据量大约每两年翻一番,到2020年全球将达到35ZB的数据信息量。 “Velocity”即数据产生处理速度快,遵循1秒定律,大数据时代数据无时无刻都在生成,对数据的分析处理必须在秒级时间范围完成,而且对于很多应用程序来说,数据生成的速度比数据规模更重要。“Variety”即数据类型繁多、格式五花八门,包括诸如网络日志、视频、图片、地理位置信息等非结构化、半结构化的数据,而且非结构化数据的增长远快于结构化数据的增长, 2012年非结构化数据比例已超过互联网整个数据量的75%。“Value”即价值密度低,商业价值高,比如一小时连续不间断监控的视频中,可能有用的数据仅仅有一两秒,但如果使用得当将产生巨大价值,比如零售业可以利用大数据提高 60%的运营利润。
大数据能够解析存在于现实世界、虚拟世界以及虚实融合世界的复杂网络关系,并适时做出判断和决策。这种决策模式遵循以下流程:数据变为信息、信息变为知识、知识涌现出智慧。大数据具有独特的在区域之间、行业之间和企业部门之间的强力穿透性,因此它不同于传统的、线性的、自上而下的目标驱动的精英决策模式,正在逐渐形成面向不确定性的、非线性的、自下而上的发现群体智慧的数据驱动决策模式。
二、为什么大数据可以帮助政府监管
大数据可以帮助政府在监管过程中摒弃经验和直觉,通过生产、生活各个领域获取的实时信息,及时掌握社会某一领域的趋势或更全面地了解某一事件的进展,从而做出更科学的决策,并对未来做出更准确的预测,提高应急响应能力。
大数据的集中和整合,将加快政府职能、流程的改变,打破政府各部门间、政府与民众间的边界,打开民众参与监督管理的渠道,提高政府各机构协同办公效率和为民办事效率,帮助政府在简政放权的同时由管理型向服务型转变,为社会带来巨大效益。美国总统奥巴马曾指出,大数据最核心的理念就是要建设开放的政府,这是大数据对于政府最核心的价值。
(一)帮助政府提高监管水平和效率,节约决策成本
主要体现在以下四个方面。
1.政府通过大数据可以获取更加精确真实的信息
大数据的产生多数时候不需要人工参与,直接由机器自动生成,真实准确,不容易受主管因素影响。基于大数据技术对这些数据进行处理,和以前采用人工現场监管、依靠小数据进行分析的方式相比,数据量更大,数据内容更加丰富、真实,因此得到的结论也能更客观地反映真实状况。大数据是实事求是的,未来中国的持续进步正需要依靠这种实事求是的精确管理体系。
2.通过大数据能得到采用传统手段不易得到的结论
当数据的规模达到一定阈值之后,数据会自动发声,并且涌现出在小数据条件下无从显现的性质,比如大数据中反映出的空间分布和时间延续结合的关联关系,能发现传统的因果关系分析思维不易发现的规律。最经典的案例就是沃尔玛通过大数据挖掘将风马牛不相及的“啤酒与尿布”放在一起。
3.大数据能帮助政府更及时地发现问题,提高预警能力
科学开发和利用大数据能够缩短监管所需经历的时间周期,弥补传统监管方式在及时性方面的不足。研究发现,“Google 流感趋势”监测到的流感爆发比医院的报告早 2~3 周,为应急部门提供了一种强大的早期预警系统。麻省理工学院(MIT)的两位经济学家,阿尔贝托·卡瓦略(Alberto Cavell)和罗伯托·里哥本(Oberto Rigobon)通过软件在互联网上收集信息,每天收集50 万种商品价格,在 2008 年 9 月雷曼兄弟破产之后马上就发现了通货紧缩趋势,然而官方数据直到 11月份才反映出这一情况。
4.利用大数据可以节省政府监管成本
传统监管很多时候需要数量庞大的监管人员实地参与,而大数据监管可以大大降低这类人工成本。比如苏州市建立了覆盖城乡的信息化防控网络,在警力与人口配比不足万分之十的情况下,却使打击处理案件数、邢拘转捕率、技术支撑率均为全省最高,实现了“以十抵万”的办案效率。麦肯锡估计欧洲发达经济体政府利用大数据可以节省超过1000亿欧元的政府开支。
(二)打破了政府部门间、政府民众间的边界,促进政府向服务、开放转型
主要体现为以下四个方面。
1.政府监管更加透明
大数据的开放性能够增大政府的透明度,提高政府的公信力。越来越多的政府部门向民众公开信息,包括政务数据、公共服务数据、基础数据等,免费供公众查询、下载,同时还提供应用程序开放接口,方便对信息资源进一步深入开发利用产生价值。政务公开程度提高,社会民众就可以及时获取政府信息,并根据大量服务信息作出判断,改变了过去信息不对称的状态。在这样公开的环境里,政府行政会更加公正,有助于公信力的提高。
2.促进政府各部门的协同合作
传统的管理思维让政府各个部门各自为政,而且传统的技术在支持各部门协同合作上也存在一定障碍,而大数据的包容性理念和数据获取存储技术打破了政府各部门间的边界,通过跨系统、跨平台、跨数据结构的数据共享平台使政府内部纵向、横向部门得以流畅协同,使被割裂存储于不同部门的数据在统一平台上得到开放,信息孤岛现象大幅削减,数据信息共享成为可能,这将有利于在监管中及时发现问题,找到解决办法。
3.帮助政府在监管中对不同对象采用有不同的评价方法和标准,促进政策从“一刀切”走向“差异化”
大数据技术非常精准,能够把数据与实体相连接、相匹配,让需求以个人、家庭、社区的形式出现,并被记录、鉴别、挖掘、设计和营造,这样就可以让政府在监管评价同一项政策措施时对不同的对象采用不同的评估标准,对不同对象进行“定制性”服务和施行相应政策,这将有助于社会资源的更优配置,创造出更多价值。
4.促进政府和民众的互动,提高民众参与监督管理的积极性和主动性,帮助政府更好地了解社会对某项政策措施的真实反映
美国政府前助理信息官、 纽约大学法学院教授贝丝·诺维克(Beth Noveck)在她的《维基政府——运用互联网技术提高政府管理能力》一书中指出“数据开放可以让体制内外的人一起参与进来,解决政府无法完成的以及棘手的问题。 ”大数据是开放的,如微信、博客、微博、twitter 、facebook等社交网络以其开放性、互动性赢得了众多用户的青睐,被多国政府和组织用于电子政务中,通过它们建立了公众与政府间的沟通渠道,通过在线交互让民众成为政务流程的节点,参与政策制定与执行、效果评估和监督,从而能让政府更好地了解到公众在想什么,需求什么。大数据的这一精神与中国共产党的群众路线精神完全相符。
三、大数据用于政府监管的可行性和必要性
本部分主要从两个方面来论述。
(一)在政府监管中应用大数据是可行的
主要体现在以下三个方面。
1.世界各国政府和组织都积极地在政府管理中应用大数据,并已取得显著成效。
2012年 1 月,达沃斯世界经济论坛将大数据作为会议重要议题之一,发布了“Big Data,Big Impact:New Possibilities for International Development” 的主题报告,指出数据和货币、黄金一样,已经成为一种新的经济资产类别,并探索、研究如何让大数据释放潜能、跨越鸿沟,为低收入人群及国家的发展服务。2012年3月美国政府发布了 《大数据研究和发展倡议》,此项带有2亿美元推动资金的倡议,主要用于开发、收集、存储和管理大数据的工具和技术,以提高从大数据中洞察分析和获取信息的能力。2012 年 7 月,日本总务省推出新的综合战略“活力 ICT 日本”,重点关注大数据应用所需的云计算、传感器、社会化媒体等智能技术开发,以解决新医疗技术开发、交通拥堵等公共问题。2013 年初,英国商业、创新和技能部宣布,将注资 6 亿英镑发展8类高新技术,大数据独揽其中的1.89亿英镑。
大数据提高政府管理能力的成效也是显著的:荷兰政府推出了一项名为数字三角洲的工程,通过协调环境部、税务部和国家研究所三方的财力、人力和物力,研究如何利用大数据预测,改变防洪策略以及整个荷兰水资源系统的管理工作。对比传统的水资源建设项目,这种合作组合预计可以节省高达15%的荷兰年度水资源管理预算。美国一位程序员发明了一款应用程序“SeeClickFix”,人们可以通过手机拍照使用该程序举报乱涂乱画、交通损坏或排水管堵塞等问题,这些投诉被自动记录在案,并被发送到公共事业部门,相关问题会很快得到解决。该软件已经在美国上千个城市投入并使用。
2.政府拥有大量的大数据源,较其他部门更具研究应用大数据的优势
麦肯锡研究指出:与其他部门相比,政府部门在应用大数据的时候所面临的困难最小,从大数据中获得的收益更多,价值潜力更大。政府工作关系国民经济、社会民生的方方面面,在日常工作中形成了大量的行政记录,掌握着众多数据:人口、交通、卫生、社保、税收、城市规划……政府拥有专门的统计数据部门,中央有国家统计局,地方有调查队,大多数部委也设有统计司或者统计处,此外工信、财政、交通、海关、气象等部委还拥有自己的大数据系统。而且与欧美国家相比,我国政府在社会体系中的地位、能力和影響力要大得多,在资源配置中所起的作用也更加重要,能够发挥体制上集中力量办大事的优势,因此我国政府使用大数据进行监管是具有一定优势的,并在推动大数据发展上能起到巨大的作用。
3.我国庞大的人口和众多的基层政府部门蕴藏了大量其他国家无法比肩的数据宝藏
大数据时代,每个人都是数据的“生产—消费者”。中国有13亿人口,每个人背后都是一串数据,除了基本的姓名、性别、身份证号码、银行帐户情况、房屋贷款情况、婚姻状况、工作状况、健康状况等,还有其使用手机、平板电脑等移动终端所产生的聊天记录、浏览痕迹、位置信息等大量数据,这些数据量乘以13亿,其规模将在世界数一数二。而且这个庞大的人群必然也对数据产生巨大的需求,这些都将促进中国大数据的大发展。
中国拥有2852个行政县,40446个行政乡,并且近年来信息化建设发展迅速。“十一五”期间,中央和省级政务部门主要业务电子政务覆盖率已经达到70%。县级以上政务部门普遍建立政府网站,积极开展政府信息公开、网上办事和政民互动等服务。随着各级政府部门云计算、物联网、大数据等信息技术的进一步铺开,把政府工作与大数据相结合,在政府监管中使用大数据是完全可行的。
(二)在政府监管中使用大数据是非常必要的
主要体现在以下三个方面。
1.很多大数据必须要政府的介入才能够得到开发利用
政府不仅是大数据的受益者、拥有者,更在建设大数据基础设施、培育大数据产业、培养大数据人才、完善相关标准和立法等方面负有至关重要的责任。只有通过政府,不同企业、不同行业协会、不同科研院所的大数据才能够得以整合。在美国,为了充分发挥政府在大数据中的作用,奥巴马签署了政府信息开放令。根据开放令内容,大多数联邦机构对他们拥有的数据资源必须开放,范围包括医疗、教育、能源以及公共安全等,让公众能够“容易发现、获取并使用”这些数据资源。
2.政府拥有的海量数据必须向社会开放才能充分发挥作用
政府拥有大量数据,但却缺乏挖掘其中价值的力量,只有引入软件开发商的大数据技术,才能够利用这些数据开发出商业的 App 或者服务,为经济增长带来积极的效果。美国的医疗部门收集了全美几乎所有医院的感染率,但是政府并没有足够的能力把这些数据转化为有价值的信息。于是政府专门建立data.gov网站,把数据放在网上。微软和谷歌利用这些数据制作出了数据地图,不管是研究机构还是普通患者, 都能够运用搜索引擎在地图上查找任何一家医院的感染率,从而决定是否住院。
3.中国要赶上本次大数据浪潮必须依靠政府推动
大数据的兴起,必然会带来一次深刻的产业革命。如果说前两次产业革命,中国因为历史的原因,都处于落后的阶段, 那么以大数据为代表的第三次产业革命将是中国真正实现经济强国的历史契机。事实上,全世界都还没有准备好迎接这场革命,尚不了解数据的类别、品质和价值如何界定,也不知道数据的隐私、安全和版权如何保障,没有建立良好的数据产业生态环境,也没有针对大数据的教育和训练。这种不清晰给了我们更多的机会,只要也只有政府率先在政府管理中引入,企业界、学术界、投资界和媒体齐心协力,才能推动这次可能深刻改变我们社会和经济的变革,使我国成为第三次产业革命的领跑者。
四、如何把大数据应用于政府监管
政府应用大数据帮助监管,既需要政府的顶层设计,更需要从下到上的积极参与,具体来说可从技术层面和体制层面两个方面入手。技术层面,要建立政府牵头、企业、个人参与的一体化大数据系统,做到天上有云(云平台),地上有网(物联网、泛在网),中间有数(数据);体制层面,要确立数据的收集、共享、分析、发布、决策和保护机制,建立大数据使用的标准流程和相关法律法规,推动大数据行业规范发展。
(一)技术层面要有数、网、云
主要体现为以下三个方面。
1.数据方面要在盘活已有数据资产的基础上不断发现和吸收新的大数据源,整理后构建国家级大数据仓库
大数据对于国家来说是重要战略资源,建立在互联网上的各种大数据基础设施服务已成为铁路、公路和水电煤等之外的重要基础设施。已经拥有多少大数据,还可以拥有哪些大数据,应该有专门的部门进行统一规划,建立登记制度,把大数据作为重要资产管理。
第一,要对已有历史数据充分使用和挖掘。
以国家统计局为例,它是数据的最权威机构,一直在生产新的数据,但是要得出深刻、对经济有指导意义的结论还需要使用挖掘建国以来全国各地区大量的历史数据,这些数据对于分析经济周期、了解经济波动背后的深层原因,在政府放手的背景下帮助企业掌握经济规律、科学经营具有重要意义。
第二,要重视所有的数据,不要把数据当做垃圾丢弃。
每时每刻每地,政府的各个部门,社会上的每一个企业、每一个人、每一台机器都在产生大量的数据,其中很多数据都曾经过政府之手,都可能被政府采集到,因此要把数据视为资产,通过多种渠道尽可能多地采集。这不仅包括官方内部数据,也包括大数据链条上的其他外部数据,比如企业在政务平台上、在社交平台上对政府政策措施所提的意见建议或者是一些只言片语,并按照优良资产、不良资产等分类存储。
第三,对不同来源的数据进行整合。
由于数据来源的部门不同、层级不同、地域不同,因此具有不同的格式、不同的指标含义,且其中存在不少无效数据、异常数据、不完整数据,需要有专门部门对不同数据源进行整合,转化统一,形成可以实现检索、汇总等初级功能的国家级数据仓库。
2.通过建立一张遍布全国、互相联系、顺畅流通的网,消除信息孤岛,使大数据流动起来
要能够使数据仓库不断吸收最新的数据,并得到有效维护和充分利用,就需要建立能有效收集、维护和使用数据的网络。虽然现在大多数政府部门都有自己的信息化平台,比如国家统计局有企业一套表联网直报平台,国家工商行政管理总局有网上注册申请业务系统、网络市场监管信息化平台,财政部有在线申报系统等等,但是各个部门之间系统不同,条块分割,如一个个信息孤岛,缺少跨部門的信息整合。而且即使同一系统,中央和地方之间、地方和地方之间的数据库也因为管理或者存储的不一致,也处于分割状态,比如交通运输部的高速公路联网监控系统虽然各省都建有数据库,但是由于格式不同,无法实现部级数据库与省级数据库、及省级数据库之间的实时传输,滞后时长超过半月。
信息孤岛是信息化发展到一定阶段的必然产物,不可避免,但是要想真正挖掘出大数据中蕴藏的价值,从中发现有利于政府监管的信息,就必须实现数据库的联动,打破阻挡数据流动的信息高墙。这需要政府有所作为:建立一个跨系统、跨平台、跨数据结构的政府综合信息处理网络平台,在技术上使政府内部纵向、横向部门得以流畅协同,缩短数据的获取、处理及分析时间,提高发现问题、处理问题的速度,提升工作效率。当然要彻底消除信息孤岛,还需要从政府的管理理念和行政体制上入手。
3.云平台是大数据得以发挥作用、形成价值的决定性通道,需要政府与企业合力共建
大数据时代,政府要为公众创造价值,就必须要能够建立整合电子政务内网、电子政务外网、互联网、城市应急卫星通信网、短波通信网、集群通信网及3G/4G通信网络于一体的信息资源云,并且能够通过挖掘云内的信息,为各个部门提供他们所需的各类信息和辅助决策支持。
第一,云要能够帮助政府监管、感知发生的问题。
这需要各类海量数据能够在云平台上得到有效配置,并在云平台上完成深入挖掘,第一时间为政府精准地提供与监管相关的重要信息、最新情况。
第二,云平台要能够帮助政府解读数据,找到数据背后的深层相关因素,帮助形成解决方案。
这需要有能完成大规模数据挖掘的软硬件设施,政府可以一方面从大型的企业获得云支持,比如阿里巴巴、百度,另一方面也应该充分利用公众的力量,比如前面提到的美国Data.Gov网站的1140 个应用程序中就有近 300 个应用程序由民间的程序员、公益组织自发开发。
第三,通过云平台找到相关影响因素后,政府需要做出及时有效的反馈,并准确投放。
就像大数据时代的定制广告,政府要把云中发现的监管问题和应对措施分类打包,投放到企业、公众需要的地方——他们在微博上,政府就把它投放到微博上;他们在微信上,政府就把它投放到微信上,如何找到正确的投放位置,给出所需要的信息这也需要政府通过大数据挖掘找到。此外,政府还可以总结在云中挖掘出的常见问题、近期的趋势性变化等,利用舆情渠道,把信息及早地传递到企业和民众,帮助他们避免不必要的决策失误。
以上的数、网、云是应用大数据的三个基本方面,对于政府应用大数据进行监管从技术层面来说,还需要善于把从大数据中挖掘出的蛛丝马迹与实际的政策结合起来,科学地监督评估政策执行情况。这其中有一个积累经验的过程,哪些指标对监管最具有意义,需要经过大量的挖掘和分析,并结合实际情况比较后才能找出。一旦找到,就要以这些指标为基础建立一套科学的监管评估指标体系,把它作为监管评估的依据,并且随着掌握数据量的加大,还要不断补充更新监督评估指标体系,并建立规范的应对措施。
(二)体制层面需要思维、制度、法律、战略
主要从以下五个方面来加以分析。
1.树立“用数据说话,让数据做主”的数据驱动决策思维模式和组织结构
中国不少政府部门的决策者倾向于依赖经验和直觉进行监管,做出判断,采取措施,缺乏数字管理的习惯。这样的决策过程是粗放的,可能实施效果很差。过去,我们这样“拍脑袋”决策可能受到无法获取数据和进行分析的限制,但今天,在大数据时代,政府拥有大量数据,各行各业也都在利用所拥有的数据改进生产经营,政府决策者们如果不能与时俱进,做到凡事心中有“数”,很难进行有效的监督管理,尤其是在简政放权的大背景下。决策者应该养成用数据说话、用数据管理、用数据决策、用数据创新的思维习惯,尊重数据与客观证据,尤其要重视数据结论与常识不符的情況,避免有倾向性地选择使用与常识一致的数据,放手使用员工用一线的大数据得到的结果,放手让大数据说话。
大数据时代政府需要转变的不仅是领导作风,更需要再造政府组织文化。政府的监督管理工作要采用非线性的、去中心化的、自下而上、发现群体智慧的大数据方案编制科学计划;组织结构上应提高统计部门、发展规划部门的地位,并在监督管理中多与工商、税务、银行等部门沟通,使用它们的大数据;在机构内部还可以设立首席数据官、首席信息官,聘请统计学家、数据科学家担任顾问等;在监督管理作出决策的过程中,要重视每一份数据信息所承载的民意,避免对上负责、对下不负责的情况;利用大数据加强过程监管,通过多个数据获取渠道时时地监管企业生产、流通、消费各个环节的关键漏洞,使数据手段成为帮助企业改进经营生产方式,提高政府工作效率的有力工具。
2.为大数据建立共享制度
“世界是平的,未来是免费的”,大数据的开放使用是世界趋势,尤其政府数据作为公共资源更是应该尽量公开。我国政府网官方微博和官方微信虽然在2013年已经开通,但并没有涉及数据集层面,对于什么样的数据可以公开,何时公开、如何公开都缺乏明确统一的规定。这在相当大程度上降低了大数据的价值,没能使其在政府服务公众、监督管理上发挥应有的作用。世界各地有很多经验可以借鉴:“公共资料,增值再用”,这是香港公共数据开放网站“资料一线通”的口号,该网站专门免费向公众提供交通资料、公共设施的地理参考数据、天气数据、空气污染指数和慈善筹款活动资料,用户可以通过手机客户端使用,并且香港政府还委托互联网产业协会开展网站的推广运动,鼓励公众用这些免费资料编写应用程序。
如何制定数据开放的标准和原则可以参考“政府2.0”之父蒂姆.奥莱利制定的开放公共数据的8条规定:数据必须是完整的;数据必须是原始的;数据必须是及时的;数据必须是可读取的;数据必须是机器可处理的;数据的获取必须是无歧视的;数据格式必须是通用非专用的;数据必须是不需要许可证的。数据共享机制首先要做到政府的原始数据只要不涉及隐私和国家安全,都全部开放、开源,结合中国国情,可以先从统计、气象、地震、交通、公安、社保、医疗卫生、教育等公共数据资源的开放入手,再重点推进至投资、生产、消费、审计等经济领域,使公共数据与民间、企业界拥有的数据资源相互融合,形成巨大财富,成为政府监管的重要依据;然后是要提供处理政府数据的应用程序开放入口,方便企业和个人对大数据资源进一步深入开发利用,形成全民监督,共同发现解决问题。
3.针对大数据时代建立相应的社会保障制度
大数据时代,数据信息已成为最重要的资源之一。信息自由、数据开放,意味着信息和每一个公民之间都是等距的,而且中间没有层级的过滤。数据的开放和流动,就代表着知识的开放和流动,代表着权力的开放和流动。这种开放和流动,是多中心的、水平的。在这种情况下,社会的主体结构将从分层转向网状。同时,由于新技术的广泛应用和深层渗透, 社会形态和社会结构将会出现新的变革,而且这种社会变革的速度将随着数据信息的增加而不断加快。因此,在大数据所带来的挑战面前,社会各阶层在迅速地发生变化,市场竞争加剧,商业风险提高,群体有可能被打上数据标签而分化对立。因此政府应敏锐地发现这些问题,监管到这些领域,建立相应的保障防范制度,促进在大数据时代社会的凝聚融合。只有如此,大数据才有可能推动社会生产力的更大解放与发展,才能实现社会的全面进步。
4.建立保护隐私安全的法律法规
大数据从本质上要求信息开放,但信息开放就会涉及到企业的行业机密、个人的隐私等等,因此在大数据应用的过程中,政府一定要制定相关隐私安全的法律法规,对如数据主权归属、大数据服务可靠性、出现争端时的化解与裁决等进行规范和保障。目前我国虽然有《统计法》这样关于数据提供和使用的法律,但主要针对的是传统数据情况,在大数据这方面还还存在相当大的空白和欠缺。大數据时代,数据安全的保护模式应该更着重于数据使用者为其行为承担责任,而不是将重心放在收集数据之处的个人许可、匿名化上面。有了针对大数据安全的法律法规,使用数据的政府部门、公司就需要基于对数据生产者可能造成的影响、对涉及个人数据再利用的行为进行正规评估。此外,政府必须制定科学规范的方法,平衡数据二次利用的价值与个人信息过渡披露所带来的风险,明确不同种类的企业、个人数据必须删除的时间,以防止隐私泄露。个体隐私层面外,大数据时代的国家信息安全也需要有明确的法律和惩罚措施,对大数据拥有者进行约束,需要政府高度重视、大力推动国家的网络信息安全建设。
5.全面实施国家级大数据战略
美国、日本等国为代表的全球发达国家已经展开了以大数据为核心的新一轮信息战略。国家数据主权,即对数据的占有和控制,成为了继边防、海防、空防之后的另一个大国博弈空间。我国虽然已出台一些支持大数据发展的文件,但在国家战略层面的文件中对大数据提得不多。因此,我国应从两个方面着手提升大数据在国家战略中的地位。
第一,加速营造良好的大数据产业生态环境。
政府应从全球性的视野来洞察大数据的发展,在我国当前电子信息产业发展的基础上,提前进行着眼全球的产业规划和布局引导,加快推进大数据技术向泛在、融合、智能和绿色方向发展,在产品功能融合、网络融合、制造与服务融合等方面向其他产业交叉渗透,推动信息产业转型升级。拓展大数据应用的空间,实施信息化带动工业化、现代化战略,用大数据改造提升传统农业、传统工业和传统服务业,推动产业融合发展和转型升级。鼓励企业积极创新,加速培育以企业为主体、市场为导向的政、产、学、研、用相结合的创新体系,集中力量攻克核心难题,提升企业的技术创新能力、市场拓展能力、经营管理能力和国际竞争能力。支持企业参与国际大数据市场的竞争,从国家层面对数据资产标准进行规范,保护数据资产的交易和流通,力争我国在国际大数据中的话语权。
第二,要高度重视大数据人才的培养。
政府使用大数据进行管理必须建立在拥有专业人才的基础之上,因此,大数据管理更需要专业的人才和完善的人才管理配套制度。大数据人才是复合型人才,需要掌握统计学、数学、计算机科学、人工智能、人文社会科学等多个领域的技能和知识。 因此政府在建立自己的大数据专业团队同时,一定要充分地使用企业、民间的大数据力量;另一方面应在高等院校增设大数据相关课程、专业方向和学位,鼓励企业与高校及培训机构合作培养大数据人才,并建立大数据人才的创业与创新支持体系、评价体系、管理与服务保障体系,营造有利于这类高端人才脱颖而出的人才发展环境。
五、大数据帮助政府监管设想
主要有以下三个方面。
(一)借力大数据,加强注册资本登记制度改革后工商部门对企业的事中、事后监管
注册资本登记制度改革后,企业注册变得相对容易,经营手续相对减少,激发了市场活力,但同时也给监管工作带来新的挑战。基层工商部门反映:不实际经营又不办理注销的“名存实亡”企业进一步增多,给经济户口管理和企业日常监管增加了复杂性;变企业年检为报告公示制度后,基层对企业的直接沟通、监管制约减少,大量异地经营企业的实际经营地等信息难以及时、准确采集,增大了后续监管难度;实收资本不再是工商登记事项,交易方将难以从营业执照上看出企业规模、实力,交易风险、经营欺诈等矛盾可能增多;办照更加容易,经营者可能稍遇不顺就关门大吉、另起炉灶,擅自停业、预付费卡等引发的消费纠纷、社会矛盾增多。运用大数据可以弥补政府对企业直接监管的减少,在一定程度上解决上述问题。
基于大数据,工商部门可以建立包含企业多方面信息的大数据仓库,并采用可行的算法对数据仓库展开挖掘,在后台建立企业的评级分类模型、行业前景预测模型、用户文本分析模型,为企业的登记、监管、抽查等提供依据,并在此基础上,通过信息公示系统提供预警提示和企业、公众互动功能等,以更好地为企业、公众提供服务。
1.建立企业信息大数据仓库
工商部门应成立专门机构,从多个部门(公安、安监、法院、银行、税务)以及民间机构、民众中搜集数据、信息(可以包括企业生产经营、银行信贷、纳税情况、违法情况、个人诚信记录、经营履历等),把各类数据、信息统一结构、整理加工,建立形成大数据仓库,并时时更新维护。为了保证数据库及时准确地反映企业的经营状况,中央的数据仓库和各地的数据仓库,各级工商部门的数据仓库与同级其他部门的系统都应该有有效的对接渠道,确保数据及时传输。使用大数据的同时要高度重视对传统数据的利用,必须把它们也纳入数据仓库。
2.通过对企业信息大数据仓库的挖掘,建立评级分类模型,实现对企业的差异化监管和服务
通过挖掘历史上数据仓库中数据与企业失信、违法等之间的相关性,找到准确评估企业和个人诚信度、预测企业发生违法经营概率的评价指标体系和科学方法。评估分类模型中的指标应该是一些可以随时获得客观真实数据的指标,并且指标体系应包括哪些指标,采用何种方法对企业进行评估都应随着对其的使用和数据源的扩大及数据挖掘技术的进步不断改进。基于评级分类模型对企业和个人均建立综合档案,计算企业和个人的诚信度、违约概率,并分为不同类别区别化对待。比如对诚信度高的企业和个人,其在登记注册、变更、注销及办理其他业务时候可以享受到快捷、优先的政策支持;对于诚信度低的企业和个人,要采取措施使其在一定时期内办理业务时受到约束和限制。
3.把企业大数据与一些宏观经济数据相结合进行分析,还可以发现行业的规律性趋势、影响因素、先行指标等,据此可以建立行业前景预测模型。
政府可以通过信息平台把行业前景预测模型结论与企业分享,以帮助他们改善经营:对未来可能发生的风险,及时在平台上预警,提示企业规避风险;对未来可能到来的机会也应及时在平台告知,帮助企业早作筹划;对于经营状况较差的企业,还可以多提供一些优秀企业的经营案例。模型应该在使用中,通过政府和企业的共同力量不断改进。
4.充分发挥民众力量,在信息平台中提供他们的参与渠道,基于他们的文本非结构化数据和企业的经营数据建立用户文本分析模型。
在信息平台上,政府可以开辟投诉意见箱、信息反馈窗、民众讨论坛等。这样一方面可以及时得到关于企业的更多反馈信息,便于及时发现问题;另一方面可以把这些非结构化的文本信息通过处理技术转入企业信息大数据仓库,供研究民众意见与企业实际经营状况关系使用。一旦建立起用户文本分析模型,工商部门就可以自动对民众的意见去伪存真,直接根据民众的网上言论发现企业的异常行为,自动地得到问题报警。除民众外,平台上也应能听到企业的声音,甚至在文本数据之外,企业还可以具有一定自主权限,在平台自己可以公布上更多反映其经营状况的信息。
5.基于前述数据仓库,在信息平台上建立预警系统,企业可以也只能看到对自己的警告,政府部门将根据警示内容和企业的调整情况对企业进行处理
预警系统可以分为若干个子系统。比如,在登记预警子系统中,一級警示为提示性警示,工商部门仅提示工作人员注意该企业有可能会出现失信行为,如果企业前来办理业务,工作人员应对企业进行善意的提醒,不影响该企业业务办理;二级警示为约束性警示,工作人员经过认真核实,确定企业的失信行为对某项业务的办理并没有影响,可以向上级申请,说明情况,为该企业暂时解除锁定;三级警示为完全限制性警示,工商部门对企业的全部登记行为进行限制,失信企业在依法受到处罚前,任何人无法解锁,以促使企业改正失信行为。
6.对企业的抽查要基于企业评级分类模型,并采用网格化管理思路
工商部门对诚信度较低的企业要增大抽样比例,同时参考社会管理中的网格化管理,把企业分配到不同网格后再行抽取,并对抽到的企业直接下沉到街道、社区进行调查,充分利用社区委员会、社区居民的非结构化数据,获得对企业更全面的信息。
7.政府可以借助外力,提高运用大数据监管效果
工商部门可以引入第三方机构帮助建立信用信息体系,比如阿里巴巴的诚信体系多年来就运行得非常成功,政府可以从他们那里吸取经验,还可以引入他们的专业团队帮助建设平台、挖掘数据。除了与这样的大数据企业合作外,政府还可以使用大数据分析类的众包平台,如Kaggle,把希望解决的问题和希望达到的目的提出来,让世界各地的数据分析师们参加竞争,找到问题的解决方案。
(二)大数据在高速公路管理上的应用
高速公路联网监控系统通过高速公路站点的各类检测监控设备,如环形线圈检测器、微波检测器、超声波检测器、视频检测器、计重收费系统及人工输入等对经过车辆实时识别、时时记录产生了大量数据,仅每天的数据就上百万条,其中包含了大量可以用于帮助高速公路管理的有价值信息。我们司组织人员对这一大数据源进行了专门研究,并得到了部分有价值的结论。
在整理原始记录、形成数据仓库的基础上,我们已经挖掘出了大数据中隐藏的一些相互关系,与高速公路车辆超载、站点拥堵问题相结合建立了模型,展开了分析。
超载车辆模型中,我们找到了高速公路上超载车辆的行驶规律:主要什么时间、什么路段出现在高速公路上,主要是哪几个类型的车辆,主要来自什么方向等等。这可以用于帮助交通管理部门有针对性地对重点路段、高峰时段进行超载检查。
为了解决站点拥堵问题,我们建立了站点关联性分析模型,对收费站点之间的相关性进行了分析:一个站点闲忙的时间规律,忙时经过的车辆主要对什么范围的哪些站点产生影响,并计算了影响的传播速度。这可以用来帮助站点根据车流大小提前进行合理的人员安排。
两个大数据模型都可以帮助交通部门减少管理成本,提高管理效率,并且都可以作为服务信息及时传递给驾驶员,帮助其规划路径,合理行驶。事实上利用高速公路大数据,我们还可以做很多事情:挖掘高速公路数据与经济发展间关系,建立高速公路经济监控指数;分析省际货物流向,研究各省是输入还是输出型经济,并通过分析高速公路货物流向帮助各省制定发展策略;利用数据衡量节假日免费政策对高速公路通行状况的影响等。
(三)基于大数据的网络反腐
大数据为网络反腐提供了一个非常庞大且可以便利索取的数据库和信息来源,这里面包括很多官员的最新动态和历史活动。利用大数据技术,民众可以分析出任何一位官员背后的关系网络,指出可能存在的各种裙带关系。在大数据时代,一件普通的事件很容易引发多米诺骨牌效应,“拔出萝卜带出泥”。近年来,因为网络监督落马的官员不在少数,比如刘铁男、雷震富、杨达才、周久耕、韩峰等。官员的一言一行都受到网民的监督,不少官员谈网色变。这恰恰成为了纪检部门反腐斗争的有力工具,也使网络成为一种监督,促使政府官员时刻谨言慎行,更好地执好政、用好权。
六、政府监管中使用大数据的难点
主要体现在以下四个方面。
(一)需要清醒地认识到数据质量可能存在问题
大数据并不一定如我们想象的那样可靠,过度依赖数据可能产生一系列风险:比如,原始数据质量很差,基于此的分析结果不可信;人为控制数据的收集和统计过程,使结果产生扭曲和偏差;过于片面地解释一个数据等等。在中国,还很有可能发生暗箱操作、修改数据、无中生有“创造”数据的事情,依赖这样的数据将产生很严重的后果,因为假数据比没数据对社会的危害还要大。
(二)数据的开放共享存在相当大的困难
从政府层面讲,信息公开是政府利用大数据治国的一个必要条件。但是在中国,政府习惯的是全能型的社会管理模式,政府部门之间条块分割,各部门之间都存在一定的利益驱使,政府与公民之间权利不对等,因此虽然大规模的数据在被政府采集,但大部分的数据都仅能在部门内部使用,没有开放共享,价值没有得到很好利用。2008 年前后中国制定了 《政府信息公开条例》,但实施几年以来,政府各部门对信息的封锁依然如故。这方面中国和发达国家(如美国)尚有差距,美国 1967 年就通过了《信息自由法》。要想完全开放共享大数据,国家应要建立国家层面的信息法,真正拿出勇气打破阻碍数据流动的樊篱。
(三)数据信息安全始终是重大隐患
大数据的存储和处理模式,不可避免地会带来信息安全、隐私信息保护的严峻问题。从全球范围来看,目前已有50 多個国家依靠法律形式规范个人信息数据的管理与使用。在我国,相关方面的法律保护意识较弱,国家尚未出台相关的法律政策对个人信息数据库进行统一保护。在大数据时代之前,民众能以保密的方式保护隐私,但今天,采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,我们的每一个行为都透露了一定的个人信息。大数据时代,我们的隐私应更好地得到法律的保护。
(四)使用大数据可能带来群体歧视
由于大数据能够做出有关群体不同行为方式的论断,而且大数据应用在政府管理中的一个重要方法就是把不同个体进行分类,归入不同的群体中,因此,在政府管理中使用大数据可能会带来根据数据标签的群体歧视,这应是政府在使用大数据进行监管中尽量避免的问题。
大数据时代是智慧的时代,在这个时代充满机遇与挑战。政府部门在监督管理中,只有勇于转变思维,敢于迎接挑战,善于把握机遇创新变革,方能真正实现从“拍脑袋”到“数字驱动”的转变,“从行政主导的政府到以人为本的服务型政府”的转型。
参考文献:
[1] Bill Franks. 驾驭大数据[M].北京:人民邮电出版社,2012.
[2]维克托.迈尔-舍恩伯格,肯尼思.库克耶. 大数据时代[M].浙江:人民出版社,2013.
[3]黄铧焕,薛丽芳. 大数据,大政务,新网络[J].电子政务,2013(5):104-109.
[4]胡泳,郝亚洲. 数据治国与数据强国 [J].新闻爱好者,2013(7):4-8.
[5]林志刚,彭波.大数据管理的现实匹配、多重挑战及趋势判断 [J].改革, 2013(8):15-23.
[6]于施洋 王建冬.政府网站分析进入大数据时代[J].电子政务, 2013(8):79-85.
[7]徐继华,冯启娜,陈贞汝. 智慧政府[M]. 北京:中信出版社,2014.
[8]吴秋兰,梁勇,孙永香,佟彩. 大数据助推村镇电子政务发展 [J].测绘科学,2014(5):23-26.
[9]唐虹.注册资本登记制度改革给基层市场监管带来的机遇、挑战及建议 [J].中国工商管理研究, 2014(5):41-52.
(编辑:韦京)