大数据时代公共管理应用决策4M思维:理论思考与实践探索
2019-06-11孙轩孙涛
孙轩 孙涛
摘 要: 近年来,大数据在公共管理领域的应用日趋增加,但由于缺乏理论指导,其应用决策往往无一定之规。相比于技术层面创新,思维方式变革在大数据时代更为重要。本质上,公共大数据具有“广泛记录”和“有限描述”特性。为保证其利用的科学性、合理性和可靠性,在公共管理应用决策中,应建立4M思维:即通过微观探究(Microscope),发掘数据的内在价值;凭借复合利用(Mixability),提升数据的知识挖掘广度;以语义为导向(Meaning),实现数据与应用的有效结合;采用多维分析(Multidimension),保证数据应用结论的有效性。在分析的基础上,结合北京市交通治理的实践,对大数据的应用思维进一步诠释。
关键词: 大数据;公共管理;4M思维;应用决策;治理能力
中图分类号: D035 文献标识码:A 文章编号:1009-3176(2019)01-056-(10)
作为信息化和数字化技术高速发展的产物,大数据正深刻地影响着人们社会、经济生活的方方面面。如今,借助OA、ERP以及在此基础上发展起来的各类数字化应用系统,企业和政府的所有经营、管理活动可以被实时记录;利用教育、医疗、社保等网络共享平台,居民全生命周期的个人信息能够被完整保存;而通过传感器、物联网和UGC(User Generated Content)网络资源,社会、经济、文化等多方面的特征参数和辅助信息也不断得以丰富和更新。这些数据都为物理世界和非物理世界的描述、分析、理解和管理提供了多维度、详尽的数据资料[1],并推动管理学科朝着科学化、智慧化的方向发展[2][3]。
从其所产生的价值效应来看,在某种程度上可以说,大数据是当前先进生产力的体现。它既是一种现象,也涉及一系列相关技术,更需要新的研究范式和思维方式与之相适应[4]。近年来,大数据在公共管理领域的应用越来越多[5],从国家到地方,都在积极探索数据治理的体系架构[6]、政策法规[7]和应用方法[8]。但现有的研究成果通常只能为政府部门的特定业务提供技术方案和案例参考。因此,大部分政府公职人员对于大数据的认识仍然停留在其表面特征,现实工作中技术与方法的学习、模仿远大于数据资源的有效利用。一方面,日益复杂的经济、社会环境对公共管理提出了越来越高的要求,各个部门都希望通过大数据的分析、挖掘提升应用决策的科学性;另一方面,大量公共数据被存储在政府的数据库中,却往往难以得到充分、有效利用,有的甚至因为缺乏应用需求而被直接清除或动态覆盖。究其原因,传统的数据思维方式已经无法满足大数据时代公共管理应用决策的需要。
一、大数据的应用挑战
随着应用的深入,研究学者和工程专家从不同角度对大数据进行定义,提出了3V(Volume、Velocity、Variety)、4V(3V + Value)、5V(4V + Veracity)等一系列特征描述框架[9]。其中,4V在各领域得到最为广泛的认同,被认为是大数据不同于传统数据资料的本质特征。一直以来,无论是数据收集、整理,还是分析、应用,对于大数据的研究和探讨,大多围绕其4V特征展开,尝试从技术层面解决现实工作中所面临的复杂问题[10]。然而,以数据处理能力提升和计算方法创新为导向的思路,往往容易陷入技术陷阱,并产生许多脱离实际的错误,特别是在人文社会科学和公共管理领域,例如:对政治倾向的错误预测,对疾病发病率的高估,对灾害影响的失效描述[11]。大數据在创造机遇的同时,也给管理和应用带来了诸多挑战。
1.体量增长与价值提升
体量大小通常被看作是表征数据资源丰富程度的最重要参考指标。从TB(万亿字节)到PB(千万亿字节),甚至是EB(百亿亿字节),日趋完善、多样的数据收集体系和信息平台使我们能够获得的数据资料比以往任何时期都要多。由IBM2011年的统计结果可知,我们每天都可以创造出超过2.5EB的新数据。根据Human Face of big data于2012年发布的项目报告,Facebook每天会产生300亿条以上的信息记录,Youtube上每分钟都会新增时长达48小时的视频资料并带来每天40亿的浏览量,Google每天处理超过20PB的信息请求。而在我国,百度2015年收录的网页数量也已超过一万亿张,每天响应中国网民请求达几十亿次;阿里集团拥有近千PB的数据,日处理数据量等同于几千个国家图书馆信息总量之和;腾讯数据中心存储的数据总量超过1000PB,且日均数据增速达500TB;据九次方大数据创始人王参寿描述,我国全国的政府数据加起来实际已有数百甚至上千个阿里的数据体量。
然而,数据量的增长并不能完全代表其内在价值的提升。特别是,当我们面对的是复杂、异构、无序的大数据集时,信息理解和知识发现的成本已远远超过了通过统计汇总和抽样调查所获得的小数据。从应用角度看,虽然数据的准确性、有效性和完整性在整体上决定了其分析结果的合理性,但当数据规模达到一定程度时其分析利用的投资收益往往会随着数据量的进一步增加而急剧降低[12];而从数据共享角度看,尽管各级政府都在努力推动部门间数据的互联互通以及各领域大数据的开放与利用,却由于数据标准不统一、结构化不足、语义缺失,其实际应用范围、使用效率和产生的社会、经济价值都受到严重制约[13]。为了保证数据的可用性,提高其价值密度和使用效率,很多时候有必要对原始数据进行适当清洗、整理和提炼,将粗放的数据资源转化为高质量的数据资产[14]。
2.技术革新与模式转变
面对海量、多样化、快速更新的大数据,公共管理辅助决策的信息应用技术和手段正在产生巨大变革[15]。随着各单位间沟通与协作的加强,跨领域的数据互通与共享越来越多,过去广泛使用的关系型数据库逐渐被Hadoop、NoSQL数据系统所取代,灵活、网络化的数据中心和云计算平台成为政府大数据存储、管理的基础。针对复杂的数据类型、全新的现实问题,习惯于使用统计表格对数据进行标准化整理与汇总的信息部门,在新时期不得不开始尝试借助R、Phython、GIS(GeographicInformation System)或各类专业化应用系统进行多层面的数据分析,以提升数据认知和理解的深度。特别是那些直接参与城市运营的政府机构,如今也不再满足于传统的程序化处理机制,而是更多地通过引入智能化辅助决策系统,基于实时的数据收集能力和高效的可视化监测手段,对辖区环境、事务和突发状况进行动态管理。
但是,大数据带来的不仅仅是技术手段的革新,数据分析方法和利用方式转变对于管理决策制定具有更为重要的意义[16]。从量化指标的比较到数据压缩与融合、从公式计算到变量间的泛在关联,各领域应用在进行数据分析时已不再单纯强调理论模型的科学性,而是日益关注于数据本身的加工、处理和信息表达。例如,进行智慧交通管理,需要以数据所反映的动态交通现象为基础进行道路流量预测和复杂网络控制[17];实现网络社会的数字化治理,关键在于识别信息流通的复杂结构特征和核心节点间的连接关系[18];而在公共政策分析方面,只有从具体语境出发对不同数据集进行阐释,才能有效理解和推断多利益群体、多阶层的行为反应,明确执行过程中的潜在影响和问题[19]。知识既来源于数据又作用于数据,围绕流动性强、碎片化、不规则且来源各异的数据资料,从实证视角对事物的共性规律和个性特征进行探索成为大数据分析、应用的关键。
3.数据挖掘与事务管理
为了发现大数据背后的潜藏价值,数据挖掘在当下得到了前所未有的关注。越来越多的大数据应用尝试通过不同方式的数据解译和时间、空间维度的深入剖析,对已知经验与未知问题进行验证和说明[20]。不同于简单的统计描述与比较,数据挖掘往往更关注于研究对象的组成结构、变化规律和关联关系。采用聚类分析或机器学习手段对数据样本的个体属性与群体特质进行研究,能够了解相关事物的系统构成和基本模式;凭借函数拟合与特征识别方法,对数据的变化和差异进行分析,可以有效认知事物的发生、发展规律;通过对数据间的关联关系进行细致探讨,我们能找出现象的产生原因和影响因素,并在此基础上更好地理解事物的相互作用机制[21]。而除此之外,可视化作为一种更加灵活、综合的数据挖掘手段,如今也被广泛运用于社会科学领域的各项实践活动中[22]。
不过,大数据应用绝不是纯粹的科学计算与研究,其实际价值应更多地体现于事务管理的改革创新[23]。公共管理在逐渐走向精细化、现代化、智能化的过程中,公众需求理解、资源优化配置、应急动态响应等方面都存在着大量的复杂问题[24]。虽然大数据的重要性近年来一再得到认可,但供给与需求对接不畅、理论支撑不足、应用框架缺失使得基层的数字化治理往往“名过其实”,许多有价值的数据得不到充分利用。以应用为導向,如何将大数据分析融入公共部门的日常工作,实现问题探索与治理实践的统一,切实提升基础设施运行效率和民生服务质量、保障社会安全、改善生活环境,是各级地方政府所面临的巨大挑战。
二、公共大数据的本质
公共数据涉及经济、文化、教育、公安、交通、医疗、卫生、就业、社保、环境等众多领域。它既包括政府因工作开展而产生和采集的业务数据,也包括与公共管理实践相关的各类外部网络数据。相比纯粹的商业数据和科学数据,其来源更丰富、复杂性更强、应用更多元化,而且与日常生活的关系更加密切。在大数据时代,公共数据收集的途径、方式和速度与过去相比有着巨大差异,不仅数据量急剧增加,而且数据内涵也发生了深刻变化。
1.广泛记录
数据的本质是记录。在数字化手段和信息化技术还不够发达的时期,人们往往只能通过抽样调查方法,对部分典型或特殊事物在特定时段的状态进行有针对性的记录。由此获得的传统数据虽然也具有一定代表性,但相对于现实世界的复杂情况,却是不全面、不完整、不连续的。与之相比,大数据所记录的内容则要更为广泛。
一方面,大数据属于强细节记录(Full-detailed)。过去那些用于反映经济、社会生活中各种现象和事件的抽象指标参数正在被一系列直观的数字档案所取代。这些数字档案不再仅仅聚焦于个别感兴趣的对象,而是力图对整个场景进行细致刻画。例如,安装在各个交通路口的摄像头不仅记录了该位置通过的车辆信息,也记录了车辆通过时刻的路况环境;网络电商的交易数据,不仅记录最终的交易金额,也记录了买卖双方交易事前、事中和事后的交流内容;各大医院保存的电子病历,不仅包括病人的诊断结果,也涉及其病发症状、应诊医生、医疗处方和后续疗程。
另一方面,大数据倾向于全样本记录(Full-sampled)。随着传感器、物联网和移动互联网等技术手段的广泛应用,公共数据的收集能力相比过去得到了大幅提高,其关注对象也不再限于群体集合或少数个体,而是针对集合中的每一个组成单元。利用号牌识别和ETC技术,我们可以了解通过特定路口的每一辆车,而不仅仅是记录通行的车辆数目;借助信用卡、一卡通等带有身份标识的消费工具,每个人在购买商品或服务的过程中,其社会、经济活动可以被有效记录;而通过GPS和手机信令的空间定位信息,每一部正在使用手机的当前位置也都能够被实时掌握。
与此同时,大数据往往是全周期记录(Full-period)。在数字化管理体系下,数据的产生和收集已成为日常工作的重要组成部分。伴随着公共服务提供和公共事务办理的过程,一系列相关数据得以不断更新。如今,我们能够获得的不单单是代表事物当前状态的片段数据,而是反映其变化和发展的完整历史轨迹。比如,通过连续的空气质量监测,各城市能够了解其近一周、一月、一年甚至多年的大气环境状况;基于出租车、铁路和航空公司的销售运营记录,城市内和城际间每天、每周、每月乃至每年的人流情况都可以被清晰地反映;而根据公交车乘坐、公共自行车租赁和水、电、气等生活必需品的使用记录,政府能够掌握公共资源在不同时段的使用需求。
大数据的广泛记录背后充斥着海量信息。海量信息在给公共管理带来众多潜在应用的同时,却也给每一个应用的信息利用带来了巨大的认知负担。针对具体的管理实践需求,我们往往只关注大数据所反映的某些特定现象和问题,而其绝大部分内容则会被认为是“无效信息”和“暗数据”[25]。
2.有限描述
数据的应用目标在于描述。为了清晰、有效、准确地描述特定问题、现象和规律,过去我们制定了许多标准化的数据收集、整理和分析流程,以获得尽可能可靠的小数据。与之相比,大数据虽然蕴藏着更多信息,但很多时候它只能对事物进行有限描述。
一方面,大数据的描述具有表面性(Superficial)。不同于传统的社会调查和调研数据,以计算机技术为支撑和以自动化数据采集、整理为主导的大数据,通常只是对于所发生事物的现象进行描述,而难以深入其本质。现象与现象之间,通过统计计算归纳出的泛相关性,也仅能说明一些表面问题,无法科学地阐释其内在机理。面对啤酒与尿布的关联、男性内裤与经济形势的联系、女服务员颜值与股市波动的关系、不同星座人群的性格特点,虽然我们都能够从数据中找出一些规律,并尝试从不同角度给出看似合理的解释,但其真实原因及影响过程却始终不得而知。
另一方面,大数据的描述存在有偏性(Biased)。如今,企事业单位和政府机构的数据获取能力越来越强,通过各种渠道所获得的每一个数据集都足够大。但由于业务领域的区别、观察视角的不同、用户群体的差异,其数据描述实际上只能代表特定情况、特定方面或特定人群,而并非对普适规律的系统诠释。例如:通过对社交媒体数据进行跟踪分析,我们能够了解公众对各类事件的网络舆情变化,但用户的线上活动很多时候并不能完全反映其真实想法和线下行为;司机的驾驶习惯对车辆保险的定额有着重要参考价值,然而个人交通事故的发生率还与其视力水平、身体状况、所驾车辆、行驶路线等内容有着密切关系;滴滴打车虽然能够通过对出租车的行驶轨迹进行数据挖掘,理解居民在不同时段的乘车出行模式,却无法涵盖通过公交、地铁出行人群的行为选择。
另外,大数据的描述还缺乏精确性(Inaccurate)。在这个数据爆炸的时代,快速的更新频率和错综复杂的来源,都给数据的精度控制和评定带来了极大困难。特别是那些基于网络开放平台所获得的大数据,很多时候,我们根本无法对其误差和真实性进行有效估量与验证。以中关村在线、搜房网、汽车之家为代表的交易门户网站,虽然能够提供相关领域商品的一系列资讯数据,但其数据的采集方式、计算方法都不得而知;以大众点评、口碑网为代表的众源信息平台,尽管为事物认知提供了丰富的资料描述,但该类数据在语义表达方面却存在巨大的模糊性;对于论坛、贴吧、微博等自媒体数据而言,网络水军的广泛存在,也使得其实际参考价值大打折扣。
大数据并不能完美地解决所有问题,其有限描述能力给应用实践带来了一定风险。但不可否认,它为我们了解现实世界开辟了一个全新的视角[26]。在DT时代,寻求答案不能仅依靠简单的量化计算,而是要在充分认识大数据的价值和不足基础上,对其进行有效利用。
三、应用决策的4M思維
作为政府公职行使的主要形式和政策制定的基础,应用决策在公共管理实践中具有重要意义[27]。高效的公共服务应用离不开合理的数据分析,而科学的决策制定过程也需要依靠充分的数据支撑。为了提升公共管理质量,保证应用决策的可靠性,面对大数据的广泛记录和有限描述能力,其数据利用的思维方式必须进行相应转变。
1.微观探究(Microscope)
受到计算机技术发展和人类认知能力制约,各级政府机构和机关单位长期以来习惯于通过宏观分析了解事物的当前状况和历史变化,并在此基础上总结归纳其发生、发展规律。所使用的数据大多严重缺乏微观细节;即便通过特殊手段进行详尽的数据收集,经过一层层汇集、整理,最终也转化为一目了然的指标参数。汇总数据固然简洁、明了,但同时也丢失了许多对于应用决策而言极为重要的参考信息。它不仅无法对事物的不同组成部分进行细致刻画,也不能对其描述内容进行深入剖析,清晰说明相关分项指标对最终数据的影响,更难以明确知道该数据在不同情况下的差异和变化。
随着经济、社会发展与改革的推进,数据的深度理解对于保障应用决策的合理性具有越来越重要的意义。很多复杂问题的解决有赖于细致的数据分析,而大数据的强细节、全样本和全周期记录特性则为事物的微观探究创造了先决条件。基于语境的数据统计与比较,可以为现象理解提供更完整的信息[28];从个体出发的数据描述与多层次综合,能够为规律发现提供更系统的知识[29];而完整、有效的时序分析与模拟仿真,则为我们认识事物的变化过程和机制提供了更加科学的手段[30]。无论是政策分析、社会治理,还是资源优化与应急处置,数据的分析与利用已不能仅仅停留在宏观层面,只有在微观视角下对问题的本质进行探讨,才能充分发掘大数据的内在价值。
2.复合利用(Mixability)
面对制度化、标准化的日常工作,政府部门的数据使用往往具有极强的独立性和针对性。各单位在对具体事务进行分析和处理时,都习惯基于自身的应用体系和流程进行封闭式的信息整理,而较少考虑数据的多重价值以及数据与数据之间的潜在联系。然而,对于包含丰富细节的大数据来说,传统的单通道数据解读与应用不仅难以满足复杂事物认知和现象理解的现实需求,而且也是对信息资源的极大浪费。同一份数据,采用不同手段、从不同层面进行分析和探讨,可以获得多样、系统的知识;各部门所收集和掌握的数据资料,不仅对其自身的业务开展具有重要意义,很多时候也有利于其他相关单位的资源规划、配置与调度、管理。
大数据对于应用决策的支持,不只体现在问题探究的深度上,也反映于其知识挖掘的广度。广泛记录所带来的多元信息,决定了大数据分析方式和使用过程的复合性。对数据的信息利用,并不局限于个别问题的解决,更多的是通过时序关联、业务关联和知识关联,实现不同应用场景下的形势判断与发展预测[31]。由于内容的开放性和可重用性,大数据的计算框架正从过去的“以流程为中心”转变为“以数据为中心”[32],从强调数据的保密和自主管理逐渐过渡到注重其在线应用与互操作[33]。考虑到数据外部关联所带来的乘数效应,跨领域互通与共享被认为是大数据价值放大的有效途径,而“块数据”的推广与应用则能够进一步为数据复合和信息流动奠定基础[34]。
3.语义导向(Meaning)
不同于直观、明确的小数据,大数据由于内容描述的表面性,其分析、处理过程通常离不开隐含信息的挖掘和语义属性的探讨。相比数据本身的变化、差异和量化特征,其价值更多地应体现于对内容和结果的应用解释[35]。对于文本数据而言,传统的词频统计方法仅能揭示语料记录的关注重点,只有通过句法解析和语境理解才可以明确其表述的真实含义和背后所反映的情感、态度;多媒体数据的挖掘,不能仅依靠资料的分类组织与整理,如果缺乏深入、有效的语义标注和索引,大量有价值的信息将埋没于复杂、异构的数据文件中而难以被利用;即便是数值数据的分析与应用,离开了知识推理与语义论证,其参数计算最多也只能反映一些表面现象,而无法说明现实世界的事物本质与客观规律。
从数据选择、加工到存储、管理与分发、利用,语义在基于大数据应用决策的整个流程中起到了越来越重要的作用,它既是数据和应用之间的黏合剂,也是信息融合与知识创新的基础。语义场景的构建、语义内涵的阐释、语义关系的剖析日益成为大数据分析、探索的关键。为了提高大数据的应用效率,保证信息的合理、有效利用,一方面,需要根据数据的语义内涵对其进行结构化、标签化处理,将隐含信息显性、规范地表达出来,以满足大规模计算和机器学习的现实要求[36];另一方面,还要考虑事物间的内在关联,依据本体论、知识图谱和语义网,围绕实际应用构建具有针对性的语义计算框架,实现从表层感知到深入理解[37]、从被动响应到智慧服务[38]的价值过渡和升华。
4.多维分析(Multidimension)
大数据虽然为我们了解现实世界提供了更多精细、完整的记录资料,但面对复杂的内、外部环境,有偏性和不精确的内容描述却使得其分析结果的真实性和可信度大打折扣。使用大数据对事物进行探索,就好比“盲人摸象”,通过单一视角或依靠单一数据源所得出的结论通常都难以全面、准确地反映其实际情况和变化规律[39]。从现有的众多应用来看,数据本身的代表性问题往往是一系列误差的主要来源。与此同时,在对事物的当前状态进行量化评价时,由于其多维度的外在表现形式,仅依据某类属性特征进行比较和判断,相应结论必然会有所偏颇;基于历史数据对事件的发展过程进行推演和预测,也非常容易因为相似样本有限和诱导因素的多样化,导致最终结果存在较大的不确定性。
在推动国家治理体系和治理能力现代化的发展背景下,“寻数治理”需要通过不同视角的补充、完善和相互印证,尽量避免数据利用过程中的无效探讨和由此造成的错误决策。在大数据收集方面,采用不同方式获得的数据越多,对事物的描述往往越接近其真实状态[40];在数据计算方面,借助多源数据的交叉比较与融合纠正,能够使系统误差得以科学评估与有效控制[41];而在数据内容的表达方面,则可充分利用可视化仿真、虚拟现实、增强现实等全方位展示手段,最大限度提高应用决策者的信息综合能力[42]。从“全息感知”到立体化理解,从单一标签到多层面画像,大数据分析维度增加带来的不仅仅是数量上的变化,更是应用决策质量的跃升。
四、4M思维在北京市交通治理中的实践探索
交通拥堵是当前各大城市公共治理过程中普遍面临的难题。地方交管部门虽然采用特定的车流限制和疏导措施,也出台了一系列相关政策,但过高的人口密度、逐年攀升的汽车保有量和巨大的区域通勤压力使得城市“车-路矛盾”始终难以得到有效解决,并由此带来了包括环境污染在内的诸多经济、社会问题。而借助大数据,我们可以在有限条件下尽可能地提高城市治理水平,改善道路通行环境、完善城市功能系统。
相比全国其他城市,北京市的交通数据积累和应用探索都比较超前,其实践经验具有很强的参考、借鉴意义。在没有先进的数据获取手段下,早在1986年,北京就开始开展军民出行调查,详细记录每一户当天的出行日志;2008年之前,北京市五环以内快速主干道基本都安装了车流量监测器,而所有出租车也装配了GPS接收机,进行浮动车动态数据采集。如今,为了更好地发现问题、找出规律、提出方案,基于大数据的城市交通治理正在得到越来越多的认可,并被写入《北京市“十三五”时期交通发展建设规划》。综观当前的诸多应用,其大数据的分析、利用过程实际上都离不开4M思维的理论框架。
北京市交通委员会和市公交集团联合多所高校与科研院所共建的“北京城市交通协同创新中心”,在利用大数据开展城市交通研究与治理方面做了大量工作。其中,以“微观探究”思维为主导,利用公交ID卡数据和每一台运营出租车的GPS定位数据对不同时段的公共交通出行和道路交通流量进行细致分析,并借助模拟仿真手段实现由微观到宏观的城市交通过程推演与预测;基于“复合利用”的思路,不仅将车流量数据应用于城市交通状况的评价,而且与北京市交通行业节能减排中心合作,利用该数据对道路网周边的空气质量变化进行研究,探讨绿色可持续交通体系构建问题;而且采用“多维分析”方法,在展现道路拥堵的变化规律时,充分综合出租车、公交车以及手机定位等各类数据,全方位涵盖不同交通出行方式,以提升信息的完整性与准确性。
为了深化大数据的行业应用,给交通规划、管理提供决策支持,北京交通发展研究院与中国电信共建的“城市与交通大数据联合实验室”致力于数据资源的有效整合与利用。在对人流和车流的运动规律进行研究时,从“微观”层面入手,尝试利用大数据探索每个区域、每条道路的人和车都从哪来、要到哪去;出于理解城市居民出行需求的目的,根据数据背后隐含的“语义”信息,对城市空间布局、业態和区位作用机制进行量化描述和分析,力求弄清行人、车辆和道路网络之间的复杂关系与相互影响;更通过打造交通大数据生态圈,实现多方数据的“复合”与交叉利用,在借助电信数据提升交通治理能力的同时,也将公共交通数据应用于移动端的智能服务推广。
另外,北京市交管局以及腾讯、百度、滴滴打车等企业也都从不同角度收集并拥有大量的城市交通相关数据。对于这些数据的利用,绝不是仅仅依靠传统的指标监测手段进行路况播报和车辆监管,而是通过“微观探究”,对市区交通现象和过程进行细致剖析,发掘不同区域、不同人群的出行特征和行为模式;凭借“复合利用”,拓展交通数据在多个相关部门和服务行业的应用,实现政府、企业、社会的多元协同治理与基于位置的服务;以“语义导向”,分析交通问题的表征内容、产生原因和后续影响,推动公共服务的供给侧改革和精细化管理;采用“多维分析”,完善和补充对复杂交通体系的认知,保证管理决策的正确性和有效性。
五、结 语
大数据不是简单的“大存储+大计算”,它给整个社会带来的挑战,不完全在于技术层面。其价值更多地体现于对实际应用决策的支持,而应用决策的最终需求往往又会到影响到数据收集、整理、分发、利用的各个环节。只有明确公共大数据的特性与差异,才能清晰地了解数据应当怎样科学利用、如何有效共享、怎么合理开放。特别是,随着人工智能(Artificial Intelligence)技术的进一步发展,机器对数据的自动化学习和智能化处理将越来越广泛。人类对数据分析和应用过程的管理,也将逐渐从程序化干预过渡到方向性控制,而此时其应用决策的思维方式将显得更为关键。
通过分析、探讨所总结的4M思维,在公共管理大数据应用决策中扮演着重要角色。不仅是交通治理,人口、经济、文化、教育、医疗卫生、土地资源、公共安全等领域的数据利用都面临着思维方式转变的问题。虽然大数据的分析、应用和开放还涉及社会伦理、经济效益、部门关系、政策法规等众多方面,而且需要考虑数据脱敏、数据流通、数据权益和数据标准化等一系列问题,但从大数据的广泛记录和有限描述特性出发,微观探究、复合利用、语义导向和多维分析对于保证数据的科学、合理、可靠利用具有指导意义。
參考文献:
[1] Lynch C. Big data: How do your data grow?[J]. Nature, 2008, 455(7209): 28-29.
[2] McAfee A, Brynjolfsson E. Big data: the management revolution[J]. Harvard business review, 2012, 90(10): 60-68.
[3] George G, Haas M R, Pentland A. Big data and management[J]. Academy of Management Journal, 2014, 57(2): 321-326.
[4] 徐宗本, 冯芷艳, 郭迅华等. 大数据驱动的管理与决策前沿课题[J]. 管理世界, 2014(11):158-163.
[5] Kim G H, Trimi S, Chung J H. Big-data applications in the government sector[J]. Communications of the ACM, 2014, 57(3): 78-85.
[6] 陈之常. 应用大数据推进政府治理能力现代化——以北京市东城区为例[J]. 中国行政管理, 2015(2): 38-42.
[7] 张勇进, 王璟璇. 主要发达国家大数据政策比较研究[J]. 中国行政管理, 2014(12): 113-117.
[8] 米加宁, 章昌平, 李大宇, 林涛. 第四研究范式: 大数据驱动的社会科学研究转型[J]. 学海, 2018(02): 11-27.
[9] Wamba S, Akter S, Edwards A, et al. How 'big data'can make big impact: Findings from a systematic review and a longitudinal case study[J]. International Journal of Production Economics, 2015, 165: 234-246.
[10] 李国杰, 程学旗. 大数据研究:未来科技及经济社会发展的重大战略领域--大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012, 27(6):5-15.
[11] Lazer D, Kennedy R, King G, et al. The parable of Google Flu: traps in big data analysis[J]. Science, 2014, 343(6176): 1203-1205.
[12] Nair B. Reaping ROI from Big Data[J]. CSI Communications, 2014, 38(3):29-30.
[13] Zuiderwijk A, Janssen M. Open data policies, their implementation and impact: A framework for comparison[J]. Government Information Quarterly, 2014, 31(1): 17-29.
[14] Tang, N. Big data cleaning[A]. In Asia-Pacific Web Conference[C]. Berlin Heidelberg: Springer-Verlag, 2014.
[15] Jagadish H V, Gehrke J, Labrinidis A, et al. Big data and its technical challenges[J]. Communications of the ACM, 2014, 57(7): 86-94.
[16] Provost F, Fawcett T. Data science and its relationship to big data and data-driven decision making[J]. Big Data, 2013, 1(1): 51-59.
[17] Shi Q, Abdel-Aty M. Big data applications in real-time traffic operation and safety monitoring and improvement on urban expressways[J]. Transportation Research Part C: Emerging Technologies, 2015, 58: 380-394.
[18] Tan W, Blake M B, Saleh I, et al. Social-network-sourced big data analytics[J]. IEEE Internet Computing, 2013, 17(5): 62-69.
[19] Schintler L A, Kulkarni R. Big data for policy analysis: The good, the bad, and the ugly[J]. Review of Policy Research, 2014, 31(4): 343-348.
[20] Fan W, Bifet A. Mining big data: current status, and forecast to the future[J]. ACM SIGKDD Explorations Newsletter, 2013, 14(2): 1-5.
[21] Kantardzic M. Data mining: concepts, models, methods, and algorithms[M]. New Jersey: John Wiley & Sons, 2011.
[22] 孫轩, 孙涛. 基于大数据的城市可视化治理:辅助决策模型与应用[J], 公共管理学报, 2018, 15,(2): 120-129.
[23] LaValle S, Lesser E, Shockley R, et al. Big data, analytics and the path from insights to value[J]. MIT sloan management review, 2011, 52(2): 21-31.
[24] Teisman G R, Klijn E H. Complexity theory and public management: An introduction[J]. Public Management Review, 2008, 10(3): 287-297.
[25] Heidorn P B. Shedding light on the dark data in the long tail of science[J]. Library Trends, 2008, 57(2): 280-299.
[26] Davenport T H, Barth P, Bean R. How big data is different[J]. MIT Sloan Management Review, 2012, 54(1): 22-24.
[27] Bozeman B, Pandey S K. Public management decision making: Effects of decision content[J]. Public Administration Review, 2004, 64(5): 553-565.
[28] Light, Paul, and George Butterworth (eds). Context and cognition: Ways of learning and knowing[M]. New York: Routledge, 2016.
[29] Girard Y, Hett F, Schunk D. How individual characteristics shape the structure of social networks[J]. Journal of Economic Behavior & Organization, 2015, 115: 197-216.
[30] Hassan, S., Antunes, L., & Arroyo, M. Deepening the demographic mechanisms in a data-driven social simulation of moral values evolution[A]. In International Workshop on Multi-Agent Systems and Agent-Based Simulation[C]. Berlin Heidelberg: Springer-Verlag, 2008.
[31] Fan W, Bifet A. Mining big data: current status, and forecast to the future[J]. ACM SIGKDD Explorations Newsletter, 2013, 14(2): 1-5.
[32] Li A S, Soh B, Bhatti M I, et al. Data-centric view of knowledge in information systems literature review[J]. International Journal of Services, Economics and Management, 2016, 7(2-4): 111-123.
[33] Madden S. From databases to big data[J]. IEEE Internet Computing, 2012, 16(3): 4-6.
[34] 大数据战略重点实验室. 块数据[M]. 北京: 中信出版社, 2015.
[35] Frankel F, Reid R. Big data: Distilling meaning from data[J]. Nature, 2008, 455(7209): 30-30.
[36] Berman J J. Principles of big data: preparing, sharing, and analyzing complex information[M]. San Francisco: Morgan Kaufmann Publishers Inc., 2013.
[37] 王天思. 大数据中的因果关系及其哲学内涵[J]. 中国社会科学, 2016,(5):22-42.
[38} 温有奎, 乔晓东. 大数据下智慧发现服务平台研究[J]. 情报学报, 2015, 34,(11):1181-1189.
[39] Wu X, Zhu X, Wu G Q, et al. Data mining with big data[J]. IEEE transactions on knowledge and data engineering, 2014, 26(1): 97-107.
[40] Kostyuchenko, Y. V., Movchan, D., Kopachevsky, I., &Bilous, Y. Robust algorithm of multi-source data analysis for evaluation of social vulnerability in risk assessment tasks[A]. In SAI Intelligent Systems Conference (IntelliSys)[C]. London: IEEE, 2015.
[41] Rssler S. Data fusion: identification problems, validity, and multiple imputation[J]. Austrian Journal of Statistics, 2016, 33(1&2): 153-171.
[42] Olshannikova E, Ometov A, Koucheryavy Y, et al. Visualizing Big Data with augmented and virtual reality: challenges and research agenda[J]. Journal of Big Data, 2015, 2(1): 1-27.