基于大数据的工程项目社会稳定风险评估模式研究
2021-12-30向惠聪赵小亚
向惠聪,赵小亚,王 浩
(1.吉首大学 土木工程与建筑学院;2.吉首大学 旅游与管理工程学院,湖南 张家界 427000)
改革开放以来,中国的经济飞速发展。中国一些重大项目工程应势而生,但同时,在发展的背后,我们也应该注意到各种项目工程等在实施过程中可能引发的对社会稳定造成一定影响的风险因素[1]。为了有效规避、预防和控制项目在实施过程中可能出现的各类影响社会稳定的风险,确保项目的顺利实施,在实施前都会进行风险评估[2]。例如在2016年6月,四川遂宁叫停了一份投资上亿元的项目,原因无他,就是因为该投资建设项目“虽可大幅增加遂宁县财政税收,但该项目社会稳定风险系数较高,安全性、可行性、可控性差,不宜在原项目建设地址建厂”。传统的风险评估收集数据时比如实地调查,随机抽查问卷等具有的普遍性不高,很难得出民众群体的真实反映,且主观性太强,数据调查的空间范围不够,数据所具有的时效性不强,收集到的数据的类型同样不能代表广大人民群众,这就会对评估结果产生一定影响,并且一些项目由于某些原因,致使关于该项目的一些数据公开不到位,导致评估结果具有一定偏差。相比之下,将互联网技术运用到风险评估当中,在大数据下通过对个人的动态分析从而上升到对群体的动态分析,将现实数据与网络数据结合起来,得出更加准确、能反映出实际状况的数据,为风险预测评估提供进一步的支持。
1 基于大数据的社会稳定风险评估内涵
大数据,顾名思义指数据的量大。实际上,这不仅仅是简单的数量概念,还包括了更丰富的内涵。根据IBM公司的阐释,大数据具有“4V”特点:Volume(大量)——数据体量巨大;Variety(多样)——数据类型繁多;Velocity(高速)——数据高速处理;Veracity(精确)——追求数据高质量。
基于大数据下的社会稳定风险评估,在一定程度上摆脱了传统风险评估的不足性,同时也具有上述所提到的“4V”特点。当今世界科技不断发展,如果仅仅依靠讲座、走访、调查问卷,公示等方式收集数据,推测人民群众对项目建设的反映或者意见,所得出来的评估结果往往是不全面的。将互联网技术运用到社会评估中,在大数据的背景支持下,得出的评估结果不能说是百分之百的正确,但也会给我们提供平时收集不到的数据,进一步提高评估结果的准确性。在科技越来越发达,网络越来越普及的时代,网络发声这种方式也越来越被人们所接受,当有某一时事热点发生时,往往能在网上掀起很高的讨论热度,网友通过评论留言发表自己的意见看法,千万不要小看“网友”这一群体,它涵盖了各种各样的人,年龄不同、职业不同、地方不同等,相比于传统的数据收集,分析互联网数据具有一定优势,如果再将二者结合起来,势必会使评估结果更加准确。其中,可以通过了解并综合群众在网络上搜索浏览的内容,得知群众对社会事件的关心度及发表的内容意见,将群众的动态浏览转化为社会稳定评估上的静态可参考的数据意见。如谷歌通过对“流感”及其相关词汇在网络搜索记录中出现频率的观察,准确预测了流感病毒在全美的传播状况;又如美国加州大学的人类学家和数学家共同建立了犯罪活动预测平台,通过分析过去1 300余万起案件,探寻即将发案的时间与区域④。这便很好展示了基于大数据下的社会稳定风险评估的优越性[3]。
2 系统构建的基本框架
2.1 信息收集与共享功能
大部分的数据资源都储存在政府处,对于零零散散,复杂而繁多的数据资源,政府也有能力将其掌握好,这表面上做到了各类数据的互通融合,做到了数据的共享,可由于地方不同、部门不同,导致各处政府掌握的数据资源不同,从另外一个方面来看,对于数据,还是处于零散状态,只是使单个零散的数据体积变大了而已。
所以,各地政府将数据资源公开共享互通是数据收集平台搭建的第一步。2015年,国务院印发的《促进大数据发展行动纲要》中提及了要在2018年底前建成国家统一的数据开放平台[4]。而在此之前,我国多个省市已经陆陆续续开始政府数据开放平台线上试运行了[5]。虽说数据资源共享开放得到了一定的重视发展,但在目前来说也只主要集中在地方政府,往更大的区域层面上看,数据资源共享开放的发展并不理想,这导致在进行社会稳定风险评估前收集的数据并不全面,影响评估结果。就现实情况来看,我国目前至少可以同贵州的“云上贵州”平台一样,建立预测社会稳定风险信息共享互通平台,将交通、住房、就业、入学、保险、医疗等信息,通过处理分析,将其“集中”起来,建立一个数据库,促进数据资源共享开放不理想的区域的发展。
同时,这样一个数据资源共享平台搭建也应该注意以下几点:①在平台上的数据要保证其真实性,运用真实数据来进行社会稳定风险评测;②在不影响威胁到国家安全、机密的前提下,数据体积越庞大越好;③数据应注重时效性,社会不断发展,人们的思维趋势不断改变,及时掌握实时数据,有效做出针对当前情况的分析。
2.2 信息挖掘与分析功能
在数据资源收集平台搭建完成后,接下来就要对收集到的体积庞大的数据进行分析处理了。如果对数据不会分析运用,那么即使拥有藏有如此多信息的数据,也不会增加风险评估的准确性,只是徒劳。美国在数据分析处理方面的发展比较好,花重金在数据分析平台的搭建上,投入大量人力物力财力去研究,将大数据运用在经济发展、反恐、维持国家稳定等方面,并取得不错的成果。
基于大数据的数据分析和挖掘技术,其理论基础来源于数据的分布式计算和挖掘原理,分布式计算是在原有算法基础上的改进,将原有的单机运算变为多台机器的分布式运算,而数据挖掘则主要依据聚类、分类和主题推进等算法,常用的大数据分析工具主要有Hadoop、Spark、Storm等。
2.3 信息评估与应用功能
将大数据运用于社会稳定风险评估中的目的就是提高评估的准确性。因此,在完成数据资源的收集,分析处理后,就要考虑将其运用到现实中,完成对大数据的应用。
以往的评估结果之所以不被公开,是因为运用传统风险评估方法去评估风险,其结果仅仅只能得出项目是否能够继续,并不能知道这个结果是否准确,民众也无法了解整个评估过程。试想,如果用传统评估方法得出的评估结果可以被公开,民众知道了这个结果,而恰恰这次的评估有所偏差,与预想中的不符,这是否会从另一方面引起社会恐慌,降低政府的“公信力”。而搭建风险评估应用平台,将评估过程、数据来源、数据分析、在现实中的应用等都公开在平台上,民众对此一目了然,评估结果的准确性也有了一定的依据,每一次的评估都有数据支撑。而且也可以进一步拉近民众与政府的距离,一举两得。
3 系统构建过程中面临的主要挑战
3.1 对风险的概念认知不够全面
一般评估影响社会稳定的风险因素,传统上只注重该风险是否会引发群众聚集类事件,而这仅仅只属于“稳评”中的一小类,实际上应该从多个方面、多个角度去看待问题。对于突发的,会引起群众恐慌,社会不良影响的风险因素,也应着重、有针对性地开展风险评估。具体来说,前段时间高架桥坍塌事故,上海一在建楼房连根拔起倒塌事件的发生,都已经引发了严重的社会恐慌,哪怕没有人员死伤,都应该列为高危的社会风险。同时,我们不仅要关注现实生活中引起的影响社会稳定的风险因素,还不能忽视群众在网上的动态意见,不能只将引起人员伤亡定义为风险。互联网技术基本走进了家家户户,近几年来也有很多通过微博等媒介揭露一些事实真相,从而引起社会大众共鸣的事件发生,这些事件的发生通常具有不确定性,更加不会提前预知,往往发生得很突然,并且引起很大的社会反响,这就对项目的实施具有一定影响作用,无论好与坏。由此可见,引发影响社会稳定风险的因素有很多,网络上的数据也是我们在进行评估时必须要考虑的因素。
3.2 采集的数据有限,对数据的分析运用不够
传统的社会稳定风险评估中,所用到的数据大部分都是来自“线下”。一般都是通过讲座、听证会、实地调查问卷等收集数据,先不讨论收集到的数据准确性如何,单单就数据的“体积”来说,就是不够的,或许尽可能地多收集数据,可是这些对于当地区,甚至是中国这么庞大的人口基数来说,他们还很渺小,并不能代表全部民意,也不能够保证基于这些数据上实施的重大项目会不会引起公众躁动,甚至是社会动荡。并且即使运用互联网技术,将大数据利用起来,但由于数据的杂乱无章,缺少专业人员用专业技术处理,也很难将有用的数据提取出来,将其运用到稳定评估中,大数据将处于被浪费的状态,致使结果仍和之前传统的评估相似,并没有太多地提高其分析结果的稳定性。
4 结束语
虽然将大数据运用于社会稳定风险评估在我国目前还处于起步阶段,整体规模较小,并且面临着众多困难,如一些相关数据公开不到位,难以获取到较为私密的数据,但随着科技的不断发展,将互联网技术运用于社会稳定风险评估也必然成为趋势,传统评估方法会逐渐从主力军位置退下来,大数据分析必将代替他得出更加准确的评估结果,保证在项目实施后不会严重影响社会稳定。