APP下载

网络公众对高放废物深地质处置接受性研究

2021-07-24张冰焘赵帅维李洪辉谢龙龙孟子贺

世界核地质科学 2021年2期
关键词:废物信任权重

张冰焘,赵帅维,李洪辉,谢龙龙,孟子贺

(中国辐射防护研究院,太原 030006)

随着核电的发展,将会有越来越多的高放废物产生,而高放废物的安全处置是核能可持续发展和环境保护的重大问题[1]。目前大多数有核国家都倾向于采用由美国国家科学院首先提出的深地质处置方案来进行高放废物处置[2]。中国对于高放废物处置的相关研究开展较晚,于1985年由徐国庆等开始了第1个高放废物地质处置研究课题[3-4]。从此,中国开展了高放废物地质处置的跟踪调研、高放废物地质处置规划、处置库场址区域筛选、地下实验室场址筛选、工程屏障、核素迁移和安全评价等多方面的研究。自21世纪开始,中国高放废物地质处置相关的研究开发工作进入了一个稳步发展的全新阶段[3],高放废物地质处置科研从选址、场址评价逐渐进入为地下实验室建设做准备的阶段。

高放废物深地质处置地下实验室的建设涉及到许多的问题,在使用的过程中肯定会涉及到放射性废物的处置。一旦有关放射性废物的处置研究势必离不开公众的支持[5-7]。公众接受性研究是政治学、心理学和公共政策等领域中公共舆论与风险治理研究的一大分支,是一项科学创新与公共管理的交叉研究[5]。地下实验室的公众接受性会对国家未来的核退役治理工程发展的政策、技术、经济性等问题都会产生影响。国家决策不仅要考虑经济成本,还要考虑社会成本,如果公众对地下实验室存在较大争议,甚至引发冲突,其结果所造成的巨大社会影响是政府在进行决策时考虑的主要问题之一[8]。因此,地下实验室的公众接受性既影响核退役治理工程的发展,也影响安全目标的制订,在国外地下室实验的建设过程中,公众的决定占据了主导地位。如芬兰、瑞典,在建设的初期与公众保持了良好的沟通,项目顺利进行;相反的是,法国、美国因为公众的强烈反对导致研发计划终止或者延期。因此公众的参与起到了决定性的作用[9-12]。

由于中国高放废物地质处置地下实验室工程初步建立,而高放废物潜在的安全性以及公众对其的担心和影响决定后续发展,特别是工程周围的居民的接受度对其拥有巨大的影响力,他们对高放废物的认知水平将对工程的建设起到了重要的作用。调研国内、外分析公众接受性的方法,以及收集有关公众接受性的数据,是目前了解高放废物地质处置地下实验室建设公众接受性的基础。然后再选择合适的分析与研究方法总结影响公众对高放废物地质处置地下实验室工程接受度的关键因素,进而了解公众参与的接受程度。这有利于对后续过程中加强高放废物知识的宣传普及,提高公众的核应急意识,解决由于高放废物地质处置研究室对他们生活、生活环境中造成问题提供帮助。因此,寻求影响地下实验室公众接受性的关键因素,一方面有助于社会科学研究者提炼出公共舆论、政策过程和政府回应的一般知识;另一方面有助于决策者把握公众心理,从而制订出技术可行、人民满意的政策,实现科学化和民主化[5]。

1 网络爬虫确定关键因素

以网络爬虫(Web crawler)的方式从各大新闻网站上爬取核相关新闻数据进行研究,对爬取的数据进行数据预处理,并进行分析、归纳和整理,最终得到公众接受性关键因素。

爬虫就是请求网站并提取数据的自动化程序,本研究采用Scrapy框架来实现爬虫,其具体步骤如下:(1)打开一个网站,找到处理该网站的爬虫(Spider),并请求第1个要爬取的网址(Uniform Resource Location,URL)[13];(2)通过调度器(Scheduler)以请求(Request)的形式进行调度,并请求下一个要爬取的URL;(3)Scheduler返回下一个要爬取的URL,同时下载页面;(4)页面下载完毕后,将其发送给引擎(Engine);(5)将下载的页面交给Spider处理,并返回爬取到的项目(Item)及新的Request;(6)将返回的Item给项目管道(Item Pipeline),将 新 的Request给Scheduler;(7)重 复 以 上 步骤,直到Scheduler中没有更多的Request,关闭该网站,爬取结束。

通过以上步骤,一共爬取到11 508条数据,涉及包括性别、年龄、学历、住址、职业、年收入、对核的了解、对政府和专家的信任程度、知情权、监督权、参与权和对核退役的态度等29个属性,如表1所示。

表1 各个因素指标含义Table 1 The meaning of each factor index

2 各个因素权重的计算

2 .1层次分析模型的建立

根据表1所得到的网络上公众接受性的指标与分类,因素中人口性别、年龄、职业和家庭收入是通过其他因素等间接影响到公众的接受性。公众对于接受程度的判断结果是非常主观的[14]。虽然年龄、性别等客观因素可能影响到公众的接受情况,但并不能作为公众接受性的评价标准[15]。因此,对于公众接受性影响因素当中的性别、年龄、职业和家庭收入的客观因素进行删除,最终可以构建出层次分析模型,如图1所示。

图1 网络因素的层次分析模型Fig.1 AHP mode of factors in the internet

2 .2 XGBoost算法确定各个因素的权重

层次分析法确认权重一般通过专家打分法进行打分,但是这种方法个人主观性太强,不能很好地表示出民众的意愿。为了更好地结合网络工具,采用大数据处理的方法对采集到的数据进行整理,以确定各个因素的权重。

XGBoost(Extreme Gradient Boosting)算 法是基于决策树的集成机器学习算法,使用梯度上升框架,适用于分类和回归问题[15]。它可以有效地构建增强树并能够并行运行,假设有T颗树,那么模型的输出值为:

式中:T—树的数目;F—树的集合空间;yi—模型的预测值;xi—第i个数据点的特征向量,且xi∈R(i=1,2,…,n);ft—第t棵独立树的结构,与叶子的权重向量有关。每一棵的参数包括它的结构与叶子结点的值,不妨将每一颗树作为参数来进行优化,目标函数可改写为:

采用前向分布算法把学习过程分解为先学习第一颗树,然后基于学习好的第一颗树再去学习第二棵树,以此类推,直到通过第t−1颗树来学习第T颗树为止。即要找到这样一个树,使下面的目标函数最小:

在一个基学习器(CART)中,影响其复杂度的因素主要有叶子结点数、叶子的权值,因此树复杂度函数Ω(ft)可以写为:

问题转换为使得目标函数Obj(T)最小

解得

代入目标函数得

XGBoost算法从根的节点开始,用递归的方法选择树结构的最优特征,以此对训练数据进行分割[16]。信息增益最大的分割为该节点的最优分割,其计算如公式

式中:中括号第1项—左子树分数;第2项—右子树分数;第3项—不分割时的分数;γ—加入新叶子节点引入的复杂度代价,当Gain<0时,放弃分割[17]。

XGBoost根据结构分数的增益情况,计算出选择哪个特征作为分割点,而这个特征的重要性就是它在所有树中出现的次数之和[18]。也就是说一个属性越多地被用来在模型中构建决策树,它的重要性就相对越高,相应的对结果的预测影响更高。

以是否同意所在的地区被选定为高放废物处置库建设区为类别标签,同意为1,反对为0,训练集和测试集的数据比例按照7:3进行划分。最终XGBoost模型相关性能指标结果如表2所示。由 表2可 见,XGBoost模 型 的AUC达 到 了91.22%,预测效果良好。Accuracy(ACC)代表模型准确率,XGBoost模型的ACC为82.18%,表示模型具有良好的准确率。Recall和Precision分别代表查全率及精确率,F1-score代表F1得分。这三个指标都在80%以上,代表模型预测精度好,结果的可信度较高。

表2 XGBoost模型性能指标Table 2 Performance index of XGBoost mode

由于集成模型中的XGBoost仍然属于树模型,对于树模型可以判断每个特征变量对模型的贡献程度,从而判断哪些特征变量对于是否同意所在的地区被选定为高放废物处置库建设区的影响更为显著,其结果如图2所示。

图2 因素的特征重要性Fig.2 The characteristic importance of factors

图2显示了每个特征变量对模型的贡献程度,通过程度的强弱来表示每种因素的权重,最终笔者通过以下公式确定每个因素的权重。

式中:q—子因素对模型的贡献程度,Q—该子因素所对应的主要因素的贡献程度,V—该子因素的权重,以此可以计算出每个因素的权重。根据构建好的公众接受性评价指标体系,建立评价指标集。

一级指标:

U={V1;V2;V3;V4}={认知水平;信任水平;感知风险;感知利益}

二级指标:

V1={V11;V12;V13;V14;V15;V16;V17}={是否了解核泄漏;是否了解核污染;是否了解核;是否了解核电;是否了解核能;是否了解核技术;是否了解核退役};

V2={V21;V22;V23}={对当地政府的信任;对核事故防范的信任;对企业和科学家的信任};

V3={V31;V32;V34;V35;V36;V37;V38}={建造高放废物处理地区的位置;遏制本地经济的发展;参与权;对本地生态环境的破坏;对本地居民造成心理负担;监督权;生命安全;知情权};

V4={V41;V42;V43;V44;V45;V46}={对 发展核退役工程持何种态度;补偿收入得到提高;提供更多的就业机会;促进本地经济发展;基础服务设施得到提高;引进人才}。

通过上述方式,进而计算各因素权重值,得出U的具体权重为:

U={V1;V2;V3;V4}={0.176;0.268;0.315;0.241}

设Vi各因素的权重分配为:

3 公众接受性综合评价

3.1 建立评语集

建立公众接受性的评语集S={S1;S2;S3;S4;S5}[14]。其中S1为非常差,S2为较差,S3为一般,S4为较高,S5为非常高,如表3所示。

表3 公众接受性评语等级Table 3 The comment grade of public acceptance

3.2 综合评价

如果rij(i=1,2,…,m;j=1,2,…,n)可以用来表示指标vi对第j级评语vj的隶属程度,根据调查结果,并进行整理分析,则

因此,根据rij值就可以得到各因素对不同评价的隶属程度所组成行向量元rij,根据行向量元rij,可以得到相应的评价矩阵。对于研究不同因素的权重值,通过以下公式:

形成相应的评价向量Bi,所得的Bi组成矩阵B,即

根据指标权重集U={V1;V2;V3;V4},得到向量Bv的具体公式:

根据计 算得出Bv=(0.060,0.338,0.097,0.431,0.074)。为了得到具体的结果,将评语集S={S1;S2;S3;S4;S5}设分值并组成一个列向量W=[W1,W2,W3,W4,W5]T。分值定为每个等级范围的中值,即W=[95,85,70,50,20]T,具体公式:

式中:Bi—评价向量jW—分值向量;G—综合评价分数。根据公式计算可以得出:认知水平G1=60.753;信任水平G2=56.050;感知风险G3=58.770;感知利益G4=63.529;公众接受性G=59.537。根据评价结果可以得到相应的网络上公众接受性水平,具体情况见表4。

表4 网络群众的公众接受性评价结果Table 4 The evaluation results of Internet public acceptance

从分析该结果可以得出,网络公众的整体接受性处于较差水平。其中感知风险和信任水平的公众接受性水平较低,说明网络上公众接受性受到个人状况的影响较大,另外总体对政府部门、科学信任以及处理能力信任的水平不够高。感知利益的公众接受处于一般水平,这可能是由于网络上的群众并非是选址区域的受益方,导致感知利益方面上与选址区域群众可能存在差异。认知水平的公众接受性处于一般水平,说明网络群众整体对核的相关知识不太了解,从而造成对专家和政府的能力还不是十分信任。

4 结论

通过对网络上公众接受性进行研究,得到了以下的结论。

通过爬虫爬取网络上与核相关的信息评论,借鉴已有相关文献的基础上和通过数据整理归纳知识,建立公众接受性的层次结构模型。通过该模型的识别,信任水平、认知水平、感知利益、感知风险是影响网民公众接受性的主要因素。

根据网络上高放废物深地质处置公众接受性的主要影响因素,建立了由4个一级指标和29个二级指标所组成的高放废物深地质处置公众接受性的评价指标体系。采用层次分析法建立模型,并通过XGBoost算法对每一项评价指标赋予权重值,结合模糊层次综合评价法对高放废物深地质处置公众接受性进行综合评价,得到评价结果为59.537分,根据所建立的公众接受性的评语等级,可以得出,网络上高放废物深地质处置的公众接受性处于较差水平。

通过所得的评价结果对网络群众高放废物深地质处置公众接受性进行综合分析,网络上高放废物深地质处置在多个方面存在着不足,其中信任水平和感知风险处于较差水平,而认知水平和感知利益仅仅处于一般水平,说明网络上公众对于高放废物深地质处置的信任不足,认知不够。根据这些不足,可以加强有关高放废物深地质处置知识的普及,建立该领域专家、政府、环保局等新闻发布制度,提升高放废物深地质处置的相关技术和管理水平,进而为提高网络上高放废物深地质处置的公众接受性提供依据。

猜你喜欢

废物信任权重
深度睡眠或有助于有效排出废物
废物不废的西瓜皮
权重常思“浮名轻”
表示信任
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
嘤嘤嘤,人与人的信任在哪里……
从生到死有多远
电子废物何处去
信任