APP下载

基于主成分分析对“禁瓶令”效果的研究

2020-03-18杜晋华

智能计算机与应用 2020年9期
关键词:瓶装水贡献率变量

杜晋华

(中国地质大学(北京) 信息工程学院, 北京100083)

0 引 言

生活水平的提高和经济的富裕使得人们更加追求高品质的生活和可持续性的发展,更加关注个人健康与生态平衡。瓶装水的存废因此成为一个备受争议的话题。部分地区出于对环境保护和能源节约的需要,采取“禁瓶令”的方式禁止瓶装水的生产,但受到该禁令限制的居民和企业并不看好“禁瓶令”[1]。如何衡量“禁瓶令”的有效性成为制约当地政府决策的一个重大问题。

本文通过建立有效的评价模型,针对同一区域给出采取“禁瓶令”前后的评价分数,针对不同区域给出采取“禁瓶令”后的评价分数,衡量“禁瓶令”的实际效果并判断其适用的场景。

1 模型假设和符号说明

1.1 模型假设

(1) 所研究对象(如某城市)的平均购买力在研究阶段保持不变;

(2) 单瓶矿泉水的制作流程的全部环节在研究阶段内不发生明显变化。

1.2 名词解释

(1) 人口流量:指在一定时间内人口数量的增量;

(2) 时间成本:指顾客为想得到所期望的商品或服务而必须耗费的时间换算而成的代价;

(3) 主成分载荷:各指标对主成分所做的贡献,其值越大,在主成分中所起的作用就越大,该评价指标也就越敏感。

1.3 符号说明

符号说明见表1。

2 模型建立

2.1 指标归纳

瓶装水的存废备受争议。一方面,其具有便携、健康、易运输等优点;而另一方面,瓶装水对水的私有化和商品化,破环了人类的水生态系统,加剧了能源的消耗和环境的污染,损害了人类的利益。针对不同使用环境,不同使用人群,瓶装水的作用又有所不同。因此,“禁瓶令”的推行与否会有正负两方面影响。

表1 二级评价指标

正面影响:

(1) 衍生出大批新的产业部门,带动瓶装水产业的人员就业;

(2) 瓶装水广告效益拉动其他行业经济增长;

(3) 瓶装水生产厂家从中获得收益,并为当地贡献税收;

(4) 在自然灾害、社会险情中及时解决吃水困难;

(5) 影响顾客的货架选择:在众多不健康饮品中选择瓶装水,利于健康;

(6) 提高顾客用水满意度,促进人员流动,带动相关旅游业和人员外出地经济。

负面影响:

(1) 在生产、输送、加工、包装过程中的能源损耗与浪费;

(2) 生产瓶装水对水源地生态与经济的破坏;

(3) 增加可饮用水二次加工的时间成本;

(4) 在生产、输送、加工、包装过程中产生大量温室气体;

(5) 空瓶回收与处理成本高昂;

(6) 降解难度大,环境污染严重。

根据可比性和概括性的原则,针对上述影响可将衡量指标细化为8个一级指标及26个二级指标。

2.2 数据标准化

在即将建立的多指标评价模型中,由于各评价指标的性质不同,它们会具有不同的量纲和数量级。考虑到各指标间的水平相差很大,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。为了保证结果的可靠性,需要对原始指标数据进行标准化处理。采用min-max标准化的归一化方法。

设每一个研究对象的上述26个指标构成行向量为式(1):

X=[x1,x2,…,x26].

(1)

对该向量中的值序列进行变换为式(2):

(2)

则得到新向量,式(3):

X′=[y1,y2,…,y26].

(3)

该向量中各元素均属于区间[0,1]且无量纲。

2.3 数据获取

以美国芝加哥市和康科德镇为例,通过搜集美国运输统计局、劳工统计局、人口统计局官方公布的数据以及美国零售业数据或者通过实地市场调查获得数据,直接确定多数指标取值。

部分指标需要通过二次计算才能得到,如式(4)和式(5)计算的水源地经济受损度和供水层破坏度。

(4)

(5)

为了使评价体系的适用性更强,能够反映不同地域范围、不同人口数量区域之间的差异,并通过对比同一区域在采取禁瓶令前后受到的影响程度,可以选取两个地域范围相差较大的地区(如旧金山市和康科德镇)采取禁瓶令前后的四组数据。

3 主成分分析

在待建立的评价模型中,过多的变量增加了分析问题的难度和复杂性,而诸变量之间是具有一定相关关系的,所以期望通过相关分析,利用较少的新变量代替原来较多的旧变量,同时尽可能多地保留原来变量所反映的信息。因此,本文选用具有降维思想的主成分分析法来构建模型。

设有n个区域样本,每个样本观测上述23个指标,将原始数据写成矩阵,式(6):

(6)

(1)将原始数据X标准化;

(2)建立变量的相关系数阵,式(7)和式(8);

R=(ri,j)26*26,

(7)

(8)

(3)借助MATLAB等工具求R的特征根及相应的单位特征向量:

设求出的特征根为:

λ1≥λ2≥…≥λ26≥0.

相应的特征向量为式:

(4)得到主成分,式(9);

Fi=a1,iX1+a2,iX2+…+a26,iX26(i=1,2,…,26).

(9)

(5)计算主成分贡献率及累计贡献率;

①贡献率,式(10):

建构主义学习理论认为,学习是学生在已有知识和经验的基础上进行的一种主动建构,而不是被动地接受教师给予的知识和经验。适当的问题可以激发学生的学习热情,促进学生的积极反思,不断拓展、更新和重构认知结构。从心理学的角度来看,问题激活了思维,思维促进了问题解决,思维又在不断地解决新问题的过程中生长。问题引领教学的价值主要体现在以下几个方面。

(10)

②累计贡献率,式(11):

(11)

(6)对主成分进行取舍:取累计贡献率达85%~95%的特征值λ1,λ2,…,λ26所对应的第1、第2、…、第m(m≤26)个主成分;

(7)利用主成分F1,…,F26做线性组合,并以每个主成分的贡献率作为权重构造综合评价函数,式(12):

y=a1F1+…+amFm.

(12)

4 模型求解

以美国的康科德镇和旧金山市为例,经过标准化处理后的数据见表2。

表2 区域“禁瓶令”效果指标数据汇总实例

利用主成分分析对上述数据进行计算,可得到前三个主成分、主成分得分与特征根。设前三个主成分的各项系数为ki=[k1,k2,…,k26](i=1,2,3),则计算结果可表示为:

k1=[-0.480 7 0.636 9 -0.480 7 -0.271 9 -0.444 5 -0.450 0 -0.410 1 -0.468 6 -0.480 7 -0.474 1 -0.480 0 -0.480 7 -0.475 6 0.224 6 -0.481 4 -0.478 1 0.226 1 -0.183 6 0.092 0 -0.396 4 -0.055 2 -0.449 3 -0.449 1 0.648 9 -0.463 9 -0.474 1]

k2=[-0.401 3 0.127 0 -0.401 3 -0.431 2 -0.361 7 -0.306 3 -0.411 4 -0.403 1 -0.401 3 -0.402 3 -0.401 4 -0.401 3 -0.402 1 -0.501 7 -0.401 2 -0.401 7 4.521 2 -0.201 6 0.819 0 0.160 7 -0.457 2 -0.306 4 -0.405 4 -0.421 9 -0.403 7 -0.402 2]

k3=[0.013 3 0.021 9 0.013 3 0.014 7 0.019 7 0.026 6 0.013 8 0.013 4 0.013 3 0.013 3 0.013 3 0.013 3 0.013 4 0.013 6 0.013 3 0.013 0 0.677 0 0.001 0 -0.582 2 -0.439 1 -0.024 3 0.026 6 0.010 1 0.062 1 0.013 4 0.012 5]

(13)

第一主成分贡献率为49.87%;第二主成分贡献率为49.01%;第三主成分贡献率为0.99%,前两个主成分累计贡献率达98.88%,故可选取它们为新的因子。

第一新因子Z1主要代表变量为a12(水源地经济受损度)、a81(降解复杂度),其权重系数分别为0.636 9、0.648 9,反映了这两个变量与生态环境水平密切相关;第二新因子Z2主要代表变量为a52 (同等饮料替代比)、a63(平均价格),其权重系数分别为0.501 7、0.521 2,反映了这两个变量与瓶装水主要用途密切相关。

最后的评价函数为式(14):

y=0.498 7z1+0.490 1z2.

(14)

5 模型改进

上述模型在常见地域内计算出的评价分数能够在较长时间内与实际情况相符合。但在一些包含特殊场所(如机场)的区域,其适用性就有待质疑。

具体原因是:机场和静态地域不同,虽然在机场内瓶装水“禁瓶令”的影响因素没有发生较大改变,但机场十分突出的特点就是人员的流动性大。如美国旧金山常住人口约为88.5万,而旧金山机场年接待游客数达1900万。上述模型中对这一因素没有体现,所以可以从人口方面进行改进。

人口数量满足以下公式(15):

地区人口=常住人口+流动人口.

(15)

考虑到常住人口和流动人口购买力的不同,a76不应该是购买总量与地区人口的比值的直接结果。

设人均相对购买比为式(16):

ω=流动人口人均购买量/常住人口只均购买量.

(16)

则购买总量应为式(17):

M=(1+ω)*常住人口购买量.

(17)

更新后的a76为式(18):

(18)

其中,ω通常情况下借助零售业有关部门的反馈数据求得。但其时间成本远大于人口统计局人口数量统计工作,所以无法及时获得数据。

为解决这一问题,考虑引入人口相对数量比,式(19):

β=人口流量/常住人口数.

(19)

需要获得β与ω的关系。受不同地域的影响,人均相对购买比与人口相对数量比跟当地的经济水平和繁荣程度呈正相关,而这两个指标与时间有明显的数量关系。为提供本模型除评价外的预测能力,考虑利用拟合的思路,借助往年的数据,分析β与ω所满足的函数关系。

利用最小二乘拟合的方法可求出ω/β与时间t的非线性最小二乘拟合的函数,设为式(20):

ω/β=f(t).

(20)

6 误差分析与敏感性分析

本文建立的评价模型采用了主成分分析的方法。由于主成分分析的核心思想是降维,虽然有效降低了评价模型的复杂度,但势必造成了一定程度的数据信息丢失。在大多数情况下用大于85%贡献度的主成分作为新的指标,误差可以在允许的范围内,对最终的评价结果不会造成足够大的影响,但在特殊场合下,如以某人口数量锐减的乡镇作为研究对象,该模型可能失效。

评价模型的主成分选择是基于主成分载荷的大小是否不小于85%确定的。主成分载荷越大,该指标就越敏感,就可以作为敏感性分析的指标。

设在理想情况下,求出y的目标值为y0。为尽可能简化分析复杂度,选择单因素敏感性分析,取主载荷最大的成分为变量,不改变其他指标的值,观察该变量变化对整体结果的影响程度。

衡量影响程度的变量及其计算为公式(21):

(21)

若κ≥60%,则该指标影响程度过大,应该作为政府“禁瓶令”中重点考虑因素;反之,该指标影响程度较低,政府“禁瓶令”决策的重心可从此处偏离。

7 结束语

为了解“禁瓶令”是否会给施行地更多带来有益影响,本文通过建立举措效果评价模型为不同地域施行“禁瓶令”前后进行打分。相关人员可根据分值变化与差距对是否在某地区施行“禁瓶令”进行决策。通过本文的实例样本,可以初步得到以下结论:大型城市和流动性较强的地域,如美国旧金山及其机场采取“禁瓶令”是有效的;而其他地域采用“禁瓶令”,短期内效果不明显。

猜你喜欢

瓶装水贡献率变量
聚焦双变量“存在性或任意性”问题
自制饮水机
14.8%
瓶装水上的广告
高等教育体制改革的贡献率研究:1998—2011年的数据观察
分离变量法:常见的通性通法
不可忽视变量的离散与连续
你分得清这些水的区别吗
变中抓“不变量”等7则