未确知聚类在蔬菜产地环境质量评价中的应用
2014-06-05葛莹莹刘伟
葛莹莹,刘伟
(河北工程大学信息与电气工程学院,河北邯郸 056038)
蔬菜在生长过程中,主要从土壤中汲取养分,一旦土壤被污染,那么种植出来的蔬菜必然也不会是健康蔬菜。因此,为了保证蔬菜的质量安全,保护人类的生命健康,需要及时客观地对蔬菜产地污染程度进行评价,以便及时采取措施对土壤污染进行治理。随着我国城乡工业化程度的不断提高,土壤的污染源主要有两个:一是工业中“三废”的排放以及城镇生活垃圾的增加;二是污泥农用和蔬菜种植过程中使用有机肥、含重金属的农药以及化肥的不合理使用等。在各类污染物中,蔬菜产地污染的主要来源是土壤重金属污染,其中,Hg、Cd、Cr、Pb、Zn、As、Cu、Co 等是最主要的重金属污染物[1]。
近年来,土壤重金属污染的评价方法主要有模糊数学综合评判法[2]、改进层次法[3]、灰色聚类法[4]、物元分析法[5]等等,但各有优势及不足。未确知聚类是一种基于未确知集合的无监督分类,是针对解决不确定性问题而提出的,已成功的应用于煤矿矿井工作面瓦斯涌出量的分类评价以及井下空气质量的评价中。因此,本研究将针对以上方法的不足,且考虑到其评价的不确定性,将未确知聚类应用到蔬菜产地环境质量评价中,对江苏省南京市六合区六个乡的土壤质量实测数据进行实例研究[6],最后得到新的标准状态以及对应的评价准则。
1 未确知聚类
未确知聚类[7]是一种基于未确知集合的无监督分类,它不同于一般的聚类分析,而是一种不确定的分类方法。对于任意给定集合U,数据样本个数为N,指标向量长度为d,拟将其分为C类,Γk(k=1,2,…,p)是第k类,那么U 中任意对象xi都以测度 μΓk(xi)属于 Γk类,μΓk(xi)是[0,1]区间中的实数,且满足
1.1 未确知测度的确定
式中ε为控制常数,作用是调整当Dik过小时对隶属度的影响;而各种特征的分类权重ωi的求解方式如下:
1.2 类中心的确定
在d维特征空间中,xi关于Γk类的基本隶属度μik可以被当做点质量赋予样本点xi,这样就能得到 N 个质点构成的质点组{(x1,μ1k),(x2,μ2k),…,(xN,μNk)},下一步可依据物理方法确定其质心,新类中心即为
2 实例研究
一般来说,土壤重金属指的是比重大于或等于5.0 g/cm3的重金属(如 Cr、Cd、Pb、Cu、Zn),土壤重金属污染是指由于人类活动将重金属污染加入到土壤中,致使土壤重金属含量明显高于原有含量,并造成生态环境质量恶化的现象[1]。考虑到数据获取的难易程度,文中仅选取Cd、Hg、As、Cu、Pb、Cr6种土壤中最常见的重金属污染物为评价因子,根据我国《土壤环境质量标准》(GB156182-1995)对土壤各采样点进行分类[8-9],具体评价标准见表 1。I级标准为清洁,即保护区域自然生态、维持自然背景的土壤质量的限制值;II级标准轻度污染,即为保障农业生产,维护人体健康的土壤限制值;III级标准为重度污染,即保障农林生产和植物正常生长的土壤临界值[10]。
表1 土壤环境质量标准(mg/Kg)Tab.1 Environmental quality standard for soil(unit:mg/Kg)
笔者借助参考文献[11]中的数据,以江苏省南京市六合区6个乡的土壤环境质量为研究对象[12],利用未确知聚类对其分类。其中,各采样点土壤利用方式为蔬菜用地,主要污染类型为农药化肥污染,具体数据见表2。
针对表2中的实测数据,对未确知聚类算法运用Matlab7.0编程,将样本分为三类,分类精度ε=0.001,最终得到的样本分类结果及隶属度如表3所示,各类的类中心见表4。表3显示,样本6属于第 I类;样本2,3,5属于第 II类;样本1,4属于第III类。
表2 土壤各重金属元素含量的分析数据(mg/Kg)Tab.2 Content of heavy metal elements in soil samples(unit:mg/Kg)
表3 样本的分类结果Tab.3 The classification results of the sample
表4 各类的类中心Tab.4 The centers of the clusters
3 实验结果分析
针对得到的实验结果,主要从类中心、隶属度以及分类结果三方面进行分析。
1)从类中心(表4)来看,很容易发现,在6种重金属污染物中,只有As含量是越高越好,其余五种均是越低越好,这与土壤环境质量标准(表1)中是一致的,说明未确知聚类能够应用到土壤环境质量评价中。
2)从各样本点以及各类的隶属度(表3)来看,当某样本点处于某两类之间,其隶属度相差并不太大,或者说很难区分,比如样本点2,对I类和II类隶属度相差只有0.000 6,是很微小的,这是因为在求yii-mki时总体相差并不大,唯一不同的是各指标权重ωi的取值不同,才导致其属于各类的隶属度有微小偏差。
3)从分类结果上来看,样本6属于第I类;样本2,3,5 属于第 II类;样本1,4 属于第 III类,与当地实际情况一致,证明未确知聚类能够对土壤环境质量进行准确评价。同时,未确知聚类不仅给出了分类结果,也给出了各样本相对于各类的隶属度,这可以为下一步改善蔬菜产地环境质量提供一个指导方向。
4 结语
分析实验结果,与实际情况相符,证明此方法能够在蔬菜产地环境质量评价中应用,且该算法同时能够保证蔬菜产地环境质量评价更加精准化和定量化。将未确知聚类应用到土壤环境质量评价中,不仅拓宽了未确知聚类算法的应用领域,同时也为土壤环境质量评价提供了一种新的思路。
[1]徐鸿志.安徽省主要土壤重金属污染评价及其评价方法研究[D].合肥:安徽农业大学,2007.
[2]朱 雷,陈 威.模糊指数法在水质评价中的应用[J].武汉理工大学学报,2001,23(8):61 -65.
[3]吴传星,伍 钧,杨 刚,等.基于改进AHP法重金属污染因子权重的确定及其在农作物重金属安全性评价中的应用[J].四川农业大学学报,2010,28(3):346-347.
[4]孟宪林,郭威.改进层次分析法在土壤重金属污染评价中的应用[J].环境保护科学,2001,27(103):34-36.
[5]余立斌,张江山,王菲凤.熵权物元分析模型在土壤环境质量评价中的应用[J].黑龙江环境通报,2008,32(1):70-74.
[6]李朝奎,王利东.土壤重金属污染评价方法研究进展[J].矿产与地质,2011,25(2):172 -176.
[7]曹庆奎,任向阳,刘开弟.矿井工作面瓦斯涌出量的未确知聚类研究[J].煤炭学报,2006,31(3):337 -341.
[8]王国庆,骆永明,宋 静,等.土壤环境质量指导值与标准研究I—国际动态及中国的修订考虑[J].土壤学报,2005,42(4):666 -673.
[9]夏家淇,骆永明.我国土壤环境质量研究几个值得探讨的问题[J].生态与农村环境学报,2007,23(1):16.
[10]刘蕾,姜灵彦.基于可拓物元法的土壤重金属污染程度评价[J].土壤,2013,45(3):517-521.
[11]朱青,周生路,孙兆金,等.两种模糊数学模型在土壤重金属综合污染评价中的应用与比较[J].环境保护科学,2004,30(123):53 -56.
[12]陈建勇,张江山,郑育毅.基于熵权的物元分析法在土壤重金属污染评价中的应用[J].安全与环境工程,2011,18(5):57 -60.