土壤筛选值在镉污染稻米产地环境评价与分类适用性探讨
2019-10-23王祖光周其文赵玉杰刘潇威张铁亮王夏晖李志涛
王祖光,周其文*,赵玉杰*,刘潇威,张铁亮,王夏晖,李志涛
(1.农业农村部农产品质量安全环境因子控制重点实验室,天津 300191;2.农业农村部环境保护科研监测所,天津 300191;3.环境保护部环境规划院,北京 100012)
Cd是一种高活性重金属,生物富集性强、毒性强,易被稻米吸收富集,进而危害人体健康[1-2]。Cd主要来源于工业三废的排放,土壤污染普查结果表明我国土壤Cd含量点位超标率达7%,已成为首要土壤重金属污染物[3-5]。2018年国家修订了原《土壤环境质量标准》(GB 15618—1995)[6],新标准名称为《土壤环境质量标准农用地土壤污染风险管控标准(试行)》(GB 15618—2018)[7],新标准将土壤环境质量二级限值修订为土壤污染筛选值并细化了Cd的限值,根据土壤pH将Cd污染限值分为4类,以求最大限度地保护农产品产地及农产品质量安全。
研究表明,农产品中的Cd主要来源于土壤[8-9]。农产品对土壤Cd的吸收除受pH及土壤Cd含量影响外,还受其他诸多因素影响,如:钙(Ca)、铁(Fe)、锰(Mn)、锌(Zn)、硫(S)、氯(Cl)等[10]。在某些区域,其他因素对稻米富集Cd的影响比土壤pH和土壤Cd更明显[11],仅考虑土壤pH和土壤Cd很难正确评价产地环境质量水平,同时也很难准确划分农用地土壤环境质量类别,从而导致Cd污染产地防控面积的误判。
稻米是我国居民的主粮,其质量安全与人民群众的健康息息相关。与其他农产品相比,水稻是更易吸收Cd的农作物,相关报道表明我国部分稻米产区的稻米Cd含量超过国家食品卫生标准限值的比例达10%[12-14]。尤其在我国西南地区、湖南长株潭地区存在较高的Cd污染风险[15]。因此正确评价我国稻米产地环境质量状况,科学划分产地类型,从而有效防控稻米Cd污染风险,对保障我国农产品质量安全,提升农业绿色发展水平尤为重要。
本研究以近年来获取的在我国稻米产区土壤稻米一一对应采集的80 000个数据样点为基础,以土壤Cd与稻米Cd非对应性超标误判率为判定参数,分析土壤污染风险筛选值在稻米产地类别划分中的适用性,并针对个别误判率高的区域试探性探索了降低误判率的方法。本研究结果对于标准的科学运用及进一步改进提供了一定的技术支持。
1 材料与方法
1.1 数据来源
本研究数据来源于农业农村部环境保护科研监测所风险评估团队自2012年以来获取的风险评估土作对应数据。数据筛选要求如下:(1)pH、土壤Cd含量和稻米Cd含量数据齐全;(2)以县为单位,每个县土壤作物对应监测点位不少于10个。所筛选数据分布在东北三省、天津、湖南、广东、四川、贵州、福建、浙江等15个省(市)144个县。土作对应监测点位约80 000个,数据分布情况见图1。
1.2 数据处理
本研究采用误判率作为GB 15618—2018中Cd的筛选值在一定区域适用性的判定依据,总误判率是指一定区域内(本研究以县域为单位)土壤和作物一一对应的采样监测数据中,土壤超标与否与对应的稻米超标情况不一致的点位数占土壤总采样点的百分比,总误判率(TMR)为以下两种情况的总和:(1)土壤Cd含量超过筛选值,稻米Cd含量不超标的样点个数占总样点个数的比例,称此情况为误判率一(MR1);(2)土壤Cd含量未超过筛选值,稻米Cd含量超标的样点个数占总样点个数的比例,称此情况为误判率二(MR2)。
MR1、MR2及 TMR 的计算方法分别如式(1)、式(2)、式(3)所示:
式中:t1为土壤超过筛选值,稻米Cd含量不超标的点位个数;T为研究区(本研究以县域为单位)的土壤-稻米对应采样点个数。
式中:t2为土壤未超过筛选值,稻米Cd含量超标的点位个数;T为研究区(本研究以县域为单位)的土壤-稻米对应采样点个数。
图1 标准研判用监测点位分布图Figure 1 Monitoring point distribution map
式(1)~式(3)中土壤Cd含量超标是指土壤Cd含量超过《土壤环境质量标准农用地土壤污染风险管控标准(试行)》(GB 15618—2018)规定的筛选值,稻米Cd含量超标是指稻米Cd含量超过《食品安全国家标准食品中污染物限量》(GB 2762—2017)规定的限值。根据研究需要,本文假定土壤超标、农产品不超标作为误判率1,《土壤环境质量标准农用地土壤污染风险管控标准(试行)》(GB15618—2018)并未说明土壤Cd超过筛选值,农产品一定超标。
为了进一步提升土壤Cd污染与稻米Cd超标之间的关联性、减少误判,本研究拟采用混合线性回归技术(Cubist)建立土壤-稻米之间Cd转运模型并筛选主控因子。Cubist模型是由Rule Quest公司开发的一种基于规则的模型,与传统线性回归技术相比,混合线性回归技术具有以下优点:(1)可以高效处理多个变量,并自动筛选影响显著因子。(2)更容易处理不同条件下自变量对因变量影响能力差异性问题。(3)可以把自变量对因变量的影响分为条件贡献与模型贡献两类,便于使用者筛选主控因子。Cubist模型融合了若干其他模型树的方法,它的每一条规则是一条运算路径,树的节点是线性模型。为了提高模型预测精度,在对目标进行预测时它的数据空间被分为若干个子空间(每个子空间无最低数据要求),然后对其进行建模。Cubist使用标准方差来度量误差值,其每个节点的误差表示为:
式中:T是某一节点上的训练样本;Ti是这些样本分裂出的子样本;SD(T)和SD(Ti)是T和Ti的标准偏差,是每一节点的分类误差; ||Ti是样本数量。Cubist使每次误差降到最小,使其分类更加合理[12]。模型的具体使用方法可参照文献[16]。
1.3 图件编制
采用Arcgis软件为平台绘制相关误判率图件,其他相关图件采用Excel制作。
2 结果与讨论
2.1 误判率情况分析
误判率是产地类别划分需要重点考虑的指标。土壤筛选值的制定以pH和土壤重金属含量为核心,以Cd为例,在某些区域采用以上两个指标评价的土壤环境质量与实际农产品质量安全存在着明显的不符。图2、图3和图4分别为误判率一、误判率二及总误判率在研究区的分布情况。结果表明,误判率一即土壤超标农产品不超标的情况,主要分布区域为湖南中部和南部地区、广东北部、四川盆地中部、广西中北部地区。其他稻米主产区,如东北三省、长三角区域因本数据库中采用的土壤数据较少存在Cd超标情况,因此无法判定标准使用误判率一的结果。误判率二即土壤不超标农产品超标的情况,主要分布区域为湖南长株潭地区、四川绵竹、什邡市周边县市、广东省英德、韶关市周边区域。东三省、长三角、珠三角和淮河流域稻米主产区基本不存在误判率二的情况。综合以上两种情况,总误判率突出的区域为湖南长株潭地区、广东北部地区、四川盆地中部地区、广西中部地区,而这些区域通常是误判率一和误判率二重叠区。以上4个区域总误判率最高值分别为79%、59%、70%、64%。而珠三角地区和淮河流域误判率一和误判率二情况均较少,高误判率区域也是我国土壤Cd污染较突出区域[17-18]。高的误判率会对产地安全类别划分及分区分类治理产生不利影响,这表明仅采用这两个指标无法真正指示这些区域的土壤环境质量状况。
针对误判率高的区域,本研究首先采用改变土壤Cd筛选值的方式,分析误判率改善情况。图5和图6分别为在误判率一较高的12个县市土壤Cd筛选值提高 0.1 mg·kg-1和0.2 mg·kg-1后的误判率一变化情况。当土壤Cd筛选值提高0.1 mg·kg-1时,除湖南省湘潭县和宁乡县外大部分县市的总误判率和误判率一都会降低,其中误判率一降低范围为0~18.64%,总误判率降低范围是5%~11%,同时误判率二会升高,其升高范围为0~19%。当土壤Cd筛选值提高0.2 mg·kg-1时,除湖南省湘潭县和宁乡县外大部分县市的总误判率和误判率一都较提高0.1 mg·kg-1时降幅明显,但总体降幅不大,介于10%~20%之间,其中冷水滩市和邵东县尤为明显,总误判率分别由26.54%、24.77%降低到了12.18%、9.17%;湖南省涟源和湘乡市误判率一降低幅度最大,达30%。随着误判率一的降低,研究县市的误判率二都会提高,提升范围在1%~30.29%之间。综合结果分析表明,即使增加误判率一较高地区Cd的筛选值,总的误判率也不会有大的改善。
图7、图8和图9分别为在误判率二较高的12个县市土壤Cd筛选值降低0.1 mg·kg-1和0.2 mg·kg-1后的误判率二变化情况。当土壤Cd筛选值降低0.1 mg·kg-1时,除广东连州和四川绵竹外大部分县市的总误判率和误判率二都会降低,其中误判率二降低范围为6%~26.81%,总误判率降低范围为3%~26.09%,同时误判率一会升高,其升高范围为0.73%~15.29%。当土壤Cd筛选值降低0.2 mg·kg-1时,除广东连州和四川绵竹外大部分县市的总误判率和误判率二都较降低0.1 mg·kg-1时降幅明显,介于11%~38%之间,其中湖南长沙市尤为明显,总误判率由39.86%降低到了9.42%。随着误判率二的降低,研究县市的误判率一都会提高,提升范围在1.45%~29%之间。结果表明,即使降低误判率二较高地区Cd的筛选值,总的误判率也不会有大的改善。
图2 稻米产地安全评估误判率一分布图Figure 2 Distribution chart of misjudgment rate one of safety assessment
图3 稻米产地安全评估误判率二分布图Figure 3 Distribution chart of misjudgment rate two of safety assessment
综合分析表明,大部分误判率高的地区不能通过升高或降低土壤Cd筛选值来降低误判率,而这些地区多是我国主要的稻米产区,高误判率对管控稻米Cd污染产生了不利影响。为了提高土壤环境质量评价及类别划分的准确率,除了土壤pH和土壤Cd含量外还需要考虑土壤中其他因子的作用。
图4 稻米产地安全评估总误判率分布图Figure 4 Distribution chart of total misjudgment rate of safety assessment
图5 筛选值增加与误判率的关系(湖南误判率一严重地区)Figure 5 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate one of Hunan Province)
2.2 稻米富集Cd主控因子筛选
研究表明,稻米对Cd的富集受多种因子影响。在实际农田中不同环境条件下各个因子作用效能存在差异,而筛选出主控因子,建立土壤因子与稻米质量安全之间的关系,是降低产地环境质量类别误判的重要手段。研究表明土壤 pH、有机质、Ca、Fe、Mn、Zn、S、Cl等因素都对稻米富集Cd有影响[19-25]。而刘佳凤等[10]提出了采用混合线性回归技术构建土作关系模型筛选主控因子的方法。
图6 筛选值增加与误判率的关系(广东、广西、四川误判率一严重地区)Figure 6 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate one of Guangdong,Guangxi,Sichuan Province)
图7 筛选值降低与误判率的关系(四川省误判率二较高的地区)Figure 7 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate two of Sichuan Province)
图8 筛选值降低与误判率的关系(湖南省误判率二较高的地区)Figure 8 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate two of Hunan Province)
根据以上研究结果,本研究选取了误判率较高的湖南省湘潭市、株洲市、永兴县、宜阳县作为采样区域。依据土壤Cd污染状况及前期调查发现的稻米Cd污染情况,采用专家研判法布设采样点,采用5点混合法采集水稻根际土壤和稻米,土壤和稻米样品一一对应,共采集137对。土壤及植物样品前处理、检测、质控参见相关文献[26-28]。采用混合线性回归技术构建土壤稻米Cd转运模型,并筛选主控因子,模型见表1,主控因子筛查结果见表2。
由表1可见,Cubist模型结果分为6种规则,土壤各因子含量在规则1和规则2范围内,稻米基本无Cd污染风险;土壤各因子含量在规则3和规则4范围内,稻米存在一定的Cd污染风险;土壤各因子含量在规则5和规则6范围内,稻米存在严重Cd污染风险。由表2可见,在诸多土壤因子中土壤Ca含量的条件贡献率最高,其次是土壤Fe、Mn和S含量,表明采样区稻米富集Cd是受土壤多种因子控制,其中Ca是主控因子,其可以增加土壤pH,通过增加土壤吸附从而固定重金属,可以增加土壤Ca2+和阳离子交换能力(CEC),从而促进与根表面Cd2+的竞争[29-31]。土壤pH的模型贡献率最高,6个规则中有4个规则的模型含有pH,可见pH在稻米富集Cd的过程中也扮演着重要角色,pH主要通过影响碳酸盐的形成和溶解来影响土壤Cd形态的变化,还可以通过影响土壤表面负电荷来影响土壤对Cd的吸附[11]。
基于模型分析结果,当仅考虑Ca对稻米富集Cd的影响时,两者的关系及拟合模型见图10。拟合模型的公式为
式中:y为稻米Cd含量的预测值,mg·kg-1;x为土壤CaO含量,%;R2=0.44**(P<0.01)。说明此模型可解释稻米Cd含量44%的变异性。
根据上述模型可以看出当稻米Cd含量为0.2 mg·kg-1时,CaO含量约为0.5%,这与Cubist模型预测结果基本一致。实际检测数据表明当CaO≤0.5%时稻米Cd超标率为79.2%,土壤Cd含量的平均值及标准差为0.54±0.3 mg·kg-1,当CaO>0.5%时稻米Cd超标率为19%,土壤Cd含量的平均值及标准差为0.9±0.7 mg·kg-1,两者稻米Cd超标率差距为61个百分点。可见Ca对稻米富集Cd的影响比土壤Cd对稻米富集Cd的影响更显著。
同时稻米Cd含量19%的超标率也表明以CaO含量0.5%作为产地环境安全条件限值仍存在一定的误判情况,这与混合线性回归模型及CaO与稻米Cd关系模型的拟合结果基本一致,毕竟稻米Cd含量的变化还受Fe、Mn、SOM、pH等因素的影响,CaO仅能解释稻米Cd含量44%变异性。
根据CaO与稻米Cd含量关系模型,当CaO含量>0.5%时稻米Cd含量仍然存在下降空间,因此采用穷举法计算CaO含量增加、稻米Cd含量不变时CaO的最小限值,此值为0.85%,此时稻米Cd含量为0.085 mg·kg-1,95% 置信区间范围为 0.06~0.16 mg·kg-1。实际监测样品137个,实际样品中CaO>0.85%的样品62个,其中有4个样品超标,超标率为6%,超标的样品土壤Cd平均含量为1.17 mg·kg-1。可见要保证稻米安全,在CaO充足的条件下,土壤Cd的高富集对稻米Cd含量的影响不能忽略,毕竟稻米Cd主要来源于土壤Cd。而以筛选值为依据评估稻米安全状况,研究区稻米Cd的总误判率为39.41%,远高于本研究结果。
图9 筛选值降低与误判率的关系(广东省误判率二较高的地区)Figure 9 The relation between the increase of screening value and the misjudgment rate(areas with serious misjudgment rate two of Guangdong Province)
表1 Cubist模型拟合结果Table 1 Cubist model fitting results
以上分析结果表明,以《土壤环境质量标准农用地土壤污染风险管控标准(试行)》(GB15618—2018)的土壤Cd筛选值为标准进行产地安全评价及类别划分时个别区域会出现误判情况,通过增加其他因素可以将误判降到最小。由于个别区域环境质量的差异性,具体采用哪种指标、如何定值需根据区域进行细致研究。
3 结论
(1)《土壤环境质量标准农用地土壤污染风险管控标准(试行)》所规定的土壤Cd筛选值适用于大多数稻米产区产地环境质量安全水平的评价,但在湖南长株潭地区,广东北部与湖南接壤地区,四川绵竹、什邡市等区域仅考虑pH与土壤Cd含量还不能在土壤环境质量与农作物安全之间建立良好的耦合关系,无法用这两个指标正确评估产地环境质量安全水平。
表2 Cubist模型计算条件贡献率与模型贡献率Table 2 The conditions contribution rate and model contribution rate of cubist model
(2)以湖南长株潭部分区域监测数据为例,采集的数据所构建的模型分析结果表明:Ca是调控采样区内稻米Cd富集的关键因素。土壤Ca含量的变化与稻米Cd含量之间存在显著的指数关系,较土壤pH和Cd含量相比能够更好地指征产地环境对稻米Cd含量的影响。本文由于缺少稻米品种、农田水肥管理水平等数据,在筛选影响稻米富集Cd的关键因子时会存在一定的不足。
图10 CaO与稻米Cd含量拟合关系图Figure 10 Fitting diagram of the relationship between CaO and R-Cd
(3)在采用《土壤环境质量标准农用地土壤污染风险管控标准(试行)》所规定土壤Cd筛选值判定稻米产区产地环境质量安全存在误判率高的区域,可以通过构建相关模型筛选主控因子的方法来更加科学地评价稻米产地环境质量及划分产地安全类型。