0 引 言


然而,目前对于科学的田间表层土壤采样研究相对较少,也缺乏科学的采样方法作指导[3]。Zhang等[4]查询两份重要的环境期刊(Environmental Science and TechnologyAnalytical Chemistry)上已发表的论文数量,结果表明关于采样的论文数目占已全部发表论文的数目不足1%。而对于田间土壤重金属采样数目确定方法的研究关注的更少。因此,为了更加清楚地认识表层土壤重金属采样数目确定方法,推动土壤重金属采样研究的发展,本研究从土壤重金属采样数目现状、确定方法以及未来研究方向进行评述。

1 土壤重金属采样数目研究现状

在确定土壤重金属采样数目时,采样单元的定义至关重要,不同的土壤采样单元定义直接影响土壤采样区域面积及采样数目的确定[5-6]。不同学者对土壤污染物的采样单元定义并不相同。联合国粮农组织(FAO)认为最小的土地单元为土壤采样单元(Soil Sampling Unit),采样单元内具有相似的土壤污染情况[7]。Ramsey 等[8-9]、Minnitt等[10]及美国洲际技术和法规委员会(ITRC)[11]认为在抽样理论中基于采样物的平均浓度可以代表的土壤面积、体积的区域被称为“决策单元”,决策单元由一个或多个采样单元组成。而在欧洲国家主要是依据土地利用、历史背景、地质水文等共同确定土壤污染物的采样单元[5-6]。

以欧洲国家为例(表1),瑞士的土壤污染物采样单元定义取决于土壤、土地利用、筛查、采样站点的相关性,卢森堡的采样单元定义取决于土地利用、历史背景、筛查,而荷兰的采样单元定义考虑土壤、土地利用、历史背景、地形水文条件、筛查、采样点的相关性。根据不同定义确定的采样单元面积并不相同,从瑞士的100 m2到卢森堡/葡萄牙/奥地利的10000 m2,进而决定了采样密度从瑞士1 600个/hm2到荷兰的2~3个/hm2,采样数目从卢森堡的每公顷面积内采样2~5个到瑞士每公顷面积内采样1 600个。Wagner 等[6]也选取了来自不同欧洲国家的15个参与者分别制定土壤污染物的采样策略,确定采样单元的准则或只依据土地利用,或同时考虑土壤状况及土地利用情况。以在6 100 m2区域内确定土壤污染物的采样数目为例,欧洲国家的不同参与者基于不同准则最终确定的混合采样数目从4个到16个。

表1 欧洲国家采样单元内土壤污染物的采样策略


比较中国不同部门(如环保、农业及国土资源部门)对土壤污染物的采样策略,结果发现不同部门之间确定土壤污染物的采样单元及采样数目相差很大(表2)。例如,依据《土壤环境监测技术规范》(HJ/T 166—2004)确定农田土壤污染物的采样策略,需在每个采样单元内设置3~7个采样区,并要求单个采样单元面积为40 000 m2;依据《农田土壤环境质量监测技术规范》(NYT 395—2012)确定污水灌溉农产品生产区的土壤污染物采样标准,要求在每个采样单元布设10~12个采样点。中国不同部门(如环保、农业及国土资源部门)之间的采样单元定义或确定准则不同,可能会造成不同土壤调查过程中所确定的重金属采样数目不具有可比性。同时,也可能会导致在同一变异系数及精度要求下所确定的土壤重金属采样数目有较大差异。

回顾中国土壤重金属的相关研究,基于文献搜索方法总结归纳表层土壤重金属的采样数目。其中,文献搜索的准则包括土壤主要污染物为镉(Cd)、数据来源于表层土壤(0~20 cm)、采样区域为农业土壤、城市土壤及矿区土壤,最终确定案例222个(图1)。由于篇幅限制,只列出部分代表性参考文献[12-22]。研究发现土壤重金属Cd的采样数目主要集中于200个以内。在变异系数相近的情况下,不同研究者基于不同的研究目的及采样单元划分准则等所确定的土壤重金属采样数目有很大差异。如在变异系数约为15%时,Cd的采样数目有21[12]、91个[13];在变异系数约为50%时,Cd的采样数目多达144个[14],少到16个[15]。

表2 中国不同部门采样单元内土壤污染物的采样策略


2 土壤重金属合理采样数目确定方法研究


2.1 基于经验型方法确定土壤重金属合理采样数目

基于专家经验确定表层土壤重金属采样数目是早期常用的方法。从事多年土壤采样工作的专家综合考虑所需精度(如在土壤环境监测中一般设所需精度为70%~80%)、费用及研究目的等得出合理的土壤采样数目。如Oliver等[25]认为在没有严格的精度限制下,在几平方米内需要布置16个采样点。Leung等[26]在研究土壤砷的空间变异时,根据研究目的及地质背景等,认为在1 600 m × 2 700 m区域内可取388个样品。然而,上述仅仅依靠于经验型方法进行土壤采样,可能会造成采样数目过多,出现土壤采集信息重复的现象。

目的性采样是常用的基于经验型确定土壤重金属采样数目的方法。它是根据研究目的,通过专家的先验知识布设具有“代表性”或“平均状态”的样点的采样方案[27-28]。在早期土壤调查制图中,拥有多年野外经验的土壤普查专家根据经验确定采样数目及选择样点位置。如杨琳[29]认为基于获取典型样点的目的性采样法,在76%的制图精度要求下,60 km2的研究区域内取35个样点即可。但是,目的性采样过分依赖于具有多年实践经验积累的专家和先验知识的指导,主观性过强,没有成熟的理论基础和方法框架[30-31]。由于采样精度是建立在专家主观选择的基础上,很难得到客观的误差评价[32]。因此,随着统计学尤其是地统计学的发展,基于统计学确定土壤重金属合理采样数目的方法越来越得到重视。

2.2 基于统计学方法确定土壤重金属合理采样数目

土壤样本的数据一般为正态分布和偏态分布。在土壤重金属污染区域,由于土壤重金属含量较高,空间分布差异性较大[33],变异系数高[34-35],土壤重金属采样数据多为偏态分布,一般为对数正态分布[36-38]。因此,本研究从采样数据满足正态分布或偏态分布方面出发(图 2),系统论述基于统计学方法确定表层土壤重金属合理采样数目。

图2 基于统计学确定土壤重金属合理采样数目框架图

2.2.1 正态分布下合理采样数目确定方法


土壤合理采样数目不仅取决于土壤样本的变异性,而且需要估计样本总量均值所要求的精度水平和置信区间。当土壤采样数据符合正态分布、相互独立且采样数目足够多时,可以认为中心极限定理成立[39]。可依据 Cochran等人提出的合理采样数计算公式确定采样数目[40]。

式中,为合理的采样数目,(α, f)为某一置信水平下相对应的标准正态偏差,可由分布表查询,为显著水平,通常设为90%及95%;为自由度;为样本变异系数,为相对误差。其中一般可通过前期土壤普查、历史区域文献查找、邻近相似区域替代或专家经验判断获取。










克里格估计的最大标准误差是评估合理取样数目好坏的一个有效标准,因此提出一种利用模拟退火算法优化土壤样点数目及空间分布的方法,即设定一个目标函数克里格方差,然后利用模拟退火算法优化样点数目及样点布局,使样点的克里格方差最小。模拟退火算法是由Metropolis首次提出,并将其应用于空间统计及合理采样设计当中。如Van Groenigen等[62]通过利用模拟退火算法最小化克里格方差优化采样数目。Vašát等[63]在模拟退火法中通过克里格法和加权克里格法优化采样数目及布局,对不同土壤属性得到全局或局部最优布设。韩宗伟等[64]通过多种地形因子在道路周边设置采样尺度,通过模拟退火法对各样点的空间布局进行优化,并通过设计不同采样点数目,优化土壤采样数目。


2.2.2 偏态分布下合理采样数目确定方法




基于对数正态概率函数,Land[73-76]通过复杂迭代算法给出对数正态分布下区域样本算数平均值的置信宽度、置信区间上限/下限,并列出不同精度下可供查询置信区间的表格。因此,通过给定的置信区间,进而确定出对数正态分布下合理采样数目。Perez等[36]和Armstrong[77]指出这种迭代算法是对数正态分布下合理采样数目的精确算法。遗憾的是,这种计算太过于复杂,且给出的可供查询表格不足以涵盖多数情况[77]。随后,Hale[78]提出对数正态分布下合理采样数目确定公式(如表3,公式4),并比较相对误差为10%和15%下不同几何标准差(geometric standard deviation,GSD)所对应的合理采样数目。


Box 等[80]认为合理采样数目是一个关于采样精度和几何标准差的函数,可以基于对数转化和二次函数公式计算获得,并给出在95%的置信区间下公式。基于Box等[80]提出的算法,Perez 等[36]给出了合理采样数目的计算公式(表3,公式7),然而这个公式更适用于相对误差<25%,且GSD相对较小(如GSD=1.5)的条件,对于>25%且GSD较大时并不推荐[36]。随之,Perez等[36]认为可以通过对经典对数正态分布计算公式进行校正,获取较精确的计算公式(表3,公式8),并适应于较大的相对精度>25%的计算。通过结合经典对数正态分布计算公式和线性回归模型,给出不同置信水平下对应不同GSD(如GSD为1.1,1.5,2.0,2.5,3.0,3.5,4.0)的计算公式。然而,这种方法仍不能计算涵盖不同几何标准差下土壤重金属的合理采样数目。

Singh等[81]采用切比雪夫不等式确定对数正态分布下的土壤污染物的置信区间上限。基于切比雪夫不等式推断出对数正态分布下土壤重金属合理采样数目计算公式(表3,公式9)。多点增量团队(Multi-increment Sampling team)于2012年将切比雪夫不等式应用于美国夏威夷州土壤污染物的置信区间计算,并在多个州进行应用和推广[11]。

表3 对数正态分布下合理采样数目确定方法

注:为合理采样数目;(α, f)为某一置信水平下相对应的标准正态偏差,为显著水平;为自由度;classic为基于经典对数正态分布计算公式所求采样数目;为相对误差;S为随机变量的标准差;GSD为几何标准差(GSD= exp(S);0、1、为给定参数值。

Notes:is an optimum sampling number;(α, f)is the standard normal deviation corresponding to a certain confidence level,is the significance level, andis a degree of freedom;classicis a calculated sampling number based on the classic lognormal distribution equation;is a relative error;Sis a standard deviation of the random variable;GSD is a geometric standard deviation of the lognormal distribution (GSD= exp(S);0,1andare given parameter values.



2.3 基于经验统计学方法确定土壤重金属合理采样数目


基于经验统计学方法确定土壤重金属合理采样数目一般是先通过专家经验初步判断采样数目,后通过统计学方法优化采样数目。在选用统计学方法时更多的集中于正态分布下的确定方法,如经典统计学、地统计学与专家经验的结合,对于偏态分布特别是对数正态分布下的确定方法的应用极少。Su等[87]在研究土壤铜的采样策略及空间变异时,先基于主观经验以1.72 km2为间距,采集623个样点,后基于协同克里格法优化采样数目使得插值误差最小化,最终使采样数目减少10%;樊燕等[88]在评价汞、铅等土壤重金属污染现状时,依据经验在1 km2的地块内采集121个土壤样品,进而获取土壤重金属的变异系数,后结合经典统计学方法确定合理采样数目,指出在5%的允许误差下,汞的推荐采样数目为83,铅的推荐采样数目为51。李凯等[51]依据土地质量地球化学调查,以1 km×1 km 的网格为基准共采集2 033个土壤样品,后结合地统计学方法优化,得出研究区内采集1 017个样点是比较合理的采样数目。



2.4 其他方法

从成本分析出发确定合理采样数目也是较为常用的方法。Tenenbein[98]通过对土壤样本采集的可靠性及不可靠性进行区分,给出在固定预算成本下使区域土壤样本平均值的变异最小化的合理采样数目计算公式。Gilbert[99]通过Tenenbein 提出的采样数目计算公式,确定了在5 000美元固定预算成本下美国华达州的土壤污染物样本的合理采样数目。

信息价值分析也是一种基于成本分析确定合理采样数目的方法。信息价值分析是对贝叶斯风险-成本-效益决策分析框架的应用,它是基于增加采样点数是否会增加有价值的信息确定合理采样数目。通常将增加采样数会带来的价值信息与增加的采样成本做差定义为信息期望的净价值(ENV),所以当在采样过程中,信息期望的净价值达到最大,从成本效益上看,此时的土壤样本数即为合理采样数。目前VOIA已应用到土壤污染过程中合理采样数目的确定中。如Norberg等[100]应用信息价值分析计算区域内土壤重金属的合理采样数目,并指出该方法可以明显的节省成本。Back[101]通过分析采样数目与预算成本的关系,建立信息价值分析概念模型(VOIA),并指出对于100 m的土壤污染修复单元内,合理的采样数目为16~18个。遗憾的是,这种模型需要通过先验分析、预后验分析及信息价值计算确定合理采样数目,应用较为复杂。


表4 澳大利亚污染土壤采样数目确定标准


3 结论和展望





Research progress of methods for determining sampling numbers of soil heavy metals survey

Huang Yajie1, Li Jumei1, Ma Yibing2※

(1.,,100081,; 2,,999078,)

The soil contamination by heavy metals is one of the increasingly serious environmental issues worldwide, and it is believed to pose a high risk to natural environments and human health when their accumulation exceeds certain levels.Optimum sampling numbers in a sampling unit can be an effective tool to achieve credible results when surveying heavy metals in topsoil and undertaking risk assessment for sustainable land uses or remediation decisions. Based on a large amount of literatures and available data in the recent years, the current situations of sampling numbers, methods ondetermining optimum sampling numbers for survey of soil heavy metals were reviewed in this paper and future research issues in this area were discussed. Also, based on empirical methods (e.g. purposive sampling), statistics (including different methods under the normal distribution and lognormal distribution) and empirical methods combined with statistics (e.g. multi-stage sampling), the merits and demerits of these methods on determining optimum sampling numbers for survey of heavy metals in topsoil were then systematically analyzed and compared. The results showed that there were some challenges or issues. First, the consideration of sampling scales or sampling units was lacked when determining optimum sampling numbers for survey of soil heavy metals. Second, researches for determining optimum sampling numbers were more focused on the empirical methods, but there were few by statistics or empirical methods combined with statistics. When determining optimum sampling numbers by statistics, they were more focused upon the methods under the normal distribution, such as classical statistics, geostatistics and simulated annealing algorithm. However, their usefulness was often limited because there was adequate empirical evidence and a theoretical proof to illustrate that the distribution of soil heavy metal content often approximately followed a lognormal distribution. The application in determining optimum sampling numbers for survey of soil heavy metals under the lognormal distribution, which has little been reported to date. Third, although some scientists proposed the methods to determine optimum sampling numbers under the lognormal distribution, including the Land’s accurate method and other correction equations of this accurate method (such as Hale’s method, Armstrong’s method, classical lognormal equation, quadratic term approximate equation and Chebyshev inequality), the Land’s accurate method under the lognormal distribution was too complex because of the need for computing by an iterative algorithm and requiring extensive tables. The different correction equations had been limited because they not only were not enough to cover the different coefficient of variation of soil heavy metals, but also overestimated or underestimated the optimum sampling numbers. Moreover, these mentioned different methods under the lognormal distribution had not been applied to estimate the optimum sampling numbers for survey of soil heavy metals. Therefore, sampling scales or sampling units of soil heavy metals were defined when determining optimum sampling numbers. The researches on determining optimum sampling numbers by statistics and empirical methods combined with statistics were strengthened. The accurate methods on determining optimum sampling numbers under the lognormal distribution were explored. The methods suited for determining optimum sampling numbers for survey of soil heavy metals in a sampling unit were sought. These ../../../hyj/AppData/Local/youdao/dict/Application/ - /javascript:;were important guarantees to achieve scientific risk assessment, effective environmental decision-making and pollution control of soil heavy metals.

soils; heavy metals; sampling; statistics; normal distribution; lognormal distribution

