APP下载

基于Cubist多元混合回归的稻米富集Cd模型构建研究

2018-06-28刘佳凤田娜娜赵玉杰周其文刘潇威郭新蕾

农业环境科学学报 2018年6期
关键词:稻米规则土壤

刘佳凤 ,田娜娜 ,赵玉杰 ,周其文 ,刘潇威 ,袁 旭 ,郭新蕾

(1.沈阳农业大学土地与环境学院,沈阳 110866;2.农业部农产品质量安全环境因子控制重点实验室,天津 300191;3.贵州省草地试验推广站,贵阳 550000)

我国是受土壤镉(Cd)污染危害较严重的国家,土壤Cd污染不但对生态环境产生危害,而且还会通过食物链危害人体健康[1]。由于水稻是易吸收Cd的农作物,农田Cd污染严重危害了粮食安全,对人体健康造成潜在风险[2]。据2014年国土资源部、环境保护部公布的《全国土壤污染状况调查公报》显示,我国土壤总的超标率为16.1%,其中Cd的超标率为7.0%,在无机污染物中污染最为严重[3]。但相关研究也表明,土壤重金属Cd与稻米Cd含量很多情况并不存在线性关联。土壤超标但农产品不超标,土壤不超标而农产品超标的情况在很多地区均有发现。如何构建土壤Cd与稻米Cd之间的关联关系,解析土壤环境因子对稻米富集Cd的影响是土壤环境质量监测亟需解决的问题之一[4-6]。当前,将农田土壤Cd与稻米Cd之间建立关联模型的常用方式是构建多元线性或非线性回归方程,模型构建考虑的参数主要为土壤pH、有机质(SOM)、阳离子交换量(CEC)、土壤 Fe/Mn氧化物或土壤质地等[7-9]。多元回归方法构建土壤-稻米Cd传输模型的缺陷在于无法有效考虑土壤环境因子在不同条件下对稻米吸收Cd影响能力的差别,而模型构建时仅考虑土壤pH、SOM等少量环境因子,也往往忽视其他因素对稻米富集Cd的影响。

近年来,由Rule Quest公司开发的Cubist混合线性回归决策树算法有效弥补了线性回归方法无法区分自变量不同情景模式对因变量影响能力存在差别的问题。Cubist模型是一种强有力的基于规则的预测模型,每个规则都关联一个多元线性回归子模型,规则与模型的匹配完善了单一模型带来的不足,从而提升了模型预测精度[10]。Cubist模型自发明以来,已被广泛应用于遥感影像识别分类、数字土壤制图中[11-12],而将Cubist应用于土壤-稻米Cd传输模型的构建中还少见报道。本研究在对土壤理化性质进行多参数分析基础上,采用Cubist技术构建土壤-稻米Cd传输模型,以期为稻米质量安全预测及产地污染治理修复环境因子筛选提供技术支撑。

1 材料与方法

1.1 样品采集

本研究的样品采集自我国湖南省存在稻米Cd污染风险的6个区县,采样时间为2016年10月下旬,水稻类型为晚稻。采集根际土壤和对应的水稻籽粒样品共140对,采样区包括稻米Cd高、中、低风险种植区。记录采样点经纬度及周边环境状况,每个样品采集50株左右水稻,相对应的水稻根际土采集1 kg左右,深度为0~20 cm。根际土样品采集后带回实验室,经过自然风干,去除土样中的植物残体、石块等,运用四分法取土研磨过2 mm尼龙筛;取混合均匀后的土壤200 g,过20目尼龙筛;取其中50 g用于检测土壤pH、质地,其余150 g缩分至50 g,过100目尼龙筛,用于检测重金属全量以及采用X射线能谱法测定分析其他元素含量参数值。稻米样品采集后用自来水洗去表面附着的泥土,再用蒸馏水冲洗两遍,晒干后用砻谷机去糙,然后再粉碎成糙米,制成糙米样品,四分法过40目尼龙筛备用。

1.2 化学分析

本研究除测定土壤常规理化参数外,还采用高能偏振能量色散X射线荧光能谱法检测土壤大量金属及非金属元素含量,检测参数达60项,以尽可能明确采样点土壤理化性质。其中pH、有机质的测定分别采用电位法、重铬酸钾滴定法,具体参见《土壤农业化学分析方法》及《土壤农化分析》(第三版)[13-14]。DOC利用TOC分析仪测定[15]。土壤中重金属Cd全量采用三酸消解法(浓 HNO3、HF 和 HClO4体积比为 10∶4∶1),稻米样品Cd为双酸(浓HNO3和HClO4体积比为10∶1)消解,用 ICP-MS 测定[16]。土壤重金属 As、Hg采用浓HNO3消解法,运用原子荧光测定As、Hg的含量[17]。采用PANalytical公司X射线能谱法测定其他元素含量,仪器型号为Epsilon5。土壤检测平行样分析相对偏差不能大于10%。

1.3 分析方法简介

Cubist模型是一种连续变量分类回归决策树方法,其每一条规则被定义为树的单独路径,树的节点是一系列线性模型。预测时将数据空间划分为若干个子空间,分别对子空间数据建模,以提高预测精度。Cubist规则的建立方法与回归树模型类似,详尽地对自变量值和训练数据集搜索遍历后找到最初的分裂,通过不断减小叶节点的错误率来调整分裂结果[18-19]。具体模型及应用方式可参看相关使用说明[20]。

1.4 数据分析

本文模型以R 3.2.2所载程序包Cubist 0.2.1进行混合线性模型构建;SPSS 22.0进行数据描述性统计分析及多元回归分析建模。

2 结果与讨论

2.1 土壤理化参数描述性统计分析

根据经验,我们从60多个土壤理化参数中筛查出23个参数作为建模及土壤环境质量评价初选参数进行统计分析,各参数检测结果见表1。结果表明,采样区土壤pH值范围为4.81~8.22,负的偏度值及平均值小于7的统计表明,虽然大部分土壤偏酸性,但也有部分采样区土壤pH呈现碱性,说明采样区土壤类型具有明显差别。研究区土壤SOM含量的范围为1.55%~8.54%,均值是4.42%,土壤肥力较高。检测数据统计结果表明,除土壤Cd超过《土壤环境质量标准》(GB 15618—1995)2级标准值比较严重外,其他金属或类金属含量如 Cu、Zn、Pb、Ni、As、Hg、Cr均处于未污染或仅有个别点位超标情况,基本不会影响建模过程。

表1 采样区土壤理化参数描述性统计结果Table1 Descriptive statistics of soil physical and chemical parameters in the sampling area

2.2 土壤-稻米Cd传输多元混合模型

首先采用GritBot分析并去除数据异常值[21],本数据共集中发现7个异常数据,因此建模所用数据实际为133个,然后将数据分为培训数据及验证数据两类,其中验证数据从全部数据中随机抽取20个。培训数据集构建的Cubist模型见表2。各因子条件贡献及模型贡献见表3。模型预测稻米Cd(R_Cd)含量与实际检测值散点图见图1。模型培训数据集预测值与实际检测值在稻米Cd含量表现出良好的一致性。培训数据检测值与预测值全部数据相关系数为0.97,在稻米Cd含量小于0.6 mg·kg-1时为0.81,验证数据检测值与预测值也显著相关,线性关系模型决定系数为0.86。说明Cubist模型能真实反映土壤因子对稻米吸收Cd的影响。

表3表明,在检测的23个土壤参数中,有6个达到了显著影响稻米对Cd吸收富集的程度,从而被纳入了Cubist模型参数。其中pH、CaO、Fe2O3、S等4个参数不但成为模型分枝判定条件,而且在子模型中也承担主要角色。土壤Cd含量对稻米富集Cd虽有影响,但没有成为模型判定分枝条件,结合表2可知其仅在偏碱性土壤中起到了作用。这进一步说明,土壤Cd全量并非影响稻米富集Cd的最关键因素,而只是必要条件。

表2表明,本研究构建的土壤-稻米Cd传输模型共有7个规则,其中规则1及规则3、4所含样品量最多,占全部培训数据集样品量的81.4%。在规则1中,以土壤pH为判断条件,当pH>6.97时,即土壤处于中偏碱性水平时,稻米Cd含量受pH及土壤Cd含量的影响:pH升高,稻米Cd含量下降;土壤Cd含量升高,稻米Cd含量随之升高。在规则1条件下,稻米Cd平均含量为0.04 mg·kg-1,假定土壤pH固定为7,则稻米Cd含量达到食品安全国家标准(GB 2762—2017)0.2 mg·kg-1,土壤 Cd 含量需达到 12 mg·kg-1时才会超过这一标准,但这在现实中基本不存在,可见在湖南碱性土壤种植的水稻,基本不存在Cd超标情况。

表2 Cubist预测稻米富集Cd模型Table2 The Cubist model of Cd transfer

表3 不同因子在Cubist模型中的条件贡献及模型贡献Table3 Condition and model contribution of different factors

图1 Cubist模型预测稻米Cd含量与实际检测值散点图Figure1 The relationship between the observed value and predicted value of rice Cd in Cubist model

在规则3中展示的是当土壤pH处于中偏酸水平时,稻米Cd含量受pH及Fe含量影响的模型形式。本研究数据分析结果表明,土壤Ca与土壤pH在Ca(以CaO计)含量低于1%时,有显著相关性,结果见图 2,关系模型为 pH=3.571 8CaO+4.049 6(R2=0.636 2)。这与Wang等[22]在江苏省稻-麦轮作区研究结果一致。说明在湖南及江苏省等区域,在土壤CaO含量小于1%时,通过调控Ca含量可显著影响土壤的酸碱性。根据规则3土壤CaO含量条件,当CaO含量为0.451%时,土壤pH计算结果为5.7,95%置信区间值为5.57~5.76。说明在土壤pH为5.5~7.0时,稻米对Cd的吸收受土壤pH、Fe含量的影响,两者影响力一负一正。对比规则1与规则3中pH的系数,可以看出,在中偏酸性土壤中,pH变化对稻米富集Cd的影响力是碱性土壤的12倍。

图2 土壤Ca与土壤pH关系Figure2 The scatter diagram of the soil calcium and pH

规则4的判断条件为土壤CaO含量≤0.451%,Fe2O3含量介于4.9%~5.8%之间,根据本研究获得的Ca与pH关系式可知,土壤pH不大于5.7为酸性环境。我国860余个表层土壤全铁含量实测值在0.17%~17.86%之间(以Fe2O3计,下同),95%的置信范围为1.22%~8.24%[22]。规则4中的研究区土壤Fe含量处于中等水平。根据规则4可知,在酸性环境中,稻米对Cd的吸收受到土壤S含量影响比较明显。本研究区土壤全 S 的含量范围为 255.05~1 972.22 mg·kg-1,均值是561.93 mg·kg-1,明显高于其他地区水稻田S平均含量252 mg·kg-1[14],监测结果与黄运湘等[23]测定结果一致。规则4稻米Cd平均含量为0.35 mg·kg-1,超过我国稻米Cd安全限值,对数据进一步分析表明,土壤S与土壤有机质之间存在显著的联系,两者决定系数达到了0.571(相关系数0.756),其关系图见图3,这说明有机质是土壤S的重要来源[13]。Cubist模型中共有2个子模型,1个判断条件涉及到S含量对稻米富集Cd的影响,而且这种影响均为正效应。土壤中S形态的改变影响重金属生物有效性,从而起到调控重金属在土壤中迁移的作用。土壤中S包含水溶态、吸附态和难溶态,其化合价在-2~+6范围内转变,其中有效S包括以形态存在的水溶性S、吸附态S和部分有机态S。水田厌氧条件下,SO2-4被还原为S2-,在环境中S2-与Cd2+发生沉淀反应生成难溶性的CdS,从而使土壤中有效S和有效态Cd含量降低。在排水烤田期,S2-易被氧化,此时硫化物中的Cd2+也被释放出来,土壤中有效态Cd增加,导致水稻Cd吸收量增加[24]。当前,我国南方水稻田种植均采用干湿交替方式,土壤淹水降低了有机质分解速率,促进了S的富集[14],土壤排水又促进了硫化物中Cd的释放,导致了稻米Cd含量的进一步增加。可见,湖南省土壤S含量偏高是稻米Cd超标的重要诱因之一。

图3 土壤有机质与土壤S含量散点图Figure3 The scatter diagram of the soil SOM and S

规则5、6、7中共有18个稻米监测样品,虽然样本量较少,但3种规则条件下稻米均处于严重超标水平,应引起重视。综合3个规则表明,在酸性且Ca含量偏低条件下稻米Cd污染严重,pH值增加不但不会降低稻米Cd含量,反而会增加稻米污染程度,这在土壤pH调控时应引起注意。综合本研究各规则中pH对稻米富集Cd的影响可见,其过程复杂,低pH及高pH均能抑制水稻对Cd的富集,但当土壤pH由强酸性向偏酸性上升时,稻米对Cd的富集增加,偏酸性向中性过渡时,稻米对Cd的富集显著下降,中性向碱性转化时稻米对Cd的富集也随之下降,但不如偏酸性向中性过渡明显。

作者收集了我国南方7个水稻种植区不同pH条件下稻米对Cd富集系数的变化状况的资料,(富集系数=稻米Cd含量/土壤Cd含量),结果见图4。可见不同地区稻米对Cd的富集系数虽有较大差异性,但pH对富集系数变化的影响规律是一致的。这与pH影响土壤Cd存在的形态变化有直接关系,当pH变化时,土壤Cd与土壤有机质、粘土矿物及Fe/Mn氧化物结合的形态会发生显著的变化,从而影响稻米对Cd的富集[25]。

综合相关规则表明,土壤低Fe水平(Fe2O3≤4.9%)增加Fe含量会抑制稻米对Cd的富集,但高Fe时(Fe2O3>5.8%),会促进稻米对Cd的吸收。土壤Fe(以Fe2O3计)与稻米Cd含量散点关系图见图5。总体而言,土壤Fe升高对稻米富集Cd有抑制作用,这与Fe含量增加促进根表铁膜形成有关[26],模型模拟结果中高Fe会促进稻米对Cd的吸收可能与散点图中圈定样品Cd含量增加有关,这可能是水稻品种差异性造成的,具体原因还有待探讨。

在规则7中,土壤Cl离子也表现出对稻米富集Cd的影响,且这种影响以负作用为主,这与王芳等[27]的研究结果一致。可能原因是Cl离子与土壤中的金属Cd离子的络合作用抑制了镉在作物体内的毒害效应[28]。

图4 不同区域pH变化对稻米Cd富集系数的影响Figure4 Differences of the enrichment factor in different soil pH in different research districts

3 结论

(1)稻米Cd检测值与模型预测值显著相关,Cubist方法是构建土壤-稻米Cd传输模型最有效的方法之一。

图5 土壤Fe与稻米Cd含量散点图Figure5 The scatter diagram of the soil Fe and rice Cd

(2)在筛选出的23个土壤理化参数中,pH、Ca、Fe、S、Cd、Cl等 6个参数对稻米富集 Cd影响最为突出,并被纳入Cubist模型中。

(3)土壤Ca与土壤pH,S与土壤SOM显著相关,当土壤Ca(以CaO计)含量小于1%时,Ca是控制土壤pH的关键因素。土壤S随土壤SOM的增加呈指数增加,且对水稻富集Cd有正面促进作用。

(4)土壤pH对稻米富集Cd的影响在不同阈值范围内作用效能不同。随土壤Fe含量增加,稻米富集Cd总体呈下降态势。

[1]黄立章,金腊华,万金保.土壤重金属生物有效性评价方法[J].江西农业学报,2009,21(4):129-132.

HUANG Li-zhang,JIN La-hua,WAN Jin-bao.Methods of evaluating bio-validity of heavy metals in soil[J].Journal of Jiangxi Agriculture,2009,21(4):129-132.

[2]Brus D J,Li Z,Song J,et al.Predictions of spatially averaged cadmium contents in rice grains in the Fuyang Valley,P.R.China[J].J Environ Qual,2009(38):1126-1136.

[3]环境保护部,国土资源部.全国土壤污染状况调查公报[R].2014.

Ministry of Environment Protection of the People′s Republic of China,Ministry of Land and Resources of the People′s Republic of China.Report on the national general survey of soil contamination[R].2014.

[4]Rafiq M T,Aziz R,Yang X E,et al.Cadmium phytoavailability to rice(Oryza sativa L.)grown in representative Chinese soils.A model to improve soil environmental quality guidelines for food safety[J].Ecotoxicology and Environmental Safety,2014,103:101-107.

[5]刘 情,陈红燕,唐豆豆,等.苏南典型区土壤-水稻系统中重金属迁移特征及定量模型研究[J].环境科技,2016,29(4):20-25.

LIU Qing,CHEN Hong-yan,TANG Dou-dou,et al.Migration characteristics and quantitative model of heavy metals in the typical polluted areas of Southern Jiangsu Provice[J].Environmental Science and Technology,2016,29(4):20-25

[6]赵科理,傅伟军,戴 巍,等.浙江省典型水稻产区土壤-水稻系统重金属迁移特征及定量模型[J].中国生态农业学报,2016,24(2):226-234.

ZHAO Ke-li,FU Wei-jun,DAI Wei,et al.Characteristics and quantitative model of heavy metal transfer in soil-rice systems in typical rice production areas of Zhejiang Province[J].Chinese Journal of Eco-Agriculture,2016,24(2):226-234.

[7]李志博,骆永明,宋 静,等.基于稻米摄入风险的稻田土壤镉临界值研究:个案研究[J].土壤学报,2008,45(1):76-81.

LI Zhi-bo,LUO Yong-ming,SONG Jing,et al.Critical values for Cd in paddy field based on Cd risk of rice consumption:A case study[J].Acta Pedologica Sinica,2008,45(1):76-81.

[8]Römkens P F,Guo H Y,Chu C L,et al.Prediction of cadmium uptake by brown rice and derivation of soil-plant transfer models to improve soil protection guidelines[J].Environmental Pollution,2009,157(8/9):2435-2444.

[9]潘 杨,赵玉杰,周其文,等.南方稻区土壤pH变化对稻米吸收镉的影响[J].安徽农业科学,2015,43(16):235-238.

PAN Yang,ZHAO Yu-jie,ZHOU Qi-wen,et al.Influence of soil pH on cadmium absorption by rice in main rice production region of South China[J].Journal of Anhui Agricultural Sciences,2015,43(16):235-238.

[10]Frank E,Wang Y,Inglis S,et al.Using model trees for classification[J].Machine Learning,1998,32(1):63-76.

[11]Dai S,Fu Y C,ZhaoY L.The remote sensing model for estimating urban impervious surface percentage based on the Cubist Model Tree[J].Journal of Geo-information Science,2016,18(10):1399-1409.

[12]Gray J M,Bishop T FA,Yang X H.Pragmatic models for the prediction and digital mapping of soil properties in Eastern Australia[J].Soil Research,2015,53(1):24-42.

[13]鲁如坤.土壤农业化学分析方法[M].北京:中国农业科技出版社,2000.

LU Ru-kun.Analytical methods of soil agricultural chemistry[M].Beijing:China Agricultural Science and Technology Press,2000.

[14]鲍士旦.土壤农化分析[M].三版.北京:中国农业出版社,2000.BAO Shi-dan.Soil agro-chemical analysis[M].Third Edition.Beijing:China Agricultural Press,2000.

[15]吕国红,周广胜,周 莉,等.土壤溶解性有机碳测定方法与应用[J].气象与环境学报,2006,22(2):51-55.

LÜ Guo-hong,ZHOU Guang-sheng,ZHOU Li,et al.Determination of dissolved organic carbon in soil and application[J].Journal of Meteorology and Environment,2006,22(2):51-55.

[16]Moor C,Lymberopoulou T,Dietrich V J.Determination of heavy metals in soils,sediments and geological materials by ICP-AES and ICP-MS[J].Mikrochimica Acta,2001,136(3):123-128.

[17]李 艳.双道氢化物发生原子荧光光谱法同时测定土壤中的砷和汞[J].农业环境与发展,2004,21(1):41-42.

LI Yan.Simultaneous determination of arsenic and mercury in soil by dual channel hydride generation atomic fluorescence spectrometry[J].Agricultural Environment and Development,2004,21(1):41-42.

[18]孙 慧,郭治兴,郭 颖,等.广东省土壤Cd含量空间分布预测[J].环境科学,2017,38(5):2111-2124.

SUN Hui,GUO Zhi-xing,GUO Ying,et al.Prediction of distribution of soil Cd concentrations in Guangdong Province,China[J].Environmental Science,2017,38(5):2111-2124.

[19]Kuhn M,Johnson K.Regression trees and rule-based models[M].Springer:Applied Predicdictive Modeling.2013:369-413.

[20]Kuhn M,Steve W,Chris K,et al.CRAN-Package.Cubist[EB/OL].2017.https://cran.r-project.Org/web/packages/Cubist/index.Html.

[21]Ltd Rule Quest Research Pty.GritBot:An Informal Tutorial[EB/OL].2017.http://www.rulequest.com/gritbot-unix.html.

[22]Wang C,Li W,Yang Z F,et al.An invisible soil acidification:Critical role of soil carbonate and its impact on heavy metal bioavailability[J].Scientific Reports,2015,5:12735.

[23]黄运湘,郭春秋.湖南省稻田土壤硫素状况研究[J].生态环境学报,2000,9(3):235-238.

HUANG Yun-xiang,GUO Chun-qiu.Study on the sulphur status in some paddy soils of Hunan Province[J].Ecology and Environment,2000,9(3):235-238.

[24]张基茂,黄运湘.硫对水稻镉吸收的影响机理[J].作物研究,2017,31(1):82-87.

ZHANG Ji-mao,HUANG Yun-xiang.Effect of sulphur on cadmium absorption of rice[J].Crop Research,2017,31(1):82-87.

[25]廖 敏,黄昌勇,谢正苗.pH对镉在土水系统中的迁移和形态的影响[J].环境科学学报,1999,9(10):81-86.

LIAO Min,HUANG Chang-yong,XIE Zheng-miao.Effect of pH on transport and transformation of cadmium in soil-water system[J].Acta Scientiae Circumstantiae,1999,9(10):81-86.

[26]Liu J G,Gao C X,Wong M H,et al.Variations between rice cultivars in iron and manganese plaque on roots and the relation with plant cadmium uptake[J].Journal of Environmental Sciences,2010,22(7):1067-1072.

[27]王 芳,郑瑞伦,何 刃,等.氯离子和乙二胺四乙酸对镉的植物有效性的影响[J].应用生态学报,2006,17(10):1953-1957.

WANG Fang,ZHENG Rui-lun,HE Ren,et al.Effects of chlorine ion and EDTA on cadmium availability to plants[J].Chinese Journal of Applied Ecology,2006,17(10):1953-1957.

[28]王吉秀,王丹丹,祖艳群,等.氯离子对玉米累积镉的影响[J].安徽农业科学,2014,42(15):4630-4632.

WANG Ji-xiu,WANG Dan-dan,ZU Yan-qun,et al.Effects of chlorine ion on accumulation to cadmium in the maize[J].Journal of Anhui Agricultural Sciences,2014,42(15):4630-4632.

猜你喜欢

稻米规则土壤
隐藏于稻米花果中的酒香
撑竿跳规则的制定
稻米飘香醉人时光
稻米香喷喷
土壤
数独的规则和演变
灵感的土壤
为什么土壤中的微生物丰富?
识破那些优美“摆拍”——铲除“四风”的土壤
让规则不规则