3因素随机裂区试验设计及其统计分析
2017-05-30陈庭木王宝祥杨波
陈庭木 王宝祥 杨波
摘要 提出一种新的3因素随机裂区试验设计,给出了自由度与平方和分解方案,以及固定模型、随机模型及2种混合模型的均方构成,同时提出了随机模型误差方差计算方法。
关键词 3因素试验;随机裂区;统计模型;方差分析
中图分类号 S-3 文献标识码 A 文章编号 0517-6611(2017)25-0003-03
Abstract We designed a new design of randomized block and split plot of three factors, gave the decomposition scheme of the degree of freedom and square, as well as the mean square composition of fixed model, stochastic model and hybrid model of the two, and put forward the calculation method of stochastic model error variance.
Key words Three factors experiment;Randomized block and split plot;Statistical model;Analysis of variance
作物科学研究领域,常用3因素试验设计,一般3因素试验有完全随机区组试验、品种多年多点试验和再裂区试验,至今很少有其他的3因素试验设计报道,通用统计软件SPSS\SAS\STATA等也未提供相应分析方法[1-3]。完全随机区组试验对于栽培研究很不适用,不同的栽培因素如密度、水分管理、施肥方式等,不适合小区操作,但试验面积又不能过大。再裂区设计,3个因素误差精度不同,主区试验面积最大、误差较大,裂区试验面积较大、误差中等,再裂区试验面积小、误差小、精度高。如2个栽培因素均要求较大小区,或重要程度均较高,则可以将这2个因素作完全随机组合排列,较适宜操作且有相同试验误差,将2个因素组合作为主区,另一因素对小区面积要求不高,或重要性高,则将其在主区内裂区排列,则该试验设计称为3因素随机裂区设计。笔者提出了一种新的3因素随机裂区试验设计,给出了自由度与平方和分解方案,以及固定模型、随机模型及2种混合模型的均方构成,同时提出了随机模型误差方差计算方法,以期为生物统计提供新思路。
1 试验设计方法
设A、B、C 3个试验因素,分别有a、b、c 3个水平,每水平重复r次。A、B共ab个组合,将区组划分为a×b个主区,C为副区因素,在每个AB组合主区内裂区排列。该设计遵循重复、随机排列及局部控制原则。先按田间肥力梯度划分为r个区组,每个区组划分为a×b个主区,分别随机安排A、B因素的a×b个组合,每个AB组合构成一个主区,对每个主区再随机排入C因素的c个水平,保证每个主区内均再随机裂区。播种期、栽插期或水分管理及N、K肥运筹间的主区间以田埂区隔,密度主区间可以走道间隔,品种、种苗处理、药剂处理、移动性弱的P肥运筹适宜作副区因素,副区间以走道间隔。
该设计是一种完全试验平衡设计,较3因素随机区组试验设计,增大了主区2因素的处理面积,便于同一水平小区集中连片,田间操作相对简易。较再裂区设计,多了1個主区因素,便于安排2个需要较大小区的因素,2个主区因素有共同的误差,副区因素也有独立的误差估计。该试验设计较再裂区与条裂区试验设计误差成分简单。
2 线性模型
df=MS2MS21df1+MS22df2+MS23df3
+MS24df4,为误差项的估计近似自由度,FA=MSAMS,近似服从自由度(dfA,df)的F分布,当方差测验显著时,以MS为误差项作多重比较,文献[4-5]只有2个方差项合并的近似自由度计算,该研究改为多个误差项的合并,但不再将被比项加上另一个方差均方作近似F测验,且原法无法估计误差项作多重比较。其他误差项的合并处理方法参考上述方法。从上述公式可以看出,方差成分越大,对近似自由度估计影响越大,相反则越小,为0则无影响;方差项的自由度对近似自由度的估计则相反,当除误差项均方外,其他方差成分均为0,则转化为固定模型的测验方式。实践中,方差成分出现负值很常见,理论上方差只能为非负,如最小范数二阶无偏方差估计法(MINQUE)、限制性极大似然方差成分估计法(REML)均对方差作了非负限制[6]。
由表2可知,MSB方差显著性测验方法与A因素相同,MSAB、MSC误差项均由2项构成,误差项近似自由度估计公式略为简单。表3、4、5列出了其他3种模型的均方构成,F测验的误差项选择与随机模型相似,参考表2可写出方案。
表1~5只列出了4种模型期望均方构成,其他4种模型可仿该4个模型由随机模型变化得出,具体可以口诀“固含随,不含他固;随不含固”辅助写出。
5 实例计算
有一棉花栽培试验,有A(播期)、B(密度)、C(品种)3个因素,A分为A1(谷雨播)、A2(立夏播),B分为B1(低密度)、B2(中密度)、B3(高密度),C分为C1(品种1)、C2(品种2)。3次重复,AB作为主区因素,完全随机排列,每个主区内随机排入2个品种。田间布局见图1。试验数据见表6。
有A(播期)、B(密度)、C(品种)3个因素。表7显示,播期与品种互作、密度与品种互作,4种模型分析均极显著,播期、密度与品种二级互作、播期与密度互作、密度4种模型分析均不显著。播期、品种,不同的模型得出的结论不同,固定模型分析二者均极显著,其他模型显著水平发生变化或不再显著。因此,试验模型选择很重要,可能产生不同的结论。
参考文献
[1] 黄燕,吴平.SAS统计分析及应用[M].北京:机械工业出版社,2006:106-113.
[2] 郝黎仁,樊元,郝哲欧.SPSS实用统计分析[M].北京:中国水利水电出版社,2003:166-179.
[3] ANDERSON T W.多元统计分析导论[M].张润楚,程轶,译.北京:人民邮电出版社,2010:258-262.
[4] 莫惠栋.农业试验统计[M].2版.上海:上海科学技术出版社,1992:224-259.
[5] 马育华.田间试验和统计方法[M].2版.北京:中国农业出版社,1995:171-186.
[6] 朱军,杨天桥.遗传模型分析方法[M].北京:中国农业出版社,1997:28.