APP下载

混料格点设计的性质及应用

2021-12-29李光辉李俊鹏张崇岐

高校应用数学学报A辑 2021年4期
关键词:单纯形混料格点

李光辉,李俊鹏,张崇岐

(1.凯里学院 理学院,贵州凯里 556011;2.广州大学经济与统计学院,广东广州 510006)

§1 引言

由格子点集所构造的设计在生产实践中经常被使用,而关于它们的诸多性质却少有文献进行讨论及证明.鉴于此,本文在此基础上,对已有的混料格子点集的部分性质进行了证明,并补充了相关性质.首先,§2给出了混料试验的基本概念与记号,§3讨论了混料格子点集的基本性质;§4列举了格子点集的两个应用,分别是非参数回归模型的建模与格点剖分下的均匀性检验;§5总结并提出了进一步可研究的问题.

§2 基本记号

q分量混料试验域可以表示为

它是q −1维空间中的一个单纯形.若试验还受到其他约束条件的限制,将试验域记作

其中φj(x)是关于x ∈Sq−1的已知函数,aj,bj(j=1,2,···,k)为已知常数.

定义1设i1,i2,···,iq是1,2,···,q的一个置换排列,∀x=(x1,x2,···,xq)T∈Sq−1,由x生成的置换点集为H(x)={x,x1,x2,···,xp},其中xi=(xi1,xi2,···,xiq)T,i=1,2,···,p,它表示经下标置换后得到的所有互不相同的试验点构成的集合.令H(x)=[x,x1,x2,···,xp]T表示将H(x)中的各试验点按行排列而成的矩阵,称之为置换点矩阵.

例如令x1=(1,0,···,0)T,, 则由这两个点生成的置换点集为

其中eq(j)表示第j个元素为1,其余元素为0 的q维列向量.

性质2.1当1

其中Iq为q阶单位阵,为元素全部为1的q维列向量.

定义2记

为q分量m阶格子点集.

若L{q,m}={x1,x2,···,xN},其中xi=(xi1,xi2,···,xiq)T,i=1,2,···,N.将该点集中的试验点按行排列而成的矩阵记为L(q,m)=[x1,x2,···,xN]T.

§3 格点设计的性质

以下讨论关于L{q,m}以及对应规范多项式的一些性质.

性质3.1对于任意的m ∈Z+,格子点集总可以表示为由若干试验点生成的置换点集之并,即有

在混料试验设计中,随着分量q及模型阶数m的增加,需要生成高阶的格子点集.而逐一生成并储存高阶格子点集需要耗费大量的内存,所以可以考虑储存格子点集的生成元,然后再由生成元经过置换变换而得到.则关于格点设计有以下性质.

性质3.2L{q,m}中一共包含个试验点.

文[7]中有提及该性质,但未进行证明.Scheffé[8]在提出格点设计时也对这一性质进行了简要说明.实际上,该性质可等价于找到q个非负整数α1,α2,···,αq,使得成立的组合数.每个格子点都与一个0-1编码的数一一对应,如试验点就与

是对应的,它可以抽象为在q+m −1个位置上,选出q −1个位置放入“0”,而在剩下的位置放入“1”,其中第1个“0”前有α1个“1”,表示第一个分量为,以此类推,第q −1个0后的αq个“1”表示第q个分量为.

例如3分量3阶格子点集中,以下三个点对应的编码关系可表示为

性质3.3若k个正整数m1,m2,···,mk的最大公约数为m,则

记int(X)=表示不包含试验域X边界的区域.例如表示单纯形Sq−1的不含边界的内部区域,所有的分量都是正数.则有以下性质.

性质3.4, 其中#(A)表示集合A中元素的个数.

证先计算L{q,q+m}边界上点的数量.由于

若x=(x1,x2,···,xq)T∈L{q,q+m},且x ∈Sq−1int(Sq−1),则称x是L{q,q+m}的边界点,其中的分量x1,x2,···,xq至少有一个为0.设x中有一个分量为0,这样的边界点一共有个,若x中有2个分量为0,这样的边界点一共有个,以此类推,若x中有q −1个分量为0,这样的边界点一共有个.所以有

由性质3.4,可以得到一个更一般的结论.

性质3.5, 其中m ≥q.

由性质3.4可知,L{q,q+m}的内点个数等于#(L{q,m}),要求L{q,m}的内点个数,等价于将m个小球放入到q个盒子中,且盒子不允许有空,由此可以得到性质3.5的结论.

q分量m阶混料规范多项式是由m阶完全型多项式变换而来,下面先讨论完全型多项式.

性质3.6对于q分量混料系统,m阶完全多项式为

该性质在文[7]中有所提及,但未给出证明.本文给出该性质的详细证明.

证在(4)式中,常数项β0共1项;一次项共q项;二次项部分可以分解为

以此类推,直到m次项可以分解为

对于q分量混料系统来说,不能直接使用完全型多项式(4),因为q分量受到基本约束条件的限制,如果直接使用完全型多项式模型,则信息矩阵必然是退化的.关于这一问题的讨论可以参见文献[7].混料规范多项式与完全型多项式不同,最大的区别在于混料规范多项式不含有常数项.为方便记,令关于x=(x1,x2,···,xq)T∈Sq−1的函数如下.

记1,2,3,4阶混料规范多项式分别为

在以上记号的基础上,给出以下性质.

性质3.7对于m阶混料规范多项式ηm(x),m=1,2,3,4一共有项.

由于混料格子点集中的点数与规范多项式中的项数是相等的,所以在使用格子设计时,通常会考虑使用规范多项式来建模.在一阶和二阶规范多项式建模的情形下,使用格子点集能达到D-最优,而使用三阶及四阶规范多项式来建模则不能达到D−最优.很多情形下,都使用二阶混料规范多项式来建模,这一情形下模型对应的信息矩阵就十分重要,于是给出下面的性质.

性质3.8考虑L{q,2}作为试验点集,对于设计

其中x1=(1,0,···,0)T,,测度w1,w2满足,使用二阶混料规范多项式建模,所得到的信息矩阵为

使用格子点集可以将单纯形区域剖分成若干个没有共同内点的子单纯形,在不同的子单纯形上取重心就可以构造出最大距离准则下的均匀设计,也可以用于单纯形域上分布的均匀性度量.下面使用文[9]中介绍的方法,对单纯形Sq−1进行剖分.

首先构造两个q因子m水平的完全析因设计阵.令lm=(0,1/m,···,(m −1)/m)T,

其中N0=mq,然后将单纯形Sq−1剖分为若干个没有共同内点的部分,令

若有I(<1)I(>1)=1,j=1,2,···,r,其中I(·)为示性函数,记

则满足单纯形内的下界约束矩阵与上界矩阵分别为

这样一来,单纯形Sq−1就被剖分为若干个没有共同内点的子区域,即有

其中aj=(aj1,aj2,···,ajq)T,bj=(bj1,bj2,···,bjq)T分别是(6)式中矩阵L与U的第j行元素.

例如当q=3时,S3−1被2阶格子点集剖分为4个全等的子单纯形,如图1(a)所示;被3阶格子点集剖分为9个全等的子单纯形,特别的,S3−1被m阶格子点集剖分为m2个子单纯形,并且这些子单纯形是全等的.当q=4时,情况变得稍显复杂,S4−1被2阶格子点集剖分为8个子单纯形,其中在子区域内包含了4个子单纯形,该区域共有6 个极端顶点,如图1(b)所示.

图1 格点剖分下的子单纯形

当q=5时,S5−1被2阶格子点集剖分为16个子单纯形,在子区域内包含了11个子单纯形,并且这11个子单纯形与余下的子单纯形体积不全相等.当格子点集的阶数更高时,剖分的情形则会更加复杂.

性质3.9使用L{q,m}可以将Sq−1剖分为mq−1个没有共同内点的子单纯形.

§4 格点设计的应用

4.1 基于格点设计的非参数回归建模

众所周知,多项式回归模型在混料试验域上建模常考虑最优设计,而一个设计是否达到最优,不仅取决于试验点的选取,还依赖于各试验点处重复的试验次数.所以一个自然的想法是:与其在相同的试验点处重复试验,不如考虑在更多的试验点下各进行一次试验,以此获得更多试验点下的结果.由性质3.6,性质3.7和性质3.8可知,如果要在单纯形区域上建立高阶混料多项式模型,当模型中分量个数q和阶数m较大时,则难以保证其稳健性.因此可以考虑非参数的方法建立非参数回归模型.

此外如果一个试验的模型形式是已知的,使用最优设计能使得响应的预测方差达到最小,而如果试验所涉及到的模型的基本形式都是未知的,此时格点设计能够很好的满足非参数建模的要求,其中最关键的一点是:格点设计中相邻的各点之间距离几乎相等,它使得使用非参数回归更为稳健.

考虑在试验域X上使用格子点集来建模,记

定义高斯核函数为

其中h为已知的窗宽参数,若试验在各点处的观测值为y1,y2,···,yN,则基于(7)的非参数回归模型为

如果在试验域内有足够多的格子点,选择适合的窗宽,能使得非参数回归模型具有良好的预测效果.在Sq−1上使用非参数回归建模,一般需要使用m(m ≥4)阶的格子点集,当q较大时,所需要进行的试验次数会非常的多,随着分量数的增加,不可避免的会面对维数灾祸的问题.当然,在q较小的情形下,使用高阶格子点集来建模,则非参数回归模型是一个不错的选择.

例4.1设3分量的回归模型为

令h=0.1,分别使用m=3,4,5阶格子点集来建立非参数回归模型,所得到的结果如图2所示.其中(a)是模型(8)的曲面图,(b),(c),(d)分别为m=3,4,5阶格子点集建立的非参数回归模型的曲面图.由此可见,随着阶数的增加,格子点数越来越多,拟合的曲面也越来越光滑,拟合效果也更好.

图2 Sq−1上的非参数回归建模

4.2 格点剖分下的均匀性检验

在很多情形下,会面对所谓的混料数据,即收集到的数据为x1,x2,···,xN ∈Sq−1.这时想知道这些数据在单纯形域内分布是否均匀,这就可以使用格点剖分下的χ2检验来进行.由§3中介绍的格点剖分方法,即性质3.3,性质3.4以及性质3.9可知,Sq−1可以由L{q,m}剖分为mq−1个没有共同内点的子单纯形,记为

其中k=mq−1,Vi=V {xi1,xi2,···,xiq} 表示由xi1,xi2,···,xiq为顶点构成的子单纯形,需要检验的是P={x1,x2,···,xN}在Sq−1内是否分布均匀,所提出的原假设为

令NVi=#{P ∩Vi},i=1,2,···,k为Vi中包含试验点的个数,由文[11]可知,单纯形的体积为

由L{q,m}剖分下的子单纯形的体积近似为

(当q ≥4时,剖分得到的子单纯形的体积有些许差异),则有

λ(P)可以用于度量P的均匀程度,如果P在Sq−1内分布越均匀,则λ(P)就会越小,反之越大.再令

当原假设H0成立时,有χ2近似服从自由度为k的χ2分布,即.文[9]中给出了一个χ2检验的实例.

§5 总结

混料格点设计在实际中应用广泛,文[12]中介绍的混料分类模型也是基于格子点集来构造的最优设计.关于格点设计的其他性质和应用还有待进一步的发掘.例如在Sq−1上建模,使用4阶以内的混料规范多项式就足够了.但是如果考虑在局部使用分块拟合的话,则需要使用更高阶的多项式,而目前的文献中没有介绍到更高阶的混料多项式,于是可以考虑构造更高阶的混料规范多项式.此外3阶混料多项式使用3阶格子点集来构造的设计并不是最优的,且3阶以上的情形更是如此,如何将格子点集与混料规范多项式结合起来,且使得设计达到最优,这是一个值得研究的问题.还有使用格点剖分情形下的单纯形区域上的均匀性检验可以检验出混料数据的均匀性,然而如果在约束区域内,要实现低阶的格点剖分是比较困难的,一方面可以考虑在试验域X内生成低阶格子点集,另一方面,可求出格点覆盖区域以外部分的体积,再用类似于4.1中所给出的方法构造χ2统计量进行检验.关于这部分问题都有待进一步研究.

猜你喜欢

单纯形混料格点
带有超二次位势无限格点上的基态行波解
双重稀疏约束优化问题的一种贪婪单纯形算法
一种电离层TEC格点预测模型
一种具有混料功能的橡胶射出成型机
带可加噪声的非自治随机Boussinesq格点方程的随机吸引子
基于改进单纯形算法的Topmodel参数优化研究
格点和面积
基于PLC的混料罐控制系统设计
聚丙烯/CaCO3共混料中CaCO3含量测定方法对比
一类混料指数模型的D-最优设计