基于迭代加权最小二乘法的批次木材密度测定方法研究

2016-09-23黄时浩潘铁柱

科技与创新 2016年16期

黄时浩　潘铁柱

摘要：针对木结构承重设计时难以直接获取或测量批次木材密度的问题，提出了一种抽取批次木材试样的迭代加权最小二乘估计总样本密度的方法。设计了试样密度的频数统计方法，计算了样本密度的期望平均估计，选取了具有无偏估计性质的期望平均估计作为初始均值，并设计了权系数为样本密度的频数与估计误差距离的倒数之乘积。通过批次木材抽取的样本数据，对比了木结构质量实际测量与基于总样本密度估计的木结构质量计算结果，验证了总样本密度估计方法的可行性，其具有对期望平均估计微调至最优和迭代任意收敛的性质。

关键词：木材密度；加权最小二乘法；批次采样；参数估计式

中图分类号：TH113 文献标识码：A DOI：10.15913/j.cnki.kjycx.2016.16.081

木材密度的测定一般依据《木材密度测定方法》（GB/T 1933—2009）标准实施，但该标准中未涉及一批木材如何由抽取试样密度估计该批木材总样本密度的方法，且也没有相关文献解决此问题。由于木材密度离散性较大、测量误差非常小，传统的回归分析方法不适用于上述需求，因此，由该批木材制作木结构的质量估算准确性会受到很大的影响。

在密度估计中，算术平均值估计量是全纳伪估计量。算术平均值估计量即最小二乘估计量或正态分布的极大似然估计量，是建立在所有观测值只含偶然误差基础上的一种估计方法。如果观测值中含有较大离散分布值，这种估计由于是按平均分配误差原则来处理数据的，会导致估计结果纳伪。

中位数估计又可定名为“和极大似然估计”，由于它是根据随机变量概率事件之和为最大而导出未知参数估计式的，具有彻底的抗差性，观测值的较大离散分布或粗差都不会对估计结果产生影响。但由于具有彻底的排他性，进而使中位数估计排除了所有的多余观测，因此，带来了全弃真的估计性质，属于彻底的抗差估计方法。

在有限样本容量的条件下，上述2种平均估计均为有偏估计，中位数估计可以克服密度分布离散度大的情况而算数平均无法克服。期望平均估计因考虑了样本密度出现频数（概率密度的离散数据统计结果），估计具有既不纳伪，也不弃真的估计性质，即在有限样本容量的条件下此平均估计为无偏估计。

本文基于木材批次随机抽取试样，采集各试样的体积、质量等批次数据，计算密度的期望平均估计，再通过加权最小二乘迭代估计批次密度，通过多组批次采样数据与方法估计得到一批木材总样本的密度，通过实际测量与估计结果对比加以验证，证明了该方法的有效性和准确性。

1 迭代加权最小二乘估计方法设计

1.1 木材各试样密度的计算方法

由一批木材随机抽取试样（需要具有代表性，样本的数量应占总样本的25%以上，且不少于20个），按照GB/T 1933—2009中的标准测量出各试样的体积Vi和质量gi（i为试样的序号，i=1，2，…，n）。

第八步，判断|σk2-σk-12|≤δ（δ为设定的阈值）。如果不满足条件，则转入第二步继续加权最小二乘迭代估计计算；如果

满足条件，则结束并输出密度估计值 .

本木材密度测定方法的运算流程如图1所示。

2 木材密度估计试验设计与方法验证

2.1 木材密度测量样本数据采集

由一批木材抽取的样本如表1所示。

表1中，样本测量值如图2中的a，密度如图2中的b分布。

2.2 试样密度的频数统计

由表1中的样本密度值可确定出密度区间为[0.19，0.31]，由经验公式m≈[1.85×（n-1）0.4）]可确定出所需划分的区间为6个。因此，则落入各小区间的样本密度个数如表2所示，其直方图如图3所示。

2.3 试样密度的期望平均估计

由式（2）可计算出密度的期望平均估计 =0.256 40 g/cm3。

2.4 试样密度的迭代加权最小二乘估计

按照图1中的迭代加权最小二乘估计运算流程可计算出密度的迭代加权最小二乘估计， =0.255 17 g/cm3。

2.5 本方法的结果分析

根据表1的数据，常用估计方法的密度估计结果如表3所示。

由表3可以看出，本方法的密度估计方差最小即均优于其他估计方法。此批桐木条（曾有资料显示，桐木密度为0.2～0.4 g/cm3）制作的木结构用本方法估计出的木材结构总质量为6.14 g，经实际测量的结构总质量为6.08 g，实测结果如图4所示。计算

出的结构总质量符合实际总质量，也是上述估计方法中最符合实际结构质量的。

3 结束语

本方法采用的期望平均估计方法和迭代加权最小二乘法在测量平差领域均有广泛应用，但这两种方法都是针对测量值存在等精度和非等精度测量误差的情况下得出的较为准确的估计结果，未考虑因样本存在较大离散度而导致测量误差较小的情况。

迭代加权最小二乘法的权系数通常取方差倒数，使均方误差和达到最小，或根据对象的特点取信噪比、可信度等作为权系数。此类权系数的取法均不适用于离散度较大，但测量误差较小、离散度呈现准正态分布的木材密度样本；迭代加权最小二乘法的初始均值通常取算术平均估计值或最小二乘法估计值。由于估计值在有限样本下具有的性质，迭代过程常存在发散现象。

本方法以有限样本下具有无偏估计性质的期望平均估计作为初始均值估计值，以迭代加权最小二乘法进行回归估计微调，权系数取样本密度频数与误差距离倒数的乘积（兼顾了样本的出现概率和对样本的估计效果，符合木材密度样本离散度较大、密度较小的样本的出现概率小、样本容量有限的特点），可以任意收敛到设定的门限阈值内，不出现发散现象，能较准确地反映出总体样本的密度。

综上所述，在本文提出的迭代加权最小二乘估计方法中，初始均值取具有无偏估计性质的期望平均估计，且权系数取样本密度的频数与估计误差距离的倒数之乘积，具有对期望平均估计微调至最优和迭代任意收敛的性质，上述为本文的技术创新所在。

参考文献

[1]孙燕良，张厚江.木材密度检测方法研究现状与发展[J].森林工程，2011，27（01）.

[2]程永生，汤兵勇.基于数据点重要性差异的最小二乘加权法[J].东华大学学报（自然科学版），2006，32（06）.

[3]黄杰.正态分布三个特殊随机模型及适用范围——兼论算术平均值是有偏估计[J].桂林工学院学报，2000，20（04）.

[4]杨波.加权最小二乘估计中加权系数的确定[J].现代电子技术，2002（12）.

〔编辑：张思楠〕

科技与创新

2016年16期

基于迭代加权最小二乘法的批次木材密度测定方法研究

杂志排行

科技与创新的其它文章