计量测试中异常数据的处理方式
2019-05-07王威
王威
摘要:在计量测试中,由于受到一些因素的影响,从而使得常常会出现异常数据,为确保计量测试结果的准确性,必须对异常数据进行剔除。基于此点,本文从计量测试中异常数据的成因分析入手,提出计量测试异常数据的处理方式。期望通過本文的研究能够对计量测试数据精度的提升有所帮助。
关键词:计量测试异常数据处理
引言
计量测量,其本身便是一项对数据精准性有着极高要求的工作。而要确保数据获取的精准性,除了需科学处理计量测量所得出的数据外,尚需找出其中的异常数据并将之剔除,如此方能作为相关科学的参考依据。当前,国内已然根据计量测量中异常数据的出现原因提出了4种有针对性的异常数据剔除方法,这些方法可独立使用,亦可综合利用,其目的均在于判定异常值并将之剔除,以确保计量测量数据的准确性。
1对于计量测试的作用分析
计量测试是对日常生产科学性的体现,也会对每天的实际数据类别予以分析,而后再应用专业的测量设备进行评估和审计,对评估的最终结果进行分析,再对其实际工作情况进行探究,判定其是否符合实际的生产标准和规章制度的内容。数据的检测也是极为重要的环节,只有通过数据的核实和校对,才会对生产中的各个环节和所生产的最终产品进行检验,才会对其检测参数予以合理的判定和分析,最终判定检测结果是否符合实际的生产需求。不具备精准度的测量方式就无法对实际的生产工艺予以指导,也无法对数据进行针对性的判断,最终也不能对工艺流程予以合理的控制,导致后期的产品生产的合格以及工作落实的科学性均无法得到切实的保障。
2计量仪器出现误差的原因
由于计量仪器对外部环境有着极高的要求,加之其本身也是一种高精密的仪器,因而任何外部环境的变化都可能导致仪器测试结果产生偏差,并最终影响到检测结果的准确性。
(1)仪器受到了外界诸如震动、机械动荡一类的自然或人为因素影响;
(2)受电磁干扰或因供电电压不稳而导致的检测仪器出现故障;
(3)操作人员本身经验不足,加之操作事物所因其的检测不准确;
(4)仪器本身存在如元件损坏、零件松动一类的质量问题,这类问题一旦发生,将直接导致检测结果不准确,从而影响到工作人员的正常测量。
对于以上影响因素,操作人员在实际的操作过程中,务必全面排除,如此方能确保测量结果的准确性。当然,在此过程中,针对异常值的剔除尚需注意采取合适的剔除方法,若剔除方法选择不当则可能收获适得其反的效果。
3计量测试异常数据的处理方式
3.1异常数据的判断方法
在计量测试过程中,对异常数据进行判断时,应当选择正确的方法。目前,较为常用的判断方法有以下几种:
3.1.1拉依达判断法
这种方法基于的是拉依达准则,具体的判定原理如下:假定某一组测试数据当中只包含随机误差,通过计算处理可以获得标准偏差,根据特定的概率可确定出一个区间范围,如果误差超出这个区间范围,则可将之判定为粗大误差,含有粗大误差的数据则为异常数据,需要进行剔除。该方法可对正态或是接近正态分布的数据进行有效处理,应用时,需要确保测试次数充分,若是测试次数不足,则会造成粗大误差的可靠性降低。所以当测试次数较少时,不宜采用该方法对异常数据进行判断。该方法具体的判断过程如下:对被测试量进行等精度测量,由此可获得x1,x2,…xn,随后求取算术平均值x和剩余误差vi,其中vi可用下式表示:vi=xi-x(1)上式中i=(1,2,…n),在根据贝赛尔公式可以计算出标准偏差σ。如果某个测量值xb的剩余误差vb(1≤b≤n),并满足下式:|vb|=|xb-x|>3σ(2)则可认为xb是含有粗大误差值的坏值,应当予以剔除。
3.1.2格拉布斯判断法
这种方法是以测试量的正态分布作为判断前提,从理论的角度上讲,该方法较为严谨,操作过程也比较简便。该方法的判定原理如下:当某个测量值的残余误差的绝对值|vi|>Gg时,则可判定该值当中存在相对较大的误差,应当对误差进行剔除。该方法对异常数据的判断过程如下:
按照测量结果偏离真值的程度(误差理论),想要对偶然误差进行有效剔除,至少需要进行10次以上的测量,为了确保测量精度和响应速度,可将15次确定为一个单位,当获得15次测量数据后,其中可能会含有较大的误差,可以通过分检的方法,将可疑值剔除掉。当测量值xi对应的残差vi满足下式时应当该数据舍去:
(3)
在上式当中,x表示n次采集到的平均值(∑xi)/n;σ(x)表示测量数据组的标准差,可由贝赛尔公式求取;中的n表示测量次数,表示显著性水平(可取0.01或0.05)。当测量次数n=15,显著性水平=0.05时,则
=2.41。随后可将15次的采集值存入到同一个数组当中,求取平均值,对残差进行计算,进而求出σ(x),并将残差的绝对值与2.41倍的σ(x)进行比较,剔除可疑值后再次求取平均值,然后重复上述步骤验证是否仍有可疑值。在实际应用中发现,基本不需要重复,通常第一遍即可达到要求。
3.1.3t-检验法
这是一种假设检验的方法,可在测量次数n<30的条件下使用,通过对随机变量的数学期望进行检验,看是否与某个已知的值相等。该方法的检验过程如下:假设(x1,x2,…xn)为正态随机变量x的样本,期望Mx与已知值m0相等。按照统计理论,如果上述假设成立,则统计量服从自由度n-1的t-分布。当正态随机变量小于样本时,可用该方法对数学期望进行检验,看是否存在较为显著的差异,若是有则可将之剔除。
4实例判定
以下为结合实例所判定的异常值判断准则:如经过某测量得出了如下一系列的测量数据:10.002,10.204,0.218,10.228,10.230,10.312,10.320,10.342,10.346,结合以上方式进行判断并剔除异常值,那么置信概念的可取值可设定为95%,那么相应地。此时,我们将异常值怀疑为10.346,之后通过计算可得出这十个数的平均值为10.2317,那么对应的X1的平均值则为10.2231,,经过综合计算,得出10.346为异常值,应将其剔除。通过采用四种方法来进行判定,其10346为异常值,而G(a,n)与10.002-10.2317非常相近,这在一定程度上说明了应用格拉布斯准则的效果较好。在整个判定过程中,作为判定异常数值的基本思想是:先做好某一个统计量,如果这个统计量在规定的范围之内,便可以认为是服从止态分布,否则就认为相关的数据并不服从止态分布,这则说明了其中的数据存在一定的误差。
结语
综上所述,在实际的生产和运作过程中,都会通过各类的科学的手段对生产精准度予以确定,而后为生产产品的质量提供保障,而这一发展趋势,为计量测试的应用普遍性奠定了基础。计量测试是一项较为复杂且系统的工作,在具体的测试过程中,为提高结果的准确性,需要对异常数据进行剔除。在实际的运用过程中,为切实保障准侧的景准确并尽量降低误判现象的发生概率,通常情况下可结合两种或三种判定准则进行综合判定,若集中判定方式所得出之结论均保持一直,则可将之可疑数据处理,如此判断方式方可切实提升测量的准确性。结果表明,格拉布斯判断法的效果最佳。
参考文献
[1]徐丹,王中禹.计量测试中异常数据剔除的措施[J].科技经济导刊,2016(20):156-157.
[2]孙武强.110kV电容式电压互感器试验数据异常处理方法[J].集成电路应用,2018(11):164-166.