计量检测中异常数据剔除方法的分析
2019-01-23
(亳州市计量检查测试所 安徽 亳州 236800)
引言
在计量检测的过程中,对数据信息精准性的要求极为严格。在获取了大量数据信息后,必须对其展开科学有效的整理,剔除其中潜在的异常数据,进而充分保障计量检测工作的实效性。对于剔除异常数据的四类准则,应当根据实际情况,有针对性地选择使用,或者也可以通过综合利用多种准则的方式,保障异常数据剔除工作的质量。
一、计量检测的现实意义
计量检测即在日常的各种生产实践活动当中,鉴于对多类数据的运用需求,进而详细评估检测仪器的测量结果,最终借助于评估结果来判断检测仪器的实际是否满足工作需要的状态。所获得检测数据至关重要,唯有通过这些数据,才能够知道被测仪器的稳定性及每项参数是否达标。如果缺乏科学有效的计量检测工作,便无法获取具有价值的数据,那么企业在生产过程中优化产品质量以及控制工艺过程等目标便难以实现。
二、计量设备出现异常数据的原因
在统计学领域,对一组数据进行多次测量后,倘若组中存在个别数据和其他数据存在显著差异,那么则可推断此数据为可疑数据[1]。此类数据最突出的特征就是和同组数据存在极为明显的差异。换言之就是数据出现了变异,但是究竟这种变异是否正常,还需进一步展开深入研究。
计量仪器不仅精度高,而且对周遭环境要求非常严苛。倘若环境出现了显著的变化,也极有可能会使得计量检测出现误差,进而严重影响检测结果的实效性。通常情况下,致使计量设备出现误差的原因主要有四种。首先是被检设备受到了强烈的冲击,通常是机械性冲击或来自于外部的强烈震荡。其次是电压的波动或者是电磁干扰,致使被检设备受到了一定的影响而难以正常运行。再次则是检测人员自身的因素,由于其玩忽职守导致测量失误或缺乏丰富的工作经验,进而引发了误差。最后则是被检仪器本身已经出现了损坏,例如电子元件故障或内部零件松动等等。
因为异常数据和正常值之间存在极大的偏差,倘若参与到计算活动中,必定会严重影响结果的准确程度。所以必须对异常数据进行及时剔除,不过在剔除过程中若选择了不合理的方式,不但无法有效消除异常数据带来的负面影响,还会形成测试重复性极佳的假象,最终对人们的数据评判造成误导。反之,若对异常数据的存在置之不理,则会严重降低测量数据的重复性,对测试仪器的等级造成负面影响[2]。
三、判断计量检测中异常数据的基本准则
在具体的计量检测之中,判断异常值的准则并不是单一的,常见的主要有四种,分别为拉依达准则、格布拉斯准则、肖维勒准则以及t检验法等等[3]。尽管者四种准则的主要内容存在显著差异,但是在判断过程之中均用到了“置信概率”。这里所说的“置信概率”即随机变量处于“置信范围”的可能性。设置信范围所代表的测量数据的值领为X,各项准则的表达式如下所述:
(一)拉依达准则
把所测得的数据带入于此表达式当中,倘若不等式成立,则表示此数据为异常数据,必须尽快进行剔除。其所代表的意义是,可疑数据和组中其他数据的平均值差额的绝对值,超过了标准偏差的三倍,所以该数据作为异常数据必须被剔除。
(二)格布拉斯准则
(三)肖维勒准则
在使用此公式的时候,应当综合相互独立所测得的数据,倘若公式满足以上不等式时,则可以得出Xd为异常值,必须及时进行剔除。
(四)t检验法
四、实例研究
本文通过列举实例,对上述四种异常数据判断准则实施判定。
例如:在实施精度测量过程中,获得了以下一组数据,共十个,分别为10.001、10.205、10.217、10.221、10.229、10.231、10.311、10.321、10.341以及10.347。分别通过以上四种方式实施判断,并且对异常数据展开剔除,置信概率定为95%,α=0.05。
在此实例之中,使用四类判定准则所获取的结果相同,即10.347为异常数据。其中G(α,n)s和10.001-10.2424最靠近。这也充分表示,此时运用格拉布斯准则的效果最佳。
结语
总的来说,在实施计量检测的过程之中,若要有效剔除异常数据,可以综合运用两种甚至三种不同的判定准则,在同一时间实施判定。倘若所得到的结果一致,那么则可以毫无疑问地对可疑数据进行剔除,进而保障剔除工作的准确性。倘若所获得结果存在差异,那么则需展开进一步的研究分析,最好是做数据保留处理。