浅析如何剔除计量检测中的异常数据
2020-05-08卢云忠
卢云忠
(德州市产品质量标准计量研究院,山东 德州253000)
我国众多行业的发展以及科学技术的发展都需要计量检测工作的辅助,通过计量检测行业内相关活动、科学活动的开展可获得有价值参考,但在计量检测工作实际开展过程中,往往会获得大量数据,这些数据中很可能潜藏着异常数据,此时如何剔除异常数据保证计量检测工作质量就成为重中之重,基于以上,下面对“如何剔除计量检测中的异常数据”展开探讨。
1 异常数据剔除对计量检测的重要性
开展计量检测工作往往是为了给相关活动的开展提供科学参考,若计量检测工作开展过程中存在异常数据且未有效剔除异常数据,很可能会导致计量检测工作为相关活动提供的参考失去科学性,从而给相关活动的开展带来阻碍,严重时造成生命及财产损失,威胁我国社会及经济发展。比如,在某航天企业生产工作中,需对企业生产的电子元器件进行计量检测,在某种因素影响下,计量检测中出现异常数据且未有效剔除异常数据影响导致电子元器件质量不过关,若在电子元器件装配使用时出现问题,那么企业不得不重新生产一批质量过关的电子元器件,此时,该企业生产成本增加,对应的企业经济效益就有所降低,或者企业未发现电子元器件存在问题直接将其装配与某设备上,导致设备使用过程中存在安全隐患,使得操作人员在使用设备时受伤。从上述例子可以看出,在企业生产过程中能否有效剔除异常数据保证计量检测工作质量,关系着生产安全与经济效益。
2 计量检测中异常数据出现的原因
2.1 外部环境因素导致计量检测中出现异常数据
常见的外部环境因素有温度、湿度等等,当外部环境因素出现较大变动或外部环境较为恶劣,计量检测工作很可能出现异常数据。比如,在石油企业在针对自身产品进行计量检测时,计量检测数据很可能受到温度变化影响出现异常,此时若不能有效剔除计量检测中存在的异常数据,势必会导致计量检测工作精准性较低。因此,在开展计量检测工作时,相关人员必须考虑到外部环境因素的影响,通过采取某些手段尽可能减少检测中存在的异常数据。例如,石油企业在针对自身产品进行计量检测之前,应当结合过往计量检测的经验与其他相关研究结果,对检测过程中的温度进行关注与控制,一般来讲,为减少计量检测中的异常数据,多数情况下会在外界温度为15℃~25℃时开展计量检测工作。
2.2 检测人员专业能力欠缺导致计量检测中出现异常数据
检测人员专业能力不过关可能导致计量检测中出现异常数据,第一,因检测人员专业能力不过关,在操作某些检测仪器时不够谨慎或出现错误操作,都可能导致计量检测中出现异常数据;第二,检测人员专业能力欠缺,无法采取某些操作水平要求更高、更加精准的检测方法,也会增大计量检测中出现异常数据的可能;第三,不同的检测人员在开展计量检测工作时水平不一,再加上不同检测人员对温度、湿度等外部环境因素的理解不同,所以在很多时候不同检测人员的计量检测数据差异较为明显,容易导致计量检测中存在异常数据。
2.3 计量检测设备存在问题导致计量检测出现异常数据
计量检测设备是否性能良好关系着计量检测的工作质量,换言之,计量检测设备存在问题可能导致计量检测出现异常数据,比如因相关人员未按照相关规范对某计量检测设备进行日常管理与维护,导致该计量检测设备灵敏度有所下降,在后续进行数据测量时,若检测人员未发现灵敏度下降的问题,照旧使用该设备进行计量检测,就可能出现异常数据。此时,若不能有效剔除异常数据,直接将该数据用于后续环节当中,就可能导致计量检测工作不能取得预期成效,相关活动的开展无法参考科学的计量检测结果。
3 计量检测中异常数据的剔除方法
3.1 计量检测中常用的四种异常数据剔除方法
作为计量检测工作的重要内容之一,计量检测中异常数据的剔除关系着数据的精准性,影响着计量检测工作的最终质量。常用的异常数据剔除方法如下表。
在剔除计量检测中存在的异常数据时,3α 数据剔除法、t值检测数据剔除法、肖维勒数据剔除法、格布拉斯数据剔除法均较为常用。在利用上述方法对计量检测中的异常数据进行剔除时,应结合实际情况选用最合适的某一种方法或某几种方法,不过结合上述方法的实际运用情况来看,当几种剔除方法同时运用于计量检测异常数据剔除时,往往能容易取得较好的异常数据剔除效果。
3.2 计量检测中异常数据的剔除案例
为进一步对“如何剔除计量检测中的异常数据”进行说明,下面将联系案例,围绕上述剔除方法展开讨论。案例如下:在某次 次 计 量 检 测 时 得 到 数 据10.003、10.205、10.219、10.221、10.229、10.231、10.313、10.321、10.343、10.346,此时需剔除异常数据。经判定得出,采用方法一、二、三、四分别对计量检测中的异常数据进行判断时,得出的结果都是10.346 为异常值。结合实际判断过程来看,在计量检测中进行异常数据剔除时,若试图加快异常数据剔除工作的速度,可采取以下措施:措施一,检测人员可先质疑计量检测数据中最大值、最小值,比如在此案例中,可先假设10.003 或10.346 就是异常数据,然后针对10.003 和10.346 进行异常数据判定,这是因为在多数情况下,若一组检测数据的最大值与最小值皆不是异常数据则意味着该组数据中存在异常数据的可能性很小,换言之,在计量检测得到一组数据当中,最大值和最小值往往更容易是异常数据,结合本案例异常数据判断结果来看,该案例的异常数据的确是最大值;措施二,可通过某些方法初步判断计量检测过程中得到一组数据中是否存在异常数据,以此来加快异常数据剔除工作的效率,比如,上述案例当中可先设定好统计量,若规定范围完全包括统计量,则意味着该统计量呈正态分布,则可初步判定该组数据中不存在异常数据,从而加快异常数据的剔除速率。
计量检测中常用的四种异常数据剔除方法
综上所述,计量检测对工业生产、科技发展等等都有较大影响,相关人员需针对会导致计量检测数据精准性下降、对计量检测工作有较大负面影响的异常数据进行分析,找到判别异常数据的方法并对异常数据进行有效剔除。实际工作中,在采用3α 数据剔除法、t 值检测数据剔除法、肖维勒数据剔除法、格布拉斯数据剔除法剔除异常数据时,可将上述方法结合在一起用于异常数据剔除,以此进一步提高异常数据的剔除质量,保证计量检测工作质量并为相关活动的开展提供科学、合理的参考信息。