统计日报送制度下数据核查研究
2010-08-15张宗平胡建光
张宗平 张 咏 胡建光 王 寅
(1.广东出入境检验检疫局 广东广州 510623;2.深圳出入境检验检疫局;3.国家质量监督检验检疫总局通关业务司)
1 前言
随着检验检疫信息化的发展,国家质检总局(下称总局)需要对各直属局的业务数据进行更准确、全面、及时的了解,以便能正确、快速地进行决策。由于原来各直属局月报送业务数据已经不能适应快速准确决策的需要,因此需要将各直属局月报送业务数据改为日报送,实现总局每天自动从直属局提取数据,从而提高业务统计的时效性,同时使总局能更全面地准确了解检验检疫实际业务数据,有利于决策的科学合理。
原有的统计数据上报机制是各直属局统计人员在完成对数据的初步核查后通过手工方式报送,因为进行了简单的数据核查,所以这种人工干预的方式能及时将发现的数据质量问题进行修正。而日报送机制是定时自动将每天的业务统计数据发送到总局统计库中,因为是设定由数据库后台自动运行,未能及时对数据质量进行核查,所以报送至总局的数据可能会存在不合理的问题,降低了业务统计数据的准确性。
2 统计数据核查现状
检验检疫业务统计数据采集于在线业务各环节,各业务环节输入的数据是否准确、齐全,是否正确衔接,将直接影响业务统计数据的质量,因此,在统计数据采集之后对统计数据作进一步的逻辑审核显得尤为重要。原有的数据核查功能中,按照数据检查的目的共设计了上报情况检查、报表平衡检查、基础数据检查、下属机构基础数据与报表数据检查、数据核查等 5个功能。
(1)上报情况检查是上级机构检查其下属机构在某月是否上报了报检数据、收费数据、通关数据、归档数据、报表数据等情况;以及虽上报了数据,但机构代码设置错误或采用了未经总局批准的机构代码情况。
(2)报表平衡检查是审核本机构及下属机构各统计报表之间、表内各栏目之间的平衡关系,并将差错情况输出到 EXCL表中,便于统计人员对数据作进一步的修改和检查。一般来说,表内不平衡或表间不平衡往往都是由于基础数据发生逻辑错误所造成。
(3)基础数据检查是对本机构或各下属机构出入境货物检验检疫归档数据库和通关数据库内各数据项的逻辑关系和商品的单价进行审核,从而发现不符合逻辑的数据项和同种商品的价格差异。如果若干批同种商品价格差异太大,应对该批货物的数/重量和货值数据作进一步的检查。
(4)下属机构基础数据与报表数据检查是上级机构在接收到下属机构的数据后进行的基础数据与报表数据的批次、签证份数等平衡检查。该功能的目的旨在检查下属机构在上报数据时是否完整。
(5)数据核查是对本机构及其下属机构基础数据 (出入境货物批次、金额)与报表数据 (出入境批次、金额)之间进行的数据平衡检查。
由于统计日报送是在业务结束的当天晚上由系统后台自动运行将数据直接发送到总局,而原有的核查只能是人工在第 2个工作日或以后的时间进行,因此存在时间差异,有可能数据在总局已经被利用后直属局才核查出相关的问题进行数据修正。同时原有的数据核查手段已经不能满足实际业务的需求,需要有更广泛和更智能的核查机制。
3 统计核查的研究方向
虽然统计日报送的改革解决了数据上报的及时性,但数据的真实准确性又有可能降低。如果不能在及时性与真实准确性中找到一个平衡点,数据质量偏低也将对统计分析和决策产生不利用的影响。同时,因为业务数据增加了与其他业务系统的数据交换,如出境电子监管和进境电子监管系统与CI Q2000综合业务系统有着广泛的数据交换,特别是电子监管系统的检验检疫结果登记数据都将通过交换写入业务数据库,所以数据核查就变得尤其重要,更需要有核查机制保证数据质量。为此,我们从涉及业务数据的各个环节入手,在充分利用分析历史业务统计数据的基础上,从平衡性检查、申报异常值核查、计费情况核查、检验检疫结果数据核查、基础代码有效性核查和归档数据核查 6个方面进行研究。
3.1 平衡性核查
系统定期使用相同条件的算法从 CI Q2000基础数据库、统计数据库 (含报检数据库、检验检疫数据库、通关数据库)中,计算出批次、货值等进行数据比对,从而检查各个数据库之间是否一致。如果存在异常,则由统计管理人员作进一步分析,找出存在差异的数据进行修正后再次核查。
3.2 申报异常值核查
检验检疫的许多业务数据都是直接由企业自行申报发送,特别是进出境电子监管系统使用后,由企业申报的数据涉及的数据项更多,为确保数据质量需要对申报异常值进行核查。通过利用业务系统历史数据 (近 3年的数据)计算出每种货物的单价正常范围,与申报货物单价计算结果进行比对,筛选出超出范围的报检单进行人工核查,以发现数据录入错误 (包括数 /重量、计量单位、货值、汇率等)或个别货主故意低报货值。同时系统根据用户设定的条件项目 (如货值大于 1000万美元、数 /重量大于 1000万),从 CI Q2000数据库 (含报检数据库、检验检疫数据库、通关数据库)中,核查是否存在申报异常的数据,以便及时修正。
3.3 计费情况核查
系统计费后,由检验检疫人员进行检验检疫,可能会重新变更报检数据,增加或减少计费,应比较变更后的计费和系统计费是否存在误差。因此,需将指定周期内的报检单数据通过系统自动计算的费用与人工干预过的费用进行对比,差异过大(按差额或差额比率)的单将被筛选出来进行人工核查。
3.4 检验检疫结果数据核查
检验检疫数据的核心在结果登记环节,但有许多单的结果登记信息是由进出境电子监管系统交换进来,因此数据的核查尤其重要。对目前数据的分析主要是通过 CI Q编码、不合格信息、疫情信息、抽检标志等方面进行核查。
3.4.1 CI Q编码异常核查
在结果登记模块录入 CI Q编码,存在与 HS编码对应关系不一致的现象,容易造成统计误差,特别是电子监管的数据,CI Q编码是直接由企业端发送,因此需要利用 HS编码与 CI Q编码的对照表对CI Q编码和 HS编码对应关系进行检查,确保重要数据编码 CI Q编码的准确性。
3.4.2 不合格信息核查
质量信息分析对检验检疫把关具有重要意义,特别是针对不合格信息,其真实准确性更为重要,因此需要重点核查在不合格登记时,不合格登记情况与判定结果是否一致。例如,数据中是否存在已列明了不合格内容、不合格货值、不合格数 /重量,而检验检疫结果却判定合格的情况;或是,未列明不合格情况,却判定了不合格。核查在做不合格结果登记时,是否输入了异常的数值。例如,结果登记界面不合格数量、不合格重量、不合格金额是否录入完整;是否存在将数据录在小数点后的情况;综合不合格及放行信息是否准确一致。
3.4.3 疫情信息核查
进境检疫把关的重要体现是动植物疫情方面数据的录入和分析,需要核查入境动植物疫情、木质包装疫情和集装箱疫情在 CI Q2000中的登记完整性情况,结合中国检科院的疫情管理分析系统、LRP2000等系统,核查是否在 CI Q2000系统之外登记了而在 CI Q2000系统没有登记的现象,确保数据在各个系统的一致性。
3.4.4 抽检标志核查
抽检标志的设定更有利于分析检验检疫把关的成效和商品质量的分析。为了使抽检标记发挥更大的作用,需要根据抽检标记的含义对数据进行分析,特别是需要核查货物的属性,细分为未抽检、手工抽检、不合格系统自动抽检、电子监管系统抽检。主要核查检验检疫不合格货物“抽检标记”是否为“2”,并将该种情况进行登记;对于需要 100%抽查抽检的货物是否是打了抽检标志;电子监管货物的抽检的比例是否合理等。
3.5 基础代码有效性核查
每年检验检疫机构都会调整相关的业务基础代码,如 HS编码等,这就需要及时对某个阶段的数据进行核查,核查的主要目的是检查是否有仍在使用停止使用的编码进行业务数据处理,以确保统计数据中业务基础代码的有效性。
3.6 归档情况
核查 CI Q2000业务数据是否及时归档。核查报检后还在实施检验检疫而未能归档的;报检后已完成检验检疫工作流程而未及时归档的;施检部门与检务部门的证单交接出现失误,造成证单遗失等情况而无法归档的;只发生了报检而未做计收费及检验检疫等操作的“烂尾单”。
4 前景展望
通过对总局统计数据各个环节的数据核查,建立起统一的数据核查标准,提高统计数据的质量,确保业务统计数据的及时性、真实准确性,使总局能更全面地准确了解检验检疫业务实际,有利于决策的科学合理。