省级数据集中模式下提升数据质量的探讨
2013-10-09辽宁税务高等专科学校林立新
辽宁税务高等专科学校 林立新
省级数据集中模式下提升数据质量的探讨
辽宁税务高等专科学校 林立新
税务系统省级数据大集中背景下,加速征收管理现代化的内在要求是提高征管数据的集中处理、应用和利用能力,在此形势下,进一步提高数据质量显得尤为重要。目前一定程度还存在数据不完整、不一致、不准确等问题,需要完善机制和制度,加强技术手段,拓展应用范围等进一步提升数据质量,实现税收管理再上新台阶。
数据质量 数据大集中 数据挖掘 数据清洗
目前国地税数据大集中工作基本完成,大集中系统因其功能覆盖面广、集约处理度高、服务支撑力强、系统扩展性好,对税收业务管理会带来以下主要变化 :为优化业务管理提供了基础、为深化数据应用提供了机遇、为提升征管质效提供了支撑、为推进依法治税提供了载体。高质量的数据是大集中系统准确、稳定、高效运行的基础和前提,也是能否推动和实现管理转型的关键所在。总体来说,税务部门目前仍然存在系统数据质量不高,表现在一方面已有数据不准确、不完整、不一致,另一方面又缺少需要的数据。
一、省级数据大集中后数据质量存在的问题
(一)数据的准确性不够
数据的准确与否对数据加工、应用的影响是最大的、最明显的。中间数据加工、处理技术,可以在一定程度上对数据进行清洗,但不可能从一堆垃圾数据中产生出正确的结果,并且中间加工过程还可能将数据的错误放大。目前很多税务局在系统中每隔一段时间就不得不对数据进行清理,因为垃圾数据已严重影响数据的分析应用,其中相当一部分属于数据采集不准确。基层信息采集随意性较大,导致信息采集不全;税收管理员为应付考核有意漏采或错采信息,一些来源于相关部门的信息不客观、有水分,导致信息失真不管用等。垃圾数据造成系统数据失真,使得对数据的把握、分析都会出现不同程度的偏差,从而影响数据在科学决策中的利用价值,领导层不敢据此做出决策、管理层不敢据此进行工作部署和目标考核、税收管理员不能据此寻找税源管理中存在的问题并开展有针对性的工作。
(二)数据的完整性不够
相对数据的准确性而言,数据的完整性还没有引起大家足够的重视。表现为软件不要求必录的字段(如税务登记中的电话号码等),在很多基层单位成了必不录项,一些内容较长的字段 (如税务登记中的主营、兼营等)也被不少人有意简化了,在实际工作中需要查询这些字段时却又找不到相应的数据,造成了工作的被动。
(三)数据的一致性不够
税务部门内部系统林立,同一纳税人的信息在不同系统中可能完全相反,在三大系统整合后这一状况有所改观,但并未完全解决;在税务部门与政府、社会其他部门之间也存在数据的不一致问题。缺乏一套涵盖税收所有业务的数据采集标准,税收管理员存在采集标准不统一、采集口径不一致,采集的数据杂乱、参差不齐,既浪费时间,又浪费人力。数据一致性问题如果不引起足够重视,将严重影响我们的数据分析应用工作。
(四)数据的深度广度不够
一是深度不够。系统中采集的数据不全面,既有软件设计前需求提出不全面、缺乏前瞻性的原因,也有采集者自身原因,例如,只重视纳税人的申报表、税务登记、税款入库和发票数据等信息的收集,忽视对纳税人的生产经营情况、银行存款以及会计核算等信息的采集,对于纳税评估工作非常具有参考价值的现金流、物流、水电气使用量等情况在系统中还是一片空白。
二是广度不够。当前各部门之间存在的第三方信息“壁垒”,造成征纳双方信息不对称问题日益突出。纳税人经营方式推陈出新,注册方式灵活多样,在纳税人自身信息流没有统一的情况下,各行政机关的管理却各自为政,信息割裂。与纳税人相关的外部数据难以整合到系统内,税务部门难以全面掌握纳税人的涉税信息,特别是与税务工作密切相关的一些部门,如工商、地税、质监、银行、公安、房管等部门掌握的数据,还没有一个畅通的渠道与税务部门进行交换。
(五)数据的挖掘不够
数据的加工挖掘不够导致税源管理的效能不高。宏观、中观、微观三个层面的信息指标体系不健全,对采集到的海量涉税数据缺乏统一的标准和合适的平台进行归集分析,对数据的进一步整理、提取、加工和挖掘不够,对如何利用涉税信息来防范税收风险、破解征管难题、加强税源管理,还缺乏好的思路和办法。
二、大集中模式下进一步提高数据质量的建议
省级数据集中处理,必须保证进入系统的数据的真实性、准确性和科学性,才能逐步实现现有信息系统的全面整合和综合业务应用,数据质量的提高是一项长期的任务。
(一)建立机制,完善制度
通过推行“数据质量责任制”,树立数据质量的零差错目标,制定科学、具体的岗位职责,正确区分监管责任和行为主体责任,有效解决责任不清、权责分离、多头管理、交叉重叠和职责真空的问题;对于征管数据的维护、修改与审批,通过制度加以规范,严禁从数据库底层随意地修改数据;建立责任追究制度,使数据从采集、录入、修改到分析报告的产生等各环节都有据可查;通过使用程序化的数据传递、接口机制,最大限度地减少人工对数据流的干预,减少数据扭曲和信息衰减的机会;建立考核机制,层层明确数据管理的责任部门和责任人,对违规操作造成数据质量问题的人员,实行过错责任追究,并追究相关领导的领导责任。
借鉴ISO标准,规范业务操作规程,科学设置岗位和标准化职责。建立专门的数据管理机构,推动数据质量的改进工作,制定可操作的数据质量管理制度,如分阶段定义的数据质量目标、评价办法、管控流程等,并努力使技术手段、管理手段和征管程序协调一致。
(二)加强应用,提高质量
要使数据质量有深层次的提高,必须要加强数据的分析应用。通过应用发现数据中存在的问题,并将问题反馈给生产系统;通过应用才能见到成效,调动热情,树立信心,并引起领导重视。例如,在综合征管信息系统上线后,在进行税负分析时,发现不少单位的实际税负与系统反映出的税负明显不符,于是反过来对数据进行检查,发现部分原因是由于操作人员在录入申报表时的误操作所造成的,而如果对数据不应用,这些错误数据是很难发现的。
(三)利用技术,严把入口
从技术层面上,生产系统存在的噪音数据、遗漏数据和不一致性数据,需要进行数据清洗;在日常工作中严把数据入口关,制定相应的资料采集模板来进一步提高基础数据的采集质量,及时对错误信息进行数据修正和垃圾数据清理。
同时需要对源数据做稽核,并重新梳理业务需求,列出缺失的数据项进行采集;不断完善各种监控指标,通过数据检测软件定时查询,并编制计划由人工定期检查修改,找出疑点,定期日常维护,及时排查、纠正,防止错误数据的进一步积累。
针对税务机关与其他各部门信息系统数据交换更加频繁的情况,通过编写数据校验软件,检测和过滤外部垃圾数据,将垃圾数据控制在数据入口关。
(四)扩大广度,加强深度
应从整个税务工作流程及监控的角度考虑数据的采集广度,从税收管理的实际需求出发考虑数据采集的深度。可以按照模块化设计的理念,对业务需求进行深入分析,设计业务流程图,对复杂节点绘制细(子)流程;从监控和分析利用的角度考虑所需数据,以及数据之间的逻辑关系,生成信息流程图,详细阐述每个节点所需数据、关系表及描述字段;加入代码表及数据的完整性、逻辑关系设计,确保相关数据采集的系统性;制作标准化接口,按统一标准设计数据表,尽量利用已有系统数据,确保采集数据无重复。
扩大数据采集范围,还要加强与其他部门的合作。例如可以通过搭建各地的政府综合治税平台推行综合治税,将所有部门凡是与税基有直接或间接联系的数据、信息全部纳入政府综合治税平台之中。在政府综合治税平台的基础上,结合大集中系统开发税务机关自己的查询分析平台,对数据进行综合性的加工分析,将加工后的税务登记、纳税鉴定、纳税申报等异常分析情况,及时传递给管理部门或检查部门,为纳税评估和税务检查提供案源。
随着数据大集中以及系统整合的完成,涉税数据的采集和覆盖范围日益扩大,深化数据应用、“数据管税”已成为各级税务部门的一项重要工作,这需要税务部门不断总结实践,进一步提高数据质量,在此前提下,才能更好地实现税务管理的科学化,减少决策的盲目性。
[1]韩京宇,徐立臻,董逸生.数据质量研究综述.重庆:计算机科学, 2008
[2]沈军武.ABC集团信息系统数据质量管理研究.中南大学工商硕士论文,2012