APP下载

基于时空大数据的智慧稽查平台构建研究∗

2019-03-26张彦俊杨晓冬郑大渊毕树军

计算机与数字工程 2019年3期
关键词:稽查时空税务

张彦俊 杨晓冬 刘 毅 郑大渊 毕树军

(1.黑龙江大学数据科学与技术学院 哈尔滨 150080)(2.适普远景遥感信息技术(北京)有限公司 北京 100029)

1 引言

税收作为国家宏观调控的工具,对于国家经济发展起到了杠杆的作用。税收收入由两方面组成:一是由企业的经济行为带来的收益所缴纳的税款;另外就是由税务部门发挥其征管职能,对于纳税行为的事后监督,形成的补缴税款。税务稽查正是发挥了税务部门“事后”监督的职能,对于税收秩序的规范、税收环境的净化、违法行为的打击均发挥着重要作用[1]。智慧稽查的建设以时空信息框架的支撑,主要包含时空信息库、大数据时空信息可视化平台和大数据挖掘技术[2]。本方案将基于时空信息构建税务稽查的大数据应用平台的总体框架,将空间基础数据、公共信息数据、数据可视化、大数据挖掘技术、大数据可视化推演技术相融合,为国税局提供完善的数据处理与计算、数据模型构建、分析功能及应用支撑能力服务,便于国税局形成现代化、高效率的税务稽查办公系统。

2 稽查业务模型

总体业务上整合纳税人时空遥感数据、互联网数据、委局办交换数据、业务数据、举报数据,形成统一的纳税人时空信息画像。时空信息包含纳税人的地理位置信息、单位信息等,这些信息将有助于我们判断纳税人是否逃税。例如,纳税人涉嫌逃税时经常会与财务部门的人会面,此时我们可以锁定该人位置,及时采取措施。

时空数据对应如今已非常成熟的GIS技术[10],GIS技术主要由数字化技术、存储技术、空间分析技术、环境预测与模拟技术和可视化技术组成,GIS技术组成与大数据技术的技术组成有着相似部分。国内外对GIS技术的研究非常多,但是关于GIS技术与大数据技术结合的研究非常之少。据笔者所知,美国亚利桑那州立大学商学院院长顾彬曾在研究该校学生的退学率时将大数据技术[11]与GIS技术结合,对早期发现该类学生并提前干预非常有帮助。同样的,本文中时空数据与大数据技术中的可视化技术结合可以提高税务部门稽查效率,为国家挽回不必要的损失。

针对此模型中的关键环节,利用涉税综合信息收集及大数据分析实现对涉税企业或个人的事中监测、事后稽查、科学选案和精准稽查,形成综合应用体系,为政府、企业和第三方机构提供精准服务做数据支撑,为云计算和智慧稽查提供持续的计算动力。

将“互联网+”的理念贯穿举报管理、情报分析、选案分析、稽查实施、案卷审理、税款追缴、管查互动、法律救济等环节,拓宽信息技术在稽查工作中的应用场景,整合涉税情报、案件流程信息、业务管理信息,实现稽查事项数字痕迹记录的全面覆盖。

从关联关系、时间关系、空间关系分析数据[14],提供各种可视化分析功能,支持这三大关系的可视化布局,将大量数据转化成高价值的情报。用户可以对数据集进行深挖,以找出关注领域或关系路径、模式和趋势。数据可视化软件提供平台化能力,用以多维度可视化数据分析,提供启发式的分析过程和数据可视化能力[3],提供丰富的可视化工具和分析方法配置功能,支持大数据可视化关联分析,支持对数据的探索式挖掘和反复加工,以平台环境能力促进情报分析人员优化和迭代分析方法,达到对数据深度理解和挖掘的目的。

图1 基于时空信息的“智慧稽查”大数据应用平台业务模型

3 平台总体框架

平台总体架构分为7层,包括数据源、时空信息采集与汇聚、时空大数管理、服务层、分析层、综合应用和终端层,并制定相应数据标准、应用规范及安全管理体系,总体框架如下(见图3)。

1)数据源:包括国税涉税信息、市级各委办局(地税、海关、公安等)数据资源、第三方机构(银行、证券、供电等)和互联网中相关涉税信息,遥感地理信息数据信息[3]。

2)时空信息采集[4]与汇聚:通过数据交换共享平台采集深圳市级涉税相关部门和相关第三方机构涉税信息,通过数据爬虫方法采集互联网上相关涉税信息,通过遥感影像分析处理技术获取与税务相关的遥感地理信息数据,再借助数据交换共享平台,实现信息的可控传输和交换比对,畅通市级数据流通渠道,实现涉税信息资源的统一归集、统一管理和共享使用。

3)时空大数据库[5]管理:建立以全局应用和决策支持为目的的基础数据库,包括以稽查业务应用和协同共享为目的的主题数据库,基础数据库和与遥感相关的时空数据库,数据资源以服务的形式进行编排和对外发布。

4)服务层:服务层主要包括数据服务支撑平台,实现从大数据库中提取据,并进行相关的数据处理与接口封装,为大数据挖掘和可视化分析提供数据支撑服务,满足各个业务部门在分析层上各类数据的需求。

5)分析层:包括时空大数据挖掘子平台和可视化分析子平台两个部分。大数据挖掘以平台的时空大数据仓库为基础[15],提供数据预处理、数据探索、模型设计、模型展示及模型评估等数据挖掘与分析能力,并为选案、侦察、审查等环节提供情报支持。可视化分析子平台综合利用图形分析、认知分析、关联分析等技术,将大数据以多维的数据形式表示,提供给用户以不同维度(包括时空维度)的数据观察方式[6],进而对数据进行更深入的观察和分析(见图3)。

6)综合应用:综合应用主要包括三个中心,一是为时空涉税案件查询、时空涉税选案分析、风险分析等税务稽查工作提供信息支持的情报中心[7];二是提供稽查作战中心、时空信息选案分析、案件追踪等应用的案件中心,由大数据平台提供数据和服务能力支撑;三是提供遥感协同管理、工作项目管理、人员管理、绩效管理等应用的管理中心(见图4)。

图2 基于时空信息的“智慧稽查”大数据应用平台总体框架

图3 基于时空信息的“智慧稽查”大数据应用平台的时空分析

图4 基于时空信息的“智慧稽查”大数据应用平台的综合应用

7)终端层:将税务稽查工作延伸至移动互联网和智能终端,提供包括浏览器门户网站、手机客户端、平板客户端等终端服务,实现移动媒体稽查,提供高效、便利的移动工作平台。

8)数据标准[12]、应用规范和安全管理体系:编制数据编码标准、数据共享交换管理规范、数据安全管理规范、数据质量规范、对外应用服务接口规范等标准规范,为互联网+智慧稽查的建设提供标准规范支撑、安全支撑,保证整个互联网+稽查项目的顺利开展[8]。

平台正在最后的测试中,不久有望问世。此平台将大数据技术与GIS技术相融合,与传统平台相比,传统大数据平台无法提供实时的位置信息、单位信息,更加无法实现完整的数据可视化的推演,而数据可视化的推演在许多服务中是至关重要的。如今大数据技术日趋成熟,不能把大数据技术孤立地看待,我们要去寻找与其相融合的已有技术。图3、图4都是目前此平台可视化技术的演示图,传统平台可很少把GIS信息添加入平台中,因为增加了数据维度,在降维技术会存在不少困难。该平台正在突破这一困难,通过仿射变换等将数据进行降维处理[13]。总而言之,此平台的建设对于目前大数据技术有一点创新性,对于国家税务部门有很大的帮助。

4 结语

智慧稽查建设是一项具有基础性、应用性的庞大的系统工程,它的建设顺应国家互联网+税务计划方案,同时符合互联网、大数据发展趋势,也为我国经济建设献一份力量。本文介绍了根据业务需求,提出了基于时空数据的智慧稽查大数据应用平台框架,该平台以大数据技术为基础,结合空间信息数据[9],旨在为税务部门提供高效、低成本的服务。智慧稽查将推进税务稽查的发展,为实现办公网络化迈出重要的一步。

猜你喜欢

稽查时空税务
税务动态
跨越时空的相遇
个人独资企业对外投资的税务与会计处理
论投资性房地产的会计核算及税务处理
提升税务干部的学习力
税务稽查执法风险分析
镜中的时空穿梭
基于大数据分析挖掘的高速公路收费稽查系统
高速公路绿通稽查管理系统
玩一次时空大“穿越”