APP下载

运用“税务助手”驱动智慧税务建设的思考

2021-12-06郑甫华邓永勤

税收经济研究 2021年5期
关键词:征管助手纳税人

◆郑甫华 ◆邓永勤 ◆周 超

内容提要:新一轮税收征管改革以“税收大数据为驱动力的具有高集成功能、高安全性能、高应用效能的智慧税务”为实践导向,揭示了税务数据要素在智慧税务建设中的突出作用。文章基于税务数据要素与智慧税务的密切联系,分析了智慧税务建设的内在逻辑,提出了税务部门运用“税务助手”驱动“智慧税务”建设的思路。针对税务系统推进智慧税务建设存在的问题,设计了“税务助手”的系统架构,对“税务助手”在智慧税务实践中的应用场景进行了探讨。

自2014年政府工作报告首次提出“在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展”以来,大数据技术已成为我国经济发展的重要驱动力,对税收征管改革提出了新要求、赋予了新动能。2021年3月,中办、国办印发《关于进一步深化税收征管改革的意见》(以下简称《意见》),提出建立“以税收大数据为驱动力的具有高集成功能、高安全性能、高应用效能(以下简称“三高特征”)的智慧税务”,阐明了智慧税务建设的内在逻辑、发展目标,为进一步深化税收征管改革,明确了智慧税务建设新方向。

一、“税务助手”概述

“税务助手”是基于全国税务系统信息化主体架构建立的新型税收大数据系统的形象称谓。税务部门对智慧税务建设展开了一系列探索和实践,逐步实现数据整合。通过建设全国统一规范的电子税务局,全国纳税人80%以上的业务可以线上办理。通过运用大数据和税收规则进行自动算税与申报表信息预填,当前已经有多个税种实现了“简并申报表,一表报多税”。结合智慧税务概念和内在逻辑辨析,基层税务机关智慧税务建设的思路是:以大数据和人工智能技术为依托,数据感知和获取、处理和存储、分析和挖掘能力提升为切入点,精确执法、精细服务、精准监管、精诚共治为目标,重塑税收征管模式和流程。基于这一思路,对电子税务局和税收大数据平台进行补充和完善,构建的具有安全高效、便利友好特性的新型税收大数据系统就是“税务助手”。通过“税务助手”在税务部门的“部署”,可以从微观、中观、宏观三个层面,提升税收征管质效。

在微观层面,“税务助手”通过对税务数据的规模化、集约化应用有效提升税费征管信息化水平。一是数据规模化。税务助手融合来自金融、生态、社会各领域的数据资源,打破传统税务数据空间分散化、碎片化状态,达到泛在联系和无限感知,进而实现规模效应。二是资源集约化。借助云计算,可以提升数据运用效率,把以往重复化、程序化、非创造性的日常工作通过信息技术快速完成,促进日常税费征管去人力化,从而有条件优化税收征管资源配置,充实风险管理等关键环节。三是管理服务个性化。纳税人缴费人诉求多样化、社会治理复杂化的新形势对税务机关的征管和服务提出了更新更高的要求。通过税务助手实现数据最小颗粒度的灵活组合,可以输出个性化、自动化服务供给,为税费征管活动个性化夯实基础。

在中观层面,“税务助手”通过分析挖掘税务数据要素价值,实现决策质量、征管效能、执法质量显著提升。一是提升决策质量。税务数据要素高渗透、泛在使能的特性使得税费数据能够及时客观反映企业生产经营情况和自然人收支变动情况等,通过分析挖掘,税务助手可以对社会经济发展运行态势作出预测,进而为宏观调控政策出台提供有针对性的决策依据。二是提升征管效能。一方面,税务助手可以使纳税人缴费人履行义务更加便利,税务机关也可以精准识别失信违法信息。另一方面,通过挖掘税务数据要素,税务助手能够及时发现和弥补税费征管漏洞,确保依法依规应收尽收。三是提升执法质量。面对数量日益增长的市场主体,税务机关面临更加充满不确定性的执法环境,基于税务助手的“人工+智能执法”,更有利于规范执法行为和提升执法质量。

在宏观层面,“税务助手”驱动智慧税务建设最终表现为“飞轮效应①“飞轮效应(Flywheel Effect)”最早由美国管理专家吉姆柯林斯(Jim Collins)在《从优秀到卓越》(中信出版社 2002年出版)一书中提出,用来形容一件事情刚开始做比较吃力,成效不彰,但只要持之以恒的坚持,在后期会很顺利,成效也会愈加明显。“飞轮效应”能够较好地从宏观层面描述税务数据要素驱动智慧税务建设的客观效果。”,这是税务助手驱动智慧税务建设的必然结果。税收助手为征纳双方提供增值服务,政府部门和市场主体在享受增值服务过程中,也会产生新的税务数据,而税务机关利用新的税务数据继续产生新的增值服务,周而复始,这就是一个“正向循环”。随着“正向循环”不断演化,税收治理体系和治理能力现代化水平也将呈现螺旋式上升发展趋势。

二、以税务数据为驱动打造“智慧税务”

以税务数据驱动智慧税务建设,揭示了税务数据要素与智慧税务的密切联系,即税务数据要素在智慧税务建设中具有突出作用,智慧税务是税务数据要素应用于税收实践的发展目标和必然结果。

(一)“智慧税务”的实践逻辑

“智慧税务”作为税收改革和创新的目标之一逐步进入理论界和实务部门的视野,形成了一批初步的研究成果。重庆市国家税务局课题组(2017)较早从感知全面、识别准确、应对及时、持续创新四个方面概括了智慧税务的基本特征,并从基层税务机关角度对智慧税务实现路径进行了探索。孙存一和谭荣华(2018)较早阐述了数据资产与智慧税务的关系,指出智慧税务是以数据资产为核心的全流程、全要素管理,强调盘活、用好数据资产对形成税务数据治理应用新格局具有重要作用。樊勇和杜涵(2021)也强调税务大数据与税收征管全过程都具有密切的联系。杨志勇(2018)指出,人工智能技术的广泛应用将有力促进智慧税务建设,同时对税收理论和政策创新也会带来不可忽视的挑战。谢波峰(2021)也关注到智慧税务与人工智能的关系,指出将二者关系界定清楚,是探讨技术与业务在高应用效能业务系统中融会贯通的基础。根据《意见》关于税收大数据驱动“三高特征”智慧税务建设的阐述,智慧税务是以税务数据要素为基础、以涉税信息智能归集、纳税人缴费人行为精准管理、税务人员履责自动考核、税务决策信息和任务自主分类推送为基本内容,集技术之大成,具有安全高效、便利友好特性的税务生态。

智慧税务建设的内在机理就是利用税务数据要素夯实税收管理体系数据基础,通过数字化升级和智能化改造,引发税务数据要素流动路径、制度规范和征管思维的改革创新,继而创造出适应新兴信息技术和经济社会发展、具有“三高特征”的智慧税务体系,推动实现更加和谐的税费征纳关系。

(二)税务数据要素的内涵及其应用浅析

2020年政府工作报告提出“培育技术和数据市场,激活各类要素潜能”,明确了数据要素具有市场特性,表明数据资产的概念日益得到广泛认同,正在从理论进入实践。税务数据要素作为一项重要的数据资产,包括政府、企事业组织和个人参与税费收入征纳全过程所产生的原始数据和基于原始数据挖掘分析所产生的衍生数据。税务数据要素确定权属可分为以下三种情形:一是纳税人缴费人依法向税务机关申报和税务机关在依法履职过程中采集的未经加工、可识别数据主体的原始数据,其所有权归税务部门和数据主体共有,但税务部门除了公共用途外,不能随意披露、推送和使用;二是基于特定目的和数据技术对海量原始数据进行处理形成的衍生数据,其所有权归数据处理的主体,以体现“谁釆集、谁投入、谁受益”原则;三是其他具有个体识别性,能够识别数据主体的原始税务数据,以及经过处理但仍可识别原始数据主体的“假衍生数据”,其所有权归原始数据主体所有。

税务数据要素具有高渗透性、有限流动性、泛在使能性、通用目的性四个基本特征。高渗透性,指随着税务机关职责范围不断拓宽,税务数据已经渗透到企业、个人、政府等全部经济活动主体,成为重要的生产要素。有限流动性,指税务数据要素以在特定平台架构内、同一主体内流动为主或优先在不同平台、不同主体内流动。泛在使能性,指税务数据要素覆盖了“社会生产一流通一分配一消费”各个领域,通过挖掘税务数据要素潜力,能够赋能社会生产生活各个方面。通用目的性是指税务数据要素具有普遍适用的性质和潜力,能够对经济社会转型产生深远影响。

三、智慧税务建设的壁垒、障碍和瓶颈

近年来,税务部门数据釆集和处理能力显著提升,“数据驱动、风险导向”税费征管格局初具雏形。但由于在数据感知和获取、处理和存储、分析和挖掘等方面还存在不足,导致智慧税务建设与应用存在较大差距。

(一)税务数据获取存在“壁垒”

税务数据需求缺乏“理解力”。一是缺乏对全税种、全流程的业务认知能力,导致税务数据中存在的一些深层次问题(比如数据逻辑错误)不能及时发现;二是缺乏对纳税人缴费人需求的理解能力,导致推出的服务举措常常与纳税人缴费人需求存在较大差距;三是缺乏将数据转变成生产力的应用能力,具体表现在日常工作中缺乏数据思维,简单的数据釆集和堆砌较多,运用数据思维发现和解决问题不足。

税务数据获取缺乏“及时性”。近年来,税收共治虽然已成为全社会的共识,但出于数据安全、技术等方面考量,基层税务机关与各部门之间的数据共享仍然不够及时。部门之间的数据接口尚待建立和完善,信息共享交换多以移动存储设备、电子邮箱等传统方式进行,安全性、保密性难以保证,时效性、有用性大打折扣。同时,税务部门对纳税人缴费人管理过程中形成的数据分散在各系统模块中,没有实现统一整合,阻碍了税务数据更高层次的及时应用。

(二)税务数据处理和存储存在“障碍”

税务数据口径存在差异。税务活动的特殊性决定涉税数据必定是多主体的。不同部门、行业由于各自背景职能不同,对同一涉税事项的描述可能存在差异,所用指标名称、标准甚至实际意义大相径庭。面对海量的税收大数据,人工处理存在时间长、效率低等特点,通过算法模型处理则存在识别不精准,影响数据挖掘分析成效的可能。

税务数据存储能力不强。税务部门当前数据存储主要方式是关系型数据库。关系型数据库一般适用于结构性数据的存储,当数据规模达到一定量级后,就会出现文件不能有效管理,海量数据读写速度急剧下降等一系列问题。面对涉税数据规模大、半结构和非结构化数据快速增加的现状,显然传统的关系型数据库已经不能满足海量税务数据存储需要。

(三)税务数据分析存在“瓶颈”

自然语言处理存在“阻碍”。自然语言是指伴随文化和思想演变所产生的人类相互交流的语言。税收实践结果显示,让算法充分理解自然语言还任重道远,具体表现为:自然语言灵活度高,同一语义可用多种形式来表达,对算法而言容易产生歧义;处理自然语言过程中,遇到错别字,算法不能准确理解这些错别字所表达的真正含义;在这样一个新词额出的时代,让算法及时发现新词,并将其准确运用在税收征管中也是一个难点。

模型可解释性仍需加强。传统的统计机器学习模型如Logistic回归、线性回归等具有较高的可解释性,可以针对模型进行归因分析,确保决策的正确性。新的模型如随机森林(Random Forest)、支持矢量机器学习(SVM)等,其应用逻辑较传统模型而言由因果关系转变为相关关系,虽然更容易得出对改进纳税服务、识别税费风险有价值的结果,但由于无法准确归因,导致模型结果合理性不能判别。对于应用到税务数据上的模型而言,预测结果缺乏详细的解释和依据,会影响结果的应用性、可执行性。

四、以“税务助手”驱动“智慧税务”建设的创新和实践

从当前基层税费征管的痛点、堵点出发,结合理论思考和典型案例,较为合理设计便于税收征纳的“税务助手”架构,可以有效地将纳税人、缴费人、税务人从重复机械的工作中解放出来,变“纳税人缴费人围着税务转”为“税务资源围着纳税人缴费人转”,破解办税痛点和堵点。

(一)“税务助手”系统架构

税务助手的系统架构分为感知、数据、服务三个依次递进的层面(图1)。

图1 “税务助手”系统架构

第一,感知层面。感知层按照真实性、全面性、多元化、时效性要求,在优化整合内部数据感知和联通的基础上,打通数据获取壁垒,构建起囊括金三系统、电子税务局、12366系统及第三方数据等多数据源的多渠道、多维度数据感知体系。比如,将银行、证券交易所产生的金融数据,抖音、快手等平台产生的交易信息等纳入感知范围,数据交换时间从“T+1”变为“T+0”甚至实时交换等。

第二,数据层面。“税务助手”按照业务原则、分析原则、效率原则和冗余原则建立的“知识图谱+传统数据库”的数据整合平台,其由结构化数据、半结构化数据和非结构化数据整合而成。税务数据存储到数据层之前需要按照数据标准化要求进行“预处理”,达到统一定义、统一口径、统一标准后方可存入。同时,参照操作系统的局部性原理,将常用数据放在知识图谱中,而将访问频率不高、重复性强、对关系分析影响微乎其微的数据放在传统关系型数据库中,使得数据存储和访问时的性能更优。

第三,服务层面。“税务助手”利用新兴信息技术对税务数据要素资源进行分析和挖掘的平台,在服务层设计出了情感分析引擎、行为分析引擎、自然语言处理引擎,对改进纳税服务大有裨益。情感分析引擎根据纳税人缴费人的面部特征,利用多模态数据分别计算愤怒、厌恶、轻蔑、害怕、悲伤、惊讶、愉悦和中性等8种基本情绪概率值,并根据不同情绪的权重计算出纳税人缴费人的情感状态,同时,将情感状态映射在1分至100分区间范围内,以便后期比对处理;行为分析引擎是“税务助手”的核心引擎,综合运用社会工程学、社会关系网络分析、机器学习、工作经验、专家意见及数据可视化等方法,通过税务机关确定的行为特征对纳税人缴费人行为进行识别;自然语言处理引擎主要通过自然语言交流的方式接收、处理和应答纳税人、缴费人、税务人提出的问题(文字、语音、视频等形式均可),同时也可帮助税务人员自动识别纳税人提交资料中的信息要点,并将其上传到信息库中,优化和节省信息搜索时间,提高工作效率。

(二)“税务助手”应用场景

基于数字经济时代纳税人经营模式复杂、交易主体隐匿、交易资产流动性强的特点,税务助手提出了服务评测、风险预警、智能坐席等三个具有现实可行性的典型应用场景。

第一,服务评测是指将纳税人缴费人的满意度与对应的税务部门进行实时关联和反馈。税务助手根据纳税人缴费人业务办理完成度设置不同节点并赋予权重,利用情感分析引擎对纳税人缴费人业务办理节点的音频(视频)实时分析加权得到情感状态生成相应的满意度。如果发现某一工作人员经常性出现较低满意度,则重点关注该工作人员;如果发现某一纳税人缴费人经常性出现低满意度,则通知对应税收管理员进行核査处理。同时,利用情感分析引擎可对互联网上的涉税评价进行监测评判,以便税务部门及时有效识别和应对。

第二,风险预警包括风险点预测、利益关联风险测算、风险可视化、人工验证等阶段。风险点预测是税务机关通过专家意见、工作经验和机器学习成果将税费不遵从行为特征化,并将其存储在知识图谱中,“税务助手”根据知识图谱中生成的纳税人缴费人社会关系网络,通过行为分析引擎与图形特征库进行比对预测出风险点。利益关系风险测算是基于风险点利益关联的结构特征和关联交易的业务特征,通过行为分析引擎计算出该税费风险在其社会关系网络传播过程中各个节点的税务风险评分。风险可视化是将社会网络关系上各个节点的税务风险评分输入可视化界面,构建交互式可视化环境。人工验证是将税务风险评分大于阈值的风险点推送给税收管理员,由其作出进一步应对。同时,将在人工验证阶段发现的税费不遵从行为新特征补充至知识图谱,实现风险预警的全流程闭环。

第三,智能坐席是拥有独立主张、丰富专业知识、类人的机器坐席,分为呼叫、接听、反馈三个阶段。呼叫阶段中,“税务助手”接到呼叫后,迅速调取该纳税人缴费人相关税务数据,利用行为分析引擎进行分析,初步得到可能咨询的问题及应答清单,釆取个性化导航方式,回应问题。如若纳税人缴费人对导航问答不满意则进入接听模式,由机器坐席利用自然语言处理引擎对提出的问题进行处理后在知识图谱中检索答案并以自然语言的方式回应纳税人缴费人,同时,在问答过程中,辅以情感分析引擎使得交流“人性化”。反馈阶段分为两部分,一部分是将纳税人缴费人咨询问题运用行为分析引擎预测出涉及此类问题的纳税人缴费人清单,推送至对应税收管理员,由税收管理员依据纳税宣传辅导情况决定是否将此类问题及解决方案推送至相关纳税人缴费人,另一部分则将纳税人缴费人咨询问题补充至知识图谱,促进知识图谱的持续改进和创新。

五、结语

在云计算、大数据、人工智能等新兴技术融合赋能下,以税收大数据为驱动的智慧税务发展前景可期,税收征管和服务流程也随之加速变革。“税务助手”是基层税务机关智慧税务建设的思考和探索,对驱动智慧建设更好更快发展,贯彻“以服务纳税人缴费人为中心”的现代税收征管理念,构建“规范性、便捷性、精准性”现代税收征管业务体系,引导纳税人从“被动遵从”向“主动遵从”转变具有促进作用。“税务助手”利用税务数据要素夯实税收管理体系数据基础,通过提升税费征管信息化水平,促成决策质量、征管效能、执法质量的三重提升,把税务数据优势向税收治理优势和治理效能转化,推动税收治理体系和治理能力现代化水平提高,赋能智慧税务创新发展。

猜你喜欢

征管助手纳税人
当前个人所得税征管面临的困境及对策建议
涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象
跨境数字经济下我国税收征管面临的挑战与应对
逾期清税情形下纳税人复议权的行使
共享经济税收征管挑战及对策——以网约车为例
纳税人隐私权的确立、限制与保护
洞察全球数字税征管体系
增值税一般纳税人与小规模纳税人身份转换的现实困境与对策研究
小助手
灵感助手表彰大会(二)