基于大数据的房地产税收数据分析*
2016-10-14顾尚伟
□ 顾尚伟
(贵州省贵阳市地方税务局,贵州 贵阳 550001)
基于大数据的房地产税收数据分析*
□顾尚伟
(贵州省贵阳市地方税务局,贵州贵阳550001)
基于大数据的技术与方法,全样本全时段地分析房地产行业企业的涉税情况,尽可能地还原企业经营的真实场景,把大数据变成小数据,精准数据,从而有利于分析企业的涉税风险问题,为税收数据分析提供一种新的分析思维与分析方法。
税收分析;大数据应用;房地产行业
随着“大数据”、“云计算”等信息技术在贵阳的蓬勃发展,一个全新的信息时代已经来临,其影响波及经济社会的各个领域,给税收征管带来了深刻而长远的影响。以大数据为核心的新兴技术,为专业化分析税收、预测税收收入及控制税收风险,发展新一代征管系统提供了可行有效的解决方案。
新一代征管系统提供税收风险预警、未来税收发展趋势预测,开展逃税、避税的风险分析与管理,预防和化解风险的发生,保证税收征管活动健康正常的运行。通过分析对比企业的税务登记记录与类似企业的税收数据,进而进行风险预控,将风险造成的损失降至最低程度。
一、大数据技术应用的背景
国家税务总局提出建立“以专业化管理为基础”“以信息化为支撑”的现代化税收征管体系。贵阳市委市政府提出大数据产业创新驱动发展战略,举全市之力发展以大数据为代表的高新技术产业,构建大数据产业生态系统,把贵阳建成立足西南、辐射全国、影响东南亚的全国大数据产业创新发展先行区。这都为贵阳市地税大数据税收分析与应用提供了坚实的基础。
当前,纳税人的数量急剧增长,跨地区、跨行业的大型企业集团相继涌现。纳税人的经营方式、经营业务不断调整,日趋复杂,纳税人的法律意识、维权意识不断增强,涉税诉求逐步多样化,服务需求个性化日趋明显。这都给税收征管工作理念、管理方式带来深刻变革。
二、大数据技术与税收分析
大数据是指“不用随机分析法这样的捷径,而采用所有数据的方法”。英国圣安德鲁斯大学的Jonathan Stuan ward和Adam Barke(2013)认为:大数据是描述使用一系列技术,比如非关系型数据库、并行编程技术和机器学习(但并不局限于此)来存储和分析大型或复杂数据集。所有的大数据概念至少包含两点共性:规模(数据集的量);复杂性(数据集的结构、表现方式和交织);技术(用来处理数量众多或复杂的数据集的工具和技术)。
大数据技术与云计算密不可分,在云计算的分布式存储的基础上,大数据技术可进行集群的海量数据计算。大数据技术具有大量、高速、多样、规模、价值的特点。大数据技术分析结果有助于统筹决策。从信息处理的角度,鉴于数据清理和数据集成的困难性,以及多个数据源之间的复杂关系,计算机可以帮助分析和理解数据。此外,结合数据挖掘、数据分析方法、数据处理技术,对客观事实进行基于量性分析,其分析结果极大提升决策的客观性。
税收分析是以税收经济现象的数量方面为研究对象的认识活动。税收分析以税收和经济理论为理论基础,数理统计方法为分析工具,税收与经济现象和问题为分析对象,充分利用税收经济数据,从税收表现出的客观结果和实际数据出发,客观描述税收及税收经济关系现状的成因,揭示隐藏在税收现象背后的客观因素。
深化税收数据分析,可以帮助认识税收数量特征、深化对税收的理解、预测和推断税收收入的未来,把握税收管理的主动权。而税收分析指标是用于分析纳税人税收风险的计算公式及其属性标识,税收分析识别模型则是识别纳税人税收的若干指标的集合。
税收风险指标按与税款的关联度,分为税种类、行为类和特定事项类。税种类风险指标主要包括营业税类、企业所得税类、土地增值税类、个人所得税类、房产类、土地使用税类、印花税类、契税、城建税及附加类等;行为类风险包括发票行为类、登记类、申报类、税款征收类和管理认定类等;特定事项类风险主要包括非货币性交易、债务重组、拆迁、搬迁、破产、合并、分立、土地房产转让等。
根据该企业税收贡献率与本地同行业企业税收贡献率的比较,对低于同行业平均贡献率的情况,提示预警,判断企业是否存在多计生产成本、多结转销售成本、多计期间费用、扩大税前扣除范围或不计、少计销售收入等问题。将计算出的税率与企业以往年度或本地同行业水平相比,分析判断企业是否存在以上问题。
在税收分析管理的过程中,税收分析识别必须通过构建一套指标和模型来进行。一个科学的模型能够全面、及时、准确地识别出纳税人存在的税收问题,而构建一个高质量的模型,关键在于收集有效的税收数据(特征)、设定精确的指标和建立科学的模型,让风险监控数据趋于企业真实情况,从而强化税收监管。
在模型构建过程中,需根据指标对模型管理的重要性设置不同权重,设定关键指标,并可通过设置指标层级进行管理,如一级指标、二级指标、三级指标等,根据实际情况实施动态管理。
指标体系的建设也是至关重要的,如:指标名称、指标功能、取数口径、指标的计算公式、重要等级、评估类型、行业、范围、适用度、数量属性、指标性质、税收经济关系、数据来源、可信度、纳税人适用范围、比对方式、指标在模型中的权重、预警值的计算等。
利用贵阳市地税局2003至2013年的大量数据展开税收的数据分析,分税种、分地区、分行业、分企业等进行数据的筛选、分类、归纳和描述,并建立数据风险指标体系。
对税收数据进行宏观分析,进行经济与税收的分析,了解贵阳市经济的规模、分布、结构、质量与变化,进行跨税种、跨部门以及重点税源的综合税收数据分析,据此编制相应的税收计划,组织税收收入。
重点税源管理部门将加强重点企业与重点税源管理中的专业税收数据分析,评估与稽查部门进行涉税案件风险类型的规律性分析。剖析纳税人的组织形式、核算方式、生产经营特点、投资动向、财产变化、产品结构及交易方式,确定企业纳税人类型、税款缴纳方式、税源变化趋势、税务风险类型及程度,为个性化纳税服务和加强征管提供数据支撑。
通过各项税收指标之间或者税收与经济指标的对比,借助统计分析工具,利用历史数据,建立税收分析预测模型,合理分析税收波动因素。利用差异分析、逻辑关系分析、趋势分析、波动分析、相关性分析、聚类分析等技术,更好地、更直观地体现税收趋势变化,加强税源管理。
三、房地产行业数据分析
房地产行业作为贵阳市经济的主导行业,在全市经济结构中有着举足轻重的地位。由于它与其他行业相比,具有项目开发周期长、资金流量大、涉及部门多、支出项目杂、边开发边销售等特点,加上受国家宏观调控政策影响较大,导致成本核算比较特殊,收入确定比较复杂,税收征管难度大,有必要加大对其进行税收上的分析与应对。本文主要着重对房地产开发与经营业务进行涉税分析。
运用大数据关联所有数据的真实性。针对房地产行业,通过房开企业自报的数据,第三方部门采集的数据,税务部门核查的数据,征管信息系统按月或按风险识别期获得的数据(包括管理编码、纳税人名称、数据项名称、所属期限、数据额),税务机关按月补充采集的纳税人预收账款信息及按年随同企业所得税汇算清缴附报的纳税人年度结转收入、成本、面积等信息,以及一些其他的途径获取的数据信息来进行全体样本的分析,通过提高对现有数据的加工实现数据的增值。
通过设定数据采集口径来进行数据的关联,纳税人申报的数据只作为一个参考数据,不作为标准,通过一次关联可以进行佐证,但可信度也不是100%。通过数据项的内部关系,可以进行二次甚至三次的关联。这时候的数据可信度将大大的增加。这将是系统的第一个风险分析点,出现数据伪造的位置必然是风险存在的最可能的位置,再通过案头核查数据点来决定要不要进行实地的核查。
设定一套房地产的特有指标体系。财务报表的各个表单数据间是由内部联系的,这个关联就成为检验税收信息真实的重要组成部分,分析出所有的数据关联,设定出房地产行业的指标值,然后再根据报送数据来查看,根据产生的异常点来进行风险的核查以及规避。
进行大数据的分析挖掘,并实时监控。进行数据的纵向比较,纳税人往月往年数据做到一张二维表中,体现单个纳税人的纳税变化情况;再进行横向比较,同地区同行业的企业通过计算期望和方差来查看偏离程度,也可以通过同行业纳税人点阵来查看偏离信息,进行偏离程度的预警。
运用对比分析,因素分析,梳理统计分析等方法揭示存在问题。从数据的变化中发现各经济类型、各税种收入的结构,及税收收入的增减变化趋势,及时发现问题,分析原因从而达到智慧征管的目的。
下面,以贵阳市房地产税收数据为例进行部分的税收分析。
图1 贵阳市房地产行业2003-2013年营业税、土地增值税、企业所得税、个人所得税、房产税、契税入库情况比较图
图2 贵阳市房地产行业2003-2013年营业税、土地增值税及企业所得税入库情况比较图
图3 贵阳市房地产行业2003-2013年营业税、土地增值税、企业所得税入库税收每年增幅比较图
图4 甲房地产企业2003-2013年营业税、企业所得税、土地增值税入库情况比较图
图5 甲企业和乙企业两房地产企业2003-2013年营业税、企业所得税、土地增值税入库税收比较图
图6 甲企业和乙企业两房地产企业2003-2013年营业税入库税收比较图
图7 甲企业和乙企业两房地产企业2003-2013年企业所得税入库税收比较图
图8 甲企业和乙企业两房地产企业2003-2013年土地增值税入库税收比较图
图9 甲企业和乙企业两房地产企业营业税每年递增百分比
通过图1说明了贵阳市房地产行业2003-2013年的总体发展趋势及各税种的入库走势;图2说明了贵阳市房地产行业2003-2013年营业税、土地增值税及企业所得税入库情况及三大税种之间入库坡度函数;图3说明了贵阳市房地产行业2003-2013年营业税、土地增值税、企业所得税入库税收每年增幅的比例及其关联的匹配;图4说明了甲房地产企业2003-2013年营业税、企业所得税、土地增值税入库情况及三大税种之间入库坡度函数;图5关联甲企业和乙企业两房地产企业2003-2013年营业税、企业所得税、土地增值税入库税收数据,可以看出其中差异的大不同;图6、图7、图8分别对甲企业和乙企业两房地产企业提取单个税种进行趋势对比与分析,找出差异过大的数值;图9对甲企业和乙企业两房地产企业提取单个税种(营业税)每年递增百分比的对比与分析。
图10 甲房地产开发有限责任公司税务登记数据
甲房地产开发有限公司税务数据与分析:
甲房地产开发有限公司税务登记数据(见下图)
图11,管理编码:520102*********
图12,管理编码:520102*********
图13,管理编码:520103*********
图14,管理编码:520114*********
甲房地产开发有限公司,同一家公司有六个管理编码。对其分别进行风险指标体系的对比与分析,本文这里只列举该公司其中一个管理编码的风险指标分析。
管理编码:520102********* 第一风险指标体系分析:可能存在的问题:(1)可能存在多结转成本费用或不计(少计)收入等问题。(2)可能存在隐匿收入或多转成本、多摊提费用以及抽逃资本等问题。(3)可能存在未足额申报城市维护建设税问题。(4)可能存在隐匿(混计)收入、少计应税收入问题。(5)可能存在税前多列支管理费用等问题。(6)可能存在的其它问题。
经评估分析,该纳税人可能存在以下疑点:(1)从时间2012-01-01到2012-12-31段,预收账款期末数:31016187473.56,从时间2013-01-01到2013-12-31段,期末预收账款:50658455853.9,可能存在隐匿收入或多转成本、多摊提费用以及抽逃资本等问题。请查看指标:预收账款变动率。(2)从时间2012-01-01到2012-12-31段,申报城市维护建设税额:61083546.02,申报营业税纳税: 942598826.79,从时间2013-01-01到2013-12-31段,申报城市维护建设税额:95157267,申报营业税纳税额:1144389528.5,可能存在未足额申报城市维护建设税问题。请查看指标:城市维护建设税与营业税增长趋势比率。(3)存在的其它疑点。建议:(1)审查纳税人利润表“利润总额”、“财务费用”,资产负债表“资产总计”、“所有者权益”、“存货成本”、“累计折旧”、“固定资产原价”、“流动负债”、“长期负债”、“资本公积”、“预收账款”、“应收账款”、“应付账款”、“其他应付款”、“其他应收款”、“固定资产”、“在建工程”等科目明细及相关凭证。(2)审查的其它科目。
管理编码:520102********* 第二风险指标体系可能存在的问题:(1)可能存在未足额申报城市维护建设税问题。(2)可能存在企业所得税申报不实问题。(3)可能存在隐匿收入或多转成本、多摊提费用以及抽逃资本等问题。(4)可能存在多结转成本费用或不计(少计)收入等问题。(5)可能存在的其它问题。
关联采集该企业涉税指标数据的信息:该企业涉税指标数据的信息包括:发改部门八大类重点工程项目信息、企业破产信息;房产部门房产登记信息、租赁信息;房管部门商品房销售合同备案信息、商品房预售许可证明细信息;工商部门变更登记信息;国税部门共管户信息;国土部门土地出让信息、土地登记信息、土地评估机构资格认定信息、土地转让信息;建设部门建设工程竣工验收备案信息、建设工程项目中标信息、建筑工程施工许可证发放信息、市政建设工程款支付信息;人民银行企业银行账号信息;统计部门规模以上企业经济运行情况统计、国民经济和社会发展主要经济指标信息等房地产企业涉税指标数据。以工商部门变更登记信息为例:甲企业涉及自然人股权变更至法人,不包含溢价转让涉及金额3亿元,未申报印花税及个人所得税。以采集人民银行企业银行账号信息为例:甲企业共在17家银行开设了68个帐户。
关联的企业最新咨讯,历史上的咨讯、第三方报道等所有数据对该企业进行风险的评估与判断。
通过对贵阳市所有行业税收数据进行分析比对,找出税收数据差异值过大的行业,再从税收数据差异值过大的行业中找到税收数据差异值过大的企业,把该企业与同地区、同行业、同规模等大致相同的企业进行税收数据再次的比对和分析,进行税种及入库函数坡度的匹配分析,提取单个税种进行趋势对比与分析,提取单个税种每年递增百分比进行对比与分析,找出差异过大的数值。
再提取该企业的税务登记数据,鉴定管理编码的匹配度,利用多种指标体系进行指标数据的比对,查找具体的税收风险预警数值。
最后,我们将以打造智慧征管、促进和谐税收为引领,把信息化、数据化、智能化融入税收征管全过程,推进征管现代化!
[1]Shangwei Gu,Zhiyong Li,Manxia Liu,Ahmed Sallam,Lv Huang," Based-on SOA Security Policy for Transverse Networking System",JDCTA:International Journal of Digital Content Technology and its Applications,Vol.6,No.23,pp.517~523,2012.
[2]王世筑,顾尚伟.大数据在税收征管工作中的应用[N].贵州日报,2015-4-2.
[3]肖东红,顾尚伟.大数据条件下大企业税收管理进入新常态[J].贵阳地税,2015(38):27-28.
[4]焦瑞进.税收专业化管理及其数据应用分析[M].北京:中国税务出版社,2013.
[5][美]比尔·弗兰克斯.数据分析变革-大数据时代精准决策之道(张建军,车皓阳,刘静如,范欢动译)[M].北京:人民邮电出版社,2015.
[6]盛杨燕,周涛译.大数据时代[M].杭州:浙江人民出版社,2013.
F810.423
A
1008-4614-(2016)02-0008-07
2016-2-24
顾尚伟(1974—),男,贵州毕节人,贵州省贵阳市地方税务局电子工程师,软件工程专业硕士研究生,长沙税务干部学院2016年贵州省地税局税收征管科技骨干人才递进式班学员。