全国性个人所得税大数据调查
2018-05-14张凯周越袁黄颖倩
张凯 周越 袁黄颖倩
摘 要:大数据冲击使税务研究正面临前所未有的挑战,同时也使其大数据网络调查成为可能。研究发现:六年多的时间内,个人所得税的关注度在8000点的高位徘徊,整体呈10%的上升趋势。个人所得税搜索指数曲线的震荡变化与国家政策和社会各界的关注度密切关联。中青年占95%,男性人数远多于女性。他们关注的内容涉及个人所得税税率、计算公式和方法、个人所得税税法、起征点、工资和年奖金的个人所得税问题。其关注热度从我国东南沿海的经济发达地区到我国西北内陆的偏远地区呈现逐渐降低的态势。个人所得税涉及每个人和每个家庭的核心利益,中青年社会主要劳动力如此高的比例和关注度应引起政府政策制定部门的注意。
关键词:个人所得税;大数据;网络调查;百度指数
中图分类号:F812.42 文献标识码:A
近年个人所得税改革一直倍受社会各界的高度关注。针对个人所得税不合理问题,综合与分类相结合的个税改革方案已提交国务院,随后将提交人大审议。为配合我国个税改革,2016年2月和4月《税务研究》发表了九篇文章。
大数据税务方面的研究,中国“知网”的文献有534篇,其中《税务研究》刊登了11篇。但个人所得税大数据方面的研究尚未发现,也未见个人所得税大数据调查方面的文献。中国“知网”中“个人所得税”和“调查”主题的文献有8365篇,其中主要是局部、地区和抽样性的调查,全国性的个人所得税大样本调查尚未发现。众所周知,全国性的大样本调查不仅耗资巨大,时间长,难度也很大。但即便如此,全国性的个人所得税大数据调查依然非常必要,因為无论是政府部门决策,还是学者研究,甚至普通百姓都很关心这方面的结果。
一、大数据网络调查方法
大数据的冲击使税务研究面临前所未有的挑战,同时,这一技术也给我们在大数据层面下进行全国性的个人所得税网络调查提供了机会。大数据网络调查是指针对某一研究主题利用网络信息系统进行的大数据调查。百度作为国内网民使用量最大的搜索引擎,在其平台上搜索产生的关键词反映了用户在搜索前后的搜索需求。据统计,目前国内使用百度搜索引擎的用户上亿,每日产生的搜索次数可达几十亿次,对于其搜索指数的统计分析也能从侧面反映出大众百姓对关键词的认知和看法。
据2017年1月22日CNNIC发布《中国互联网热点调查报告》称,截至2016年12月底,中国网民规模达7.31亿,互联网普及率达到53.2%。从大数据角度看,某一主题的大数据调查几乎可以反映“全国人民”对此的看法。正是基于这一前提,本文以“个人所得税”为研究对象和主题,借助百度指数平台,展开其大数据的网络调查,以获取其全国性的数据。
二、大数据网络调查与分析
在“百度指数”平台上输入关键字“个人所得税”,就可以获得关于个人所得税主题的相关数据和可视化图形。
(一)热词变化趋势
图1为2011年1月1日至2017年5月15日期间“个人所得税”一词百度搜索指数变化趋势图。
分析发现:近6年多的时间内,“个人所得税”一词的热度呈现波动起伏变化的趋势。2011年新的个人所得税政策出台使其产生了较大波动,出现了若干峰值,其中最高峰值达21892点。2012年到2014年相对平稳,其搜索指数在7000-10000点之间。2015年至2017年出现小幅增长,其搜索指数在10000-17000点左右,产生的原因近半年多的时间内,个人所得税再次成为社会议论的“焦点”。
百度指数平均值为8058点,其上升率为10%,这说明个人所得税不仅一直受到大众百姓的关注,而且其热度一致在8000多点的“高位”。分析发现,百度指数曲线的震荡变化与国家政策和社会各界的关注度密切关联。
(二)人群分布
关注个人所得税的人群,男性占比76%,女性24%,男性是女性的3.17倍。30-39岁的人最多,约56%;20-29岁的其次,约25%;40-49岁的再次,约占14%;19岁及以下占2%(其中包括部分青年人和部分少年儿童),50岁及以上3%。这说明关注个人所得税的人群,男性远多于女性,青年人最多,中年人其次,老年人再次,少年儿童很少。见图2。
(三)区域热图
在地域维度上,搜索热度从高到低依次为华东、华北、华南、华中、西南、东北和西北。在省份维度上,其排序为北京、广东、上海、江苏、浙江、山东、四川、福建、湖北和河南。下钻到城市维度,前10名城市的排序依次是北京、上海、深圳、广州、杭州、苏州、天津、南京、成都和武汉。
从区域热图中,我们可以看到搜索热度主要集中在东部沿海和中南部内陆。从经济发达的东部沿海到经济稍显落后的中南部内陆,其搜索热度逐渐递减。华东沿海地区的人数最多,是华北、华南、华中、西南、东北和西北地区的两倍以上。由东向西,热度逐渐减小。北京人数最多,是上海的1.5倍,其他城市的3倍以上。特大城市和大城市的人数排名靠前。
(四)热词及相关性
图3由搜索关键词与相关词进行关联分析后得出其相关程度的大小,以及相关词本身的搜索量的大小。相关词与圆心的距离表示相关词与关键词的相关程度,距离越近则相关程度越大;相关词自身的半径大小则与相关词自身搜索指数成正比关系。
与“个人所得税”一词相关分为“强相关”、“相关”和“弱相关”三个层次。与之“强相关”的分别是个人所得税计算器、个税、税率和计算4个词。与之“相关”的包括税法、个人所得税法、方法、2017、个税计算器2017、个人所得税税率表、个人所得税起征点2017、个人所得税计算方法8个词。与之“弱相关”的是申报、个税计算器、企业所得税、个人所得税计算、个人所得税起征点、个人简历模板、个人所得税查询、简历、个人所得税税率、年终和个人所得税申报11个词。
分析发现:网民最关心个人所得税计算器、个人所得税税率表和税率计算;其次关心个人所得税法、个人所得税起征点、个人所得税的计算方法;另外,也关注企业所得税、个人所得税税率、工资和年终奖的个人所得税问题。
(五)搜索热度排名
图4显示了关键词“个人所得税”在“百度知道”上涉及到的相关提问、回答和浏览热度排序。
分析发现:热词提问、回答和浏览主要涉及年终奖个人所得税计算方法、劳动报酬个人所得税计算方法、新个人所得税计算方法、计算公式。图3与图4的分析结果基本一致,且相互补充。“百度知道”为人们提供的一个开放、交流和互动的平台。
关注个人所得税的网民可以在上面进行信息交流。
四、结论
大数据网络调查发现:近6年多的时间内,个人所得税的热度呈波浪起伏的变化状态。整体呈上升趋势,其上升率为10%,且其热度一直在8000多点(每周搜索的次数)的“高位”徘徊,这说明个人所得税持续受到大众百姓非常高的关注度。2011年新个人所得税政策出台,百度搜索指数曲线有较大波动,出现了若干峰值,其中最高峰值达21892点。2012年到2014年相对平稳,搜索指数在7000-10000点之间。2015年至2017年出现小幅增长,其搜索指数在10000-17000点左右,产生的原因是近半年多的时间内,个人所得税再次成为社会议论的“焦点”。个人所得税搜索指数曲线的震荡变化与国家政策的变化和社会各界的关注度密切关联。关注个人所得税的人群,男性远多于女性,青年人最多,中年人其次,中青年占整个人数的95%。搜索地区热图主要集中在东部沿海和中南部内陆。从我国经济发达的东南沿海地区至经济较为落后的西北内陆地区呈现逐渐减弱的趋势。尤为突出的是,特大城市的热度排名较为靠前并且搜索量是其他城市的数倍。大众百姓关心个人所得税税率、税率计算公式和方法、个人所得税法、起征点、工资和年终奖个人所得税问题。
参考文献:
[1]宋立京.大数据时代如何开展统计调查工作[J].时代金融,2016(5):13.
[2]徐锐.大数据时代调查报道要素嬗变与路径选择[J].中国出版,2015(1):54-57.
[3]陈阳,魏玉东.大数据影响下的政府社会经济调查动向探寻[J].辽宁经济,2015,37001:76-77.
作者简介:张凯(1961-),男,湖北武汉人,中南财经政法大学信息与安全工程学院教授,博士。研究方向:大數据,互联网,信息系统,数学模型;周越(1994-),男,安徽宿州人,中南财经政法大学信息与安全工程学院硕士研究生;袁黄颖倩(1995-),女,湖南长沙人,中南财经政法大学信息与安全工程学院硕士研究生。