关于深化涉农大数据分析的思考
2018-05-14范长海
范长海
[摘要]介绍涉农大数据分析工作现状,指出涉农大数据分析相关法律要求,提出了牢固树立法治和互联网思维、利用网络技术广泛系统采集、多维度多方法深入系统分析、强化责任,确保安全等深化涉农大数据分析建议。
[关键词]涉农大数据;有效分析方法;结果质量
[中图分类号]C812 [文献标识码]A
大数据分析是对大量动态能持续的数字化证据和依据,通过运用新系统、新技术的挖掘分析找出其内在规律,从而对事物发展做出科学预测和判断。随着农业现代化工作的大力推进和互联网新技术的广泛运用,涉农大数据分析已成为农业部门的重点任务,农业部对大数据采集共享运用进行了具体规划,去年6月1日国家出台并实施《中华人民共和国网络安全法》,为农业大数据深入分析和安全运用提供了法律保障。它不仅有利于农业和相关部门数据分析人员及大数据经营者提升法治水平和分析能力,更有利于提升大数据分析质量,进而为国家决策和市场预测提供准确可靠的数字依据。但在实际工作中,一些农业单位存在法治观念淡化、采集数据不全不真实、分析表面化或单凭个别经验决策及数据信息管理不到位等问题,经常出现错误的预测和数据流失现象,直接影响农业部门的正确决策或对农户的高质量服务。目前,在法治的框架下如何正确采集、深入分析农业大数据,进一步提升农业管理质效是亟待解决的課题。本文结合实际,就此问题谈点粗浅的看法。
1 涉农大数据分析工作现状
近几年,农业部门都通过种种措施,大力推进法治建设和互联网技术的运用工作,大数据分析工作质效也得到了较大提高,但还有些部门未真正树立法治观念,表现在思想上不够重视,不了解相关法律规定,大数据分析工作随意性大。在采集工作中,不能严格依法真实全面采集、精准预测。如:税务部门采集的涉农数据主要从纳税人自行申报内得到,渠道单一缺少与相关部门数据综合比较,加之,涉农产品大多属免税项目,经常有少填多报现象,很难保证大数据采集真实性和全面性。在大数据分析工作中,不能深入分析、认真核实。一部分农业机关主要利用系统开发的“决策平台”、“风险内控”及“金农工程”等软件进行大数据分析,由于对比指标设定较多更新不及时等情况,往往形成疑点数据量过大且准确率不太高等问题,使部分基层核实人员迎接不暇,疲于应付,无法一一核实。如:某市工商部门登记社农民专业合作1万多户,实际正常运行的只有600多户,登记户数核实不准确直接影响国家对农民专业合作发展扶持政策的正确制定和全面落实。再如:部分基层农业部门对大数据分析方法培训不多,在涉农大数据分析工作中经常出现完全依靠软件筛选或单纯采用传统方法进行大数据分析,不能把大数据分析方法与有效的传统方法或经验结合深入地分析,时常出现预测准确率低等问题。另外,个别涉农部门还存在大数据分析结果遗失或泄露等数据信息不安全问题。这些问题不及时解决直接影响农业大数据分析人员工作质量和效率,给国家造成较大经济损失的,还会追究分析人员的法律责任。
2 涉农大数据分析相关法律要求
采集真实可靠的农业数据信息,通过科学的分析做出符合农业实际情况的市场预测判断或管理决策是深化涉农大数据分析工作的主要目标,为实现这一目标国家连续出台了一系列与大数据分析相关法律规范和部分条款。《中华人民共和国统计法》第三十条规定:统计人员进行统计调查时,有权与统计有关的问题询问有关人员,要求其如实提供有关情况、资料并改正不真实、不准确的资料。本法还进一步完善统计数据质量责任和统计资料公布及保密制度,切实强化调查人员的责任,保护调查对象的合法权益。《中华人民共和国税收管理法》第六条规定:建立健全税务机关与政府其他管理机关的信息共享制度,纳税人、扣缴义务人和其他有关单位应当按照国家有关规定如实向税务机关提供与纳税和代扣代缴、代收代缴税款有关的信息,国务院第498号令《农民专业合作社登记管理条例》第二条规定:农民专业合作社的设立、变更和注销,应当依法办理登记。第二十九条还规定了登记机关不按规定条件进行登记人员的责任。今年8月1日将要实施的新《农民专业合作社法》第七十一条规定:农民专业合作社连续两年未从事经营活动的,吊销其营业执照。《中华人民共和国会计法》第四十三条规定伪造、变造会计凭证、会计账簿,编造虚假财务会计报告,构成犯罪的,依法追究刑事责任。新实施的《中华人民共和国网络安全法》第二十一条(四)规定:采取数据分类、重要数据备份和加密等措施,第四十二条规定:网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。这些规定都不同程度地体现公权对大数据质量安全的高标准要求和对私权利的维护。在农业部门数据公开方面,目前主要是《政府信息公开法》,其要求公开范围、原则等与大数据共享和深入分析还有一定距离。
3 深化涉农大数据分析建议
随着《中华人民共和国网络安全法》及相关法律的实施,我国农业大数据深入分析有了更可靠的法律保障。截至目前,从中央到地方已建大型涉农数据库100多个,为进一步深化农业大数据分析提供了条件。为此,数据分析人员应牢固树立法治思维,严格按照国家已经出台的相关法律法规和保障措施,充分利用互联网新技术,进行广泛真实地采集涉农数据、采用多维度比对多方法深入分析,确保涉农数据运用安全,使大数据分析工作再上新的台阶。
3.1 牢固树立法治和互联网思维
依法治国的核心是树立法治思维,推进农业发展,增加农民收入是国家的重要工作,已出台了一系列强有力的法律法规作保障。身为服务农业发展的大数据分析人员必须具有法治思维、法治方式解决问题的能力,不论是进行大数据采集、分析,还是分析结果运用,都应严格按照国家相关法律法规及要求办理,秉公行事。同时,大数据分析人员还应增强互联网观念。在“互联网+”时代背景下,多利用云计算、人工智能、互联网、物联网等技术积累农业战略资源,再通过涉农大数据的开放共享、深入分析和安全应用,增强农业管理能力,为农业经营者提供精准服务。
3.2 利用网络技术广泛系统采集
采集数据信息是大数据分析工作的基础,广泛真实采集是高质量进行大数据分析的法律要求。采集数据信息可分内外两部分。内部采集数据是指部门(行业)系统内能采集到的数据信息。如:农业部门内设科室存储数据及企业报送的数据信息等。还有“金农工程”全面上线,部分省级部门应建立农业决策支持、農产品市场信息等平台以供采集。外部采集数据指农业内部数据以外相关部门(行业)存储的数据信息。如:工商、财税、司法等部门能提供的数据信息等。随着互联网、物联网等技术的普遍运用,各系统都搭建不同的服务平台,为真实广泛地采集涉农数据提供了条件。如:工商、金融等部门应大力推行“双随机、一公开”可在监管过程中随机抽取检查对象,随机选派执法检查人员,抽查情况及查处结果及时向社会公开。税务系统“金税三期”上线,实现了全国税收数据大采集。公安、法院等部门应将对社会影响较大的或已结案的案件情况及时在网上公布,以便整合统一市场数据信息,从根本上解决自然垄断、外部性和信息不对称等“市场失灵”问题。为使涉农大数据分析信息准确有效,应对采集到的涉农大数据去伪存真抽验甄别。由于大数据信息采集主要利用通过软件设定的指标提取,数量较人工采集全面且批量大,使分析及核实任务过重,难保分析及核实质量,为此,对采集的涉农大数据应经过数据筛选或实地抽验后再推送到数据分析环节。涉农大数据筛选主要通过与系统内原始数据比对和与系统外部门提供的相关数据比对确定较为一致的数据;实地抽验是对经筛选出不一致的数据进行实地抽查验证。同时,对不符实际涉农数据提供者按有关法律规定进行责任追究,进而保证以后采集涉农数据的真实性和正确性。
3.3 多维度多方法深入系统分析
涉农大数据具有规模大、种类杂、价值密度低等特点,分析目标偏重于对宏观趋势给出快速预测。对传统较为精细的分析方法无疑是一种挑战,传统分析方法有很多已不适应快速预测的大数据分析工作要求,但大数据分析方法也不能完全代替抽样、局部、个别解麻雀式的传统数据分析方法,二者应适当结合,相互弥补。涉农大数据分析方法主要有对比、分类等基本方法,还有逻辑关系、预测判断等寻找规律性的方法。对比是最基本的数据分析方法。如对两个时期的农产品销售数据进行比较,有增加或下降应找出差异及原因;销售数据相同,也应深入考虑其内在结构有无变化,是否销售在同一地方?是扶农政策导致的最优采购量,还是失去老客户迎来了新客户,怎么丢的?同样寻找出相同销售数据的原因等。分类是由“分”和“类”组成,按照不同依据把事物分开归到不同类别中,从而获得对事物的重新认知。如对享有农副产品抵扣增值税的企业归一类,时刻了解每个企业农副产品抵扣比例情况,并进行纵横对比,在进行数量变化分析时,还应结合购进地相关信息进行定性分析,了解购进农副产品及抵扣的真实性。如:某棉纱企业某月份纳税申报的进项税额构成中,80%以上为农产品核定扣除进项税额,从大数据看,其比例与其他同类企业相比高出很多形成疑点,由此对该企业进行了个别抽查和深入分析:①按农产品增值税进项税额核定扣除办法现行规定,当期农产品耗用数量=当期销售货物数量×农产品单耗数量,则当期销售货物数量直接影响当期允许抵扣农产品增值税进项税额。②企业为了达到多抵扣税款的目的,可能在保持发票总销售收入不变的情况下,增加产品数量,降低产品单价,甚至虚假增加产品产量,增加销售数量。鉴于上述分析情况,分析人员先从“金税三期”及税收分析监控系统提取企业纳税当期和前两年同期申报、农产品核定扣除、期初库存进项转出等基础信息,又对企业的销售收入、应纳税额、农产品抵扣税额的计算过程以及销售数量、原材料购进单价准确性进行审核、比对,结合实际掌握的吨纱耗棉、吨纱耗电、基本机物料损耗、工人工资等数据筛选申报异常,实施纳税评估分析。同时加强对企业的日常监控,对填开收购发票信息是否齐全、逻辑是否合理、资金往来支付是否正常进行分析,结合运费发票等相关单据进行佐证核实该企业虚开虚抵扣问题的存在,并按税法规定对此违规行为做了相应的纠正和处理。③逻辑关系是从数据之间的相关性、因果与回归分析寻找其规律性。如:某农产品加工企业分别向税务、银行、财政等同一时间的收入和利润应该相同,通过与银行、财政部门联网取得收入和利润数据,若税务申报少于银行、财政等采集的数据,意味企业少申报税款或对银行、财政部门虚报。同时,深入查看该企业申报的所得税收入和增值税的收入额有无异常情况,若发现所得税收入小于增值税收入不合逻辑的问题,应及时核实纠正。④预测是用实际经验、惯性与时间序列分析方法进行分析这种分析方法必须在具有大量全面、连续数据信息条件下运用。在实际工作中,应注重经验预测的量化方法,即:在大量涉农数据的收集分析的基础上,听取多个相关专家们的意见,若有不同意见,要经过专家相互循环评判找到分歧点及原因,进而有效地解决数据不一致问题,更好预测事物发展趋势或潜在风险。
3.4 强化责任,确保成果运用安全
面对各部门收集的大量涉农数据信息、企业报送的涉农数据信息、其他平台公开的涉农数据信息,都存在较大的安全隐患,我国对涉农大数据保护偏重于安全管理,立法主要集中在个人信息的保护领域。在数据收集阶段,应遵照用户知情同意的原则,未经用户同意不能采集。在大数据的再加工利用层面,如果经过处理无法识别特定个人且不能复原的,可不经用户知情同意程序。为防止涉农数据信息安全或分析结果泄露,各涉农部门应在执行《中华人民共和国网络安全法》和相关规定基础上,建立具体涉农大数据信息安全风险评估机制,限制特定类型的主体从事涉农大数据分析,并加强大数据分析人员泄露的责任和追究。另外,补充涉农大数据分析人员,强化大数据分析队伍培训,不断提升分析人员的法治素养和业务操作能力,尽快适应国家对农业大数据分析工作的高标准严要求。
[参考文献]
[1] 李海英.大数据的法律挑战和建议[J].大数据,2016,2 (2) :100-107.
[2] 黄琛,曾月明.财务报告供应链参与主体对会计准则执行效果的影响研究[J].企业导报,2015 (24) :15-15.
[3] 陈孜佳.法人和法律安排的受益所有权透明度问题初探[J].国际税收,2018 (2):43-50.