朴素贝叶斯分类法与数据资产会计确认
2019-10-14陈思静王磊尹波干胜道
陈思静 王磊 尹波 干胜道
【摘 要】 随着大数据时代的到来,企业对数据资源的合理使用为自身带来了日益增长的经济价值,于是,在会计学界有了将企业数据资源作为一项资产入账的呼声,然而,大数据的产权归属和价值变现具有不确定性,导致其未必满足会计确认的条件。文章全面分析了企业将自身拥有或控制的数据资源确认为资产所面临的难题,并对其提出了解决方案。首次应用朴素贝叶斯分类法建立模型,通过计算相关因素的联合概率来判断在不确定条件下数据资源是否应该被确认为资产,最后进行了算例分析。结论表明,该模型对数据资产的会计确认具有指导作用,同时也可为相关会计准则的制定提供理论参考。
【关键词】 数据资产; 会计确认; 朴素贝叶斯; 联合概率
【中图分类号】 F234 【文献标识码】 A 【文章编号】 1004-5937(2019)19-0058-04
一、问题的提出
(一)数据资产的会计确认滞后于大数据时代的步伐
2018年8月,尤瓦尔·赫拉利在其新作《今日简史》中提到,人类社会进入21世纪以后,数据的重要性会超越土地和机器,数据将成为最重要的资源[ 1 ]。对数据资源的合理使用有助于企业提高生产效率,获取竞争优势,创造经济价值。随着信息技术的飞速发展,数据驱动的决策方式在企业管理中已日益普遍,数据资源作为“新型石油”的价值越发凸显。会计作为一项重要的经济管理工作,需要全面反映经济活动的真实面貌及结果,然而,现有的会计准则并未将数据资源列为会计核算的对象,与之相应的会计核算业务种类和核算方法也未被提出,这会导致会计信息偏离经济运行的实际。维克托曾提出,“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题”[ 2 ],而会计确认作为数据进入资产负债表的首要环节却面临重重难题,目前理论界尚未对其提出解决方案,在此领域的研究和实践相对滞后。
(二)不确定性是数据资产会计确认的难题
2014年,我国修订的《企业会计准则——基本准则》规定,资产的定义是企业过去的交易或者事项形成的、由企业拥有或者控制的、预期会给企业带来经济利益的资源。一项资源应当符合资产的定义并同时满足资产确认条件,才能被确认为资产。
企业所积累的数据资源是对过去已发生的经济业务的反映,通过收集或购买而得的历史数据,可见,数据资源符合资产定义中的“由过去的交易或事项形成”。然而,数据资源的产权归属和价值实现具有不确定性,导致其未必符合会计确认的条件,数据资产具有不同于传统资产确认的特殊之处,体现在如下四方面:
1.数据资源在产权归属上具有不确定性
准则规定,资产必须是由企业拥有或控制。与传统资产相比,数据资源由于其特性,在是否为企业所拥有或控制上具有高度不确定性。Bulger et al.[ 3 ]依据数据收集的主导方来界定数据所有权的归属,即主导收集数据的一方拥有数据的所有权,这在法律形式上合理,但在经济实质上却容易产生争议。比如,企业通过大数据交易中心所购买的数据,在形式上看,企业似乎可以控制或拥有外购数据资源的所有权,但事实上,由于数据的可复制性,且不具有排他性,企业并不能排除他人使用,因而这种控制权或所有权是虚无的[ 4 ]。可见,数据资源难以被企业所绝对控制或拥有。
2.数据资源的价值在时间上具有不确定性
数据资源的价值具有时限性,新数据的产生、企业所面临的经济环境变化或商业模式变更等内外部因素都会导致原有数据的价值变动。不同于实物资产,数据资源在一个较长的周期内,价值会随时间波动。值得注意的是,数据价值随时间推移未必衰减,某一时期失效的数据资源,可能在将来由于某些因素的变化而重新产生价值。比如,在2015年发生的马航事件中,波音公司生产的发动机在工作过程中记录下来的海量数据成为马航飞机失联的关键证据,倘若没有该事件的触发,这些数据只是存放在服务器上的信息,平淡无奇而价值寥寥。
3.数据资源的价值在使用场景上具有不确定性
空间的变化会导致数据资源的价值变化,不同地区之间、不同企业之间或者同一企业不同业务场景之间的差异,都会对数据资源的使用寿命产生影响。受到企业战略规划、发展阶段以及主营业务类型等影响,同样的数据资源在不同业务场景下有着不同的价值实现方式,从而产生了经济价值的差异。
4.数据资源的价值密度导致价值变现具有不确定性
大数据因其容量巨大,其价值往往是潜在的,需要通过挖掘才能得以显现,如电商企业的客户数据,往往不能直接被企业所用,而需要通过数据挖掘来为企业创造价值。然而,当大数据时代来临,企业需要存储和处理的数据量激增,数据的结构和来源更是纷繁复杂,这会导致数据的价值密度降低,从而使数据价值的挖掘产生了不确定性。总之,数据量越大,获取有用信息的难度就越大,现阶段掌握高价值数据的收集和挖掘技术的企业为数不多,大部分企业还在探索。
(三)现有研究很少针对数据资产的会计确认进行探讨
近年来,学界对数据资产会计核算的研究逐年增加。李如[ 5 ]采用规范研究方法,论证大数据确认为资产的必要性和可能性,提出确认条件,并针对其计量中的相关会计问题给出解决方案;邹照菊[ 6 ]以企业数据类型、构成及来源为基础,考察了企业大数据的资产属性问题,分析得出企业大数据满足资产确认条件,应将其作为一项资产进行财务列报,还进一步分析了数据资产的计量和报告方法。这一类研究的特点是将数据资产的会计核算视为一个整体,就其每個环节都进行了探讨。另一类研究则聚焦在数据资产会计核算中的价值计量这一环节,张志刚等[ 7 ]运用层次分析法建立了数据资产价值评估模型,并给出了模型应用的具体步骤。李永红、张淑雯[ 8 ]优化了数据资产的价值评估方法,利用层次分析法以及灰色关联分析法的双重结合构建了数据资产的价值评估模型。不难看出,这一类研究多使用层次分析法进行价值评估,方法雷同导致结论相似。
会计确认和计量都是会计核算的重要环节,二者一体而不可偏废,资产的确认是计量的前提,资产没有得以确认,计量就无从谈起,因此,对数据资产会计核算的探讨首先应该关注会计确认。目前,对数据资产计量方法的研究较多,而对数据资产确认的研究很少,即使有所论及,也是泛泛而谈,未做深入剖析。会计准则规定,只有当与某一资源有关的经济利益流入的概率>50%时才能确认为资产。如上文所分析,数据资源不仅在产权归属上,而且在经济价值的流入上都具有高度不确定性,这会导致其未必满足资产确认的条件,于是,就有必要针对数据资产的会计确认深入研究。
在研究对象上,企业的数据类型繁杂,划分方法多样化,不同类型的数据资源所面对的不确定性各不相同,未必所有类型的数据都满足会计确认的条件。会计作为一门分类的学问,在研究数据资产的会计确认时,应将数据分门别类进行探讨,而不能一概而论。
在研究方法上,对不确定性的研究是会计确认的核心问题,有鉴于此,本文首次将朴素贝叶斯分类法引入数据资产的会计确认当中,针对其中的不确定性关系进行定量分析和判断,通过收集数据来训练模型,旨在为数据资产的会计确认提供指导,同时也可作为会计政策制定的理论依据。
二、数据资产的会计确认模型构建
基于朴素贝叶斯分类法的数据资产会计确认模型的构建方法如图1所示。
第一步,根据需求,选取待确认的数据资源。例如,某电商公司2018年全年的客户订单数据。
第二步,提取影响该类数据资源会计确认的随机变量种类。例如,根据上文对数据资源的不确定性分析,可设定A=数据资源的拥有权或控制权;B=数据资源的时效性;C=数据资源的使用场景;D=数据资源的价值密度;E=是否应确认该数据资源为资产。假设A、B、C、D四个变量相互独立,根据随机变量间的相关关系完成贝叶斯网络的有向无环图结构,即该数据资源会计确认的朴素贝叶斯网络拓扑结构,如图2所示。
第三步,确定每个随机变量的属性及其特征向量的空间。样本属性记为:{A=Ai,B=Bi,…,E=Ek}(i,j,k=1,2,…,n)。其中,Ai用一个n维特征向量A={A1,A2,…,An}表示,每个取值分别对应一个可被监测到的原始信息,例如,Ai表示(其中i=1,2,…)企业对该数据资源的拥有权或控制权的状态数,A1=拥有,A2=控制,A3=不确定。
第四步,采集并输入训练样本集,建立朴素贝叶斯分类模型。利用经验丰富的会计专家打分获得先验知识,赋值后得出向量的实例。例如,样本训练集为S={S1,S2,…,Sn},其中,S1={A=Ai,B=Bj,…,E=Ek}(i,j,k=1,2,…,n)表示随机变量构成向量的一个实例。
第五步,计算未知样本的最大后验概率,以判断分类。代入未知样本的特征向量,先计算每一个分类的条件概率P(Xi|E)=P(XiE)/P(E);再计算每一个分类的联合概率,即P(X1,X2,…,Xi,E)=P(E)·n i=1P(Xi|E)(i=1,2,…,n);最后比较大小,以最大概率值所对应的类型作为最终归类。如,若有P(E1)·n i=1P(Xi|E1)>P(E2)·n i=1P(Xi|E2),则未知样本被判断为第1类。
三、算例应用
2015年4月,国内首家大数据交易所——贵阳大数据交易所正式挂牌运营。在该交易所的平台上,数据供应方(企业)将自身收集的数据作为商品用于交易。交易所通过电子系统,线上线下相结合,撮合交易,促使数据作为商品来流通。用于交易的数据是通过对底层数据进行清洗、分析、建模和可视化之后形成的,可在一定程度上降低数据所有权争议的风险和保护用户隐私。
假设G公司为贵阳一家大数据交易所的会员企业,从事B2C电子商务业务,经过多年运营,公司已经积累了大量在线业务的交易数据,可用于精准营销、改善物流等管理活动的决策依据。G公司财务部准备将交易数据作为资产入账,但在其是否满足资产确认条件上存在争议。该数据包含用户的购买详情以及大量个人信息,如IP地址、账户情况、家庭住址等涉及个人隐私,那么,数据理应归用户所有,用户也应该相应地享受数据所带来的收益。然而,电商企业为用户提供服务,用户购买商品,双方各取所需,数据只是交易过程留下的痕迹,那么,企业也应该获得数据的所用权。倘若企业意欲将该数据在交易所出售,还需要进行数据清洗以降低法律风险,但无法完全规避。于是,数据的产权归属问题就存在不确定性。同时,电商交易数据未必为企业带来经济价值,还有赖于数据的价值密度和数据挖掘方法,这就产生了资产确认的不确定性。
在此情况下,G公司财务部基于朴素贝叶斯方法,构建了一个针对交易数据的资产确认模型,通过模型求解来判断是否应该确认。
首先,抽取五个随机变量,分别是:A=数据资源的拥有权或控制权;B=数据资源的时效性;C=数据资源的使用场景;D=数据资源的价值密度;E=是否应确认该数据资源为资产。
其次,确定每个随机变量状态数的取值。根据性质,都是离散型变量,取值如表1所示。
最后,通过专家打分法获得训练样本集。由于会计专家在行业背景、专业知识等方面都存在差异,有不同的判断,所以应该尽可能选取不同行业背景的专家以获得全面的样本集。如表2所示,假设有表2中训练样本的数据,这个模型的学习目标是根据给定的不确定因素的先验值来判断对指定数据资源的会计确认是Yes还是No的结论。
将表2数据集中的10个训练样本,运用朴素贝叶斯分类法完成对新实例的分类。根据G公司財务人员的判断,待确认的数据资源具有以下特征:
(A=A1,B=B1,C=C2,D=D1)
用以上新实例预测E(是否应确认该数据资源为资产)的目标值是Yes或No。此时,训练样本集就相当于会计专家的经验库,对新实例的分类就相当于G公司财务人员去咨询会计专家的经验库,同时结合自身的职业判断而得出结论。由上面的公式计算可以得到表3。
由表3数据计算可得:
P(A=A1,B=B1,C=C2,D=D1,E=E1)
=P(E=E1)·P(A=A1|E=E1)·P(B=B1|E=E1)·P(C=C2|E=E1)·P(D=D1|E=E1)
=2.33%
P(A=A1,B=B1,C=C2,D=D1,E=E2)
=P(E=E2)·P(A=A1|E=E2)·P(B=B1|E=E2)·P(C=C2|E=E2)·P(D=D1|E=E2)
=0.74%
因為前者大于后者,所以应该将新实例归类如“E=Yes”这一类,即此类数据资源应该被确认为资产。
上述算例根据会计专家对数据资源不确定性因素的先验知识得出训练样本集,进而计算条件概率,可用于特定数据资源的分类判断。目前的方法在构建贝叶斯网络时只选取拥有权或控制权、时效性、使用场景和价值密度四个因素作为随机变量,并没有全面囊括企业数据资源所面临的不确定性因素,也没有考虑到各个随机变量的关联性,同时在算例应用分析中的训练集样本数量偏少,该模型还可进一步优化。首先,后续研究中可引入更为全面的随机变量和更大量的样本集对贝叶斯网络进行智能学习,进一步去除专家先验知识或其他环节可能产生的主观性,从多个角度出发使得会计确认更具客观性和科学性;其次,由于将随机变量都假设为离散型,同时对P(E)和P(Xi|E)的计算只是频数统计,这会导致模型难以描述真实情况,后续研究可以将随机变量设计处理为连续变量,并采用高斯模型进行计算,如下所示:
其中?滋E表示类别E的样本中某一类随机变量X的均值,σE则表示该类随机变量的方差。
四、结论
本文首次利用朴素贝叶斯分类的方法构建了判断数据资源是否应该被确认为资产的模型,并创造性地将概率推理所得概率值定义为会计确认的判断标准,这为确认数据资产提供了理论依据。最后,以电商企业的交易数据为例,通过算例证明了基于朴素贝叶斯分类法的模型对确认数据资产具有可行性。本文的模型形式简单,数据意义明确,便于应用,对企业数据资源的会计核算以及相关部门制定“大数据资源进财务报表”的会计政策都具有一定的参考价值。
【参考文献】
[1] 尤瓦尔·赫拉利.今日简史[M].北京:中信出版社,2018:50-67.
[2] 徐鑫.企业如何下好数据资产这盘棋[J].上海信息化,2016(7):23-26.
[3] BULGER M, TAYLOR G, SCHROEDER R. Data- driven business models:challenges and opportunities of big data[R].Oxford Internet Institute,2014.
[4] 李雅雄,倪杉.数据资产的会计确认与计量研究[J].湖南财政经济学院学报,2017(8):82-90.
[5] 李如.对大数据资产确认与计量问题的研究[D].西安理工大学硕士学位论文,2017.
[6] 邹照菊.企业大数据的资产属性辨析[J].会计之友,2017(12):7-12.
[7] 张志刚,杨栋枢,吴红侠.数据资产价值评估模型研究与应用[J].现代电子技术,2015(20):44-51.
[8] 李永红,张淑雯.数据资产价值评估模型构建[J].财会月刊,2018(9):30-35.