人工智能在预算预测中的应用

2022-05-27厦门燕之屋生物工程股份有限公司熊婷厦门大学管理学院陈亚盛许欣

管理会计研究 2022年3期

文 · 厦门燕之屋生物工程股份有限公司熊婷厦门大学管理学院陈亚盛许欣

一、引言

人工智能（Artificial Intelligence, AI）的概念在1956年的达特茅斯夏季讨论会上被首次提出。作为计算机科学的一个分支，人工智能旨在用计算机模拟人类智能，让机器像人类一样进行认知、思考和学习，其本质在于模拟、延伸和拓展人类学习和思维的过程（周志华，2016）。近年来，越来越多的研究人员尝试将人工智能技术应用于管理预测和决策支持系统的开发。例如财务欺诈预测（Yang Bao et al.,2020）、产品定价决策（Tsantekidis et al.,2017）和投资项目决策（Galeshchuk et al.,2017; Nanda et al., 2010）等。然而，预算管理作为管理会计的重要职能之一（Covaleski et al., 2003），却鲜见相应人工智能应用的实践探讨。为了填补这一空白，本文基于一种深度学习算法—长短期记忆模型（Long Shortterm Memory, LSTM），构建了一个智能预算预测模型，并将该模型应用于一家服装直营门店的预算管理中。研究结果表明，本文构建的智能预算预测模型能够较为精确地捕捉该门店的销售变动规律，预测的日销售量与实际日销售量基本吻合。根据该模型的预测结果进行订货管理，可以帮助门店管理人员更好地规划库存和销售活动，有效降低库存积压和提高资金利用效率。本文展现了人工智能技术应用于预算管理领域的可行性和可靠性，丰富了智能管理会计方面的研究，为预算管理方法的智能化发展和升级转型奠定了良好的研究基础。

二、传统预算预测方法及局限

20世纪90年代公司法实施后，我国企业在引进西方预算管理思想的基础上发展出具有中国特色的全面预算管理制度（贡华章，2008）。在预算编制中，企业通常运用多种定性和定量预测方法来制定预算指标。由于有限理性的存在，企业预算编制人员可能受到认知偏差的影响，倾向于启动以经验和直觉为主的定性预测方法。定性预测法虽然能够提高预算效率，但缺乏定量分析，而且容易受到管理人员工作经验和分析判断能力的影响，往往很难得到准确可靠的预测结果（徐国祥，1999）。定量预测法以历史数据为依据，运用现代数理统计方法建立模型，其中最常见和最流行的一种方法是回归预测法。回归预测法的理论基础来自Box和Jerkins（1971）提出的自动回归滑动平均预测模型（ARIMA），假设预测目标与影响因素之间存在线性关系，在历史数据基础上运用连贯、类推等原则对预算指标进行预测。由于预测对象所处的内外部环境在不断变化，传统定量预测模型无法根据环境的变化做出改变，灵活性和适应性较差（Galvan et al., 2001）。在时效性上，传统预算预测方法通常以一个固定的会计分期（一年或一个季度）为预测周期，难以支撑动态实时的业务管理需求。所以，运用传统预算预测方法制定的预算目标容易与非财务指标脱节（于增彪等，2004），缺乏相应的外部环境分析（毛洪涛等，2013），通常是公司股东、董事会等利益相关方相互协调、讨价还价的结果（王斌等，2001）。

为了解决传统预算预测方法存在的问题，提高预算管理的科学性和准确性，2000年后，越来越多的企业在预算管理中引入了信息化支持，例如采用ERP系统或者专业的预算管理系统来开展预算管理工作等（韩向东，2014）。企业将预算流程嵌入ERP系统，提高了预算管理的流程规范化水平和效率（Grabskiet et al.,2011）。专业的预算管理软件为集团企业提供了统一的商业智能数据管理平台，能够处理繁琐数据之间的联动整合，其编制模块主要功能是建立各子预算之间的勾稽、联动关系，确保整体预算结构的完整、一致与合理（刘俊勇，2017），解决了复杂组织架构下内部各主体数据间难以相互验证的问题。预算管理软件大大节省了企业预算编制过程中的时间和人力成本（张念珍，2013），但缺乏大数据分析处理和预算预测等管理决策支持功能，预算目标制定的准确性仍有待提高。

目前的商业智能预算系统能够较为高效地处理数据量较少的结构化数据，但仍然难以满足大数据背景下动态实时的预算数据处理要求。随着互联网的普及和物联网的发展，社会信息总量呈爆炸式增长。同时，企业内部信息系统的建设也极大丰富了业务和财务数据，大量结构化以及非结构化的数据的价值有待企业管理者深入挖掘。在海量数据面前，处理数据的效率和效果就是企业的生命，因此引进人工智能技术进行大数据处理并服务于预算预测和管理，已成为当前预算管理系统亟待补充的新功能。

三、人工智能算法在预算预测中的应用

本文选取了福建省厦门市某服装公司一家直营终端门店作为研究对象，尝试使用机器学习算法构建一个预算预测模型，提高销售预测的准确性和门店管理的科学性。该样本门店位于厦门市大型购物中心中华城，是该品牌成立最久且店效最高的门店之一，积累的历史数据较为丰富。当前门店采用增量预算的方式确定年度销售预算，即用往年实际销售量乘增长比例。增长比例在品牌总销售量增长比例基础上，由总部与店长协商确认。这种自上到下的目标制定方式，缺乏科学合理的定量分析，外部环境与内部政策等相关因素也没有得到足够重视。由于销售预测涉及的因素多，数据量大，财务人员难以全面考虑每一项影响因素，即使拥有丰富的基础数据，预测出来的销售数据的准确度仍然不高。因此，本文通过全面分析与销售相关的影响因素，尝试利用机器学习算法构建一个智能预算预测模型，对该门店的商品在一个产品季的日销售数量进行预测，验证人工智能技术在企业预算预测中应用的可行性。

（一）算法选择

循环神经网络（Recurrent Neural Network, RNN）作为深度学习算法之一，在时间序列的预测方面具有明显的优势。与人工神经网络（Artificial Neural Network,ANN）、卷积神经网络（Convolutional Neural Network, CNN）等算法不同，RNN刻画了时间序列的当前输出与之前信息的关系。在时间序列数据中，每个时间点的输出都不是孤立的，彼此之间存在一定程度的关联。第t时刻的输出结果不仅与第t时刻的影响因素相关，与第t-1、t-2…t-n时刻的输出结果和影响因素也是相关的。所以，准确预测第t时刻输出的关键在于当下和之前信息的融合。例如，在语义理解中孤立理解一个词的字面意思很难洞察其背后的含义，需要结合上下文才能进行更准确的理解。类似的，销售预测也具有时间序列数据的特点。第t天的销售量不仅受到当天商场人流量、门店促销活动、商品上新等因素的影响，与第t-1、t-2…t-n天的销售量以及相关因素也存在联系。例如，商场举办的大型促销活动不仅能够提高活动期间门店的销售量，还会对活动结束一段时间后门店的销售量产生延续性的影响。如果在预测活动结束后的门店销售量时没有考虑到之前的促销活动，很有可能会高估其销售量，导致预算编制不准确。另外，天气也具有类似的延迟性效应，连续一周的暴雨会让门店的销售量大幅下降，天气转晴后会因为暴雨积压的消费力得到一次爆发，使得门店的日销售量得到明显提升。RNN恰好吻合上述销售预测的逻辑，可以帮助我们进行更客观、更科学销售预测。

RNN虽然可以记忆之前的信息，并将其运用到当前时刻的预测中，但对于间隔时间过长的信息可能存在梯度消失的问题。Hochreiter et al.（1997）在RNN的基础上提出了长短期记忆模型，并由Schmidhuber et al.（2000）引入忘却阀门优化之后，赋予了LSTM有效记忆长期信息的能力，使其成为预测应用中最有效的处理时间序列数据的模型之一。Wiese（2009）使用LSTM对信用卡交易数据进行交易欺诈识别与预防实验，验证了LSTM精确度相比支持向量机（Support Vector Machine, SVM）更高。Akita et al.（2016）在50家东京证券交易所上市公司的实际数据中应用LSTM进行金融市场时间序列预测，分析过去事件对股票开盘价的影响，取得了很好的预测效果。Liu et al.（2017）使用LSTM预测日本连锁超市销售额，从大量历史数据中了解销售如何随天气变化，在预测天气敏感产品（如饮料）的销售方面取得成功。Yu et al.（2018）在不考虑季节性和促销影响的情况下，对66种产品的45周销售点（POS）数据进行了LSTM测试，验证了LSTM应用到销售预测的可行性。在欺诈识别、金融市场预测、销售预测等领域的实践证明，LSTM是解决时间序列预测问题的有效算法。同时，LSTM符合销售预测的逻辑，能够解决销售预测这类时间序列型问题，所以本文将基于LSTM构建智能预算预测模型来进行销售量预测。

（二）数据分析

1. 原始数据选取

根据该店铺历史销售数据，短袖女T恤品类的销量最大。因此，本文选取短袖女T恤这个标杆品类作为研究对象建立预测模型。通过对该品类的研究和验证，如模型有效，可以复制推广在其他服装品类预测上。首先，我们从该零售门店终端软件中导出2015年6月5日至2018年10月31日短袖女T恤日销售记录共计1245条，并对数据进行预处理，包括剔除仓库调拨、财务调账等非销售或者明显异常的进出数据以及对缺失值查找其他记录进行补充等。同时将2015年6月5日至2018年5月31日的1092条销售记录作为训练集，2018年6月1日至2018年10月31日的153条销售记录作为测试集，检验LSTM的预测效果。由于LSTM模型需要把前n日的销量和与销量相关影响因素共同作为当日销量预测的输入指标，而本文设定LSTM的滞后期数为30日，所以在1092条销售记录中得到1062条销售记录作为有效的训练集。

2. 影响因素的选取

销售的影响因素主要来源于两类数据。一是外部环境数据，包括以人口、经济、自然、政治法律、科学技术和社会文化环境为代表的宏观环境数据，以及价值链上供应商、分销企业、顾客、竞争者等微观环境数据。二是企业内部大数据，包括财务和业务数据等。在本次观察期内，该店铺所处的宏观环境相对稳定，所在区域人口与经济保持小幅增长趋势。作为一种快消品，服装受消费者购买能力影响较大，社会零售总额（X1）一定程度上代表着当地消费者购买力水平，可以作为人口与经济环境的代表指标。服装销售有很强的季节属性，且受天气和节假日等环境因素变化而变化，因此月份（X2）、天气（X3/X4/X5）、节假日（X6/X7）作为自然环境影响因子纳入模型。在微观环境数据分析中，该店铺属于品牌企业的直营门店，商品由总部配货，且在该区域内没有加盟商经营，因此供应商和分销商的因素可以不予考虑。竞争者是影响销售的重要因素，该店铺所处的购物中心在观察期内竞品店铺数没有变化，暂时不纳入影响因子。影响消费者市场与顾客购买行为的因素包括社会与文化环境、个人年龄、职业、经济和生活方式，以及消费动机、感知、信念、心理等诸多方面，要对其进行分析需要大量的消费者市场调查和大数据积累。从传统做法看，服装企业在没有独立进行消费者市场调查时，会参考政府或行业机构发布的一些统计指标来了解消费者市场的活跃度或者流行趋势。例如中国纺织工业联合会发布的原料价格指数、国家统计局发布的中经服装产业景气指数，以及由商务部、绍兴市柯桥区人民政府和中国轻纺城建设管理委员会联合编制发布的柯桥纺织指数等。但这些指数有的涵盖面太广，有的依托纺织经济活跃地区的数据，参考意义有限。本文曾尝试将历史数据比较健全的柯桥纺织指数和时尚指数纳入模型，发现对预测结果有负向影响，说明指标的代表性不够。要对该店铺所销售的潮牌商品进行消费者市场分析需要专题研究，本文暂时不予纳入影响因子。

麦卡锡（1997）将影响销售的可控因素归纳简化为4Ps营销组合，即产品、价格、渠道、促销四要素。作为市场营销的策略构架，4Ps组合能帮助企业从复杂的变量中找到最为重要的影响因子，因此本文对企业内部数据分为4大类进行因素分析。

（1）渠道包括店铺客流量、竞品位置、店铺形象等。进店客流量决定了可能购买商品的消费者数量。店铺形象是吸引客户进店并影响购买决策的关键因素。在同一个商圈是否存在竞品，且竞品位置的优劣也在很大程度上影响了销售达成率。因为本文聚焦在单店铺的销售预测，在观察期店铺位置、形象、竞品环境等未有变化，所以渠道因素暂不考虑作为影响因子。如果是多店铺的销售预测，不同店铺所处的渠道因素就应该作为影响因素纳入模型。例如叶倩怡（2017）以德国Rossmann连锁商场的数据为例，基于梯度提升模型（eXtreme Gradient Boosting，XGBoost）对各个门店的位置、类型、与竞品的距离、竞品上架的时间、进店客流等作为模型输入特征，对商场整体零售数据进行预测。

（2）产品是消费者决定是否购买的最主要因素。由于本文聚焦在女T恤这一单品类预测，女T恤在款式、面料、做工方面没有太大变化，观察期主销图案（加菲猫联名系列）稳定运营，因此可以先不考虑商品属性特征，而是把整个品类可供销售的库存数（X8）作为影响因子。另外，该品类每天的退货数量（X10）代表了消费者对该产品的满意程度，单日退货数量越多，说明消费者对该产品的满意程度越低，产品可能存在质量问题。此外，历史累计月均销售数量（X11）一定程度上刻画出该品类服装的销售周期与趋势，有助于模型做出更准确的销售预测。

（3）价格是影响消费者是否购买的决定性因素，因此选取可供销售的产品均价（X9）作为重要的影响因子。

（4）促销，包括品牌推广和促销活动推广。品牌推广指的是品牌广告投放、代言人推广、主题IP形象推广等。这些活动着力于品牌影响力的打造，对中长期销售的促进作用较明显。该公司在观察期内与联名厂商的合约没有明显变化，品牌投放相对稳定，因此品牌推广费用暂时没有纳入模型。促销活动指的是满减或打折等短期促销措施，例如满300元减100元或满500元减200元、买500元打九折或买1000元打八折等。服装零售门店促销活动灵活多变，存在同一天多种促销活动组合叠加的情况，导致同一天中不同笔销售的折扣均不相同，将促销活动作为一项影响因素加入销售预测模型会带来很大的干扰。考虑到不同的促销结果最终体现在销售数量和价格上，而价格已经作为影响因子纳入，因此把日销售数量（X12）作为影响因子纳入模型。

通过对上述指标综合分析，本文选取了12个影响因子作为销量预测的特征指标，相关描述与说明详见表1。

表1 影响因子说明

（三）模型构建

经过上文的分析与筛选，本文搭建的LSTM智能预算预测模型输入层单元数为12个影响因子×滞后期数。由于只预测当日的销售量，所以输出层单元数为1。我们选择了能够解决LSTM中梯度消失问题的Softsign函数作为激活函数，有利于LSTM进行更高效的学习。对于损失函数而言，我们选择了常见的绝对误差平均值（Mean Absolute Error，MAE）来计算LSTM模型预测值与真实值的差异程度，并据此调整优化模型。另外，我们选择了自适应性更强和学习速率更快的RMSprop优化算法作为LSTM的优化器来加快模型收敛的速度。

在LSTM神经网络的搭建中，小批量训练数值、迭代次数和隐含神经元个数很大程度上决定了模型训练的有效性和结果预测的准确性。由于小批量训练数值（batch_size）、迭代次数（epochs）和隐含神经元个数（hidden_nodes）是相互影响的3个参数，每个参数的不同取值均可组合出不同的LSTM神经网络结构，所以本文借助sklearn（基于 Python 语言的机器学习工具平台）中的网格搜索（grid search）与交叉验证模块（GridSearchCV）来进行LSTM神经网络参数的自动组合选择。根据LSTM神经网络常见的参数默认值，我们为小批量训练数值提供了36、72和128三种待选值，为迭代次数提供了100、200和300三种待选值，为隐含神经元个数提供了100、200和300三种待选值。根据GridSearchCV的结果，每次随机选择36个训练数据，进行100轮的小批量迭代训练，隐含神经元个数为200，为最优组合参数。

由于LSTM神经网络能够处理当前输出与之前信息的关系，所以滞后期的确定十分重要。在本文销售预测的场景中，滞后期n意味着当天的销售量不仅取决于当天的影响因素，还与前n天的销售量以及相应的影响因素有关。滞后期定义了每一天的销售量以及影响因素的持续影响效应，n越大说明持续影响效应越大。根据服装销售的经验，本文为滞后期数提供了7、15、30、40、50、60的待选值，在上述最优组合参数框架下，逐个检验了不同滞后期对销售预测的影响。根据检验的结果，当滞后期为30天时，即每一天的销售量受到前30天的销售影响时，均方根误差（Root Mean Squard Error，RMSE）最小，此时的预测效果最优。

经过调优，本文构建了一个滞后期为30，隐含层神经元个数为200，以Softsign为激活函数、MAE为损失函数、RMSProp为优化器，同时采用batch_size为36的小批量训练，迭代训练次数为100的LSTM神经网络。

（四）结果呈现

图1展示了基于LSTM算法的智能预算预测模型的训练结果，其中黄线为预测值，蓝线为真实值，纵轴为销量（件），横轴为日期，测试集训练结果的均方根误差（RMSE）为3.240，拟合度较为理想。

图1 日销量预测值与真实值对比

同时，本文比较了LSTM与其他几种模型，包括XGBoost、多元线性回归（Multiple Linear Regression）和人工神经网络，在日销售量预测方面的效果。如表2所示，在均方根误差（RMSE）、均方误差（MSE）、平均绝对误差（MAE）和R2四个衡量指标上，LSTM网络均显示出了更强的预测能力，其次是多元线性回归，人工神经网络算法在销售预测中的预测效果最差。

表2 销售预测效果对比表

观察期2018年6月3日（2018年度第23周）至2018年10月27日（2018年度第43周）这个产品季，预测的销售数量为759件，实际销售数量为825件，相差8%。在企业实际商品规划中，通常以周为周期进行商品调度。所以，本文在上述日销售量预测的基础上，以周为单位进行加总，计算每周的预测销量变动率与实际销量波动率，具体计算公式如下：

2018年第23周到第43周这21周的周预测销量变动率与实际销量波动率的拟合结果如图2所示。LSTM模型得到的预测周销量变动率与实际变动率曲线基本重合。只有在销售周期接近结束的第42周，出现较大差异，该周销售数量的绝对值差为4。说明模型较为准确地发掘了周销售波动变化的规律，按照模型预测结果进行周销售计划指导有助于提高预算目标编制的准确性和客观性。另外，该门店这个品类在观察期的实际平均周动销率（周动销率=周实际销售数量÷周均库存）只有12%，说明原有预测方式指导下的库存备货远超过实际销售数量，库存周转不足，积压情况较为严重。对于服装这类注重潮流时尚的商品而言，库存积压意味着货品的资金占用大，没有及时出售导致过季会产生大量跌价损失。本文提出的基于LSTM模型进行销售预测的新方法能够较为精确地抓住销售变动规律，帮助总部以及直营终端门店更好地规划库存，从而降低门店库存占用率，提高整体的资金周转率。

图2 周预测变动率与真实变动率对比（%）

四、结论与展望

基于大数据的智能预算预测系统的研究和构建具有重要的管理实践意义。首先，基于大数据的智能预算预测可以根据外部环境和内部业务数据的变化动态修改和扩展输入因子，从而智能更新预算预测结果，提高预算对内外环境的适应性，使原来相对静态的预算管理变得更加动态。其次，基于人工智能技术的预测综合考虑了财务和非财务影响因素，并且能够发掘目标与影响因素之间的关系，有效提高了预算数据的准确性，从而指导企业进行科学合理的预算资源配置。再次，相较于传统预算以年为周期的目标预测与跟踪，基于人工智能技术的预算预测能够以最小单位（日）进行预测，实现企业滚动预算的编制与管理，让企业更方便快捷地完成生产和销售计划的调整。最后，智能预算预测系统可以与制造资源计划系统、客户关系管理系统等业务系统整合，有助于实现预算的实时控制，增强企业的整体柔性、减少库存积压，盘活企业资金和存货，最终促进企业整体效率和效益的提高。我们希望本文可以抛砖引玉，让更多会计学者参与到人工智能方法应用于预算管理的探索。