基于轻量级卷积神经网络的科技型中小企业估值研究
2023-08-30田庆锋
田庆锋,徐 朗
(1.西北工业大学管理学院,陕西西安 710129;2.中国航发沈阳黎明航空发动机有限责任公司,辽宁沈阳 110043)
1 研究背景
中小企业是我国推动国民经济发展、构造市场经济主体、促进社会稳定的基础力量[1]。科技型中小企业因其技术含量高,创造了大量专利与创新产品[2]。作为兼备创新活力、发展潜力与高成长性的创新集群[3],中小企业在市场发展中最具推动作用,在经济活动中占主导地位的企业是未来高科技大企业的萌芽与开端[4],是推动产业创新的先锋力量。党的二十大报告指出,要营造适宜科技型中小企业健康发展的有利环境,这进一步强调了科技型中小企业的重要作用和战略意义。但根据林海[5]、张目等[6]、马卫民等[7]的研究,中小企业由于规模小、风险性强且前期投入高,发展的不确定性较大,一直存在融资难、估值难的问题。
传统的估值方法主要包括绝对估值法与相对估值法[8],其中绝对估值法一般包括现金流折现法、经济附加值法与实物期权法,分别有如Edwards等[9]、Stewart[10]、Myers[11]的研究;相对估值法则是市净率、市盈率和市销率3 种价值乘数法[12]。绝对估值法立足于预测,在估值过程中不可避免带有主观色彩,且其基于严格假设,较难适应实际估值的复杂情况,因此已有关于企业估值的方法存在一定弊端[13]。现金流折现法与经济附加值法仅针对财务层面,忽略了非财务指标对于企业的价值贡献[14],宣晓等[15]部分学者的研究也认为其并不适用于科技型中小企业。相对估值法的核心则是选择合适的可比企业,以价值乘数为“桥梁”对目标企业进行价值评估,估值效果也在很大程度上取决于可比企业[16]。然而,现实中科技型中小企业的可比企业很难确定[17]。因此,对于规模小、技术密集的科技型中小企业而言,相对估值法的准确性有待考量[18]。
如今,大数据技术的蓬勃发展为科技型中小企业的估值研究带来了新的机遇,卷积神经网络因其具有权值共享与局部连接的特性[19],可以在保证模型性能的同时有效减少参数数量,即便网络加深也能防止过拟合[20],且兼具良好的非线性能力,因而被广泛应用于图像、语音等领域,包括Krizhevsky等[21]、Gu 等[22]、连海伦等[23]学者的研究均证明了这点。由于卷积神经网络能够通过加深网络提高模型非线性能力[24],并且通过大量数据学习自动提取特征拟合出适宜模型,故非常适合应用于企业估值这类复杂的回归问题[25]。Khalifani 等[26]认为,卷积神经网络具有良好的准确度、可迁移性且能提高运算效率。
由此,本研究设计了一种轻量卷积神经网络TecNet,通过大量数据训练学习得到适用于科技型中小企业的估值模型,以期为企业估值提供新思路。
2 科技型中小企业价值评估指标构建
2.1 理论估值指标
在中国知网上以“企业价值评估指标”“企业估值”“企业评价体系”等关键词进行检索,得到相关文献资料,忽略重复文献,并经过对题目、关键词、摘要等部分要素进行人工筛查,保留符合研究主题的文献以备后续统计分析。其中,相关文献多为期刊或学位论文,所以其观点的科学性与专业性相对较高。相关文献中涉及的企业大多为高新技术企业、创业板企业、科技创业企业等,均对科技型中小企业具有可借鉴意义,故初步判定此类文献资料作为本研究的量化文献分析样本是有效的。
采用频次计数法统计样本文献中出现频数大于两次的评价指标。对于偶然出现的单一指标不做统计,默认这些指标为特定研究场景下的特有指标。其中,资产负债率、应收账款周转率等为出现频率排名前十的财务评价指标(见图1);非财务指标中,出现频次排在前10 位的分别是研发费用率、市场占有率等(见图2)。
图1 样本文献中有关财务指标出现频次及占比
图2 样本文献中有关非财务指标出现频次及占比
基于以上分析,可初步得出科技型中小企业价值评估相关文献的常用评价指标(如图3 所示)。
图3 样本文献中科技型中小企业价值评估常用指标
2.2 修正估值指标
为得到科技型中小企业投融资过程中实际关注的估值指标,邀请领域内相关专家访谈,并结合词频-逆文本频率指数(TF-IDF)关键词提取技术对访谈文本进行分析。在国泰安数据库中搜索采访与访谈的文本资料,同时以电话或现场的形式对专家就科技型中小企业估值问题进行访谈,咨询了科技型中小企业估值过程中的估值指标选取应参考哪些方面,并要求给出较为具体的估值指标或参考方向。参与此次访谈的专家共9 位,其中6 位为投资领域专家,均在科技型中小企业或其他类型企业投资方面具有丰富经验;3 位为企业高管,对本企业及行业的情况十分了解,且因其所在企业均属于科技型企业,故对科技型中小企业的发展也同样具有敏锐嗅觉与洞察力。投资专家相关从业经历为7~15 年,平均经历为12.0 年;企业高管相关经历为11~22 年,平均经历为16.3 年。由于访谈专家来自不同领域、拥有不同的行业背景,并均对科技型中小企业估值相关问题具有可借鉴经验,所以此次访谈结果较为可信。在寻求访谈专家同意后,对访谈全过程进行录音并记录,将访谈结果、来自国泰安库中的相关文本整理形成本访谈文本库,将文本输入TF-IDF 模型中,经过分词、去除停用词、计算词频与逆文档排序等一系列步骤后,得到文本的关键词及其得分,并输出该文本库对应的关键词文档。
本研究选择较为权威且便捷的Jieba 工具来进行分词,因为Jieba 是目前最优秀的中文分词库,其功能强大,使用简便,非常适用于中文的文本分析,且其自带的分词功能十分精准可信,内嵌了强大的文本库。采用的停用词表是目前较为全面的哈尔滨工业大学研制的停用词表,在其基础上加入一些对于本研究问题无用的词组。经过分词、过滤停用词后,计算词频得出词语的TF 值,与Jieba 自带的逆文档库中的IDF 值相乘,得到其关键词得分。最后输出的前20 个关键词如表1 所示。
表1 基于实践经验的科技型中小企业价值评估前20 个关键词
从表1 可看出,对于科技型中小企业的价值评估,受访者较为看重科技型中小企业的人才团队、研发创新能力、经营能力、发展能力、偿债能力以及盈利能力,尤其强调人才和研发相关指标,其中在研发方面则注重专利数、无形资产等知识产权指标;此外,在财务指标方面,企业的经营发展与负债相关的指标排名较为靠前,而盈利相关的指标较少。可见,基于科技型中小企业技术密集与智力资本价值高的特点,其高成长性、高风险性的特征使得投资者除了无形资产外更加关注其经营发展与偿债能力,而非其规模与盈利能力,这也是由于科技型中小企业大多规模小、市场占比小且通常初期并不盈利的缘故。
综上,初步提炼出科技型中小企业估值指标(见图4),其中圆圈大小代表某个词与其他词共同出现的频率大小。根据图4 的连线及共现频率可以看出,对科技型中小企业进行价值评估时,需将财务指标与非财务指标相结合。目前企业财务方面的估值较为成熟,多数受访者认为可以参考已成体系的财务指标,但不过分关注目前是否盈利,更看重企业的发展成长与经营能力,包括相关周转率和增长率;同时,重点关注资产负债率,因企业的偿债能力能够反映其应对风险的能力,盈利方面则仅更为关注回报率、利润率等。另外,多数受访者认为,能显示企业创新和研发能力的非财务指标为专利数、一些未公开的核心技术无形资产以及产品更新等;人才方面,对于以研发为重的科技型中小企业,需着重关注其硕士及以上比例,才能更好地衡量团队的质量。此外,员工是否接受了后续培训能够反映企业对于人才成长和培养的意识。
新课标指出,在小学语文教学过程中应该对学生各种能力的培养提出更高的重视,而阅读能力作为一种重要的基础能力,教师更应该给予重视。在实际的教学过程中,教师要重视学生阅读能力的培养,创建有趣的情境激发学生的阅读兴趣,面对小学生,情境教学是一种非常有效的手段,具备特殊的应用价值,尤其值得在小学语文教学中推广和运用。
图4 科技型中小企业价值评估关键词共现网络
在访谈过程中发现,受访者希望通过易量化的指标来进行企业估值,以更简便清晰地了解企业的估值结果,也更加便于数据的获取。由于传统的估值方法存在普适性较差、预测值不准确等弊端,对科技型中小企业来说不甚友好,且现实中的估值通常极大地受到人为主观因素影响,容易导致企业估值过高或过低的结果,对于企业融资和投资者投资有不利影响。另外,有受访者表示,希望得到对于企业较为关键的指标,并通过分析各个关键指标对企业价值的贡献来衡量其重要程度,这样有助于企业有针对性地进行提升。
通过访谈资料分析发现,实际评估中更关注科技型中小企业研发能力、团队素质等非财务指标,对于市场相关指标并不过分关注,且科技部、财政部、国家税务总局公布的《科技型中小企业评价办法》中主要聚焦于研发与人员的评价,故仅保留了研发、团队相关指标。由于越来越多的企业已将员工门槛定为本科学历,故对于科技型中小企业而言,本科以上比例并不能体现智力资本的质量,故设计了硕士以上比例指标。此外,受访者均表示文献分析得来的财务指标已形成较为完善的体系,故保留了这些财务指标,同时结合官方发布的财务评价指标进行修改。基于此,初步形成较为全面的科技型中小企业价值评估指标体系(见图5)。
图5 科技型中小企业价值评估指标
2.3 关键估值指标
结合德尔菲法对初步得到的估值指标进行筛选,构成本研究网络的关键输入指标。首先,通过首轮函询确定专家的基本信息,根据专家对此研究领域的熟悉程度对专家的专业性进行评估,并采纳或去除现评价指标体系中的部分指标。首轮共函询23 位专家,有19 位专家应答,应答率达到82.6%。其次,根据首轮的结果对指标体系进行问卷修正,并进行第2 轮函询。第2 轮共有19 位专家给予回复,响应率为100%。鉴于应答率在70%以上可认为专家响应度较高,因而本研究具有一定专家认可度与研究价值。由于指标体系在第2 轮函询就已达成一致,故仅进行两轮专家意见问询。经计算,专家权威度为0.81,大于0.70,因此判定所选择的专家组的意见较为可信。综合两轮结果得到与本研究问题相适应的科技型中小企业价值评估关键指标,如图6 所示。
图6 科技型中小企业价值评估关键指标
3 轻量级卷积神经网络估值模型
3.1 数据集建立
由于科技型中小企业多在创业板上市,因此在国泰安数据库以及同花顺官网进行相关数据收集。将导出的数据整理成Excel 表格并进行数据清洗,为减少无效值对模型的影响,将其删除之后进行人工复查。共使用1 000 组样本,其中800 组作为训练集,200 组作为测试集。本研究所收集的数据并不完全集中在某一区间,具有多样性,且存在一些极端数据,能更好地探究模型的鲁棒性。为降低原始数据之间因衡量尺度不一致对目标函数贡献程度所造成的影响,通过正态标准化来进行预处理以消除数据量纲。指标说明和计算方法如表2 所示。
表2 科技型中小企业价值评估指标说明和计算方法
3.2 网络设计
卷积神经网络的基本结构主要包括输入层、卷积层、激活层、批归一化层、池化层以及全连接层,在应用中,根据研究问题对以上各层进行个性化增减。对于深层的卷积神经网络来说,有时会出现加深网络模型性能反而下降的情况,而跳跃连接(shortcut connections)能够很好地解决这个问题。跳跃连接是指为防止梯度弥散与过拟合问题,人为地跳过一些层,并将一层的输出作为下一层的输入。网络中出现退化问题主要是因为在卷积神经网络的反向传播过程中需要更新梯度,而梯度会随着网络的加深逐渐消失,继而影响模型的学习性能,而跳跃连接通过跳过一些层,直接将原特征训练学习,有效避免了梯度减少到0 的情况,从而提升模型的训练速度与性能。此外,本研究并未设计池化层,而是用一个步长为2 的卷积层进行代替,因为其训练效果与使用一个步长为1 的卷积层和一个池化层是一样的,但却节省了运算量与参数量,提高了模型的训练效率。
本研究具体的轻量卷积神经网络(TecNet)设计如图7 所示。其中:(a)模块是2 层卷积核,由尺寸为3×1、步长为1 的卷积层连接一个批归一化层和ReLU 激活层组成,支线是跳跃连接;(b)模块是由一个步长为2 的卷积层连接一个批归一化层和ReLU 激活层,以及“卷积层+批归一化层+ReLU 激活层”的组合组成。最终,网络由两组3 个(a)模块与1 个(b)块串联后连接全局平均池化层与全连接层的17 层网络组成,预处理的输入数据经过本研究搭建的卷积神经网络可自动拟合出适用于科技型中小企业的估值模型,并输出估值结果与可视化结果。
图7 轻量卷积神经网络结构
3.3 模型训练
经过数据收集、数据清洗、标准化去量纲,得到最终的预处理数据集,通过K 折交叉验证避免数据集划分的偶然性,将训练集的800 组数据输入网络进行训练。迭代过程中的损失函数值如图8 所示。损失函数是用于衡量预测值与真值差距程度的函数,是反向传播算法中的目标函数,即网络参数更新优化的重要依据;其函数值代表预测与实际的误差,该值越小代表预测值与真值越相近,也就证明拟合模型的性能越优异、鲁棒性越强。由图8 可见,模型的收敛速度很快,10 代之前呈骤降状态,前期处于急速更新优化的状态;50 代以后逐渐趋于平稳,对于损失函数的更新有些波动,这是由于网络结合了余弦退火策略动态调整学习率、避免陷入局部最优;200 代后损失函数值已近于0,也就是说预测值与真值十分接近,其拟合效果较好,且精度较高,至此模型已初步建立。
图8 样本数据的模型训练结果
本研究的训练方案对于研究问题而言到后期已成功拟合,证明所设计的TecNet 是切实可行且有效的,能够根据研究问题与训练数据对估值模型进行自动拟合建立。图8 的结果说明模型训练效果较好,后期拟合平稳,未出现欠拟合现象。此时,TecNet已初步学习了训练集的大部分特征,并自动归纳出适用的估值模型,以待后续在测试集上验证其估值效果。
3.4 模型测试
TecNet 经过在训练集上的特征学习,已拟合出有效的估值模型,为验证该模型的科学性与实用性,将TecNet 模型应用于测试集观察其性能。测试在测试集上完成,样本容量为200 个,部分测试结果如图9 所示。从拟合曲线可以初步看出测试样本的预测值与真实值总体走向一致重合度较高,拟合效果较好,且未出现退化问题,故可推断模型拟合过程中并未发生过拟合现象,且具有优秀的泛化性,证明模型的预测与估值效果较好。
图9 样本数据测试拟合曲线
从部分测试结果能够看出(见表3),大部分样本的相对误差都保持在3%以下,而2020 与2021年预测结果的相对误差稍高;5 家样本企业中的4家均在2020 年获得最大预测误差,且2020 年误差偏高的现象普遍存在。推测是由于2019 年年末遭遇新冠病毒感染疫情,股民心理受到影响,也对股市造成一定冲击,对部分数据造成影响,导致误差有所波动,但整体误差仍在可接受范围内。
表3 样本数据的部分测试结果
由表4 可知,有85%的测试样本的相对误差在5%以内,90%测试样本的相对误差在10%以内,94%的样本相对误差在20%以内,相对误差的比例在可接受域内,达到了模型的预期要求;且测试集的平均相对误差仅为3.43%,说明TecNet 模型对于估值效果较好,在实际应用中具有一定意义。观察训练样本与测试样本的结果发现,测试结果与训练结果的相对误差差距不大,可以推断其并无欠拟合或过拟合现象发生,表明TecNet 模型适用于所研究的问题且科学有效,其估值结果能够作为科技型中小企业估值的客观参考。
表4 测试样本的误差分布
图10 呈现了TecNet 模型对10 家样本企业2017—2021 年度预测值与真实值间的相对误差。5年间相对估值误差大部分在3%以下,表现出前段较低、后段偏高但具回落趋势。其中,2017、2018年较低;2020、2021 年相对较高。推测受新冠病毒感染疫情影响,且其影响对于指标数据与市值而言存在一定滞后性,故企业估值有些波动;同时,有文献表明新冠病毒感染疫情确实对股市造成一定负向冲击,其中创业板因上市科技型企业多数具有规模小、市值低等特点故所受冲击相对较少,但市值不可避免受到影响。虽然由新冠病毒感染疫情导致的股市突发负向冲击这一短期事件对估值效果造成一定影响,但误差仍在可接受范围内,且所造成的影响在2021 年已逐渐削弱。可见,本研究建立的科技型中小企业估值模型具有很好的泛化能力,对于突发事件的影响有一定抵御能力,且由于使用的客观数据能够在很大程度上减少主观因素的影响,故估值结果对于衡量科技型中小企业价值有一定参考意义。
图10 基于TecNet 模型的样本企业的预测值与真实值误差走势
3.5 敏感度分析
卷积神经网络的局部连接在节省了网络参数并防止模型过拟合的同时,降低了模型的可解释性。换言之,卷积神经网络无法回溯原始指标对于最终输出结果的具体贡献值,输入与输出间无法用公式进行显示表示。故本研究进行敏感度分析,将原始的关键输入指标分别提升5%,来观察平均相对误差的变化值,以此分析哪些指标对于输出的贡献较大,并得到贡献排序,基于此为科技型中小企业的成长与发展提出有针对性的建议。随机抽取50 个样本,将其原始关键输入指标分别上浮5%,观察网络预测结果的平均相对误差变化情况(见图11)。
图11 样本企业估值的关键指标贡献程度
由图11 可知,硕士以上比例、研发投入占营业收入比例与专利数3 个指标对于科技型中小企业的估值最为敏感,浮动程度分别为16.51%、16.10%和11.87%;其次是研发人员数量占比与无形资产比率,浮动程度分别为9.98%和9.06%。其中,研发投入占营业收入比例、专利数与无形资产比率可代表企业的研发能力,硕士以上比例与研发人员占比能够在一定程度上衡量企业的智力资本。也就是说,在科技型中小企业估值过程中,研发能力与智力资本是尤为重要。因此,科技型中小企业若想更加有效地对自身价值进行提升,可以主要从研发能力与智力资本两个方向切入,即通过提升整体员工学历层次、增加硕士及以上人才比例、提高核心业务的研发人员占比、改善员工结构等来赋能智力资本;或是通过适当加大研发投入、提升无形资产占比,促进技术升级,掌握核心技术以提高企业研发能力,加快技术落地,从而形成自身的创新优势与发展路径,有效提升企业价值。
此外,在财务指标中,对科技型中小企业估值贡献较大的指标为偿债能力相关指标,其中资产负债率可体现企业的长期偿债能力,而流动比率与速动比率则能够反映其短期偿债能力。适当举债经营能够创造更多经济价值,尤其是对于科技型中小企业这类前期盈利较低的企业来说,可以适度负债;同时合理利用财务杠杆能够促进企业发展与健康成长,提升企业自身价值。对于科技型中小企业这类轻资产企业而言,其估值对于偿债能力较为敏感,企业可以通过预测结果,结合经营状况选择合适的负债占比,以及时规避风险并优化价值创造,同时通过灵活调整经营策略来提升自身价值。
4 结论
本研究围绕如何科学地对科技型中小企业估值的问题,采用文献分析、TF-IDF 与德尔菲法相结合的方法,构建了包括研发能力、团队素质、盈利能力、偿债能力、发展能力与经营能力在内的6 个方面14 项关键指标,结合深度学习方法设计轻量卷积神经网络结构,并基于大数据训练自动拟合得到适宜的估值模型;由模型输出的可视化结果可知,训练过程中模型的拟合呈向好趋势,且拟合速度较快,模型学习能力较强。在测试集上验证模型效果发现,模型预测的拟合曲线与真值重合度较高,平均相对误差仅为3.43%,且90%的样本相对误差在10%以下,达到模型可用的标准,故此模型十分适用于本研究的问题。从敏感度分析结果可知,硕士以上比例、研发投入占营业收入比例与专利数指标对科技型中小企业估值的贡献较大,因此,科技型中小企业的发展应紧密贴合其关键指标的作用程度,提高智力资本,促进技术创新升级;同时,加强相关数据的披露,以便今后进一步研发出更加科学有效的估值模型,以提高估值准确度,为融资提供客观参考,带动企业持续高质量发展。