APP下载

基于改进PCA的高新企业核心技术创新与专业技能提升数据分析研究

2023-07-12张玮

粘接 2023年6期
关键词:随机森林信息熵主成分分析

张玮

摘 要:针对企业创新创业技能提升影响因素多,各因素相关性强,传统主成分分析不能够很好地提取主要因素的问题。通过随机森林模型获得最佳特征组合,采用信息熵对传统主成分分析进行改进。对比主成分分析和改进主成分分析结果,改进主成分分析的前3个主成分包含了超过95%的信息量,而传统主成分分析的前7个主成分所包含的信息量仅为91.01%。结合主成分分析结果指出有效提升化工企业创新创业技能必须强化员工技能培训,注重企校合作,打造创新创业平台,这对化工企业转型升级提供了数据支撑。

关键词:随机森林;主成分分析;信息熵;企业

中图分类号:TP391;TQ050.8 文献标志码:A文章编号:1001-5922(2023)06-0166-05

Research on improving innovation and entrepreneurship skills of enterprises based on improved PCA

ZHANG Wei

(Jiangsu Provincial High & New Technology Innovation Centre,Nanjing 210008,China)

Abstract:The traditional principal component analysis cannot effectively extract the main factors that affect the improvement of innovation and entrepreneurship skills in enterprises due to the multiple factors and strong correlation among them.The best feature combination is obtained through random forest model,and the traditional principal component analysis is improved by information entropy.Comparing the results of principal component analysis and improved principal component analysis,the first three principal components of improved principal component analysis contain over 95% information,while the first seven principal components of traditional principal component analysis only contain 91.01% information.Based on the results of principal component analysis,it is pointed out that effectively improving the innovation and entrepreneurship skills of chemical enterprises requires strengthening employee skill training,emphasizing enterprise school cooperation,and creating innovation and entrepreneurship platforms.This provides data support for the transformation and upgrading of chemical enterprises.

Key words:random forest;principal component analysis;information entropy;enterprise

环境污染、能源危机使得国民的环保意识不断增强,化工企业传统经营模式必须实施改革,通过提升企业的创新创业技能,确保自身市场竞争力的持续提升[1]。影响化工企业创新创业技能提升的因素是多方面的,提升企业创新创业技能必须抓取主要因素。主成分分析(PCA)在处理复杂影响因素且各种影响因素之间具有一定相关性的问题中具有突出的优势,在许多领域得到了广泛的应用[2]。构建了激光麦克风语音信号特征提取的PCA模型,有效降低了计算成本和时间,并指出由第1主成分重构的语音信号最为清晰[3]。采用PCA构建了CFRP-钛合金叠层材料制孔刀具健康指标,其健康指标具有良好单调性、趋势性,能够有效反应制孔刀具加工过程的健康状态,达到提升孔加工精度和加工质量的目的[4]。为解决风电齿轮箱故障诊断特征指标之间存在的相互干扰、非线性分类困难问题,采用PCA对数据降维处理,并结合支持向量机实现了对风电齿轮箱故障高精度分类的目的[5]。采用PCA对小麦籽粒、面粉、面团品质指标进行分析,有效筛选出综合性状优良的品种,实现了对优质强筋小麦品质的改良[6]。考虑到影响企业创新创业技能提升的因素是十分复杂的,且各因素之间存在相关性。对PCA进行改进,获得影响企业创新创业技能提升的主要因素,从而达到提升企业创新创业技能的目的。

1 化工企业创新创业技能影响指标体系

化工企业创新创业技能直接影响到企业的竞争力,影响企业创新创业技能的因素是多方面的,同时各种影响因素之间往往存在一定的相关性。通过对创新创业技能的分析,构建影响指标体系,如图1所示。

由图1可知,从创新创业意识、创新创业环境、创新创业水平、创新创业制度4个角度构建了包含16个指标的企业创新创业技能影响体系。很明显,16个指标中部分指标之间存在明显的相关性,如主观意愿和内在动力。只有具有比较强的主观意愿,才能够激发企业创新创业的内在动力,但是2者之間也存在差异。采取PCA来消除16个指标之间的相关性,减少影响企业创新创业技能提升的指标维度[7]。

2 化工企业创新创业技能主因素提取模型

2.1 主成分分析

主成分分析的关键是降维,作为多元统计方法,其在处于具有比较强相关性的多指标问题中具有良好的效果[8]。影响化工企业创新创业技能提升的指标是多方面的,同时不同的指标之间存在相关性且不同指标对企业创新创业技能提升的影响也存在比较大的差别。通过PCA来获取信息量大的主成分,确保所筛选出的评价指标之间不相关,大大减少数据分析的工作量[9]。定义为化工企业创新创业技能影响指标集合,对各影响指标进行标准化处理消除评价指标数据之间存在的量纲差异,即

3.3 结果分析

分别采用PCA和信息熵改进PCA的特征信息融合模型进行分析,结果如表1所示。

由表1可知,采用主成分分析,第1主成分特征值为1.236,方差占总方差的比重为26.45%,前7项主成分在总方差中的比重超过90%。采用信息熵改进PCA的特征信息融合模型,第1主成分特征值为3.56,前3项主成分在总方差中的比重超过90%。由此可见,通过计算随机森林模型对应特征重要性指标,以指标筛选出的最佳特征组合使得算法的效率大大提升,通过前3个主成分就可以包含原有信息超过95%的信息量。获取主成分载荷矩阵[20],结果如表2所示。

由表2可知,对第1主成分影响比较大的是创新创业能力和创新创业环境;对第2主成分影响比较大的是创新创业定位和创新创业制度;对第3主成分影响比较大的是创新创业主观意识。

3.4 企业创新创业技能提升建议

通过对化工企业创新创业技能提升影响因素的主成分分析可知,提升创新创业技能的关键在于创新创业能力的提升与创新创业环境的改善。为了有效提升化工企业创新创业技能,需要做到3个方面的内容。

3.4.1 强化员工技能培训

化工企业创新创业技能提升的关键在于员工技能的提升,必须强化对员工的技能培训。员工只有掌握了相应的创新创业技能,才能够更好地结合企业现有的资源实施创新创业,打造符合市场需求的高质量产品。构建对企业员工的完善培训体系,使得员工的个人发展和企业的发展之间实现双赢。图3为构建的员工技能培训体系。

3.4.2 注重企校技术合作

企校合作是企业在发展的过程中有效借助专业高校的力量来促进企业创新创业技能的提升,高校的发展离不开企业,同样企业的高质量发展也离不开高校。通过注重企校合作将高校先进的技术应用于企业实际生产中,提升企业产品的市场竞争力。充分发挥企校合作在提升化工企业创新创业技能方面所发挥的重要作用,具体如图4所示。

3.4.3 打造创新创业平台

打造创新创业平台能够有效改善化工企业创新创业环境,从而达到提升企业创新创业技能的目的。企业要加大对创新创业的支持力度,在整个企业内部形成人人讲创新创业的良好氛围,对创新创业过程中存在的错误给予最大程度的宽容,激发员工的创新创业潜能。

4 结语

创新创业技能的提升是化工企业转型升级,更好迎合社会和市场发展需求的关键。构建了包含16个指标的企业创新创业技能影响指标体系,采用信息熵改进主成分分析,得到了对化工企业创新创业技能影响大的主成分。通过和传统主成分分析结果对比,改进主成分分析模型能够通过比较少的主成分来获取原始数据中所包含有的超过95%的信息量。为提升化工企业创新创业技能,要重点强化员工技能培训,注重企校合作,打造创新创业平台,这对化工企业实施转型升级,实现绿色、可持续发展提供了参考。

【参考文献】

[1]屈永斌.面向化工企业的管理系统构建及实现[J].粘接,2021,47(7):141-144.

[2]陈艳杰.HPLC法测定银杏叶提取物中9种小分子有机酸类含量研究[J].粘接,2021,48(12):39-43.

[3]孙学明,张大华,周志全,等.基于主成分分析的激光麦克风的语音信号提取[J].激光与红外,2022,52(12):1761-1767.

[4]王贤锋,王守文,张烘州,等.基于主成分分析的CFRP—钛合金叠层材料制孔刀具健康指标构建[J].工具技术,2022,56(11):128-132.

[5]黄宇斐,石新发,贺石中,等.一种基于主成分分析与支持向量机的风电齿轮箱故障诊断方法[J].热能动力工程,2022,37(10):175-181.

[6]李晓丽,姜兰芳,马小飞,等.基于主成分分析的强筋小麦加工品质综合评价[J].麦类作物学报,2022,42(12):1473-1483.

[7]张贱根,刘均华,刘知远,等.基于相关性和主成分分析的上犹名优綠茶品质评价[J].食品安全质量检测学报,2023,14(3):285-292.

[8]刘青,张浩然,尚英强,等.基于主成分分析法的高压服役电缆主绝缘老化状态评估[J].绝缘材料,2022,55(11):56-62.

[9]郑自强,李凌,乔宇,等.基于主成分分析的目标热红外伪装效果评价研究[J].激光与红外,2023,53(3):431-438.

[10]孙强,王丽艳,荆瑞勇,等.不同品种亚麻籽8种生物活性物质含量及其主成分分析[J].食品与机械,2022,38(9):40-45.

[11]滑小赞,程滨,赵瑞芬,等.基于主成分分析的山西省油桃主产区土壤肥力评价[J].北方园艺,2023,524(5):77-84.

[12]陈伟,陈绍安,罗婷,等.思茅松产脂量相关生态因子的主成分分析[J].西部林业科学,2023,52(1):27-33.

[13]梁良,杜雨馨,杨子建.基于主成分分析的有机化合物吸收光谱识别方法[J].激光杂志,2022,43(9):183-187.

[14]邓智广,谭振鹏.基于机器学习的智能电网调度控制系统在线健康度评价研究[J].粘接,2021,48(12):158-161.

[15]陈薛辉,冯燕,钱权.差分隐私保护的随机森林算法及在钢材料上的应用[J].工程科学学报,2023,45(7):1194-1204.

[16]李顺勇,许晓丽.基于信息熵加权的多视图子空间聚类算法[J].陕西科技大学学报,2023,41(2):207-214.

[17]杨军,张敏敏.利用模型相似性的三维模型簇协同分割[J].光学精密工程,2021,29(10):2504-2516.

[18]王小刚,闫光辉,周宁.多阶邻接分布熵下的复杂网络节点相似性分析方法[J].控制理论与应用,2021,38(6):739-747.

[19]潘婷婷,张枫,邢昆明,等.不同储层相对渗透率曲线归一化方法评价[J].大庆石油地质与开发,2016,35(3):78-82.

[20]闫春晓,周聪,王德华,等.基于主成分分析玫瑰露酒感官特征与偏好性关系[J].食品研究与开发,2023,44(1):83-88.

收稿日期:2023-01-20;修回日期:2023-04-20

作者简介:张 玮(1981-),男,硕士,副研究员,研究方向:科技管理;E-mail:zhweizq_zh@sina.com。

基金项目:江苏省高新技术创业服务中心自立项目(项目编号:CY202105)。

引文格式:张 玮.基于改进PCA的高新企业核心技术创新与专业技能提升数据分析研究[J].粘接,2023,50(6):166-170.

猜你喜欢

随机森林信息熵主成分分析
基于信息熵可信度的测试点选择方法研究
基于信息熵的实验教学量化研究
一种基于信息熵的雷达动态自适应选择跟踪方法
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于随机森林算法的飞机发动机故障诊断方法的研究