基于ID3决策树算法的大学生体能测试数据管理系统设计
2022-10-04刘晨
刘 晨
(安徽建筑大学 公共管理学院,安徽 合肥 230601)
高校学生体质状况直接影响人才的培养,对国家未来的发展也有重要影响。借助决策树算法来管理大学生体能测试数据,能够深度分析不同体测项目中大学生体质健康检测成绩,能够更好地指导大学生体能测试训练。构建大学生体能测试数据管理系统,结合计算机信息化管理和优化分类算法,进行大学生体能测试数据分类管理和信息融合存储,优化大学生体能测试数据管理,对提高大学生体能测试数据管理能力方面具有重要意义[1],相关的大学生体能测试数据管理系统设计研究受到人们的极大关注。
大学生体能测试数据管理系统是建立在对体测数据的优化调度和信息融合的基础上,建立大学生体能测试数据结构,通过分类算法和决策树寻优算法,进行大学生体能测试数据管理[2,3]。目前已有相关领域学者对大学生体能测试数据管理系统进行了设计,(曲泉颖等,2019)提出了基于模糊信息融合的大学生体能测试数据管理方法,结合特征提取和信息融合,进行大学生体能测试数据管理[4]。(于光华,2018)提出基于关联特征分析的大学生体能测试数据管理模型,结合关联特征检测和相关特征提取,进行大学生体能测试数据管理和数据库设计[5]。
本文为提高大学生体能测试数据管理能力,提出基于ID3决策树算法的大学生体能测试数据管理方法。构建大学生体能测试数据挖掘及特征提取模型,在ID3决策树设计大学生体能测试数据的分支体系,进行学生体能测试数据管理水平评价的熵权指标参数分析,结合软件交叉编译设计,完成大学生体能测试数据管理系统的设计,并通过仿真测试分析,验证了本文方法在提高大学生体能测试数据管理水平方面的优越性能。
一、研究方法
1.大学生体能测试数据挖掘
为了实现大学生体能测试数据管理,基于大学体育部主管课程老师所管理的大学生体测成绩,构建大学生体能测试数据挖掘及特征提取模型,保证数据资料的精确性。采用决策树寻优方法进行大学生体能测试数据的特征分类检测[6,7],决策树技术需通过离散化模式来处理最终体测数据。
设计大学生体能测试数据的分布维数为N×m维,得到大学生体能测试数据的量化评价空间分布矩阵X:
(1)
考虑到大学生体能测试数据的分布关联系数J(m),J(N),通过对第i个节点存储的大学生体能测试数据进行加权融合,得到学生体能测试数据管理水平评价的模糊度参数:
δxi+1=J(m),J(N)δxi
(2)
式中,δ表示模糊特征向量,获取大学生体能测试数据的存储空间,对存储空间进行优化调度,实现学生体能测试数据管理的水平量化跟踪[8],得到大学生体能测试数据的标准量化参数,用xi∈X,i∈1,2,…,N表示,求得大学生体能测试数据量化参数的关联系数表示为:
(3)
2.大学生体能测试数据信息融合
利用训练集建立大学生体能测试数据管理决策树模型[9],根据数据特征构建大学生体能测试数据的相似度分布集为:
(4)
在ID3决策树模型下对大学生体能测试数据的属性分类,提取大学生体能测试数据的粗糙集和相似度特征量,对于大学生体能测试数据管理水平评价集[10],通过标准化调度进行数据的分类决策,采用零阶补偿和信息融合方法,通过互信息相关算法进行大学生体能测试数据管理和资源优化调度[11]。建立大学生体能测试数据的决策指标函数为:
(5)
其中,p(xi,j)表示相似度,根据学生体能测试数据特征分析,进行量化分解,通过标准的参考矩阵分解,得到大学生体能测试数据量化特征分解值为:
(6)
其中,大学生体能测试数据分布的嵌入维为m,时延参数为τ。通过子空间聚类和信息融合,提取大学生体能测试数据的关联特征解,通过模糊度测试,进行大学生体能测试数据的优化挖掘和分类管理[12]。
3.大学生体能测试数据管理优化
决策树算法作为一种分类器,能够针对无规则和无序的样本进行类别标号,并可以对决策树分类规则进行倒推。借助决策树技术开展成绩数据研究活动,能够更加直观化、全面化呈现数据研究结果。在ID3决策树算法下,小型决策树相对于大决策树的分类性能更优,通过ID3决策树算法来对大学生体能测试数据管理优化,能够显著改善数据管理效率。
(1)ID3决策树算法
在ID3决策树中设计大学生体能测试数据的分支体系,进行大学生体能测试数据管理水平评价的熵权指标参数分析,决策树模型如图1所示。
图1 大学生体能测试数据管理的ID3决策树模型
在图1所示的大学生体能测试数据管理的ID3决策树模型中,通过综合决策和特征判决,得到判决式为:
(7)
上述公式中,fx(xi,j),fθ(xi,j),gx(xi,j)和gθ(xi,j)分别表示大学生体能测试数据管理水平评价的相似度系数,基于ID3决策树进行数据分类寻优,得到ID3决策树的关联函数C(τ)定义为:
(8)
上式表示t和t+τ时刻大学生体能测试数据量化管理的模糊度系数,根据标准量化分布式融合,进行ID3决策树寻优控制,得到大学生体能测试数据管理的三阶量化参数:
(9)
(10)
根据大学生体能测试数据的ID3决策树融合结果,进行主特征建模,建立底层数据库进行信息融合和决策判断。构建大学生体能测试数据管理的ID3决策树模型,能够更好的迎合高校管理工作需求,大大提高对大学生体测数据的管理效率。
(2)数据分类提取及优化存储
基于上述构建的大学生体能测试数据管理的ID3决策树模型,开展数据分类提取、数据优化存储等相关操作。依托决策树模型进行大学生体能测试数据管理水平评价的熵权指标参数分析,提取学生体能测试数据管理的熵权特征量,具体表示如下:
(11)
通过对大学生体能测试数据的熵特征进行决策树分叉加权管理,得到大学生体能测试数据存储的空间分布函数,表示为:
(12)
在tn+1时刻和tn时刻分别对大学生体能测试数据进行信息融合,能够得到大学生体能测试数据管理系统存储节点k及候选节点j的差异性,通过条件概率分析,可以得知学生体能测试数据的条件概率密度特征,如下述公式所示:
(13)
(14)
(15)
通过上式实现对大学生体能测试数据的分类管理,显著改善了数据管理效率。
二、结果与分析
为验证基于ID3决策树算法的大学生体能测试数据管理系统的有效性,设计仿真对比实验。以文献[4]方法、文献[5]方法作为实验对比方法,在Matlab Simulink 软件下,进行大学生体能测试数据管理系统的仿真实验,验证本研究中ID3决策树算法及两个文献算法的分类准确性。本研究采集2000名大学生的体能测试数据作为研究对象,数据总量共为500MB,采集时间为2020年第一季度,体能项目主要有大学生短跑、长跑、立定跳远以及球类等相关运动数据,大学生体能测试数据详细分布见表1。
表1 大学生体能测试数据分布
结合上述数据研究样本,开展大学生体能测试数据管理工作,能够得到所有数据的测试集分布,如图2所示。
图2 大学生体能数据测试集
对上述大学生体能测试数据进行进一步的优化管理和自适应调度,可以得到大学生体能测试数据管理优化输出结果,如图3所示。
图3 大学生体能测试数据管理优化输出
分析图3得知,基于文献[4]和[5]中的对比方法进行大学生体能测试数据管理的输出波动较大,而本研究所提出的ID3决策树算法,在进行大学生体能测试数据管理的输出稳定性较好,且寻优能力也较强,显著提高了大学生体能测试数据的分类管理和信息融合水平。上述实验结果表明ID3决策树算法对的大学生体能测试数据的管理能力优于文献[4]和[5]的算法,具有较高的实用价值。
在此基础上,可以借助ID3决策树算法的大学生体能测试数据管理系统,测试不同方法对大学生体能测试数据分类管理的准确性,得到实验对比结果如图4所示。
分析图4可知,采用文献[4]方法得到的大学生体能测试数据分类准确性为74.5%,采用文献[5]方法得到的大学生体能测试数据分类准确性为70.5%,而采用本文ID3决策树算法得到的大学生体能测试数据分类准确性为95.5%。由此可见,本文所设计系统能够实现对大学生体能测试数据的准确分类。
图4 大学生体能测试数据管理优化输出
分别设置系统迭代次数为100、200、300、400,测试不同迭代次数下,测试ID3决策树算法下大学生体能测试数据管理系统在管理500MB大学生体能测试数据过程中的时间开销,得到对比结果见表2。
表2 时间开销测试(单位:ms)
分析表2得知,采用文献[4]方法得到的时间开销平均值为84ms,采用[5]方法得到的时间开销平均值为69.75ms,采用本文方法得到的时间开销平均值为3.25ms,由此可见,本文方法进行大学生体能测试数据管理的时间开销较短。本文系统对大学生体能测试数据管理的输出稳定性较好,数据分类准确性较好,且管理耗时较短,证明了所设计系统的可靠性。
三、结语
本文提出基于ID3决策树算法的大学生体能测试数据管理系统,采用决策树寻优方法进行大学生体能测试数据的特征分类检测,提取大学生体能测试数据的粗糙集和相似度特征量,通过标准的参考矩阵分解进行数据特征分解。根据大学生体能测试数据的ID3决策树融合结果,进行主特征建模,建立底层数据库进行信息融合和数据优化管理。通过实验分析能够得出结论如下:
(1)本文所设计的基于ID3决策树算法的大学生体能测试数据管理系统对大学生体能测试数据管理的输出稳定性较好,寻优能力较强,能够有效提升体测数据的分类管理及信息融合水平。
(2)所设计系统能够实现对大学生体能测试数据的准确分类,提升了系统管理性能。
(3)所设计系统在进行大学生体能测试数据管理时的耗时较短,管理效率也较好。