数理统计学在数学建模中的应用探索

2018-07-31石金贵李毅罗妮君

好日子（下旬） 2018年5期

石金贵李毅罗妮君

【摘要】随着大数据挖掘技术不断发展，面临的数据量越来越复杂，统计学显得更加重要，它是开发现代工程技术、信息技术、软件开发、卫星通信技术等的重要工具。本文采用纯数据，应用统计变异系数数据构造判断矩阵，及值具有高度一致满意性，求得最大特征向量作为指标权重，再对原始数据作奇异值分解，并将奇异值作为另一权重向量。组合这两种权重作为叠加权重，结合综合模型进行排名，实验取得较好的结果。

【关键词】统计学变异系数据；矩阵奇异值分解；综合模型

评价方法在社会生活的各行各业中广泛存在，如药物成份对总体药性效果，各色素对颜色的影响，生态环境质量优劣，项目经济效益评价，NBA球类竞赛分析与评价等体系。常常涉及多个影响因素指标值，这类问题的解决是将多个指标通过一定的方法处理汇总，得到一个综合指标值，从这个指标值反映被评价问题的整体情况。随着计算机技术和大数据挖掘技术不断日新月异的发展，面对多个复杂的影响指标，使得评价体系系统日趋复杂，迫切要求进行多学科综合评价，例如用统计学与大数据挖掘技术、计算机编程技术、代数学中的矩阵计算等相结合进行分析和评价。这样就更能使非定性的、模糊不清的、难以量化的问题得到系统性强的清晰结果。

本文对文献[1]中NBA赛程排序进行评价，利用新的方法，用变异系数构造互反判断矩阵，求出互反判断矩阵的最大特征值的特征向量作为加权系数。将原始数据个数据作为数据矩阵，通过奇异值分解得到个奇异值，每个奇异值作为另一个加权分量。将两个加权系数进行加权得到叠加加权系数。通过建立综合模型，进行指标值排序，与文献[ 1 ]的模型结果进行对比分析。

1.评价赛程的因素分析

建立恰当的评价指标体系，是整个评价方法工作的最基本的关键一步，要建立有效合理赛程评价体系，要求问题的影响因子构成的指标必须完整有效，它的选取直接影响综合评价的准确性、合理性。

本文利用文献[1]中的的6个指标进行分析，各个指标之间的相互影响具有许多不确定的模糊性，层次分析法提供了处理这类问题的一种有效的方法[2]，它是将复杂问题的各个影响指标按照支配关系主次分层，形成一定的隶属关系，并用一定的方法确定各个影响指标的权重，通过建立综合评价模型，在软件中进行统计试验。表略

记上述表1中的30个球队的6个影响指标构成原始数据单位化矩阵为。

2.用数理统计学数据构造两两成对比较互反判断矩阵

问题的影响因子指标的重要程度是一个相对比较，具有一定的模糊性，现实数据不能完全刻画它们的相对重要规律，所以建立合理的互反判断比较矩阵至关重要，互反判断比较矩阵是决策者针对方案给出的关于两两影响指标比较的一种偏好信息形式，在比较时带有强烈的主观性、经验性，常常导致不同的专家确定的值不相同。

本文用矩阵的每列的变异系数，作相互比值构造判断矩阵。由于变异系数能反映待评价对象之间的差异性[3]，变异系数之间的差异就能刻画其相对差异性程度，变异系数公式为

（1）

（其中表示第指标的标准差，表示第指标的平均值，），由表1的数据，经计算得矩阵每列的变异系数构成的向量为

利用变异系数构造的互反判断矩阵公式以及对应的判断矩阵分别为

（2）

通过矩阵H的特征值分解，求出判断矩阵的最大特征值，对应的特征向量并归一化作为权重向量，即

一致性检验。用一致性检验确定原始判断矩阵内在逻辑关系是否合理。一致性检验影响因子指标值为

由于判断矩阵的最大特征值依赖于，最大特征值比维数大的越多，判断矩阵的不一致性越严重，用判断矩阵最大特征值对应的特征向量作为被比较因素对上层某指标的权向量，其不一致程度就越大，产生的判断误差越大。反之，最大特征值比维数大的越小，产生的误差越小，用的权向量就越准确。由计算可知，，说明判断矩阵具有完全一致性，比文献[1]中的较好。

同时，随机一致性比值为

当维数时，，将数据代入得，文献[1]的，结果表明，此时的互反判断矩阵具有高度的满意一致性。

3.利用奇异值构造权重系数

奇异值分解法的几何意义是任意两个垂直方向的单位向量，在矩阵作用下进行拉伸，拉伸后形成的两个单位向量任然保持垂直，拉伸的长度就为奇异值的大小，奇异值的大小就为每个元素的叠加之和的大小，因此，可以作为客观权重向量。

根据文献[4]矩阵奇异值分解的基本概念，对于给定的任意实数矩阵，存在正交矩阵和正交矩阵，使得矩阵可以分解为（其中），由表1的数据，经计算得矩阵的奇异值分解得到

将每个对角元看作的每列影响指标的权重大小，即对角元记作权向量并单位化得

4.一级指标向量和两个二级指标向量构成交错叠加权重

本文采用由变异系数构造判断矩阵的最大特征值对应的特征向量和原始数据单位化矩阵的奇异值构成的分量权重，再综合标准差构成的一级指标权重进行交错组合，最终形成叠加权重。

取一级指标球队因素和媒体因素两个影响因子的权重为，并取，則叠加权重计算式为

（3）

将的值代入（3）式，代入计算得综合叠加权重为

（4）

5.TOPSIS综合模型：对30个球队进行效应型指标排名

第一步，利用综合权重系数加权规一化矩阵，即

（5）

第二步，确定效益型指标的正负理想值，即

（6）

第三步，正负理想距离为

（7）

第四步，绩效指标值的确定，公式为

（8）

将（4）代入（5）～（8）式，可以得绩效指标值，并进行排序，对变异系数法与文献[1]的最大离差法的负理想值进行对比，表略

从表2的对比结果，有18个排序顺序完全相同，对其余12个排序不同的队进行比较，交错顺序间隔为1的有6个队，交错间隔为2的2个队，交错间隔为3的2个队，交错间隔为5的1个队，交错间隔为6的1个队。因此，两种方法排序效果相当。

6.结束语

本文综合了文献[1]与[2]、[3]、[4]的研究方法，提出了用数理统计学方法构造互反判断矩阵的方法，求此矩阵的最大特征值的特征向量作为主观权重。通过求值，得出本文的方法比文献[1]构造的主观权重向量较好，通过奇异值分解，用奇异值作为权重分量，并且和主观权重向量组合，最终获得叠加权重，并且建立TOPSIS综合模型进行绩效排名，结果表明，使用本文的方法也较好。

参考文献：

[1]王积建.全国大学生数学建模竞赛试题研究[M].国防工业出版社，2015.5

[2]王冬琳，王妍.综合评价方法在NBA赛程分析中的应用[J].数学的实践与认识，2009.8

[3]安树庭，彭焱秋，戴宛平.对使用主成分进行绩效指标值排名的讨论[J].数学建模及其应用.2017.3

[4]姜艳萍，樊治平.基于判断矩阵的决策理论与方法[M].科学出版社.2008.12

[5]James W.Demmel著.王国荣译.应用数值线性代数[M].人民邮电出版社.2007.6

[6]卓金武.MATLAB在数学建模中的应用（第二版）[M].北京航空航天大学出版社.2014.9

作者简介：

李毅（1969-）女，副教授，主要研究课程论。

罗妮君（1963-）女，副教授，主要研究高等数学教育。

通讯作者：

石金贵（1985-）男，硕士，讲师，主要研究数值代数、数学建模应用、数理统计学、大数据挖掘处理。

好日子（下旬）

2018年5期

数理统计学在数学建模中的应用探索

杂志排行

好日子（下旬）的其它文章