APP下载

基于“精准帮扶”的高校学生贫困定级模型构建

2018-07-30

镇江高专学报 2018年3期
关键词:精准帮扶曲率特征值

曹 奇

(常州纺织服装职业技术学院 创意学院,江苏 常州 213164)

目前对高校资助政策进行评估的主要是相关政府部门,学生很少有机会参与政策的评估,其资助政策决策缺少外部的制约,相关的资助政策评估机制缺乏相应的技术支持[1]。目前高校受资助学生贫困程度决策主要以定性为主,辅之以定量分析。定性分析研究更加偏向于主观的价值判断,由于没有运用数理统计分析方法,缺乏客观性与科学性,容易造成高校资助部门无法从量化的角度了解学生资助政策实施的实际情况,不利于学生资助政策评估工作的正常开展。

高校资助政策对家庭贫困学生能够享受到公平的受教育权和均等的个人发展权具有重要意义[2-3]。但在实施过程中,存在对部分真正困难学生的资助落实不到位,一些学生的贫困等级定得过高,部分失信学生助学贷款拖欠严重等问题,这些问题直接影响高校助学政策的有效实施。

受资助学生库涉及的贫困指标变量很多,并且变量之间相关性明显,所包含的信息有所重叠[4]。主成分分析方法可以对原始变量进行降维,抓住事物的主要矛盾,在繁杂冗余的数据中尽可能多地提取重要真实的学生贫困信息[5-6],选择若干个有意义的主成分进行序列重建,降低冗余信息干扰,使问题得到简化。本文利用常州纺织服装职业技术学院创意学院400名受资助学生库中的贫困信息,采用主成分分析的方法进行系统建模,建立该院学生贫困程度综合评估模型,为学院资助系统提供决策支持。

1 主成分分析模型与方法

1.1 主成分分析原理

主成分分析又称主分量分析(Principal Component Analysis,PCA),是一种通过降低维度的技术使多个具有一定相关性的变量重新组合成为几个互不相关的主成分(综合变量)的多元统计方法[7]。这些主成分包含了原始变量中大部分的有效信息,通常表示为原始变量的线性组合。

1.2 主成分分析步骤

1) 将一个样本量为n,指标个数为p的原始数据进行标准化得到矩阵[8-9]

(1)

2) 将标准化矩阵X进行时间正交函数展开,得到协方差阵

(2)

3) 确定与选择主成分。S是对称矩阵且主对角线为同一常数(Toeplitz矩阵)[10],其全体特征值

λ1≥λ2≥…≥λp≥0,

(3)

其中{λ1,λ2,…λm}所对应的第1,第2,…,第m(m≤p)个主成分,计算其主成分贡献率

(3)

累计贡献率

(4)

一般取累计贡献率达到85%—95%的特征值所对应的主成分。

4) 根据选择的主成分个数对样本数据重新进行综合汇总

Fi=A1X1+A2X2+…+AiXi(i=1,2,…,p),

(5)

其中Ai表示λi所对应的特征向量,

Ai=(a1i,a2i,…,aii)T(i=1,2,…,p),

Xi表示为样本行向量,

Xi=(xi1,xi2,…,xip) (i=1,2,…,p)。

5) 主成分分析用于系统评估,以主成分Fi的贡献率Ti为权,利用主成分的表达式F1,F2,…,Fp进行线性组合,构造综合评价函数,即

(6)

其中Y成为评价指数,可以对系统计算出来的Yi(i≤n)排序,从而进行有效的分类划级。

2 对受资助学生贫困程度分析

以笔者所在的创意学院受资助学生库中筛选的包含大一、大二、大三年级的405名学生数据进行贫困程度模型分析,用其中400名学生的资助数据进行基础建模,用建立的贫困程度诊断模型对新入库的5位学生贫困程度进行评价分析。

2.1 贫困程度指标选取

学生受资助库中存放大量数据,但大部分数据是定性描述,而且定量记录的数据很少,这些数据很难进行统计分析。要准确评估受资助学生贫困程度,其指标的建立至关重要:

1) 选取的贫困程度测评指标必须是学生、教师、家长认为重要的,从前期的调查问卷中可以准确选择大家认为最关键、最重要的测评指标。

2) 部分测评指标必须能够控制,若某些指标学生在某一时间段还不能够完成或者能够继续改进的,则暂时不采用,比如大一学生刚入库时的义工时间完成率指标、操行等级、成绩指标等。

3) 选择的贫困程度指标必须是可以测量的,最后对400名学生建立的贫困程度测评结果是量化的值,因此选择的贫困指标必须是可以进行四则运算、统计分析的。

4) 选取的贫困指标必须具有代表性,防止部分指标出现强相关造成数据冗余。

基于上面4条原则,在深度网络调查、学生问卷调查、家长抽访与师生进行座谈等定性研究中得到以下8类指标:家庭月收入X1,家庭成员状况X2,家庭基本属性X3,家庭贫困原因X4,年资助金额X5,学生月消费X6,证明材料X7,成绩排名X8。将选择的贫困测评指标影响程度分为5级,从毫无影响到影响极重分别记为1,2,3,4,5分,即不贫困1分、轻度2分、中度3分、重度4分、极重5分。对这8类指标根据实际情况给予量化,可以消除量纲对指标变量的影响,具体量化指标见表1。

表1 受资助学生贫困程度量化表

2.2 对量化数据主成分分析

(7)

对学院400名受资助学生8类测评指标进行贫困程度量化,并将量化数据进行标准化处理,可以计算出8类贫困指标之间的相关系数矩阵R。

加权相关系数的绝对值从0到1,相关性从弱到强,从相关系数分布来看,除家庭基本属性X3与证明材料X7相关系数为0.746外,其他贫困指标之间相关系数的绝对值都小于0.5,说明该贫困指标体系中选取的指标较好、重复性较少、相关性较低、独立性较高。

对测评指标数据进行主成分分析,可以得到测评数据相关系数矩阵的各主成分所对应的特征值、主成分贡献率以及累积贡献率(见表2)。

表2 受资助学生贫困数据主成分分析提取分析表

2.3 有效特征值的选取

特征值选取常用的方法有两种,分别为观察法则和经验法则。观察法则:观察特征值序列的变化,选择排在前面较大的特征值为有效特征值,其余的置零;经验法则:主成分的特征值尽量大于1,主成分的累计贡献率在85%~95%之间[7-9]。

事实上,在库学生贫困程度受各种贫困指标的影响,单纯从特征值的变化上很难区分真实的贫困信息与冗余信息,但由于真实的贫困信息与冗余信息的统计性质不同,特征值的变化趋势不同,即会出现拐点,表现在特征值曲率上会出现峰值[10]。根据这一特点,基于特征值曲率谱峰值选取重建有效特征值的方法,表示利用特征值曲率谱最大峰值点选择有效特征值个数:若特征值曲线在曲率谱最大峰值点k处是凸出来的,则有效特征值个数为k;如果特征值曲线在k处是凹进去的,则有效特征值的个数为k-1(见图1)。

图1 受资助学生贫困测评指标曲率谱全景和特征值直方图

图1为学院受资助学生贫困测评指标曲率谱全景和特征值直方图,直方图中第5,第6特征值所占比例接近,在无法进行有效特征值区分情况下,根据曲率谱峰值对特征值曲线拐点的反映状况发现:

1) 曲率谱在前面6个奇异值时存在峰值且谱值较大,呈现出的特征值曲线上下波动明显。

2) 在第5个特征值上存在曲率谱峰值点,特征值曲线是凹进去的。故有效主成分为4。

2.4 贫困程度模型重建

前4个特征值累积贡献率达到74%,说明前4个主成分基本包括了全部贫困指标的有效信息,表3为取前4个特征值计算的受资助学生贫困数据的特征向量。

表3 受资助学生贫困数据特征向量分布

前4个主成分分量模型表达式

其中i=1,2,3,4。

第一主成分表达式中X3,X7指标起主要作用,可以把第一主成分看成是受资助学生家庭固有贫困程度的综合指标。

第二主成分表达式中X1,X2,X5指标影响大且均衡,X4,X8指标所占比例较大,可以把第二主成分看成是受资助学生品学兼优评价的重要指标。

第三主成分表达式中X1,X5指标影响较大,可以把第三主成分看成是受资助学生家庭总体收入的重要指标。

第四主成分表达式中X6指标起最大作用,可以把第四主成分看成是受资助学生消费的重要指标。

2.5 贫困程度综合评估模型建立

利用主成分模型表达式F1,F2,F3,F4进行组合,以方差贡献率作为权重可以建立学院受资助学生贫困程度综合评价模型:

利用此贫困程度模型可以对学生的贫困指数Y进行计算,并且进行排名,名次越高,说明学生贫困程度越严重。

3 贫困程度评估模型应用

对新入库的5名学生进行贫困程度分析,确定相应的贫困等级与资助等级。表4为学院新入库5名学生贫困测评指标量化情况,为保护学生隐私,表中不是真实姓名。利用贫困程度综合评估模型对5名学生贫困指数Y进行计算,藏族女孩卓玛贫困程度综合测评分Y最高,在总贫困生库中排在前10%,最高贫困等级Ⅰ级;柳荣、刘欢贫困程度综合测评排在2,3名,在总贫困生库中排在20%~50%之间,贫困等级Ⅱ级;五茂、爱平贫困程度综合测评排在4,5名,在总贫困生库中排在50%之后,贫困等级Ⅲ级。

表4 新入库5名学生贫困测评指标量化情况(名字已化名)

4 结束语

利用学院400名受资助学生库中的贫困信息,采用主成分分析的方法进行系统建模,建立学院学生贫困程度综合评估模型,归纳结论如下:

1) 结合相关系数矩阵构建了助学帮扶决策支持8类贫困测评指标的5级量化标准和量化分析模型。

2) 采用主成分分析方法建立学生贫困程度模型,在定性的指标数据中加入了定量分析,对量化指标进行了降维,有效降低了人为评定贫困等级的失误。

3) 主成分分析中有效特征值的选择一直是研究的难点,本文利用特征值曲率谱最大峰值点选择有效特征值个数,有效保留了受资助学生真实的贫困信息,减少通过观察或者经验模型带入冗余信息。

4) 建立的贫困程度综合评估模型可以为学院资助系统提供决策支持,对学生奖助学金发放、学费减免、生源地贷款、临时困难补助以及对新入库的学生进行贫困程度定级具有积极作用,有利于高校对困难学生进行“精准帮扶”。

猜你喜欢

精准帮扶曲率特征值
一类双曲平均曲率流的对称与整体解
带平均曲率算子的离散混合边值问题凸解的存在性
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
基于一类特殊特征值集的扩散算子逆谱问题
单圈图关联矩阵的特征值
面向复杂曲率变化的智能车路径跟踪控制
精准帮扶视角下贫困女大学生就业指导问题研究
关于精准扶贫的研究综述
浅谈山区小学教育均衡发展