基于生存分析模型的新疆公费师范生履约状况实证研究
2022-08-09杨晓蓉
杨晓蓉
(新疆师范大学 政法学院,新疆 乌鲁木齐 830017)
2021年8月国务院印发《“十四五”就业促进规划》,明确指出要“健全有利于更加充分更高质量就业的促进机制”,提出要加强对就业政策实施效果的跟踪调查评估,要“完善就业统计指标体系和调查统计方法,探索进行就业质量、就业稳定性等方面的分析。”,长期以来,西部地区人力资源分布不均、人才结构不合理、基层人才储备不足的短板一直未能得到有效改善,其就业促进政策从实施效果来看,在总体平稳的基础上依然存在一些问题和挑战。因此,有必要通过精准的量化分析方法,对就业促进政策的实施效果进行追踪评估,从而增强风险预警预判能力,提升形势感知、分析研判和科学决策水平[1]。
新疆维吾尔自治区作为“一带一路”核心区,基础教育师资短缺和分配不均是制约其农村地区教育水平提升的一个重要因素。为了有针对性地解决这一问题,政府陆续出台了一系列提升基础教育质量的专项就业促进政策。2010年,新疆维吾尔自治区在充分借鉴国家公费师范生政策的基础上,制定出台了《自治区对疆内师范生实行免费教育的管理办法》,正式开始实施新疆公费师范生教育政策,其目的是解决南疆四地州中小学熟练掌握并教授国家通用语言文字师资力量短缺的现实困难。随着公费师范生政策的深入实施,截止到2021年已有八届三万余名毕业生陆续走上基层教育工作岗位。越来越多的研究表明,新疆公费师范生教育政策成效与问题并存,特别是在政策推行初期,公费师范生的履约率并未达到预期,其就业稳定性需要做进一步的分析和调研。
关于履约率的研究,很多学者采用的是传统的Logistic 回归统计分析方法。在公费师范生履约率分析中,关注的重点在于毕业后在多长时间内有可能发生违约行为,即违约行为发生的概率随时间的变化及其影响因素,因此违约行为发生所经历的时间是一项非常重要的考察变量,Logistic 回归模型忽视了时间因素,所以并不适用于履约率研究。文章旨在通过生存分析模型,探究公费师范生履约率变化的关键时间节点以及影响公费师范生履约率的关键因素,为今后公费师范生政策的不断调整和完善提供科学参考。
1 生存分析模型的应用
关于公费师范生履约意愿和履约率的研究,吴浩[2]讨论了在博弈论模型的分析下,要提高公费师范生履约率,可以通过提高违约成本、提高农村基层教师的地位,以此来完善政策,降低违约率。周昊昊[3]等人基于扎根理论,通过半结构式访谈,运用Nvivo质性分析软件建立了职教师范生的从教意愿影响因素模型。更多的学者[4]采用的是传统的Logistic 回归统计分析方法,将是否履约的行为作为一个二分变量代入模型,探究影响履约意愿的主要因素[1-2]。然而,在样本数据中,违约行为不是同时发生的,很多样本在研究截止时还没观测到违约事件,不可避免地存在删失数据的情况。因此,传统的Logistic 回归模型未能将时间因素纳入其中,相对于生存分析模型来说适配性较低。
基于生存分析方法的生存函数可以反映出在每一个时间节点的履约率,揭示出Logistic 回归模型等传统统计学方法无法得到的动态特征,在本研究中的适配性较高。生存分析是一种动态的计量统计学分析方法,通常用来探究研究对象发生状态转变的现象和时间之间的关系以及两者之间存在的规律性。它将时间维度纳入到研究视野,定义因变量为个体持续处于“非转变”的时间,该理论方法主要是通过构建生存函数(概率密度函数),计算出各个时间点上的危险率,即研究对象保持状态的生存时间和它发生转变的可能性,分析各个不同因素对两者的影响程度[5]。生存分析模型的优点在于可以处理数据观察不完全的情况,如在研究截止时样本状态尚未发生转变。在生存分析统计中,通常分为三类:寿命表分析、Kaplan-Meier 分析、Cox风险回归模型方法。
生存分析模型最初被广泛应用于医学、生物学、药学等研究领域,分析具有临床意义的某些医学事件(死亡、治愈、发病等)发生的概率,并取得了大量丰硕成果。生存分析在工程科学领域被称为“可靠性分析”或者“故障时间分析”,模型通常被用于研究装置、器械、电路元件等设备发生故障的时间周期及其影响因素。近年来,经济学、社会学、人口统计学等领域也开始尝试利用生存分析法进行研究。经济学家一开始用生存分析法研究工人罢工持续的时间、失业持续的时间、企业破产的时间等,后来逐渐推广应用至研究金融风险控制和IPO[6]、农村劳动力迁移的影响因素、旅游业游客停留天数的影响因素[7]等。在教育学领域,近年来生存分析法开始逐渐被关注,主要用于研究学生毕业和就业问题、人才资源的培养成长等,例如,就业质量评价[8]、高层次人才成长研究[9]、网络高等教育的毕业时间预测[10]、待业时长与受教育程度的关系分析。
对本研究而言,违约行为的发生即生存状态变量,有两个状态:履约和违约,生存时间为公费师范生毕业以后的履约时长。同时,公费师范生作为行为个体,其个人特征、家庭背景、服务地类型等都会对违约事件的发生产生影响。文章应用Kaplan-Meier 分析法,估计不同单一变量对履约时长的生存分析函数,应用Cox风险回归分析评价多个影响因子对履约率生存函数分布的影响程度。
2 数据来源及样本描述统计分析
新疆公费师范生的培养分为两个阶段,第一阶段为2010—2011年,公费师范生政策推行的试行阶段,施行“定向”与“非定向”相结合的双轨制,招生规模较大,以非定向为主。第二个阶段为2012年至今,全部施行定向就业的公费师范生制度,省属重点师范大学招生规模收缩,公费师范生名额大量分派至地方师范类院校。本研究选取了新疆公费师范生政策实施的初始阶段,新疆某师范类院校四届共811 名已毕业本科层次定向公费师范生作为调查对象,结合初次就业统计数据,并抽选了其中131 人进行电话调研,掌握了这部分毕业生的实际履约情况。
第一阶段,2014—2015年毕业公费师范生共计2542人,大部分为非定向就业,仅有125人为定向就业公费师范生。生源质量较好,汉语言和民语言的文理科高考平均录取分数均高于一本录取分数线。其中女生占比较高,达到72.3%;汉语言学生占比58.1%.但令人遗憾的是,这一阶段培养的公费师范生虽然享受到了免除学费、住宿费的优惠政策,但毕业后较高比例的学生没有从事教师职业。根据初次就业率统计,仅有44.1%的毕业生选择从事中小学教育工作,且绝大多数集中在经济条件较好的城镇工作,深入农村基层教育一线的毕业生寥寥无几[11]。
第二阶段,2016—2017 年共计毕业公费师范生760人,全部为定向就业公费师范生。其中女生占比较高,达到74.9%;母语为非汉语的少数民族学生占比73%.根据初次就业率统计,两届毕业生履约率均达到99%以上。2016 届毕业公费师范生实际在岗履约率为86.73%,履约学生服务地在农村的比例为19.14%;2017届毕业公费师范生实际在岗履约率为98.0%,履约学生服务地在农村的比例为18.66%.
如表1 所示,2014—2017 届定向公费师范生实际履约率呈现逐级下降趋势,且降幅明显;公费师范毕业生总人数中,女生占比较高,达到74%,男生占比较低,仅有26%,履约率差异不大;母语为民语言的学生占比68.43%,且履约情况较为稳定,违约率较低,仅有2.34%;理工和文史类公费师范毕业生是主体,艺术类学生占比较小,仅有3.82%,但违约率明显偏高,达到25.81%;农村户籍和城市户籍的学生比例基本相同,农村户籍的毕业生履约率明显高于城市户籍学生,城市户籍学生的违约率是农村学生的约两倍;毕业生的定向服务地分配呈现纺锤形分布,主体为县城和乡镇,占比为69.2%,两头分别为城市和农村,能够进入到农村教育一线的学生人数仅占总人数的15.8%;服务地和生源地不一致的毕业生的违约率远高于服务地和生源地一致的学生,服务地与生源地距离越远,违约学生比例越高。
表1 新疆某高校2014-2017届毕业公费师范生履约情况描述统计
3 Kaplan-Meier分析法测算及结果分析
Kaplan-Meier 分析法也叫单因素生存分析法,做法是选取某一个协变量,比较其分组因素对生存时间的影响。对于研究中的第n个时间点tn,履约生存概率可以计算为:
其中,f(tn-1)指的是在tn-1时间点的履约生存函数,dn指的是在时间点tn违约发生的事件数,rn指的是快要到时间点tn时,未发生违约行为的人数。
对于违约时间的分布也可以用密度函数的形式来表示:
文章在描述统计的基础上,用Kaplan-Meier 分析法,从性别、年级、母语类别、专业、户籍类型、定向服务地类型、是否生源地、生源地与服务地距离等8 个方面,分别构建公费师范生履约时长的生存分析函数。对于本研究而言,生存风险率即履约率越低,也就意味着违约率越高。
以上8 个类别不同级别的生存分析函数显著性检验如表2 所示,性别在公费师范生履约时长上的差异性不显著,其余7个类别,年级、母语类别、专业、户籍类型、定向服务地类型、是否生源地、生源地与服务地距离的Log Rank和Breslow检验,P值均小于0.05,表示7类指标在履约时长上均有显著性差异。
表2 公费师范生不同类别生存分析的显著性检验
履约时长的生存分析曲线可以直观地反映出各观测指标在不同分类上的履约概率变化,如图1所示。
图1 公费师范生不同性别、年级、母语类别、专业、户籍类型、定向服务地类型、是否生源地、生源地与服务地距离的生存分析函数
根据不同观测指标的履约生存分析函数图可知,已毕业公费师范生的履约率会随着时间的增长不断下降,具体到每一类指标,分析结果如下:
(1)不同性别的履约率差异不大,但随着履约时长的增加,前半段差异并不显著,在履约时长的后半段,在第24个月前后出现相对明显的下降,男生的履约率降幅明显大于女生。
(2)不同年级的履约率存在明显差异,从2017 级至2014 级依次递减,2014 级履约率最低。各年级的履约率随履约时长的变化均在第一个月,即刚毕业时段出现明显下降,之后波动不大。其中2014、2015级学生在履约约6个月、24个月、30个月左右出现小幅下降。
(3)母语类别不同的学生履约率差异明显,母语为民语言的学生履约率一直较高,且稳定性较好,不随时间的变化波动。母语为汉语言的学生履约率随着时间的变化不断下降,在刚毕业和第30 个月左右,履约率出现较为明显的降幅。
(4)在专业分类方面,理工类和文史类专业学生的履约率相对较高,且就业稳定性较好,艺术类学生在刚毕业阶段就出现履约率明显降幅。由于本研究只针对定向就业公费师范生,2012年以前仅有理工类定向就业师范生,因此文史和艺术类公费师范生存在数据删失。
(5)不同户籍类型的履约率差异明显,农村户籍的学生履约率高且稳定性好,城市户籍的学生履约率较低,且随着时间的变化不断降低,在第1个月和第30个月有明显的降幅。
(6)不同定向服务地类型对履约率的差异明显,服务地类型为城市的学生履约稳定性较高,类型为乡镇和农村的履约率相对略低,服务地类型为县城的履约率最低。这一情况与实际认知不一致,通常认为服务地为农村的履约率应低于其他地区,结合访谈发现,由于很多违约行为发生在刚毕业,毕业即违约,学生仅知晓负责服务地分配的县教育局,不清楚自己的具体服务地,因此违约样本的服务地分类集中为县城,但并不代表其真实服务地,存在信息认定不准确的情况。
(7)服务地是否为生源地对履约率影响明显,服务地为生源地的学生履约率较高,且稳定性较好,服务地为非生源地的学生履约率相对较低,且随着履约时长的增加不断降低,在第1个月和第30个月降幅明显。
(8)为了更好地考察服务地对履约率的影响,本研究将服务地与生源地的距离划分为四个层级,从生存分析函数图可以明显看出,两者之间的距离越近,履约率越高,且随着时间迁移的稳定性越好;两者之间的距离越远,履约率越低,随着履约时间的增长,稳定性越差。
4 Cox比例风险回归法的测算及结果分析
Cox 比例风险回归法是一种多因素生存分析方法,可用于多种因素的生存率比较及其影响因素分析。在本研究中,Cox比例风险回归模型的基本形式为:在某个履约时间下,样本出现t个违约行为的风险。第i个影响因素Xi使履约率风险函数从h0(t)增加exp(βiXi),成为h0(t) × exp(βiXi),多个因素同时影响的模型为:
其中,h(t,X)表示个体在协变量X(X=X1,X2,……Xi)的作用下,在时刻t的风险函数。X1,X2,……Xi表示影响因素,β1、β2……βi表示回归系数。
基于Kaplan-Meier 分析法,本研究继续将性别、年级、母语类别、专业、户籍类型、定向服务地类型、是否生源地、生源地与服务地距离等8 类指标作为考察变量,都列为协变量。如表3 所示,其中X1表示性别(男、女),X2表示年级(2014—2017 届),X3表示母语类别(汉语言、民语言),X4表示专业分类(文史、理工、艺术),X5表示户籍(农村户口,城市户口),X6表示定向服务类型(城市、县城、乡镇、农村),X7表示服务地与生源地是否一致(是、否),X8表示服务地与生源地距离(按照交通时间,将距离按照由近及远划分为4个分段)。
表3 新疆已毕业公费师范生履约率影响因素生存分析模型因变量和自变量赋值
利用SPSS 23.0 软件进行生存分析Cox 比例风险回归,时间为履约时长,状态为履约0 或违约1,将选定的8个指标作为协变量,带入模型,使用强迫进入变量法(enter),分析随着履约时长的变化,各指标对公费师范生履约生存风险率的影响。模型分析结果如下:
由图2可知,在多重因素的影响下,随着履约时长的增加,新疆公费师范生的履约概率不断下降,违约行为的发生概率增加,但相对来说变化较小,总体降幅不大。截止到第30个月,总体履约率在95%以上。说明在毕业生履约率方面,公费师范生政策表现出较好的效果,履约稳定性较强。
图2 新疆高校已毕业公费师范生履约生存分析函数
同时,履约率的降低并非想象中的那样呈平滑曲线逐渐过渡,而是表现出明显的阶梯状下降。履约率下降第一个显著陡坡出现在履约时长的第1个月,表明有较大比例的违约行为集中发生在刚毕业时段;之后以半年为单位,逐渐下降,这一情况应该是受到学校教学周期的影响;第二个略显著的陡坡出现在履约时长的第30个月,即履约两年半左右,可观测到相对较多的违约行为。两个节点中,毕业时间段是违约行为高发的重要节点,一旦履约上岗之后,违约发生的概率就大幅下降。
从表4 可知,各协变量对新疆已毕业公费师范生履约概率预测的回归模型的总体显著性P=0.000,说明模型适配度非常理想。
表4 新疆高校已毕业公费师范生履约率的Cox比例风险回归
从各协变量的显著性指标来看,除了性别、生源地与服务地距离两项P 值未达到0.05 显著水平,其余变量均达到显著水平。
在年级方面,以2017 级为参照组,2014、2015、2016 级的t值分别为16.264、13.051、17.118,P 值均小于0.001,说明相对于参照组,这三个年级的履约率存在显著差异。根据胜算比Exp(B)值可知,2014 级公费师范生的违约概率是2017 级学生的10.558倍,2015 级公费师范生的违约概率是2017 级学生的7.543倍,2016级公费师范生的违约概率是2017级学生的5.247倍。
在母语类别方面,B值为负,t值为11.544,在0.001水平显著,胜算比Exp(B)为0.258,母语为民语言学生的违约概率是母语为汉语言学生的0.258倍,也可以表示为母语为汉语言学生的违约概率是母语为民语言学生的3.876倍。
在专业方面,以艺术体育专业作为参照组,文史专业、理工专业的履约率与之对比均存在显著差异,t值分别为5.689、6.427,均在0.05 水平上显著,胜算比Exp(B)为0.359、0.292,即艺术体育类专业学生的违约概率是文史类专业学生的2.786倍,是理工类学生的3.425倍。
在户籍类型方面,农村户籍与城市户籍学生的履约率存在显著差异,t值为4.544,在0.05水平上显著,胜算比Exp(B)为1.75,即城市户籍学生的违约概率是农村户籍学生的1.75倍。
在定向服务地类型方面,以定向服务地为城市作为参照组,定向服务地为农村、乡镇、县城的学生履约率与之相比均存在显著差异,显著性均达到0.05水平,胜算比Exp(B)值表明,定向服务地为农村的学生违约概率是城市的4.262倍,定向服务地为乡镇的学生违约概率是城市的2.832倍,定向服务地为县城的学生违约概率是城市的2.957倍。
5 结论
通过对新疆高校已毕业公费师范生的履约情况进行实证调研,并运用生存分析模型,对实际履约情况的影响因素进行了分析,可以得出如下结论:
(1)新疆公费师范生的履约率虽然随着时长的增加而不断下降,但相对来说降幅不大,总体履约率在95%以上。说明在毕业生履约率方面,公费师范生政策表现出了较好的实施效果,就业稳定性较强。
(2)通过Kaplan-Meier 分析结果来看,随着履约时长的增加,性别在履约率上的差异不显著,但年级、母语类别、专业分类、定向服务地类型、户籍类型、是否生源地、生源地与服务地之间的距离等7项观测指标,履约率差异显著。民语言学生履约率优于汉语言,理工和文史类专业履约率优于艺术体育类专业,农村户籍的毕业生履约率优于城市户籍,服务地在城市的毕业生履约率优于乡、镇和农村,生源地定向就业履约率优于非生源地,生源地与服务地距离越远履约率越低。
(3)通常认为毕业生违约行为大部分发生在上岗后,且随着时间的增长,违约率逐年增高。通过Cox 比例风险回归法分析发现,违约率虽然随时间的增长逐渐降低,但相对来说变化幅度较小。公费师范生违约行为的发生集中在刚毕业阶段,一旦履约上岗之后,出现违约行为的比例大幅下降。因此提高公费师范生履约率的关键阶段在大学四年级,要注重强化学生的诚信意识,有针对性地对易违约群体出台激励机制,提高学生履约意愿,实现政策效果最大化。
综上,影响新疆公费师范生就业稳定性的因素较为复杂,需要在今后的研究中深入探索,通过更加精准的量化分析方法,对政策实施效果进行调查研究,不断增强就业反馈机制的科学性,为新时期高质量就业促进政策的不断完善提出合理化建议。