基于Bootstrapped-Malmquist的高校办学效率动态研究
2021-05-20谢鑫陈春晓
谢鑫, 陈春晓
(湖南大学工商管理学院,长沙410082)
一、引 言
教育绩效评价在国际高等教育评估中逐渐普遍,一方面是来自政府财政拨款紧缩的压力,另一方面则是教育全球化带来的生源竞争压力,各国各高校不得不考虑提升办学效率,使教育资源的投入和产出水平最优。美国大学以市场导向为主,特别突出“绩效管理”,欧洲各国政府根据大学办学绩效评估等级进行拨款。我国高等教育在近二十年得到快速发展,尤其是国家重点建设的一批高校,大量教育资源的投入在促进高校发展的同时也使其面临社会问责,而对各高校进行绩效评价是回应社会问责的主要方式之一。
绩效评价方法主要包括数理统计法、模糊综合评价法、生产函数法、最小二乘回归(Ordinary Least Square,OLS)、随机前沿分析(Stochastic Frontier Analysis,SFA)和数据包络分析(Data Envelopment Analysis,DEA)等。其中参数法适合进行计量回归,如OLS方法是先依据经济学原理构建出一定的计量模型,再对相关参数进行估计的方法;SFA则是利用随机前沿生产函数进行效率估计的方法,需要事先确定生产函数的具体形式,属于前沿面参数方法。DEA则属于前沿面非参数方法,无须预先假定生产函数的具体形式,也无需对参数进行估计,是应用数学规划模型评价具有多投入多产出的决策单元(Decision Making Unit,DMU)间的相对有效性,并根据对各个DMU的评价结果判断该决策单元是否为相对有效,即判断该DMU是否位于生产可能集的“生产前沿面上”。
由于高校办学具有多投入多产出的特征,因此DEA方法在评价高校办学及科研绩效中得到广泛应用。多数研究主要以我国部属高校和省际高校为研究对象,研究DEA效率变化[1-2]和Malmquist指数及其分解指数的动态变化[3],或结合聚类分析[4]、主成分分析[5]等方法,对高校在一定年限内的科研活动效率发展趋势和成因进行分析,或基于超效率DEA模型[6]、SBM模型[7]、联合DEA模型[8]、三阶段DEA模型[9]、Tobit回归模型[10],为提高我国高等院校办学科研效率提供参考。
既有研究虽已作出很多贡献,但多为短期效率研究,主要比较同期各校办学效率的高低,或比较短期跨期效率的动态变化,很少考虑长期办学效率的动态变化情况,尤其是对十年以上的研究较少。虽有少量学者基于Malmquist指数对高校中长期效率的动态变化情况进行分析,但并未进行统计验证,这类研究仅列出样本高校的Malmquist指数,技术效率变化及技术变化的动态变化趋势,并没有检验这些指标对样本数据随机误差的敏感性,且对其结果无法提供统计显著检验。
为填补已有研究的不足,基于上述分析,本文选取60所教育部直属高校在2004—2016年间的统计数据进行办学效率动态分析,运用Bootstrap方法获得Malmquist及其分解指数的置信区间,排除样本数据噪声引起的结论偏差的干扰,分析我国高校效率动态变化的统计显著性。
二、研究方法
(一)Malmquist指数
基于DEA方法的非参数距离函数Malmquist指数计算给定高校在两个时期的生产率变化,即全要素生产率(Total Factor Productivity,TFP),基于DEA方法的Malmquist生产率指数由Fare等[11-12]提出,使用DEA方法,可以直接根据投入和产出指标计算Malmquist生产率指数。
式 (1)中,i=1,…,n表示被评价的决策单元(Decision Making Unit,DMU);x表示投入;y表示产出;mi表示第i所高校从t到t+1期的TFP变化情况;dit(xt,yt)代表第t期的产出距离函数;dti+1(xt+1,yt+1)代表第t+1期的产出距离函数;dti+1(xt,yt)代表以第t+1期n个决策单元的投入产出衡量第t期某一投入产出(xt,yt)的参考合集时的产出距离函数;dti(xt+1,yt+1)代表以第t期n个决策单元的投入产出衡量第t+1期某一投入产出(xt+1,yt+1)的参考合集时的产出距离函数。在产出导向下,mi(t,t+1)>1说明高校i从t到t+1期的TFP得到提升,mi(t,t+1)<1说明TFP下降,例如,mi(2015,2016)=1.12意味着该校的TFP从2015到2016年提升了12%,如果mi(t,t+1)=1,则表明该校的TFP在相邻的两个时期内不变。
采用Fare[11]的方法将Malmquist指数进行分解,进一步分析影响TFP变动的原因:
式(2)中,技术效率变化(εi)反应DMU的相对技术效率变化(即决策单元是接近还是远离有效前沿面);技术变化(τi)表示当所有决策单元作为一个整体时,生产前沿面的移动情况。εi(t,t+1)的值大于(小于)1时,表示技术效率变化从t到t+1期得到提升(下降),τi(t,t+1)的值大于(小于)1时,表示技术变化在t到t+1期间实现进步(后退),如果εi(t,t+1)和τi(t,t+1)均无改变(值等于1),则mi(t,t+1)等于1,TFP不发生改变。
(二)Bootstrap方法
Bootstrap方法是由Efron[13-14]提出的一种非参数统计方法,在分析效率及生产率对样本抽样变化的敏感性问题上受到广泛认可,并得到诸多应用[15-17]。当对观测样本的数据生成过程(Data Generating Process,DGP)知之甚少时,Bootstrap方法具有强大的实用性,该方法应用到高等教育领域能大幅提升估计的精度。同时,根据Wilson等[17-18]的研究,Bootstrap方法也可被用来估计效率得分的置信区间。
传统DEA方法在小样本情况下,TFP的变动情况受样本选取差异影响较大,因此,采用Bootstrap方法对计算结果进行纠偏,获得纠偏后的m、ε、τ及其置信区间。Bootstrap方法通过对已有样本进行有放回的抽样,得到大量新样本及相应的统计量,用新样本来估计总体的分布规律,从而对总体特征进行统计推断,并验证TFP、技术效率变化和技术变化的统计显著性,以获得对估计量的正确估计。
三、实证分析
(一)数据、指标模型
文中60所教育部直属高校2004—2016年校级宏观数据来源于《教育部直属高校基本情况统计资料汇编》、Web of Science数据库、国家社科基金项目数据库、国家自然科学基金资助项目统计。
高校的投入是多方面的,主要归结为财力投入和人力投入两部分。财力投入包含教育经费、教育事业经费、研究经费、固定资产、图书等;人力投入包含专任教师、行政人员、教辅人员、工勤人员、科技活动人员、研究与发展人员、研究与发展全时人员、在校博士生等。由于DEA方法要求指标具有代表性与差异性,而总经费与各部分经费间具有高度正相关性①,教职工总数与各类人员数间也具有高度正相关性②,因此,选取总经费作为衡量各校财力的投入指标,选取教职工总数作为衡量各校人力资源的投入指标。
人才培养、科研和社会服务是现代高校的三大职能。首先考虑高校的教学和科研产出,选取毕业生总数作为教学产出指标,选取中文出版的专著和科技著作数、Web of Science上的英文论文数作为科研的产出指标。构建的基准指标模型(模型1)由两个投入指标(经费,教职工)和三个产出指标(毕业生、论文数、专著数)构成。
基准指标模型虽能客观反映高校的办学效率,但只包含了衡量教学和科研产出的数量指标,未考虑衡量高校办学效率的质量因素,因此,在质量指标可获得性的基础上,选取学科规范化的引文影响力 (Category Normalized Citation Impact,CNCI)作为论文质量指标,选取各校获得的基金数作为科研水平质量指标,最终由两个投入指标(经费,教职工)和五个产出指标(毕业生、论文数、专著数、CNCI、基金)构成质量指标模型(模型2)。
社会服务作为高校的三大职能之一,如在校生进行的青年志愿者活动、毕业生的社会贡献、教师的专业讲座、科普文化宣传等,均体现出高校社会服务职能内容的多样性、形式的复杂性及影响的无形性,使得难以用确切的指标对高校的社会服务职能进行量化,这也是众多研究只关注高校教学与科研产出的根本原因。为衡量高校的社会服务能力,尝试引入专利授予数与咨询报告数之和,构建综合指标模型(模型3),包含两个投入指标(经费,教职工)和六个产出指标(毕业生、论文数、专著数、CNCI、基金、专利与咨询报告)。指标模型如表1所列。
表1 指标模型
(二)基本模型结果
采用规模报酬不变的产出导向模型,先计算初始TFP(m)、技术效率变化(ε)和技术变化(τ),再用Bootstrap方法进行验证,重复抽样2000次。将纠偏后的TFP和初始TFP进行对比,发现在本研究样本下,初始值与纠偏值间的差异十分微小①,纠偏后的值提高了均方误 (Mean Square Error,MSE)②,Simar and Wilson[18]也得到相似结果,因此,不报告纠偏后的结果,而是采用公式(2)中的初始TFP(非Bootstrapped)及其分解值:m,ε和τ,仍参考Bootstrap获得的置信区间来评估TFP、技术效率变化和技术变化的统计意义。
表2列出TFP显著的指标数及均值,统计出TFP显著大于1的指标数,此类高校的TFP在相邻时期内得到显著提升,并求出显著提升的指标数占总指标数的比值,对技术效率变化和技术变化进行类似的计算。
表2 60所高校2004—2016年年均TFP、技术效率变化、技术变化趋势
由表2可知,2004—2016年60所高校共计720个TFP值中,有494个值显著不等于1,因此,样本中69%的高校TFP值具有统计显著性,且每年约有3.7%的提升,不考虑TFP值的显著性时,年均提升幅度只有2.5%。325个TFP值显著大于1,占指标总数的45%。近半数高校在13年间的TFP值显著提升,说明我国高校办学效率整体得到提升。
当不考虑统计显著性时,TFP的两个分解指数:技术效率变化(ε)和技术变化(τ)的年均增幅分别为1.8%和0.9%,考虑指标的显著性时,有283个技术效率变化指标显著不等于1228个技术变化指标显著不等于1,技术效率变化和技术变化的提升幅度均大于不考虑显著性时的提升幅度,年均增幅分别为3.8%和2.1%。同时,23%的高校的技术效率变化得到显著提升,而只有17%的高校在技术变化上得到显著提升。
表3列出各年TFP、技术效率变化和技术变化的显著性情况。在2004—2016年中,每年至少有33所高校的TFP值具有统计显著性,即在5%的显著性水平下,显著不等于1。此类高校的TFP值要么大于1,TFP进步;要么小于1,TFP退步。每年有16~43所高校的TFP显著提升,且呈现无规律波动;除2010—2011年外,其余11个时期中均有超半数高校的TFP值得到显著提升,样本中的高校办学绩效整体实现快速发展。
技术效率变化和技术变化的统计显著高校数也呈现无规律波动,但技术效率变化中统计显著及显著提升的高校数多于技术变化,说明技术效率变化对TFP的贡献大于技术变化,各高校均在努力提升自身办学效率来接近有效前沿面。
我国高等教育在2000年左右开始进行院校大合并,于2005年左右各校规模才基本稳定,合并使得各高校强强联合,通过整合资源快速提升办学效益,推动我国高等教育办学水平整体提升,所以,技术变化显著提升的高校数在2005—2006年达到50所,为高峰期,但通过合并扩建获得的高效率不具有持久性,2006—2011年连续5年显著提升的高校数不足2所,在2006—2007年、2007—2008年和2010—2011年这3个时期中没有一所高校在技术变化上显著提升。
图1给出各指标的年均均值,除2008—2009年、2010—2011年和2015—2016年三个非连续时期的TFP值有所退步外,其余时期TFP值均得到提升。2004—2016年,TFP值年均提升2.4%,技术效率变化年均提升1.7%,技术变化年均提升0.8%。由数据得出,技术效率进步对TFP提升的贡献大于技术进步,同时,技术退步是TFP退步的主要原因,如在TFP退步的三个时期中,虽然技术效率变化均大于1,但技术变化均小于1。
表3 各年TFP、技术效率变化、技术变化显著数与显著提升数
图1 TFP、技术效率变化、技术变化年均均值(年内算术平均,年间几何平均)
(三)高校类别差异性检验
60所样本高校包含22所综合类高校、21所理工类高校和17所其他类高校(农林、师范、艺术、财经、政法),为验证综合、理工和其他类高校TFP值的差异性,对三类高校进行非参数Kruskal-Wallis检验,见表4。2004—2016年,在5%的显著性水平下,综合、理工和其他类高校之间均不存在显著差异。分年度来看,除2012—2013年外,综合与理工类高校的TFP值均不存在显著差异;另外,除2004—2005年及2012—2013年外,综合和其他类高校的TFP值均不存在显著差异;值得注意的是,理工和其他类高校的TFP值在所有年份均不存在显著差异。
样本高校中,包含32所“985”高校和28所“211”高校,“985”高校的教育资源投入高于“211”高校。实证研究表明,“985”高校在2004—2016年的TFP均值为1.029,高于“211”高校(TFP=1.022),同时,检验“985”和“211”高校TFP值是否具有差异性,如表4所示。虽然两类高校的TFP值在整个时期内不存在显著差异,但分年度时,则有4个时期的TFP值具有显著差异,尤其是2012—2013年,在1%的显著性水平下仍具有显著差异(“985”类高校TFP=1.077,“211”类高校TFP=0.995),说明资源投入量对办学生产率有一定影响,更多的资源投入对促进办学效率的提升具有决定作用。
(四)稳健性检验及拓展模型结果
基于模型1,引入质量指标CNCI和基金数构建模型2,在此基础上,再引入社会服务指标专利与咨询报告数构建模型3,三个模型由共同的投入和不同的产出构成。计算不同指标模型下的TFP及其分解指数,如表5所列。从表5中可见,三个模型两两间在生产率、技术效率变化和技术变化三个指数上均呈现显著正相关,验证了基准模型指标选取及结论的稳健性。
表4 不同类型高校Kruskal-Wallis检验结果
表5 不同模型TFP、技术效率变化、技术变化的相关性分析
同时,从相关系数可知,模型1与模型2在三个指数上的相关系数小于模型2与模型3,前者相关系数在0.6~0.7间,后者相关系数大于0.9。模型1的产出指标中只考虑了数量指标,模型2中则考虑了学术论文的质量(CNCI)及学术竞争力(基金数)。虽然衡量办学绩效的质量指标难以度量及获取,多数研究更多关注数量指标,但当高校办学的数量指标累积到一定程度时,考虑质量指标才是未来研究的突破点。模型3与模型2的高相关性是由于选取的衡量高校社会服务能力的指标(专利与咨询报告)也是学术产出的一部分,使得指标的区分度较小,在此只是做了初步探索,对高校社会服务能力的衡量,有待进一步研究。
表6对不同模型的TFP、技术效率变化和技术变化进行比较,从表6中看出,其均值的差异很小。2004—2016年模型1、模型2和模型3的生产率年均分别提升2.5%,2.2%,2.1%,技术变化年均提升1.8%,1.1%,1.2%。当考虑指标的统计显著性时,三个指标的年均提升的幅度在不同模型中均有所提升,且技术效率变化对生产率提升的贡献大于技术变化,不考虑指标显著性时也得出相似结论。
表6 不同模型TFP、技术效率变化、技术变化比较
为消除时间对投入产出指标的影响(如:高校产出具有滞后性,当年的投入不一定能在当年获得相应产出),将基准模型的投入产出指标以两年为一个周期取其均值:t1=2004—2005,t2=2005—2006,…,t12=2015—2016,然后,计算基于两年平均的TFP,即在时期t2/t1,t3/t2,…,t12/t11内生产率的变化情况。虽然生产率、技术效率变化和技术变化的年均提升幅度均小于基准模型,但其结果的趋势与基准模型基本吻合,即无论是否考虑统计显著性,技术效率变化对提升生产率的贡献大于技术变化。
四、结论及建议
(一)研究结论
通过研究60所教育部直属高校2004—2016年生产率的动态变化情况,在样本数量和时间跨度上对既有研究做出一定贡献。运用Bootstrap方法得出置信区间来评估Malmquist及其分解指数是否是一致估计,以获得具有统计显著、不受样本噪声干扰的稳健性结论。
统计结果表明,69%的TFP值显著不等于1(显著性水平为5%),多数高校的生产率变化显著。无论是生产率、技术效率变化还是技术变化,显著提升数均大于显著下降数,样本高校生产率整体得到提升。
非参数Kruskal-Waills检验表明,综合、理工和其他类高校的TFP值之间,除个别年份外,并无显著差异。同时,还检验了“985”“211”两类高校生产率的差异,但差异并不显著。60所样本高校作为我国高等教育的重点建设对象,其发展趋势并无太大差异,不同类型的高校在办学效率上均取得一定进步。
通过构建不同产出模型,以不同周期投入产出均值作为指标变量,得出与基准模型类似的结论,生产率年均增幅均在2%左右。同时,无论是否考虑统计显著性,技术效率变化对生产率提升的贡献均大于技术变化,说明样本高校在十三年间都在不断提升自身办学效率以接近有效前沿面,提高自身在既定投入下获得最大产出的能力。
(二)启示
我国高校技术效率变化的提升幅度较高但技术变化的进步不足,说明我国高等教育依旧处于发展初期,以重点发展一批高校来带动我国高等教育水平整体提升的政策方针容易导致高校办学整体水平发展不平衡,使得我国高等教育整体的技术进步不明显。因此,政府应合理配置资源,避免资源过度集中于某几所高校,在“双一流”建设中,在立足建设一批世界一流高校的同时,也应多重点、全方位支持其他高校的发展,提升我国高等教育整体实力。高等教育整体的进步才是我国建设教育强国的基础支撑。对于高校自身而言,通过吸引更多高质量海外优秀人才,尤其是全球顶尖高校华人教师或毕业生(华人能更快更好地适应中国环境,也能通过他们接轨顶尖高校的学术水平),将世界一流的教学和科研水平应用于中国高校,带动我国高校办学技术的进步。
技术效率增速放缓,增长的非稳定性说明以量促发展的激励机制已不再满足高校追求高质量持续发展的诉求,政府在保障教育资源投入足量的条件下,高校应更关注如何提升产学研的质量与效率。目前,少数高校对教师聘用已采用非升即走的终身轨制,终身轨聘任制在第一阶段的考察期内能激发教师的教学与科研能力,筛选出一批具备发展潜力的教师进入下一阶段,在第二阶段教师将获得更多学术自由去攻坚克难潜心研究,取得卓越突破,终身轨聘任制在提高办学质量上发挥着重要作用。此外,对高校办学绩效的评价也应从考核量化指标转向参考其内涵式发展路径及社会贡献力。
不同类型的高校在十三年内的生产率并无显著差异。对于资源基础薄弱的高校(如:“非985”高校和“其他类”高校),其效率增幅的潜力巨大,因此,在“双一流”建设中,资源配置应更灵活,施行动态评估,打破资源垄断,增加校际竞争力,保障公平的同时适当进行政策倾斜与专业性扶持。现阶段各高校在追求综合型发展的同时,除了高校内部重新设立新学科门系外,与其他专业型高校合作建立交叉学科群,利用各自优势进行互补共赢,不仅能节约教育资源,更能推动我国高等教育整体向前发展。