APP下载

基于大数据的省域老年教育发展成效PCA-DEA模型构建与实证研究*

2022-07-30沈光辉程方昭

远程教育杂志 2022年4期
关键词:指标模型评价

沈光辉 杨 惠 陈 诚 程方昭 王 炜

(1.福建开放大学,福建福州 350013;2.数字福建终身教育大数据研究所,福建福州 350003;3.上海计算机软件技术开发中心,上海 201112)

一、引言

我国人口老龄化程度在持续加深,根据第七次全国人口普查数据显示,截至2020年11月1日,全国60 周岁及以上老年人口2.64 亿人,占总人口的18.7%。其中,65 周岁及以上老年人口1.9 亿人,占总人口的13.5%。预计“十四五”时期,我国老年人口将达到3.09 亿人,进入中度老龄化社会,并成为全球人口老龄化程度最高的国家。面对人口老龄化的严峻形势,我国把积极应对人口老龄化上升至国家战略层面,并把发展老年教育作为积极应对人口老龄化的重要举措。虽然国家层面越来越重视老年教育,从老年教育的普惠制度、财政投入以及管理体制等方面入手,不断提升老年教育的功能定位与发展成效,但我国老年教育始终面临“质效低下”的困境,即在老年教育各类公共资源投入上,并没有带来服务效能、发展成效等的有效增长。

为推动老年教育的高质量发展,开展关于发展成效的研究变得尤为重要。既往老年教育发展成效的研究主要集中在理论层面,部分实证研究则聚焦在教育投入的对比分析上,缺乏教育投入产出效率方面的研究。老年教育发展效率的研究,有助于教育主管部门及时掌握投入与产出的调整幅度和方向,决定是以较少的投入来获得相同的产出,还是以相同投入得到更多的产出,从而提高老年教育发展成效。

对教育活动发展成效的科学评定,应同时基于宏观层面和微观层面两大指向性内容来开展(吴结,2019),为此,本研究利用PCA-DEA 模型,从投入产出效率角度评价老年教育的发展成效。在宏观层面,为提升模型的科学性,尝试从互联网的海量大数据分析入手,利用人工智能技术挖掘老年教育发展相关的关键词,结合德尔菲专家法进一步确认模型的投入和产出指标,利用主成分分析法(Principle Components Analysis,以下简称PCA)对投入产出指标进行降维,降低模型的计算复杂程度,最终完成PCA-DEA 模型的构建;在微观层面,从学习者参与频率、品牌数量和学习团队数量出发,衡量老年教育的发展成效,通过构建回归模型分析老年教育发展成效的影响因素;在模型应用层面,利用省域数据开展实证研究,期望通过宏观和微观两个角度,可以更全面地反映省域老年教育发展中的问题,推动老年教育的区域协调与均衡发展。

二、相关文献综述

1966年,科尔曼(Coleman,et al.,1966)等提出了“教育效率”的概念,此后,该概念在教育经济学中得到了众多学者的论证研究。相关文献主要围绕教育投入产出、教育资源配置成效等,采用调度理论、评价指标体系进行效率的验证和分析。例如,早在1980年,贝森特(Bessent,1980)就运用数据包络分析法(Data Envelopment Analysis,DEA),构建投入和产出指标模型,对美国加利福尼亚州城区55 所小学的办学效率进行了分析;阿伯特(Abbott,et al.,2003)等测算了澳大利亚各大学的相对效率、技术效率和规模效率,结果显示,澳大利亚各大学的综合效率相对较高;托特(Toth,2009)采用DEA 方法研究了影响欧洲高等教育体系效率的因素,测算出人均GDP 对高等教育效率有明显正相关。国内研究者对于教育投入产出效率的研究也比较早,王善迈等(1996)指出,我国教育投资面临的重要问题主要表现在教育投资短缺、政府教育拨款不足以及有限的教育投资利用效率低等方面;蒋玉成等(2020)、李毅等(2021)分别使用DEA 结合Malmquist 指数法,对我国高等教育资源的区域、城乡配置效率及演变趋势进行分析。

通过对现有文献梳理发现,目前学术界从教育效率维度开展老年教育发展成效的研究较为鲜见,并且相关的实证研究较少。关于老年教育发展成效的评价研究,大部分研究者是从教育投入角度,对老年教育发展成效的评价标准进行理论研究,如,吴结(2019)比较分析了老年教育发展成效的一般内涵和特殊内涵,在此基础上构建老年教育发展成效评价标准体系;张珏等(2021)从有形性、可靠性、响应性、保证性、移情性等五个维度,基于SERVQUAL 构建了社区老年教育服务质量的评价模型;程仙平(2021)从教育机会、教育投入、教育质量和教育公平等维度,采用德尔菲调查法和层次分析法构建老年教育发展评价指标体系;而从教育投入产出效率角度出发,仅有李艳龙(2021)通过DEA 模型分析了山东省老年教育资源利用效率。

围绕教育效率的研究,目前,两大主流方法是随机前沿分析(Stochastic Frontier Approach,以下简称SFA)和DEA,SFA 需要设定生产函数,由于教育投入和产出的指标较为复杂,预设生产函数存在难度,国内外学者倾向于采用DEA 方法,评价教育投入与产出效率。DEA 效率评价模型对比老年教育现有研究的评价模型,评价过程可以避免对指标权重的人为假定,更具客观性。因此,基于DEA 开展老年教育发展成效的实证研究,一方面,可以改善老年教育效率评价研究不足的情况,另一方面,可以夯实老年教育发展成效的实证研究,为教育主管部门及时掌握老年教育发展成效提供方法支撑,也为类似的实证研究提供指导思路,对推动老年教育高质量发展具有重要意义。

三、基于大数据的老年教育发展成效PCA-DEA模型构建

成效一般指某项活动按照预定的目标计划实施以后,最终所达到的效果或功效,即是否实现预定目标或者预定目标被实现的程度(吴结,2019)。本研究的老年教育发展成效指老年教育的投入产出效率,在DEA 模型中融入主成分分析法(Principle Components Analysis,简称PCA),构建了老年教育发展成效PCA-DEA 模型。DEA 模型借助数学规划方法,利用多个输入和输出的样本数据,评价决策单元(DMU,Decision Making Units)间的相对有效性,决策单元指可以将一定输入转换为产出的运营实体(在本研究中指福建省9 个地市),每个单元都有输入和输出,输入数据是指老年教育发展过程中的政府投入,输出数据是指将各种投入经过一段时间建设形成的产出物,如组织的活动数、培训的学员数等;PCA 方法将老年教育诸多评价指标降维成少数几类综合指标,把具有代表性和独立性的综合指标,作为DEA 模型评价中的投入和产出指标进行分析,可以更客观且准确地评价各地市老年教育的发展情况。

在大数据时代下,教育数据的价值已经被人们所认识,一些高校和教育机构在教育大数据的应用与实践探索方面,取得了初步成效,验证了大数据在教育领域发挥的显著影响。沈光辉等(2020)指出,大数据可以全面推动终身教育评价方式创新,实现基于大数据的多维度综合性智能化评价。老年教育数据资产规模逐渐壮大,通过大数据分析技术,有利于发现老年教育发展过程中的关注点,确认老年教育发展成效PCA-DEA 模型的初始投入和产出指标,以数据要素增强模型的科学性,避免传统模型指标确认的随意性,模型的具体构建过程如图1所示。

图1 老年教育发展成效PCA-DEA 模型的构建过程

(一)关键词抽取

首先,通过网络爬虫技术,以“老年教育”为主题,对互联网海量大数据进行抓取,涵盖的数据源主要包括综合门户的相关内容板块、各级各类教育管理部门和单位门户、老年大学门户、终身学习在线平台、院校网站、政策专题网站、微博和微信公众号等,筛选范围为福建省各地市2018年1月份至2021年12月份期间的数据,最终共获得训练数据20.3 万条。

利用Word2Vec 模型和TextRank 算法,对这些文档数据进行分析,抽取老年教育的主要关键词,作为模型投入指标和产出指标的依据。TextRank 在机器学习算法中属于无监督算法,主要原理是将训练文本拆分成句子和单词,并基于图排序建立模型,利用投票得分方式确定文本最终的摘要和关键词,其优点是利用少量文本也能训练出效果较好的模型。Word2Vec 是一种词向量模型,也是基于神经网络的深度学习模型,可以将文本内容采用词向量来表示,词语除向量化外,还进行语义分析,语义越相近或者关系越紧密的词语,词向量的距离越近。

TextRank 算法原理简单,运算效果相对较好,但由于该算法给单词之间的关系都赋予相同的权重,并没有考虑单词之间的语义关系,许多研究者为了进一步提高关键词抽取的准确性,特别引入Word2Vec模型。如,赵占芳等人(2021)利用Word2Vec 模型训练的词向量表征改进词节点间的转移概率,提出一种改进TextRank 的关键词抽取算法;余本功等人(2020)利用Word2Vec 模型提取词语的关系特征,通过线性加权计算词语的综合影响力,提出基于多元特征加权改进的TextRank 关键词提取方法。上述研究者通过实证研究,均证明融合Word2Vec 的TextRank 算法的关键词抽取效果,优于传统的TextRank 算法。因此,本研究采用融合Word2Vec 的TextRank 算法,对2018年至2021年互联网上的老年教育相关文档集合进行分析,抽取老年教育的主要关键词,具体流程见图2。

图2 关键词提取流程图

按照关键词出现的频次排序,提取前50 名的关键词如表1所示。

从表1 可以看出,关键词中“老年大学”排名靠前,且关键词出现频次较高的,也多与“老年大学”相关联,这是因为在老年教育发展初期,教育机构的主体多为老干部局系统主办的“老年大学”;随着信息化技术的发展,福建省利用网络信息技术,积极探索“互联网+老年教育”新模式,提升老年教育覆盖率和参与率,体现为关键词“平台”“远程”“直播”等。

表1 与老年教育相关的前50 个关键词

(二)指标筛选

本研究采用德尔菲专家法进行指标筛选,剔除部分对评价老年教育发展成效无关或用处不大的指标。邀请了从事老年教育相关工作5年以上、经验丰富的17 位专业人士参与调查,包括高校相关研究领域的教师、终身教育和老年教育相关机构负责人、终身教育与老年教育学术刊物的作者及编辑等。本研究共发放三轮以“老年教育发展成效评价指标体系”为题的网络问卷,并提供表1 关键词所映射的指标供专家参考、筛选和修改,最后统计问卷结果,根据专家意见是否一致,决定是否继续发放问卷,依据最终的问卷结果,对现有的指标体系进行修正。问卷的总体Cronbach’s α=0.764,KMO=0.890,P=0.000,符合信效度要求。

第一轮共发放专家问卷17 份,回收有效问卷17 份,回收率100%,本次问卷结果显示:引用率最高的为工作人员数,随后的指标引用率区分不大;第二轮共发放问卷17 份,回收有效问卷17 份,回收率100%,相较第一轮的修正结果,本次指标的引用率存在一定调整。经统计,专家一致认为,老年教育机构的软硬件、人员配置、财政投入、学员培训等方面,最能体现老年教育的发展状况。为防止专家对指标的分组过于杂乱,当前阶段只是将模型指标粗略划分为投入和产出类型。前两轮问卷最终结果如表2所示,按照阈值为0.76 的引用率筛选出前17 个指标,即超过70%的专家认为,这些指标是评价老年教育发展成效的重要组成部分。

表2 模型指标筛选结果

为细化模型指标类别,综合政策文件以及相关文献等研究,我们进一步对指标进行分类整合、归并,第三轮问卷限定指标分组类别为:基础设施、经费投入、数字化供给、人力投入和绩效产出。本轮发放17 份问卷,有效回收问卷15 份,回收率88%。经统计后发现,无论在指标选择还是分组上,专家们意见趋于一致,最终结果如表3 前三列所示。

(三)PCA 指标降维

采用DEA 模型评价城市老年教育发展情况时,评价指标的选择可以覆盖诸多维度,覆盖的维度越多,评价结果越科学。如何选择评价指标直接影响评价结果的准确性,但在实际应用中,指标之间难免存在交叉和重复的情况,如果对这些指标进行简单加权求和,则无法保证评价结果的准确性。因此,指标数量的多少和指标的独立性之间,必然存在选择上的矛盾。PCA 方法通过线性变换,将多维度具有相关性的指标降维,利用少数相互独立的综合变量表征维度特征,保证数据信息损失最小并确保指标间独立。通过Stata 15 软件,将表3 第三列中相同类别的指标进行PCA 降维,处理后得到多个主成分,再选取其中最能体现原始数据分布的主成分。图3 为各个主成分的可解释方差图,以“绩效产出”类指标的处理结果为例,PCA 得到的第一个主成分能够解释原始数据99%的方差,而相对处理结果较差的“人力投入”类指标,其第一个主成分也能解释95%以上的方差,能够较为完整地保留原始数据特征。因此,本研究仅选用第一个主成分作为PCA 降维的结果,具体指标对应的主成分分析系数,见表3 第四列。

图3 PCA 方差解释图

表3 模型指标与主成分系数对应表

(四)DEA 发展效率评价

DEA 方法通过保持决策单元的输入或者输出不变,借助于数学规划和统计数据,确定相对有效的生产前沿面,将各个决策单元投影到DEA 的生产前沿面上,并通过比较决策单元偏离DEA 前沿面的程度,来评价它们的相对有效性(丁姗姗,2009)。在对表3 的指标按照同类别降维后,我们将基础设施、经费投入、数字化供给和人力投入作为DEA 模型的投入指标,绩效产出作为DEA 模型的产出指标,通过模型计算结果,来评估决策单元(各个地区)之间的相对发展效率。

四、实证研究结果与分析

本研究应用上述模型,基于福建老年教育发展状况开展实证研究。数据来源分为三个部分:一是来源于互联网,筛选福建省各地区老年教育2018-2021年的相关大数据;二是实时收集福建省各级机构在老年教育应用平台发布的课程和活动等相关信息;三是通过数据服务平台收集福建省开展老年教育的各级机构定期上报的2018-2021年的工作开展数据。通过整理,共有记录25.7 万条。本研究首先利用PCA-DEA 模型对各个地区的发展成效进行综合评价,接着通过建立回归模型分析影响老年教育发展成效的因素,最后根据数据结果阐述老年教育存在的问题,并指出改进方向。

(一)老年教育发展成效评价

PCA-DEA 模型的求解结果如表4所示,研究结果表明,福建省大部分地市的老年教育发展成效均位于正常水平之上,说明现阶段福建全省老年教育发展路径总体是正确的,符合老年教育发展规划中的阶段性目标期望。虽然三明市和福州市的老年群体积极响应老年教育,但相对其他地区效率欠佳,模型计算结果显示,松弛变量S+>0、剩余变量S->0。为此,一方面应当考虑加大老年教育基础设施、人员师资补充与培训、经费、数字化资源等方面的投入;另一方面,也应考虑调整这些方面的投入结构。南平市的发展成效最为不足,模型反映出其老年教育的投入并没有得到充分的利用,下一步工作需要深入挖掘老年教育发展低效率的因果链条,从而激活过去已投入的教育资源。

表4 模型的求解结果表

为了讨论每个投入指标如何影响福建各地区老年教育发展成效,我们以“组织培训”“参与人数”“品牌项目”“学习团队”作为产出指标,而DEA 模型的输入仅选择表3 中的单项投入指标。图4 为在单一变量的决策下,各地区的相对发展有效程度,其中,横坐标为输入的单一指标,纵坐标为各地区的相对有效程度θ,θ 越接近1 说明越有效。由图4 曲线可知,仅在“基础设施”视角下,莆田市和厦门市的发展成效较好;而仅从“经费投入”上看,漳州市的发展成效领先,凭借中等的投入仍然取得了大多数群体对老年教育的支持;在“数字化供给”上,福州市和漳州市的发展成效较一般;最后,在“人力投入”方面,各地区的发展成效都较好,说明在该方面,各地区都进行了有效投入。

图4 单变量发展成效对比图

本研究通过累积投入指标,进一步强化DEA 模型对老年教育各方面建设情况的敏感程度,从而输出更加合理和客观的相对发展成效结果。图5 为投入指标的累积评估曲线,横坐标从左至右为不断累积和输入评估模型的指标名,纵坐标显示模型输出的发展成效结果。可以看出,尽管漳州市和泉州市的单一投入指标评估显示发展成效可能不佳,但是通过不断累积待评估的指标,能判断出这两个地区的老年发展成效较好。同样的,当其他地区投入指标累计到3 类以上时,各地区的评估曲线趋于平缓,模型能较为准确地显示评估结果。

图5 投入指标累积评估曲线

(二)老年教育发展成效影响因素分析

使用统计指标来衡量福建各个地区老年教育的发展成效,可以洞察区域之间的相对发展成效,但无法从全局视角上分析不同指标之间的潜在联系。因此,需从结构化供给侧角度,分析各个方面的投入是否合理,是否存在区域对某项指标投入过多而其他方面投入却严重不足现象,进而影响结构成效。为掌握不同数据指标对老年教育发展成效的影响程度,本研究整理了福建省内9 个地市、71 个县级地区近两年的相关数据,通过回归算法对数据进行分析,参考PCA-DEA 模型的投入指标和区域特征,设计相应的计算比例作为解释变量。具体包括:办学覆盖率、生均面积、生均投入、线上课程比例、专职师生比、兼职师生比、老年参与比例。增加“老年参与比例”这一解释变量,主要是考虑到老年人的学习过程往往伴随着社交与互动,同一地区的老年人往往交流、相处较密切,老年人参与比例高的地区老年人,更容易结伴学习,学习积极性更高。

福建省多年的老年教育实践表明,通过基础设施建设、课程活动开展、宣传推广等方式构建学习型社会,可以提升老年个体的自身素质和价值追求。因此,老年学习者参与老年教育的频率,可以在一定程度上反映老年教育发展成效。除此之外,通过严格把控教学和办学质量,提高老年成员的学习热情,并不断形成具有示范性的品牌项目,持续成立和扩大各类老年教育学习团队,也能提高发展成效。本研究参考PCA-DEA 模型的产出指标设计被解释变量,以老年学习者的学习频率、老年教育发展过程中衍生的品牌数量和学习团队数量,作为被解释变量做进一步分析。

详细的回归结果如表5所示,回归系数的正负代表解释变量对被解释变量的积极或消极影响,回归系数的绝对值越大,说明影响程度越深。通过计算各个解释变量在被解释变量回归系数中的占比,能够分析解释变量对被解释变量的影响程度占比,由此得出以下结论:

对所有被解释变量而言,专职师生比平均达到31.7%的显著积极影响,而办学覆盖率对学习团队数量变化的影响程度也达到29.8%,线上课程比例对品牌数量变化的影响程度能够达到16.6%。其中,学习频率对应的R2达到0.9,代表回归模型能够解释90%的老年学习频率变化。办学覆盖率、生均投入、生均面积、线上课程比例和老年参与比例,都显著提高了老年人参与老年教育的频率,体现出老年教育覆盖程度、教育软硬件资源发展水平,对鼓励老年人迈出家门经常参与学习的重要作用。老年教育的兼职师生比显著降低了参与频率,而专职师生比的影响方向为正向,明显提高了老年人参与老年教育的频率,这意味着专职教师越多,老年学习者越愿意积极、频繁地参与教育活动;而兼职教师的比例越高,老年人越不愿意频繁参与。在投入优先级上,相比提高线上课程比例,增加专职师生比产生的学习频率收益能够提高105.7%。

在品牌方面,对应的R2为0.899,代表回归模型能够解释89.9%的品牌数量变化情况。模型结果显示,生均投入、线上课程比例、老年成员的积极参与以及教师的数量,均能对品牌数量起积极作用。因此,如果需要建设更多的品牌,可以考虑更多倾斜于建设学员配套设施、扩大教师团队等方面的投入。从解释变量上看,结果与学习频率类似,增大专职师生比对品牌数量的贡献率,比线上课程比例高124.4%。

在学习团队数量方面,对应的R2为0.905,代表回归模型能够解释90.5%的学习团队数量变化。模型结果显示,应将较大比例的可投入资金,用于建设相对密集的教学点和丰富的活动场所,提升学员活动面积,并保持其参与积极性,有助于孵化出更多的学习团队。而办学覆盖率对学习团队数量的促进作用,相对生均面积提高了15.9%,相比专职师生比提高了101.7%。

(三)老年教育发展存在的问题和改进方向

1.资金投入难以保障基础设施建设,应完善和创新资源集聚机制

老年教育经费主要依靠财政拨款,经费占比达88.38%,资金投入存在地区不平衡性和时间序列上的不稳定性,导致各个地区的老年基础设施建设情况不一。福州市的老年教育财政投入居全省最高,甚至超过部分地市十数倍,而辖区内的老年人口数量差距远小于经费投入差距,体现出老年教育资源配置的不均等。建议根据各区域老年人口比例构成,配置合适的老年教育资源和基础设施,提高财政兜底性支持力度;同时,建立经费使用监督机制,明确相关责任。老年教育经费的不稳定性,将直接影响老年教育工作的持续开展,亟需构建政策制度生态环境,通过立法明确老年教育经费来源、投向和适用范围。同时,创新多渠道、长效、稳定的经费筹措机制,有组织有计划地开展筹资工作,保障老年教育发展机会的公平性。

2.老年教育教师队伍不稳定,亟需更完善的管理和培训机制

老年教育师资队伍的学历层次和专业技术职务不是很高,专职教师的比例仅占个位数的百分比,这样的队伍构成在一定程度上限制了老年教育事业的发展。当前,教师队伍建设存在分层现象,市级老年大学的专职教师队伍建设完备,主要以专职教师为主,志愿者投入量充足,区域发展基本均衡;乡镇(街道)的教师队伍以兼职教师为主,专职教师投入量较少,并且各地市队伍建设情况开始分化,差异凸显;村(居)教师队伍能保持专职教师投入的地市仅占少数。兼职教师的身份决定其难以将全部精力投入老年教育工作之中,并且人员流动性较大、队伍稳定性不强、薪酬难以保障。因此,需要建立老年教育师资准入制度和从业资格认证标准,完善老年教育师资库,规范教师管理。同时,亟需推进老年教育专业化培养体系建设,从而长期稳定、持续、高质量供给老年教育师资;提高老年教育机构专职人员比例,增强老年人参与教育培训的积极性。

3.区域间发展不平衡不充分,亟需加强数字化建设

由于经济发展水平和教育建设基础的差异,福建省地区间老年教育的发展情况迥然不同,建设推进、人员队伍、软硬件、教育资源等方面均体现出不平衡性。不充分则体现在老年教育的发展推进速度慢于政策规划,各地区老年教育活动质量,还不能完全匹配学习者需求,不利于现代化社区治理体系的形成以及老年教育体系的完备,不能充分满足全民学习、终身学习的学习型社会下的教育需求。因此,需要加强网络课程资源、信息化平台建设等数字化供给,在提升教育质量、优化教育资源配置、促进教育公平、完善教育制度等方面,赋能老年教育具备一定的优势。要通过更加自由的线上线下教育方式选择,缩短老年教育活动的组织成本、信息管理成本,丰富教学形式,提高积极性和情感黏性;通过更加快速、灵活且全面的教育网络向基层覆盖,更加多样的师资培养、管理和共享,实现师资区域空间限制的突破、更灵活的时间选择,利用平台统一管理、匹配授课内容、授课时间、授课区域与学习者的需求偏好;通过更加实时且真实的数据洞察发展,使教育教学方向的调整、组织管理和决策的实施都更加及时,为更理性、更科学地做出决策创造条件,精准推进福建省老年教育均衡发展。

五、研究不足与展望

(一)数据来源不够充分全面,亟需建立老年教育动态监测体系

数据采集是数据分析的基础,老年教育的数据采集机制,需要进一步的完善。一是相较于其他类型的教育,老年教育总体信息化程度不高,各地区、各机构的信息化水平参差不齐。目前,老年教育业务的信息化建设尚不够充分,大量与老年教育业务相关的数据未实现电子化留存,数据资源的积累程度有限,数据的采集和利用尚处于各自尝试和探索的初级阶段,数据来源范畴不全面、不充分,数据本身存在分散、杂乱、质量不高等问题。二是考虑当前老年教育发展现状以及我国老年教育发展历程,老年教育的海量数据,更多的指向老干部局系统开展的老年教育,基于此客观发展情况而抽取的关键词,亦存在视角上的偏重和局限。在本研究模型测试中,实际所采集的数据不管是广度还是深度,均受到客观条件的限制,数据积累不足,给实测和评价带来诸多困难。今后,我们亟需建立老年教育动态监测体系,对老年教育业务相关数据进行常态化监测,并研究可行的老年教育数据动态监测模式与方法,设计数据监测指标与分析维度,对有关数据进行持续收集与分析。特别是重点采集老年大学教育、社区老年教育、远程老年教育(包括老年开放大学)三大系统的数据,完善反馈机制,以确保数据的完整性与充分性。

(二)数据结构采集过于单一,多源异构数据的挖掘分析能力有待提升

随着大数据技术在教育领域的应用,数据密集型科学范式已成为教育研究的有效方法。一方面,从大数据的5V 特征来看,教育领域大数据存在着简单、线性和结构化等数据表现,大部分数据局限于规范标准的结构性、线性化数据,其所需采集的半结构化和非结构化的隐性数据仍远远不足。另一方面,从获取的数据维度来看,老年教育的“数据冰山模型”显示出当前所获取并分析的,仅为少量的业务结果性数据,大量隐藏在冰山下部的隐性过程性和环境性数据,还未找到较好的处理方式和分析方法,数据中的隐性信息难以获取或常被忽略。在今后的研究中,我们需要从技术到方法提升对老年教育多源异构数据的挖掘分析能力,对冰山整体数据从模式到要素、环境到文化、结果到过程、动机到行为等多方面,进行通盘考虑和数据采集;在现实可行的条件下,可以采用语义分析、数据挖掘、知识管理等相关方法识别优先问题,集中优势资源,采用实证思维,来尝试解决资源重复建设、提高教学质量、提升管理效率、促进教育均衡等问题,从而尽可能大地发挥数据价值。

(三)模型应用存在局限性,可借助新技术不断迭代更新

在PCA-DEA模型构建过程中,本研究采用部分关键词抽取结果,作为模型指标构建的初始依据,因此,评价结果虽具有一定解释性,但可能存在变量遗漏造成的结果偏误。后续研究拟引入语言分析方法,开展老年教育政策文本和规划分析,洞察国家在促进老年教育发展、扩大老年教育供给上的指引,从而确保基于研究的建议更符合发展态势和政策导向。另外,PCA-DEA 模型所计算出的数值是相对值,因此,仅适合对该决策单元集合内的各个决策单元进行比较分析,无法描述各地区老年教育发展投入与产出间的比例关系,在非DEA 有效地区难以提供量化的投入或产出调整建议。后续研究可以考虑使用更具量化解释性的模型,加入在时间跨度上的评价考虑,应用平衡面板数据分析评价各地区老年教育发展绝对水平,更为科学地探索投入与产出间的量化因果关系。

猜你喜欢

指标模型评价
适用于BDS-3 PPP的随机模型
自制空间站模型
主要宏观经济指标及债券指标统计表
主要宏观经济指标及债券指标统计表
主要宏观经济指标及债券指标统计表
模型小览(二)
主要宏观经济指标及债券指标统计表
2006—2016年度C—NCAP评价结果
2006—2015年度C—NCAP评价结果(3)
2006—2015年度C—NCAP评价结果(2)