中国教育经济学研究热点的可视化研究:基于关键词的共词分析
2011-03-12黄维,陈勇
黄 维,陈 勇
(长沙理工大学 经济与管理学院,湖南 长沙 410004)
如果以1980年全国教育经济学研究会筹备组的成立作为我国正式组织理论研究工作者向教育经济学进军的开始,[1]我国的教育经济学已走过30多年的历程,这30年是我国社会急剧转型和教育大变革的时期,也是我国教育经济学从起步走向快速发展的时期,学者们取得非常可观的成就。国内学者对我国教育经济学所作的回顾性研究,往往依据研究者的个人主观分类,对已有文献进行质化分析。如李桂荣、肖利宏、杜育红等人对我国教育经济学的话语体系、研究领域的总结,但这些回顾性研究容易受个人主观经验的影响,对研究领域间的深层次关系缺少知识挖掘。本文试图在关键词共词分析的基础上,利用知识图谱方法,将我国教育经济学领域内海量的文献数据信息转换为可视化图形,客观、形象地展示我国教育经济学的研究热点,挖掘这些研究热点间的深层次关系,揭示出研究空白。
一、数据来源
知识图谱(Mapping Knowledge Domains)是一个科学计量学的术语,是用来显示科学知识的发展进程与结构关系的一种图形,它通过数据挖掘、信息处理、知识计量和图形绘制,将知识和信息中令人注目的最前沿领域和学科制高点,以可视化的图像直观地展现出来。[2]绘制知识图谱主要的方法有引文分析、共引分析、多元统计分析、词频分析、社会网络分析等。
本文的研究数据来源于《教育与经济》于1985年至2008年发表的1600篇论文的5773个关键词,数据下载于中国知网的中国学术文献网络出版总库,数据的最后更新时间为2009年7月10日。
本文选择《教育与经济》作为数据来源期刊,主要原因是:首先,《教育与经济》是我国唯一的一份教育经济学专业学术性期刊,与Education Economics Review,Education Economics期刊并称为国际教育经济学专业权威期刊。按照布拉德福文献离散规律,大多数关键文献通常都会集中发表在少数核心期刊,[3]可以保证本文数据来源的专业性与权威性;其次,《教育与经济》具有近30年的办刊历史,成为国内教育经济学者发表学术观点、讨论学术热点的高水平平台,较为完整地见证我国教育经济学的发展轨迹;再次,《教育与经济》刊登教育经济学领域的专业文章,能够满足利用关键词的共词分析绘制知识图谱所需的大样本数据统计。
二、数据准备
(一)词频分析
词频分析也称事件分析,是研究者根据研究目的,运用统计的方法,从网络引擎、报纸杂志、历史文件、档案记录搜集所研究问题的核心词汇,然后进行编码,据以进行定量分析的方法。由于此方法搜集到的数据具有可重复性和可验证性的特征,同时能够应用于构建统计模型,因而受到普遍重视。[4]
关键词是学术论文的一个重要组成部分,虽然往往只有几个词,但却是论文的精髓,通过关键词可以了解到文献所涉及领域的主要内容等。本文首先从中国学术文献网络出版总库下载了1985年至2008年《教育与经济》所发表论文的5773个关键词,其总的出现频次为9490次;然后对这些关键词进行标准化,因为同一个意思的关键词在不同论文中的表述会有差别,比如职业技术教育、职业教育和职教等,经过标准化后,本文将此涵义的关键词统一为职业技术教育;接着提取出现频次在20次(含20次)以上的高频关键词,共得到59个高频关键词,剔除3个涵义过于宽泛的关键词(教育、相适应、学校),剩余56个,其总的出现频次为3642次,占关键词总频次的38.37%,这56个高频关键词基本代表了中国教育经济学从1985年至2008年的研究热点。
(二)共词分析
共词分析是一种内容分析技术,它通过分析在同一个文本主体中的款目对共同出现的形式,确认文本所代表的学科领域中相关主题的关系,进而探索学科的发展。[5]
本文首先利用内容挖掘软件ROST CM①,统计出所提取的高频关键词的共现频次,生成共现矩阵;然后利用SPSS统计分析软件将原始共现矩阵转换为泊松相关矩阵,从而消除由于关键词共现次数差异所带来的影响,为后面的分析做好准备。
三、分析过程
首先进行多维尺度分析,即利用多个事物之间的相似(不相似)程度,通过适当的降维方法,将这种相似(不相似)程度在低维度空间中用点与点之间的距离表示出来。多维尺度分析中,Stress值是压力指数,RSQ代表可解释变差,一般认为,Stress值越低,RSQ值越高,拟合度越高。即文献(每个点)的位置显示了文献之间的相似性,有高度相似性的文献聚集在一起,形成研究的热点,通过多维尺度分析,某研究领域或学术共同体在学科里的位置就容易判断。[6]
其次利用因子分析法“降维”的思想,通过研究众多变量之间的内部关系,探求观测数据中基本结构,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,其基本目的是简化观测系统,减少变量维度,用少数的变量来揭示所研究的复杂问题。[7]在因子分析过程中,本文先采用最大方差法(Varimax)进行正交旋转,萃取出四个主成分,累计方差贡献率87.148%,见表1。然后,本文将主成分1中因子负载为负数的九个关键词抽取出来,最终得到五个主要研究领域,见表2。
最后,根据因子分析的结果,将教育经济学划分成不同的学术研究领域,再结合词频分析的结果为每一个领域命名,最终绘制出我国教育经济学研究热点的、可视化的知识图谱,见图1。
表1 因子分析结果
续表1
表2 总方差解释表
图1 1985-2008年中国教育经济学热点研究领域的知识图谱
在图1中,多维尺度分析中Stress=0.08603,RSQ=0.97219,拟合度良好。结合词频分析的结果,本文将这5个领域分别命名为:1教育体制改革、教育结构;2教育投资、教育资源配置、教育成本;3教育收益率;4教育产业化;5教育财政、学生资助制度。
三、分析与讨论
(一)我国教育经济学的研究热点
(1)领域1教育体制改革、教育结构。如何建立起与社会主义经济体制相适应的教育体制,也是我国教育经济学者十分关注的一个问题。此领域出现的高频词还有教育结构、市场经济、经济发展、劳动者、职业技术教育等。这说明教育结构的调整是我国教育体制改革非常重要的一个方面。改革开放30年以来,中国一直处于经济体制的转型及经济结构的调整中,一定的经济结构必然要求与之相适应的教育结构,因为教育结构的建立能保证专门人才的培养和劳动力的供给,保障经济结构的调整和发展的需要。[8]因此,进行基础教育、职业技术教育、成人教育之间结构的研究,是我国经济建设的必然要求。
(2)领域2为教育投资、教育资源配置、教育成本。根据表2,本文将主成分1中因子负载为负数的九个关键词抽取出来后,主成分2的方差贡献率就成为最大的主成分。方差贡献率最大的主成分代表最活跃的研究领域[9]。因此,主成分2教育投资、教育资源配置、教育成本为1985年至2008年中国教育经济学最热门的研究领域。此领域中出现的高频词还有投资效益、办学条件、教育质量、教育事业等。
(3)领域3是关于教育收益率。教育收益率是“对一个人或一个社会因增加其接受教育的数量而得到的未来净经济报酬的一种测量”。[10]教育经济学以“投资-生产-利润”过程为系统,把教育过程与物质生产过程当作一个过程来考虑。因此,教育收益率一直是教育经济学家们关注的热点问题。我国学者对教育收益率的测算从未间断过,其主要目标不仅在于要对教育改革中出现的经济问题做出合理的解释,并且要对我国的教育投资做出科学、合理的决策。
(4)领域4是教育产业化。教育产业化这一话题在我国提出后,引发了极大的讨论,存在严重的观点分歧,一度成为热点话题,但是当教育部等权威部门公开表示不赞同教育产业化后,我国教育经济学者对这一话题的研究热度便迅速降温。该领域没能发展壮大起来,在图中就表现为研究领域很小。由此可见,且不论教育产业化(市场化)正确与否,我国教育经济学者的研究兴趣、观点倾向很容易受权威论调的影响,或者说有很强的政策导向性。
(5)领域5为教育财政与学生资助制度。这一领域是伴随着我国财政体制改革及高等教育成本分担政策的推行而出现的。高校全面实行收费上学制度后,需要助学贷款政策来化解由此造成的贫困生资助问题,这一政策为促进教育公平提供了制度性保障。这也反映了我国教育经济学研究非常重视经济发展与教育改革中的实际问题,具有很强的现实性。
(二)我国教育经济学热点研究领域的学科结构特征
(1)“教育投资”的研究备受关注。教育投资短缺问题一直是困扰我国教育发展的一大问题,因此这一问题也一直受我国教育经济学者所关注。最开始的研究热点从教育投资是生产性投资还是消费性投资的讨论开始,到缓解教育投资短缺途径的探索,再到教育投资负担主体及比重的发展过程。因此,要合理配置有限的教育资源,那么教育成本、教育投入与支出就成为不得不考虑的问题。依据这样的逻辑关系,教育投资、教育资源配置及教育成本等问题便紧密联系,成为最热门的研究领域。[11]
(2)研究热点呈现有限多元化态势。图1中的5大研究领域之间分布距离较大,不同领域之间的联系相对缺乏。在各领域内部,领域2与领域1的研究话题过于密集,而领域3、领域5则过于宽松,这说明在领域3与5中挖掘研究空白相对容易,尤其是领域3“教育收益率”的研究,不论是理论基础、研究方法,还是具体的测算,都很有前景;从领域5可以发现,与“学生资助制度”距离最近的是“对策”,这就反映了目前我国关于学生资助制度的研究大都停留在定性层面,那么,以定量的视角来研究此问题,是否可以开辟新的研究空间?说明这些主题领域相对独立,反映出教育经济学研究热点的有限多元化。
(3)理论研究相对欠缺。在图1中可以发现,关于教育经济学基础理论的研究话题甚少,这就说明我国教育经济学理论研究并不活跃。作为一门新兴的交叉学科,奠定扎实的理论基础及构建严密的理论体系是非常必要的。如果忽视了理论研究,那么对现实问题的研究难免陷入就事论事的现象。同时,随着教育经济学研究领域的扩展,必须把相关学科的理论基础纳入到教育经济学的理论体系中来,这样才能促进教育经济学的长足发展。
(三)我国教育经济学的研究展望
(1)教育经济学已经融入到中国教育各个层面,其间既有新的研究话题的产生,比如教育成本、教育公平等,也有老话题的消亡,比如教育产业化,当然也有生命力很强的研究话题会贯穿始终,比如教育投资。从总体上看,我国教育经济学研究领域呈现出融合-分化-融合的趋势,目前正处于相对分化的阶段,可以预测,经过一段时间各个领域研究的不断深化,必然会再次出现各研究领域交叉、融合,综合性研究的局面。
(2)教育经济学在我国经历了一个从一种研究方法的创新到一系列教育问题的经济分析原理和观点为世人认同和重视,再到教育经济学在教育领域中全面推广应用的过程,教育政策、教育过程、教育结构都被赋予经济性解释。如果能以一种历史的、演进的眼光来精确分析不同社会历史阶段的教育经济学发展趋势,我们就可能更加确切地知道教育究竟需要什么样的经济效率,什么样的经济效率更符合教育发展的需要。但是,中国教育经济学的理论空间仍然有待拓展,研究者需要全力构建本土化的教育经济学理论与方法,才能提高中国教育经济学在世界学界的学术地位、更好地解决中国教育变革中的现实困境。
(3)当前我国教育经济学是一个包含了多种研究主题、理论与研究路径的多元化的学科。因此,在今后的研究中创建发展一个具有广泛适应性能联结各个研究领域的一般性基础理论,成为摆在研究者面前的一个重大课题。除了寻找核心研究领域,还需要填补其他研究的空白,设法联结起现有研究领域。比如,根据本文的研究结果,可以看到有关“教育投资”与“教育收益率”的研究领域被割裂开来,这与有关教育经济学的理论逻辑不符,说明研究者忽视了两者之间内在联系,今后的研究应当将兼顾“教育投资”与“教育收益率”的内在联系。
四、结束语
与以往的文献综述方法不同,本研究是以文献关键词的共词分析方法勾勒出我国教育经济学研究热点的一次尝试,用客观的量化形式代替传统的研究者主观描述。本文分析的结果使我们建构起了一幅可视化的知识图谱,确定了当前我国教育经济学的研究热点和学科结构特征,同时帮助我们发现了现有研究当中可能存在的空白,为今后的研究提出了指引方向。
但是,关键词共词分析方法的使用,丝毫不是贬低传统综述性文章的现实意义和科学性。如果两者可以从一定角度上相互补充,就更能凸显知识图谱的借鉴意义。
[注释]
①本软件全称为ROST Content Mining,由武汉大学ROST虚拟学习团队设计开发,主要用于语义网络挖掘。
[参考文献]
[1]刘芸.我国教育经济学的发展及趋势[J].辽宁教育研究,1986,4(2):117-122.
[2]陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(1):149-154.
[3]转引自张斌贤,陈瑶等.近三十年我国教育知识来源的变迁——基于《教育研究》杂志论文引文的研究[J].教育研究,2009,30(4):17-25.
[4]谢维和等.中国的教育公平与教育发展[M].北京:教育科学出版社,2008:28.
[5]姜春林等.经济学研究热点领域知识图谱:共词分析视角[J].情报杂志,2008,25(9):78-80.
[6]刘荣.基于科学知识图谱的创新系统研究的历史与现状分析[J].科技管理研究,2008,21(12):502-504.
[7]刘大海,李宁,等.SPSS15.0统计分析从入门到精通[M].北京:清华大学出版社,2008:301.
[8]范先佐.教育经济学[M].北京:人民教育出版社,1999:55.
[9]侯海燕等.基于知识图谱的国际科学计量学研究前沿计量分析[J].科研管理,2009,30(1):165-167.
[10]沈华,沈红.我国教育个人收益率研究的回顾与展望[J].现代大学教育,2004,16(5):92-94.
[11]张学敏,田晓伟.教育经济学的核心主题及其体系研究[J].教育与经济,2008,29(3):23-29.