我国贝叶斯研究进展的计量分析
2012-01-07朱喜安陈巧玉
朱喜安,陈巧玉,2
(1.中南财经政法大学 统计与数学学院,武汉 430073;2.河南科技大学 数学与统计学院,河南 洛阳471003)
0 引言
贝叶斯方法是基于贝叶斯定理而发展起来用于解决统计问题的方法,贝叶斯分析包括先验信息的确定、数据及似然函数模型的构造、效用函数的选择、后验分布的确定和贝叶斯决策。贝叶斯推断的思想是将未知参数的先验信息与样本信息综合;然后利用贝叶斯定理,得出参数的后验分布;最后依据后验分布对未知参数进行估计和检验等推断。
20世纪90年代,由于高维计算的困难,贝叶斯方法的应用受到了很大的限制。但随着计算机技术的发展和贝叶斯方法的改进,特别是MCMC方法的发展及WinBUGS等软件的开发应用,使原来复杂异常的数值计算问题变得非常简单,参数后验分布的模拟也趋于方便,所以现代贝叶斯理论和应用得到了迅速的发展[1]。贝叶斯方面的研究论文越来越多,贝叶斯学派已发展成为一个有影响的统计学派,打破了经典统计一统天下的局面[2]。
贝叶斯方法作为科学科研究前沿领域,已得到国内各界的广泛关注。本文借助南京大学中国社会科学研究评价中心《中文社会科学引文索引》(Chinese Social Science Citation Index,简称CSSCI)数据库1998~2010的有关“贝叶斯”收录论文进行计量分析,本文检索方法是在CSSCI来源数据库中检索论文题名或关键字中含“贝叶斯”或“bayes”的论文,共从CSSCI来源数据库中检索到来源文献377篇[3]。在此基础上,本文从统计论文的年代分布、期刊分布、基金项目统计、作者与机构分布以及主题分布与研究热点等方面进行计量分析;文章还利用共被引分析方法对论文所引的参考文献进行作者被引和著作共引分析。通过这些分析,可以深入了解我国贝叶斯发展的进展和存在的不足,以及贝叶斯领域研究前沿的知识基础,对于更好的去研究这一前沿学科提供足够的数据支持,利于更好地去把握当前的研究热点。
1 文献分布
1.1 文献年代分布
由图1可以看出,1998年CSSCI期刊仅有6篇关于贝叶斯的文章刊载,1998~2002年期间每年的发文数量都不超过10篇,总计发文量为41篇,说明我国贝叶斯研究起步较晚且我国在贝叶斯研究领域尚处于起步阶段,但也正是这一时期的研究为贝叶斯在我国的进一步发展奠定了基础。2002年之后,发文数量呈现不断递增的趋势,到2010年发文累积量已达377篇,说明贝叶斯研究在我国不断发展、完善,步入蓬勃兴起的阶段。图1中的论文累计篇数的拟合线近似为指数曲线,由此可以看出,按照普赖斯(D.Price)的逻辑曲线增长理论,现阶段我国“贝叶斯”论文数量以指数方式快速增长,说明仍处于发展时期。
图1 年代分布与累计数
1.2 期刊分布
1998年至今,CSSCI中共有96种期刊收录了贝叶斯方面的论文,论文总量为377篇。其中《统计与决策》、《数理统计与管理》等27种期刊收录了3篇及以上贝叶斯方面的论文,收录论文达286篇,占全部CSSCI期刊收录的贝叶斯方面论文的75.86%。《统计与决策》刊载论文比例最大,占总载文量的27.32%;另外,《数理统计与管理》(占7.69%)和《中国管理科学》(占4.24%)所占比例较大;《统计研究》、《预测》、《心理科学》和《数量经济技术经济研究》载文数量均超过10篇,均达到载文总量的3%。《经济研究》、《金融论坛》等期刊仅刊载1篇相关论文,其载文总量(45篇)占总刊文量的11.94%;《生产力研究》、《中国软科学》等期刊仅刊载2篇相关论文,其载文总量(46篇)占总刊文量的12.20%。
表1 发文量超过3篇的期刊
从期刊所属研究学科来看绝大部分论文所属的刊物都是统计学类,如《统计与决策》、《统计研究》、《数理统计与管理》,我国统计学界对贝叶斯理论发展与继承做出了重要的贡献;除此之外,管理类权威期刊如《中国管理科学》《预测》《管理工程学报》《管理科学学报》《管理世界》,以及经济类权威期刊《数量经济与技术经济研究》《财经研究》《金融研究》《经济理论与经济管理》,也刊载了相当数量的贝叶斯方面论文,说明经济与管理是贝叶斯重要的应用领域;情报学、心理学与哲学等相关领域也有较多论文应用贝叶斯方法结合各自研究领域解决实际问题。由此可以看出,随着贝叶斯方法在多学科交叉应用的发展,贝叶斯方法拥有广阔的应用领域与发展空间。
2 获基金项目资助比例分析
3 作者分布
3.1 核心作者
在377篇相关论文中,共有652位作者,其中第一作者310位。发文量超过2篇(第一作者或独撰)的作者如表2所示。在310位作者中,有269位作者仅发过1篇贝叶斯方面的论文,占全部作者的86.77%,说明贝叶斯在我国学者群内仍未获得足够重视,很多作者只是偶然性的研究和关注。发文2篇的作者共32位,占全部作者的10.32%,说明这32人对贝叶斯进行了较为持续的研究。发文3篇以上的作者共9位,占全部作者的2.90%,他们对贝叶斯进行了更为深入、持续的研究,为目前我国贝叶斯方面的主要研究者;发文量最多的为朱慧明,达15篇,为我国贝叶斯领域的发展传播作出了贡献。
表2 发文量超过2篇的作者(第一作者或独撰)
3.2 作者机构分布
上述310位第一作者来源于165个机构单位,发文量超过4篇以上的机构及机构发文篇数如表3所示。
由表3可以看出,发文量超过4篇以上的机构共有30个,且集中分布在高校,这30个高校的在贝叶斯方面的发文量(78篇)占全部发文量(377篇)的20.69%。在贝叶斯方面发文最多的机构是湖南大学,共发文18篇,是贝叶斯研究领域的领头羊;发文10篇以上的有5所高校,它们都是贝叶斯研究领域的中坚力量。可以看出,高校是我国贝叶斯领域的研究基石,是贝叶斯在我国发展、完善及日益广泛应用中不可或缺的力量。
表3 发文量超过4篇的作者机构(第一作者或独撰)
4 研究热点
4.1 高频关键词统计
一篇文献的关键词是论文核心内容的浓缩和提炼,如果某一关键词在某领域的研究文献中反复出现,则称其为高频词,高频词反映了该领域的研究热点。因而可以通过词频分析法,利用能够揭示或表达文献核心内容的关键词或主题词在期刊中出现的频次高低来确定该领域的研究热点和发展动向,从而对其学术特征与动态发展有一个比较准确、全面的把握[4]。本文根据文献关键词,对CSSCI(1998~2010年)收录的有关贝叶斯的377篇学术论文的关键词进行词频统计[5],且仅保留频数大于3的高频关键词,如表4所示。
表4 频数大于3的高频词
贝叶斯相关学术论文的频数大于20的高频主题词主要有贝叶斯估计(36)、贝叶斯推理(30)、贝叶斯网络(26)、贝叶斯方法(23)与MCMC模拟(23);频数介于10到20之间的高频词主要有Gibbs抽样(12)、贝叶斯均衡(12)、贝叶斯统计(11)、贝叶斯决策(10)、先验分布(10)。可以看出,目前贝叶斯领域的研究焦点是利用贝叶斯方法进行估计、推理及网络分析;贝叶斯决策、贝叶斯均衡和先验分布的确定也是目前的研究热点;同时,可以看出Gibbs抽样和MCMC模拟是目前主要的估计方法,也正是这些方法的出现,极大的解决了贝叶斯中的高维积分等难题,进而推动了贝叶斯在各领域的应用。
4.2 高频主题词共现网络
在贝叶斯学术论文高频关键词统计的基础上,为了更清晰地展示我国贝叶斯研究的热点,本文利用样本文献的标题,借助可视化技术和Netdraw软件,绘制如图3所示的高频主题词共现网络,从而体现其近13年来的研究热点与关联,以期了解热点主题词之间的关联[6,7],为相关学者提供参考。
图1 高频主题词共现网络
图1节点间的矢量线说明主题词间的共现情况,连线粗细或权重大小体现了共现频次,反映高频主题词的关联紧密程度。由图1可以明显看出我国贝叶斯研究的特点:
第一,与贝叶斯有关的方法主要涉及企业、金融、银行、市场、信用、管理、分类和算法等领域;
第二,利用贝叶斯方法进行推断、评估、抽样、组合、评价、分类、预测、实证、影响、决策、理论、博弈和损失等是当前研究的主要目的;
第三,贝叶斯方法、推理、预测为我国博弈、决策和分类等分析问题提供了新的研究视角;
第四,利用实证分析研究企业风险、金融、管理方面的推理、预测等分析研究,以及模型参数的分布是我国现阶段贝叶斯领域的研究热点。
5 文献引用分析
1998~2010 期间CSSCI来源数据库中,我国贝叶斯研究领域方面的377论文中所引用的所有的参考文献(引文),构成了我国贝叶斯研究的知识基础[8]。本文利用CiteSpace软件使用共引分析方法对这些论文及其引文进行作者共引和文献共引分析,以进一步分析贝叶斯领域研究前沿的知识基础,找出在推动我国贝叶斯发展过程中,有着杰出贡献的作者和有着重要影响的著作。
图2 贝叶斯研究领域重要作者的科学知识图谱
作者共引分析的科学知识图谱如图2所示,其中节点代表被引作者,连线代表作者共被引关系,较大的节点集代表在贝叶斯研究领域中有突出贡献的作者群。频次反应节点被引得频繁程度,中心性反应了节点在网络中处于怎样的中心地位,即在网络中的影响力。由图4所示的频率及中心性可以看出,对我国贝叶斯研究影响较大的作者主要有茆诗松、张维迎、张尧庭、陈希孺、朱慧明、Amold Zellner、王春峰、Berger J.O.、周茜和江天骥等。
被引频次多于5次的文献如表5所示,这些重要文献构成我国贝叶斯研究最重要的知识基础。
表5 文献共引科学知识图谱中的关键节点
由图2和表5可以看出,茆诗松是国内贝叶斯研究领域被引次数最多(38次)、网络影响最大(中心性0.54)的作者,他的《高等数理统计》和《贝叶斯统计》也是该领域的重要文献。1998年茆诗松教授著作了《高等数理统计》,1999年又编著出版了《贝叶斯统计》,用生动有趣的例子说明贝叶斯统计的基本思想和方法,为实际中使用和研究贝叶斯统计打下良好基础,是一门很不错的入门教材,该书的出版引发了读者的学习贝叶斯兴趣及使用贝叶斯方法去认识和解决实际问题的愿望和动力[2]。两本著作均是我国贝叶斯研究领域早期的文献之一,出版后即被国内学者迅速引用且一直保持较高的被引频次。
朱慧明也是国内贝叶斯研究领域被引次数(5次)较多、网络影响较大(0.4)的作者。朱慧明教授等在2006年出版了《贝叶斯多元统计推断理论》和2009年出版的《贝叶斯计量经济学模型》,书中均附有实际案例的理论与结果分析,对从事贝叶斯计量和推断理论研究和实际工作的读者具有一定的参考价值,对贝叶斯推断和贝叶斯计量的普及也做出了贡献[9,10]。
2002年度美国经济学联合会将“杰出资深会员奖”授予芝加哥大学的Amold Zellner教授,以表彰他在“贝叶斯方法”方面对计量经济学方面的杰出贡献。1971年,他的名著《An Introduction to Bayesian Inference in Econometrics》问世,在贝叶斯计量经济学的发展史上具有里程碑的意义;1985年他在Econometrica上发表的论文“Bayesian Econometrics”再次引发了贝叶斯计量经济学研究的狂潮[11]。随后逐渐形成贝叶斯计量经济学这一方向。在贝叶斯领域,Amold Zellner至今仍是在网络中保有较高的影响力的学者之一。2005年,张尧庭教授将该著作翻译成中文并添加了一些材料,《计量经济学-贝叶斯推断引论》一书的引入,必将引导国人更进一步的了解贝叶斯方法的本质[12]。
6 结论
综合全文的分析结果可以看出,我国贝叶斯研究有以下特点:
第一,我国贝叶斯研究进程具有自己的特点。我国贝叶斯研究起步较晚,目前正经历不断发展、完善,步入蓬勃兴起的阶段。统计学类期刊在我国贝叶斯研究中起着重要的推动作用。高校是我国贝叶斯研究的中坚力量。国家级基金等各类项目的资助学术论文也有效地保证了论文的学术水平和创新水平。茆诗松、Zellner Amold等众多学者及其文章和著作也是贝叶斯研究进程中不可或缺的读物。
第二,贝叶斯主要应用及关注领域。贝叶斯方法在经济学、管理学、情报学、心理学以及哲学等学科领域都有其重要的应用。与贝叶斯有关的方法、推理、预测、决策,以及在企业、金融、银行、市场等领域的应用是贝叶斯研究的重点关注领域。
第三,贝叶斯主要研究方法及研究热点。Gibbs抽样和MCMC模拟成为目前贝叶斯领域的主流方法。贝叶斯方法进行估计、推理、预测及网络分析为我国博弈、决策和分类等分析问题提供了新的研究视角。贝叶斯方法对企业风险、金融、管理方面的推理、预测等实证分析研究,以及模型参数的分布是我国现阶段贝叶斯领域的研究热点。国际上,无论是在理论研究还是应用研究,贝叶斯方法都显示出迅猛的发展势头。尽管我国CSSCI收录的各领域的贝叶斯方面的论文数量逐年上升,但是在国内,对贝叶斯的研究似乎还处于蓬勃发展的前期阶段,大多还处于对国外研究方法等成果的引入及消化中,尚未形成系统的理论及自己的特色。我国贝叶斯理论及应用研究的空间依然很广阔,如何推动贝叶斯方法在我国的全面发展还需要不懈的努力。
[1]Brooks S.Markov Chain Monte Carlo Method and its Applicatoin[J].The Statistcian,Part 1,1998,47(1).
[2]茆诗松.贝叶斯统计[M].北京:中国统计出版社,2005.
[3]刘乐平,袁卫.现代贝叶斯分析与现代统计推断[J].经济理论与经济管理,2004,(6).
[4]南京大学中国社会科学评价中心.中国社科引文索引(CSSCI)[EB/OL].http://cssci.nju.edu.cn.
[5]马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,(2).
[6]汤建民.2006年国内科学学研究的词频分析与计量研究[J].科学学研究,2007,(S2).
[7]蒋永新,詹华清.基于共现关键词统计的图书馆学情报学学科研究趋势分析[J].图书情报工作,2008,(9).
[8]陈超美,陈悦,侯剑华,等.CiteSpaceII:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,(3).
[9]朱慧明,韩玉启.贝叶斯多元统计推断理论[M].北京:科学出版社,2009.
[10]朱慧明,林静.贝叶斯计量经济学模型[M].北京:科学出版社,2009.
[11]Zellner Bayesian Econometrics[J].Econometrica,1985,53(2).
[12]张尧庭.计量经济学-贝叶斯推断引论[M].上海:上海财经大学出版社,2005.