陕西皮革科技人才群体两个十年的同被引分析与比较
2010-02-23方小容艾学涛蒋林宙高档妮
方小容, 艾学涛, 蒋林宙, 吴 硕, 高档妮
(陕西科技大学图书馆, 陕西 西安 710021)
0 引言
共引分析的研究是1973年由美国情报学家Small开始的[1].之后,这方面的研究工作在国外便广泛地开展起来,成为引文分析研究中的热点.Small是以文献为分析单位做共引分析研究的,1981年White等人又把分析对象扩大至作者,并将之称为“作者同被引”(ACA, Author Co-citation Analysis)[2].从此,共引分析开始泛化,分析对象由文献进一步扩大至期刊、主题词甚至内容词.国内也紧随其后,从20世纪90年代初开始,就注意到了共引分析,并随之开展了研究,进而加入了泛化的应用研究行列,涉及的领域也由情报学扩大至医学、农业等学科[3].
共引分析自诞生以来,其理论和方法逐渐成熟,应用实践范围不断扩大.其分析结果的客观系统性,使得它已成为一种可靠实用的情报研究方法.目前看到的共引分析的应用范围还主要在情报学、生物、医学、农业等一些学科领域,而未见有与产业直接挂钩的,特别是在陕西省,这方面的应用研究尚处于空白.陕西省的产业发展与沿海地区以及发展水平相近的中西部省区相比,又有一些不同的特点和问题需要我们用新的观点和方法去深入地考察和研究.因此,如能将共引分析的应用范围扩大至产业领域,并得出产业发展的表征统计特征及其影响要素,如科技人员群体结构特征之间的直接关联,则有助于促进某些行业的产业健康、快速的发展.
据我们的调查和判断,皮革及皮革化工专业在陕西是有典型代表性的,该学科专业在科技人才群体结构方面可能具有较为鲜明和典型的特点,从而便于进一步考察其对产业发展的促进作用,因此本工作拟以该学科专业作为典型,采用ACA技术,选取最近10年(1999~2008年),并追溯到更早的10年(1989~1998年),对这两个10年期间内的科技人才群体结构进行考察,然后做较为详尽的分析和比较,试图找出其演进的规律性,以期为今后进一步开展研究奠定基础.
1 数据采集、计算及结果
共引分析在经历了实践探索期、理论研究期和理论形成期等几个发展阶段之后,至20世纪90年代末进入了完善发展期.共引分析方法在其发展过程中,还借鉴引入其它学科的方法,从而进一步充实和完善了它的方法体系.1990年McCain将ACA的工作步骤归纳为:(1)确定核心作者;(2)检索同被引频次,并构成同被引频次矩阵;(3)转换为Pearson相关系数矩阵;(4)进行多元统计分析;(5)给出人文社会科学意义下的诠释.
人们把按照这些步骤进行的工作称作“传统ACA”,并且广泛地加以推广和应用[4].本工作亦拟沿用传统ACA方法对陕西省皮革及皮革化工学科专业的科技人才群体结构进行考察和研究.
1.1 数据采集与预处理
1.1.1 核心作者的确定
施泰特原以为经营杂货店是一件非常简单的事情,把门一开等人进来购物就行,但让他没有想到的是,生意远不如他想的那么容易做。为了卖出更多的商品,他使尽浑身解数,不断向人吹嘘和推荐自己店里的商品是多么好,可这也根本不管用,杂货店的生意还是和原来一样惨淡。究竟怎么样才能卖出更多的商品呢?施泰特纳闷了。
本工作以中国学术期刊全文数据库(CNKI)作为统计源,根据陕西皮革及皮革化工学科专业的有关作者在前后两个10年(1989~1998年和1999~2008年)的发表论文篇数和被引证篇次数等指标,初步选择了核心作者.然后,又根据调研结果,补充了个别在产业界和学术界里颇负声望的作者,以使研究结果更加贴近行业和学科专业的实际,并有更大的指导意义.最终,我们对前10年选择18位,对后10年选择28位核心作者进行研究,入选的核心作者的名单(按音序排列)列于表1.为了便于比对和简化,我们对于每位核心作者在前后两个10年中采用了同样的、唯一的编号.
表1 两个十年期间的核心作者及其发表论文篇数和平均同被引次数表
1.1.2 检索同被引频次,并构成同被引频次矩阵
我们在本工作中采用了传统ACA方法,对同被引数据应用聚类分析、非线性映射和因子分析等多元统计分析方法进行了处理.
本工作的因子分析采用主成分分析方法,其结果经过方差极大化正交旋转.因子分析的结果,即累积方差贡献超过85%的前面若干个因子的载荷分布列出于表2和表3.在做因子分析时,顺便计算了各位核心作者的平均同被引次数,其值一并列于表1中,以备检验核心作者的选择是否恰当.
在随后的多元统计分析中,通常都先将同被引频次矩阵转化为Pearson相关系数矩阵,这一工作可以调用社会科学统计分析软件SPSS完成,也可按其定义式自行编程完成计算[5].
为了更好地优化门诊服务管理,2015年,李红副院长和林茜主任开始建立专责小组,采用信息系统数据采集和现场调查两种方式追踪医生、患者行为,力图发现门诊管理的一些问题。
食品的健康、安全与美味是每一位妈妈最关心的问题。为了让孩子们多吃一点、吃得健康、吃得美味,每位妈妈都在刻苦地学习和钻研。今年盛夏,年满30周年的太太乐将带领大家解决增“鲜”困扰,一起畅享鲜活人生!
1.2 多元统计分析与其结果
我们在本工作中以核心作者间的同被引Pearson相关系数矩阵为对象,进行了多元统计分析,采用的方法包括聚类分析、非线性映射、因子分析等.具体的原理、方法可参看有关专著,此处不再赘述[6].
环节三: 播放细胞免疫的趣味动画,指导学生观看动画,结合教材细胞免疫示意图,运用概念图的形式构建细胞免疫概念模型(图3)。
图1 前10年(1989~1998年)同被引数据的聚类树
图2 后10年(1999~2008年)同被引数据的聚类树
非线性映射方法能够在二维平面上直观地反映科技人才群落的高维空间关系的映像,且在很多情况下能与聚类树相互印证,因而颇受欢迎.非线性映射的结果分别示于图3和图4.
聚类分析采用系统聚类方法,选用类平均法计算类间距离,以Pearson相关系数作为相似性尺度.两个10年期间的聚类结果以聚类树分别绘出,如图1和图2所示.
图3 前10年(1989~1998年)同被引数据的非线性映射图 图4 后10年(1999~2008年)同被引数据的非线性映射图
1.1.3 转化为Pearson相关系数矩阵
2 分析与比较
2.1 关于学科专业的选择、核心作者的确定
从本工作的一些结果来看,选择皮革及皮革化工专业作为典型代表是适宜的,接下去所确定的核心作者也大体上是恰当的.由表1所列出的这些核心作者间的平均同被引次数在前后两个10年期间中在当时都比较高,因此可作为研究对象,经过多元统计分析可以明显地被划分为若干个“类”(亦可称作“组”、“簇”或“群”等等),并显现出该学科专业科技人才群体结构的一些特点,可供提取定量特征和做进一步的研究之用.
2.2 关于ACA方法应用的效果
检索核心作者同被引频次是ACA中的关键步骤.本工作选择CNKI作为统计源,利用该数据库系统引文检索中的作者同被引检索功能,在线进行检索.在同被引频次的统计的基础上,可形成核心作者的同被引频次矩阵.
由图1可以看出在前10年期间,18位核心作者中的17位大致聚成5类.我们已在非线性映射图(图3)上将各类分别圈出.
通过阿伏加德罗常数的应用来考查物质的量、物质的量浓度、阿伏加德罗定律、气体摩尔体积等概念的理解,或考查利用物质的量在元素化合物、原理方面中的应用。
表2 前10年(1989~1998年)同被引数据的因子载荷表
表3 后10年(1999~2008年)同被引数据的因子载荷表
(续表3)
2.3 皮革及皮革化工学科专业科技人才群体结构在前后两个10年间的演进与比较
对比皮革及皮革化工学科专业前后两个10年间的同被引数据及其多元统计分析结果,就可以看到该学科专业的巨大进步和科技人才群体结构的显著差异.
与前10年相比,后10年的核心作者人数有了较多的增加,即从18位增至28位,而且不论是发表论文篇数,还是平均同被引次数都有飞跃的增加:
之所以在前后两个10年期间有如此之大的飞跃,虽然有互联网技术和数据库系统的发展、完善,使信息传播速度加快等方面的技术原因,但更主要的原因还是相关产业的蓬勃发展,从而有力地促进了科学研究和技术开发的规模与深度,这也正是我国改革开放30年来社会和经济巨大发展的一个反映和缩影.
后10年,核心作者人均发表论文48.36篇(最高为191篇),平均同被引次数为9.93次(最高为31.61次,其中在10.00次以上的就有12人).
由图2可以看出在后10年期间,28位核心作者中的23位大致也聚成5类.我们同样地也已在非线性映射图(图4)上将各类分别圈出.
前10年,核心作者人均发表论文20.78篇(最高为41篇),平均同被引次数为1.07次(最高为2.78次,其中在1.00次以上的仅有8人).
再从该学科专业科技人才的群体结构来看,在前后两个10年期间,也发生了显著的变化:
倡导民生水利的发展理念,就要求人们不能就水利看水利,就工程论工程,而要跳出水利看水利,始终站在民生的角度审视和发展水利,把惠泽民生作为水利工作的价值追求,贯穿于水利工作的各个领域,自始至终,矢志不渝。
审计委派制的实施虽然历史性的打破了区块界限,实现了审计人员跨区域审计,但是由于审计人员的管理以驻地公司管理为主,审计人员跨区域审计受到不同程度的限制,全省系统重点审计项目受到一定的制约,审计整体调控能力还有较大的提升空间。
在前10年中,可以明显地看到群体的各类里中老年核心作者的因子载荷都非常高.表2中列出的因子载荷很高的核心作者,如:因子Ⅰ:潘津生 0.845,章川波 0.842;因子Ⅱ:李景梅 0.913,俞从正 0.884;因子Ⅲ:李临生 0.923,魏世林 0.689;因子Ⅳ:兰云军 0.853,常新华 0.811,就是很明显的例证.他们都曾在各自的研究领域中“担纲”,作为“学术带头人”、“领头羊”,发挥过重要的作用.
在前10年的各类中,皮革工艺与皮革化工材料两个专业的分界并不很清晰,两个专业的核心作者经常共处于同一个类内.
到了后10年,皮革化工材料专业逐渐地与皮革工艺专业分离,形成了相对独立的“类”.由表3,并对照图2和图4,可以看到以因子载荷最高的李临生为代表的因子Ⅰ(成员还有罗晓民、强西怀、王学川、沈一丁和马建中等)就是一个以皮化专业人员为主的新“类”.而且,在这些类里面,许多中青年核心作者的因子载荷都相当高.再对照表1的发表论文篇数来看,一些老年核心作者因为退休等原因,后10年比前10年发表论文的篇数显著地减少了,而中青年核心作者发表的论文篇数和平均同被引次数却是扶摇直上,成为“担纲”的新生力量.中青年核心作者不仅在这些数量指标上崭露头角,呈现出“后生可畏”的勃勃生机,而且他们的研究领域及方向也更加宽泛.对比表2和表3,可以看到在前10年期间,没有一位核心作者在2个或2个以上因子中均有载荷,这说明他们的研究领域和方向可能是比较单一的.而在后10年中,就可看到马建中、王全杰均各自在2个因子中有较高的载荷,这说明他们是“跨类”人才.
作为一种非常古老的海洋动物,早在寒武纪时期,鲎就已经出现在地球上了,而且至今仍保持着“当年”的形态,堪称海洋世界里的“远古遗民”。为什么和它同时代的动物大都灭绝了,唯独鲎幸存下来了呢?
3 结束语
本工作选择了陕西的一个具有典型代表性的学科专业作为研究对象,比较客观地确定了一批核心作者,对前后连续的两个10年间的同被引数据采用传统的ACA方法进行了分析和比较.结果证明:在研究一个学科专业的科技人才群体结构这一新领域的问题时,应用这一方法是可行的.通过比较研究,更使我们看到了该学科专业的巨大进步和其科技人才群体结构的显著变化,这些工作为今后定量特征的提取、研究其对相关产业发展的促进作用都奠定了良好的基础.
[1] Small, H· D·.Co-citation in the scientific literature: a new measure of the relationship between two documents[J] .Journal of the American Society for Information Science, 1973, (24):265-269.
[2] White, H·D·, Griffith, B·C·.Author cocitation: a literature measure of intellectual structure[J].Journal of the American Society for Information Science, 1981, (5):163-171.
[3] 耿海英,肖仙桃.国外共引分析研究进展及发展趋势[J].情报杂志,2006,(12):68-69,72.
[4] 马费成,宋恩梅.我国情报学研究分析:以ACA为方法[J].情报学报,2006,25(3):259-268.
[5] 郭志刚.社会统计分析方法——SPSS软件应用[M].北京:中国人民大学出版社,1999:119-121.
[6] 王学仁.地质数据的多变量统计分析[M].北京:科学出版社,1986:207-331.