基于文献计量学方法的中国医科大学基础医学院科研活动的分析
2010-11-15潘现伟温立洁崔雷
潘现伟,温立洁,崔雷
(中国医科大学 1.信息管理与信息系统(医学);2.9 2期七年制临床医学,沈阳 1 1 0 0 0 1)
科研论文是记录科研成果的主要载体,是反映国家、机构单位以及个人科研能力、科技发展水平的重要指标[1]。文献计量学是从定量的角度来分析科研论文相关指标的一门科学。文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等的计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,进而探讨科学技术的某些结构、特征和规律的一门学科[2],文献计量学的统计指标主要包括文献数量、类型、学科、引文、著者数、主题词、著者单位等[3]。运用文献计量学对科研机构进行绩效评价,可以帮助科研管理部门更全面客观地了解科研机构的科研能力,明确该单位的研究热点,及时指导该单位的科研方向。
基础医学研究是医学科学发展的基础和有力支撑,基础医学院作为我校科研活动的主力军在我校科研活动中具有举足轻重的地位。因此,有必要对我校基础医学院科研活动进行客观总结和分析,揭示其科研水平、研究重点和发展方向,为基础医学院今后发展提供参考。
1 资料来源及方法
1.1 资料
对中国知网(China national knowledge infrastructure,下简称CNKI)的《中国学术期刊网络出版总库》1978-2006年29年间收录中国医科大学基础医学院(以下简称基础医学院)发表的论文进行文献计量学分析,对论文年代、单位、载文期刊、作者发文量、关键词频次统计分析。
本研究运用该数据库的专业检索功能,检索策略为:
“(AF%中国医科大学基础)or(AF%中国医科大学生物化学)or(AF%中国医科大学病理)or(AF%中国医科大学生理)or(AF%中国医科大学解剖+中国医科大学人体解剖)or(AF%中国医科大学组织学与胚胎学)or(AF%中国医科大学细胞工程)or(AF%中国医科大学病原生物)or(AF%中国医科大学免疫)or(AF%中国医科大学组织工程)or(AF%中国医科大学机能实验)or(AF%中国医科大学细胞生物)or(AF%中国医科大学发育生物)or(AF%中国医科大学基因组)or(AF%中国医科大学生物芯片)or(AF%中国医科大学遗传)or(AF%中国医科大学神经生物)or(AF%中国医科大学生物医学工程)or(AF%中国医科大学数学)or(AF%中国医科大学计算机)or(AF%中国医科大学物理)or(AF%中国医科大学化学)or(AF%中国医科大学运动医学)or(AF%中国医科大学体育)or(AF%中国医科大学英语)or(AF%中国医科大学日语)or(AF%中国医科大学俄语)”
该检索策略检索出所有作者单位字段中含有“中国医科大学基础”字样的记录,如“中国医科大学基础部”,“中国医科大学基础医学院”,“中国医科大学基础医学部”等,同时也检索作者单位字段中未标注“基础”字样,而是直接列出基础部下属教研室名称的文献记录,如单位名称中“中国医科大学细胞生物”的记录。
考虑到部分教研室名称的变化,有些老师在署名时用教研室的简称,比如“中国医科大学生化教研室”、“中国医科大学病生教研室”等,本文又对各教研室的曾用名和别名做了汇总,并应用该数据库的标准检索功能进行了补充检索,运用软件进行去重。
检索出该数据库收录1978-2006年的中国医科大学基础医学院发表的论文4 118篇。
1.2 方法
对于检索到的4481篇文献运用文献管理软件NoteExpress-2.6.1.1512进行去重后得到目标文献集4 118篇。对去重后的文献记录,运用自编软件[4]处理如下指标:
(1)发表年代:提取论文的发表年代并统计,绘制1978-2006年间的年代—发文量曲线;(2)单位:提取论文作者所属的单位(教研室),并统计基础医学院各教研室的发文量;(3)期刊:提取载文期刊,统计后截取载文量在20次以上的期刊,按照载文量降序排列;(4)作者:提取论文的作者字段并统计,截取发文量在40篇以上的作者;(5)关键词共现聚类分析:对论文的关键词字段进行提取、统计,抽取其中高频关键词(20次以上),统计这些高频关键词在每篇论文出现的情况,形成关键词-论文矩阵。利用SPSS11.5统计软件对高频关键词-论文矩阵进行系统聚类分析,即根据这些高频关键词在同一篇论文中出现的频次将这些高频关键词分类。聚类方法采用组间平均距离法,相似系数选择Phi 4-point correlation;(6)聚类分析结果解读:根据高频关键词共现聚类的结果,分析含有相应关键词的论文,总结出各个类别的主要内容,并列出相应各个类别的主要作者,根据这些论文在CNKI中被引用和下载次数,作为比较有影响的论文列出。
2 结果与分析
2.1 论文年代分布
单位发表论文数量的年代分布反映了该单位科研活动的动态和趋势。中国医科大学基础医学院1978-2006年发表论文共4 118篇。通过对表1中的数据进行曲线拟合,发现基础医学院的发文量逐年递增,并在2005、2006年发文量大幅度提高,符合指数增长模型(y=30.73e0.0874x,R2=0.896 3),这说明基础医学院科研活动符合科学发展的普遍规律,具有上升态势。
2.2 论文单位分布
表2为1978-2006年基础医学院各科室的发文数量,病理学教研室位居榜首,病原生物、解剖教研室次之。依据发文数量可以把基础医学院的教研室分为4种类型:
(1)发文量在700篇以上:如病理学、病原生物学、解剖学、生物化学;
(2)发文量在250~700篇之间:如药理学、遗传学、组织胚胎学、生理学、病理生理学、细胞生物学、免疫学、神经生物学;(3)发文量在110~200篇之间:如化学、发育生物学、物理学;(4)发文量在6~100篇之间:如生物芯片中心、基因组学、日俄语等。
表1 基础医学院1 9 7 8-2 0 0 6年发表论文统计T a b.1N u mb e r o f t h ea r t i c l e sp u b l i s h e db ya u t h o r sf r o m C o l l e g eo f B a s i cMe d i c a l S c i e n c e s b e t w e e n 1 9 7 8 a n d 2 0 0 6
表2 基础医学院1 9 7 8-2 0 0 6年各科室发文量统计T a b.2S t a t i s t i c a l a n a l y s i so f t h ea r t i c l e sp u b l i s h e db ya u t h o r s f r o m C o l l e g eo f B a s i cMe d i c a l S c i e n c e sb e t w e e n1 9 7 8 a n d 2 0 0 6,a c c o r d i n g t o d e p a r t me n t
这说明基础医学院占有优势的教研室仍然是传统的重点学科科研单位,如病理学、病原生物学、解剖学、生物化学,而一些公共基础学科的教研室和新成立的教研室发表论文较少。
2.3 期刊分布(表3)
表3 刊载基础医学院论文2 0篇以上的期刊T a b.3 J o u r n a l s p u b l i s h i n g mo r e t h a n 2 0 a r t i c l e s w r i t t e n b y a u t h o r s f r o mC o l l e g e o f B a s i c Me d i c a l S c i e n c e s
表3是刊载基础医学院论文20次以上的期刊(共计33种),占总发文量的62.982 8%。从表中可以看出,中国医科大学基础医学院的论文绝大多数是发表在该校学报上,为1 115篇,占总发文量的27.082 8%,位于第二位的是《解剖科学进展》,共收录198篇,占总发文量的4.809 3%,第七、八名也是与解剖学有关的期刊,这3种与解剖学有关的期刊载文量占总发文量的7.602 6%,也从侧面说明了解剖学在基础医学院科研能力上占有相当重要的地位。载文量排名第三的《实用乡村医生杂志》和排名第六的《日本医学介绍》主办单位为中国医科大学,由此可见,该单位发表的中文论文的载文期刊以本校主办的期刊为主,在其他等级较高的期刊上发文量较少,这一现象应引起高度重视。
2.4 作者发文量统计
研究学术论文的作者分布,可分析单位的科研群体现状以及学科带头人的情况。表4列出了基础医学院发表论文40篇以上的42位作者,这些作者发表的论文数占全体基础医学院作者发表论文总数的17.473 4%,可谓高产作者。由于统计的时间跨度较大,作者发文数量的分布反映了基础医学院科学研究历史的积淀,高产作者中德高望重或者业已退休的知名教授占有较大比例,如李吉教授,柏树令教授和宋今丹教授,这3位教授发文量累计百分比为2.5%。从总体来看,高产作者的发文量并没有较大的差距,发文数量按照作者排序呈缓慢递减,说明基础医学院的科研力量处于稳定发展之中。
2.5 关键词频次分析
表5列出的是基础医学院发表论文中出现频次大于20次的高频关键词,从表中可以得出,位于第一位的是“免疫组织化学”,是一种研究方法;位于第二位的“基因”为研究对象;第三位的“海马”是大脑内的一个结构,也是研究对象。这些词出现频次较高,说明这些方面的研究是基础医学院科学研究的重要方向。
高频关键词-论文矩阵局部图如表6所示,第一行是文章的编号,第一列是高频关键词。数据区域中“1”表示某一关键词出现在所对应的文章中,“0”表示没有出现。
根据高频关键词在同一篇文献中出现的次数进行聚类,结果如图1所示。
通过对高频关键词的聚类树图的分析,可得知基础医学院近30年来研究的主题主要在以下几个方面:
表4 基础医学院年作者发表论文统计T a b.4 S t a t i s t i c a l a n a l y s i s o f t h e a r t i c l e s p u b l i s h e d b y a u t h o r s f r o m C o l l e g eo fB a s i cMe d i c a l S c i e n c e sb e t w e e n1 9 7 8a n d 2 0 0 6,a c c o r d i n g t o a u t h o r
(1)神经生长因子、降钙素基因相关肽、哮喘:自1995年开始,神经生物学教研室方秀斌教授、解剖学教研室的佟晓杰教授等开展这方面的研究,发表了较多比较有影响的论文,如《哮喘豚鼠下呼吸道及内脏传入部位NGF表达的研究》、《实验性哮喘时神经生长因子对神经激肽A的上调作用》、《实验性哮喘豚鼠内脏感觉传入部位SP免疫反应的研究》、《降钙素基因相关肽在哮喘豚鼠内脏传入系统的定量分析》等。
表5 基础医学院1 9 7 8-2 0 0 6年发表论文关键字段频次统计分析T a b.5S t a t i s t i c a l a n a l y s i so f t h ea r t i c l e sp u b l i s h e db ya u t h o r sf r o m C o l l e g eo f B a s i cMe d i c a l S c i e n c e s b e t w e e n 1 9 7 8 a n d 2 0 0 6,a c c o r d i n g t o t h e f r e q u e n c e o f k e y w o r d s
(2)海马、铅:自1997年以来,孙黎光教授和高明奇教授等一直从事这方面的研究,较有影响的论文有《铅对小鼠海马c-jun表达及学习记忆功能影响》、《急、慢性铅中毒对海马CA1区长时程增强和活化的细胞外信号调节激酶2影响》、《慢性铅暴露对小鼠CaMKII蛋白表达的影响》、《铅对小鼠学习记忆功能及海马区c-fos表达的影响》等。
(3)基因、胃癌:这方面在孙开来教授和张学教授的指导下,从1993年开始了研究,发表了多篇高质量的论文,如《白细胞介素1B及RN基因多态性与胃癌易感性的关系 》、《东北地区汉族人群DNA修复基因XPD单核苷酸多态性与胃癌的相关性》、《胃癌发生发展相关基因筛选与表达分析》、《多重置换扩增结合激光捕获显微切割技术在胃癌基因组学研究中的应用》等。
(4)免疫组织化学、蛋白质、预后、非小细胞肺癌、肺癌:从1998年开始研究,该领域的带头人是王恩华教授和邱雪杉教授,发表的高质量论文有《上皮性钙黏附蛋白和β-连环素的表达与非小细胞肺癌预后的关系》、《MRP在非小细胞肺癌和正常肺组织中表达及其预后意义的研究》、《细胞周期素A的表达与非小细胞肺癌增殖及预后的关系》、《肝素酶在人非小细胞肺癌组织中的表达研究》等。
(5)肺肿瘤、癌、受体:这方面的研究始于2001年,在王恩华和邱雪杉教授的带领下发表论文较多,具有代表性的论文有《血管内皮生长因子C及其受体3在非小细胞肺癌组织中的表达及意义》、《Pin1与β-catenin在肺鳞癌和肺腺癌中的表达及意义》、《TSG101与P21及P300/CBP在肺鳞癌和肺腺癌中的表达及意义》、《ILK与E-cadherin在非小细胞肺癌中的表达及意义》等。
表6 高频关键词-论文矩阵局部表T a b.6 L o c a l s a mp l e o f h i g h-f r e q u e n c y k e y w o r d s-a r t i c l e s
(6)内皮细胞、一氧化氮:在这方面发表的论文有《脂质过氧化损伤对培养内皮细胞产生cAMP、一氧化氮的影响》、《L-NMMA对去甲肾上腺素诱导的家兔肠系膜微血管运动的影响》、《一氧化氮似不参与川芎嗪抑制家兔肠系膜微血管运动》等。
(7)肿瘤、内质网:宋金丹和陈誉华教授等从1997年开始了这方面的研究,发表论文主要有《全反式维甲酸诱导人卵巢癌细胞凋亡的实验研究》、《不同人大肠癌细胞内质网合成的二硫键异构酶研究》、《人大肠癌与早幼粒白血病细胞中内质网分子伴侣Grp94的差异表达》、《不同侵袭力癌细胞内质网膜系统的对比研究》、《人大肠癌细胞中内质网分子伴侣Grp94与c-myc癌基因在表达上的相关性》、《人癌细胞内质网分子伴侣Grp94基因近3′端的初步分析》等。
(8)基因表达、凋亡、大肠癌:这方面研究是在宋继谒和孙开来教授的带领下进行的,从2001年起发表具有代表性的论文有《凋亡和相关蛋白bcl-2在肺癌组织中的表达及对预后的影响》、《Survivin反义寡核苷酸对骨肉瘤细胞凋亡的诱导效应》、《端粒酶基因与凋亡相关基因在乳腺导管非典型增生中表达的相关性研究》、《凋亡相关基因p53、bcl-2在乳腺导管非典型增生中表达的研究》等。
(9)卫氏并殖吸虫、白细胞介素:在这方面发表的论文有《卫氏并殖吸虫病患者细胞免疫功能变化的观察》等。
(10)扫描电镜、超微结构:运用扫描电镜观察超微结构的研究开始于1982年,在这方面宋今丹教授、柏树令教授、石玉秀教授和罗恩杰教授等都发表了多篇高质量文章,如《癌基因转染后细胞内质网膜系统的超微结构变化》、《怡乐村并殖吸虫的扫描电镜观察》、《卫氏并殖吸虫毛蚴超微结构的观察》、《鼠正常心肌细胞表面形态的扫描电镜观察》、《大平并殖吸虫后尾蚴的扫描电镜观察》、《法乐四联症心肌纤维扫描电镜的观察》、《升主动脉缩窄鼠升主动脉瘤的扫描电镜观察》等。
3 结论与讨论
过去近30年间,基础医学院的科学研究活动在整体上呈现上升趋势;病理学、病原生物学、解剖学、生物化学是基础医学院的强势学科;基础医学院发表的中文论文的期刊主要以该校学报为主,发表论文较多的期刊总体水平较低,在高水平期刊上发表论文较少;发表论文在100篇以上的作者较少,大部分作者发文量在40~60篇。基础医学院已经形成了自己的研究方向和特点:包括(1)哮喘,神经生长因子,降钙素基因相关肽;(2)海马,铅;(3)基因,胃癌;(4)免疫组织化学,蛋白质,预后,非小细胞肺癌,肺癌;(5)肺肿瘤,癌,受体;(6)内皮细胞,一氧化氮;(7)肿瘤,内质网;(8)基因表达,凋亡,大肠癌;(9)卫氏并殖吸虫,白细胞介素;(10)扫描电镜,超微结构。
本研究试图通过文献大致勾勒出基础医学院近30年来科学研究的基本情况,包括总体趋势和发表论文的质量,各教研室发表论文的基本情况,以及主要研究方向等。机构和个人绩效评价是一个敏感的话题,关于本研究,需要说明的是:
首先,论文仅仅是科学研究成果的一部分,对论文的统计不能代表科研课题和成果等其他指标。
其次,即使是对论文的统计,本研究也仅仅是在中文数据库中收录的期刊论文,未能包括发表在英文期刊上的论文(包括SCI论文),这些论文则代表了单位和个人的高端研究成果。
最后,在研究方法上,本研究中所搜集的数据受到数据库收录文献数据全面性的限制,尤其是特殊年代(如“文革”期间)文献发表数据的缺失,本研究只能对从CNKI中检索到的论文进行的统计分析。同时,本研究的全面性也受到作者隶属单位署名上的不规范现象的制约,在对基础医学院下属机构发表论文的统计过程中,我们发现部分作者的单位署名中既没有“基础”字样,也没有具体的教研室,而是一些研究室、实验室、实验中心等,如“中国医科大学电镜室”,“中国医科大学第二电镜室”,“中国医科大学听力研究室”,尽管我们尽可能全面搜集到基础医学院下属机构的文献,仍然会有被遗漏的单位,造成部分论文统计上的缺失。另外,机构单位的合并,人员调动等因素都会影响到统计结果。
因此,在此郑重声明,本研究意在总结中国医科大学基础医学院的近年来科研活动的状况、科研内容和方向,对于涉及到的作者排名、教研室发文量排名信息只是对基本情况的粗略描述,仅供参考。
[1]周子布,孙小虎.保定市主要医疗机构科研产出能力分析研究[J].医学情报工作,2004,(2):95-97.
[2]张琪玉.张琪玉文献情报语言学文集[M].北京:北京图书馆出版社,1999.
[3]陈文爱,杨璐,赵瑞刚.简析科研产出的文献计量学评价方法[J].图书馆工作与研究,2007,(4):73-74.
[4]崔雷,刘伟,闫雷,等.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008(8):70-75.