基于科技论文的医学院校学科结构发展可视化分析
2014-04-03邱宇红
邱宇红
〔摘 要〕高校科技论文的产出是描述和评价高校科研活动的重要指标。本文以科学引文索引(SCIE)收录的中国医科大学2003-2012年发表的科技论文为数据源,利用SCIE的分析功能和Citespace绘制论文的期刊分布、合作者、学科领域、文献共词等可视化图谱,以揭示医学高校学科结构的发展变化,为学科建设制定规划提供一定的参考依据。
〔关键词〕学科结构;可视化分析;CiteSpace
DOI:10.3969/j.issn.1008-0821.2014.02.025
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2014)02-0121-08
学科建设水平是高校核心竞争力的基础,它的建设和发展直接关系到大学的水平和实力。教育部的国家重点学科建设促进了高等学校学科结构的调整和优化,各高校都设立学科建设处专门负责本校的总体发展规划和学科建设规划,管理全校的学科建设工作。这都反映出从国家到地方对学科建设的投入和重视。因此揭示学科结构发展的规律对高校制定学科发展战略具有重要参考价值和意义。论文产出的数量、质量及学科专业属性能够描述高校的科研活动方向,直接对应于高校的科研分布体系[1]。本文以中国医科大学(以下简称医大)为例,基于SCIE检索系统收录该校2003-2012年发表的科技论文为数据源,对各学科论文产出情况进行可视化分析,探讨该校学科结构发展的现状及趋势。
1 方法和数据源
1.1 方 法美国Drexel大学陈超美博士开发的基于JAVA平台的CiteSpace软件是文献引文网络分析工具,属于多元、分时、动态的第二代信息可视化技术。CiteSpace基于研究前沿和知识基础两个概念,绘制的知识图谱可以显示一个学科或知识域在一定时期发展的趋势与动向[2]。
1.2 数据源选择美国科学情报研究所创建的SCIE数据库为数据源,检索策略为:地址=China Med Univ AND(Liaoning OR Shenyang),出版年=2003-2012,检索日期为2013年6月19日,共检索到文献4 390篇,引文数据113 820条,总被引频次为23 636次。将检索结果下载包含引用参考文献的全记录,导入CiteSpace软件(2012年1月发布3.0.R5版本),分析论文发表的年代分布、期刊分布、全作者、学科领域、期刊共引等信息,绘制网络可视化图谱。本文在分析时将数据源分为2003-2007年、2008-2012年2个时间段,分别可视化,以对比分析学科结构的发展变化。
2 结果与分析
2.1 发表论文年代分布SCIE收录的医大2003-2012年间发表的论文的数量和论文被引频次分布结果如图1所示。图1 SCIE收录医大发表论文数量和被引频次分布(2003-2012)
在2003-2012年10年间,医大论文数据增长迅速,尤其是2007年以后,每年以150篇左右的速度增长。被引频次在2008-2009年达到最高峰,2003-2009年间,被引频次的增长速度高于论文数量的增长,表明中国医科大学所发表论文的质量有了显著的提高。普赖斯在对《科学引文索引》(SCI)所做的统计分析中发现,在被调查的1年内所发表文献的全部参考文献中,有一半文献是在近五年内发表的,并在此基础上提出了普赖斯指数的计算公式[3],说明论文在发表5年后被引频次会达到高峰。因此2010-2012年发表的SCIE论文的被引频次下降不能说明论文质量下降,与论文发表时间短有关,还需进一步的统计研究。
2014年2月第34卷第2期现?代?情?报Journal of Modern InformationFeb.,2014Vol.34 No.22014年2月第34卷第2期基于科技论文的医学院校学科结构发展可视化分析Feb.,2014Vol.34 No.22.2 发表论文期刊分布利用SCIE数据库的统计功能对2003-2007、2008-2012年2个5年间医大发表论文所在期刊进行分析,来源期刊及期刊学科分类如表1所示,论文所在期刊2011年影响因子(IF值)分布如表2所示。
表1 医大发文量前10位期刊统计表
表2 发表论文期刊影响因子(2011年)分布
从表1中可以明显地看出2008-2012年肿瘤学分类中的期刊在前10位中占了5位,比例显著增高,说明近五年医大肿瘤学方面的研究发展迅速;眼科学期刊INT J OPHTHALMOL-CHI排在第三位,该刊由中华医学会西安分会主办,2000年创刊,2008年开始在SCIE中收录,因此该校发表的眼科学文献在SCIE中显著增多。2008-2012年排在第一位的PLOS ONE是美国公共科学图书馆2006年创办的多学科开放获取期刊,同时也是2012中国学者SCI发文最多的期刊[4]。从表2中可以看出发表论文期刊的IF值也显著升高,≥10.0的高影响因子期刊论文由6篇增加到65篇,占总论文数的百分比由0.79%升高到1.79%,30%的论文IF值超过3.0。
2.3 论文合著者分布利用CiteSpace软件对2003-2007年、2008-2012年2个时间段医大发表论文的合著者网络图谱进行分析,选择关键路径(pathfinder)算法,网络节点选择作者,时间分区选择1年,2003-2007年阈值为(3,3,5),(5,5,5),(8,8,5),2008-2012年阈值为(8,8,10),(9,9,10),(10,10,10)。阈值中的3个数值分别代表引文数量、共引频次和共引系数,引文数量和共引频次决定了可视化节点的多少,共引系数决定节点间连线的多少。分时间段设置不同阈值使可视化图谱更清晰明了,易于分析解读。图谱中圆环的颜色表示合著年份,圆环厚度表示合著者频次。如图2、图3、表2所示:图2 2003-2007年医大论文合著者网络图谱endprint
图3 2008-2012年医大论文合著者网络图谱
从图2中可以清晰地看出,2003-2007年医大论文合著频次较高的作者有:Chen J、Sun GF、Wang Y、Wang HL、Sun YX、Xu HM等,分别对应聚类分析的7大类。核对来源文献发现,合著频次最高的作者Chen J所属机构是安徽医科大学皮肤病研究所,提示2003-2007年间医大与安徽医科大学在皮肤病学科研合作关系密切。从图3中可以看出,2008-2012年医大论文合著频次较高的作者有:Chen HD、Xu HM、Shang H、Wang EH、Gao XH、Liu YH、Shan ZY、Xue YX、Wang ZN、Sun Z、Teng WP等,分别是医大皮肤病学、肿瘤学、临床检验、病理学、神经病学、内分泌学等学科的学术带头人,而且肿瘤学和病理学的科研合作比较密切。
2.4 学科领域分析利用CiteSpace软件对2003-2007年、2008-2012年2个时间段医大论文的共现学科领域进行分析,时间分区选择1年,阈值设定为(2,2,5),(3,3,5),(3,3,5)。图谱中圆环的厚度代表共现频次,颜色代表共现的年份,最外层紫色圈突出显示代表中心性(centrality),即在整体网络中所起连接作用大小。如图4、图5、表3所示:
从图4、图5、表4、表5中可以看出2003-2007年排在前10位的学科共现频次>30次,前5位分别是胃肠病学和肝病学、生物化学和分子生物学、药学、药理学和药剂学、肿瘤学。2008-2012年排在前10位的学科共现频次>125次,前5位分别是肿瘤学、药学、生物化学和分子生物学、神经科学、细胞生物学。肿瘤学共现频次>500排在第一位,是发展较快的学科,细胞生物学是中心度最高的学科,与生物技术和应用微生物学、生物物理学、免疫学、呼吸病学、内分泌学等学科的关系密切。
2.5 共词分析利用CiteSpace软件对2003-2007年、2008-2012年2个时间段医大论文共词和突现词进行分析,网络节点确定为关键词(Keyword),时间区选择为1年,阈值分别设定为(3,3,5),(4,4,5),(5,5,5),(10,10,20),(10,10,20),(10,10,20)。图谱中圆环的厚度代表共现频次,颜色代表共现的年份,紫色圈突出显示代表中心性。如图6、图7、表6、表7所示:图6 2003-2007年共词网络图谱
从图6、表6中可以看出2003-2007年医大论文共现词频次最高的是84次,频次高于20次的关键词有12个,分别是:表达、细胞、活化、凋亡、肿瘤、疾病、癌、小鼠、蛋白、脑、体内、基因;中心性大于0的关键词有10个,分别是:细胞、免疫组织化学、表达、脑、凋亡、活化、小鼠、肿瘤、肿瘤坏死因子、癌。通过共现关键词及其在共现网络图谱中的关系可以看出2003-2007年医大研究内容以肿瘤为主,研究方法以细胞免疫组织化学为中心,肿瘤相关蛋白或基因的表达、活化、细胞凋亡等是主要研究方向。从图7、表7中可以看出2008-2012年医大论文共现词频次显著增高,高于150次的关键词有15个,分别是:肿瘤学、表达、医学、生物化学和分子生物学、凋亡、神经科学、细胞生物学、活化、药理学和药剂学、外科学、细胞、肿瘤、癌、胃肠病学和肝病学、体外;中心性大于等于0.20的关键词有12个,分别是生长、表达、生物化学和分子生物学、凋亡、增殖、转移、乳腺癌、分化、细胞生物学、预后、腺癌、活化。通过共现关键词及其在共现网络图谱中的关系可以看出2008-2012年医大研究热点,以肿瘤学为主,研究方法以生物化学和分子生物学、细胞生物学为中心,肿瘤细胞分化、增殖、转移、凋亡,肿瘤的治疗、预后等是主要研究方向。
3 讨 论
3.1 发表论文数量和质量均显著升高医大2003-2012年10年间发表论文的数量显著升高,尤其是近五年增长迅速,而且影响力的增长速度高于论文数量的增长。发表论文的质量也相应升高,从发文期刊的IF值分布可以看出,高影响因子的论文增多,IF值≥10.0的论文占总论文的比例由0.79%增加到1.79%。这与学校加强学科建设的政策和支持有关,除国家级重点学科、省级重点学科外,还设立了校级重点学科和重点培育学科,并定期对各学科调研评估,促进重点学科的发展建设。
3.2 重点学科优势突出论文合作者可视化图谱显示2003-2007年,合作者中有较多的其他院校合作者,如Chen J、Zhang X、Jin Y、Hu DY等,该校的合作者如Sun GF、Wang HL、Sun YX、Xu HM分别是劳动卫生、药理学、心血管病学、肿瘤学等学科的带头。2008-2012年的合作者可视化图谱显示Chen HD、Gao XH团队、Teng WP、Shan ZY团队、Xu HM、Wang ZN、Sun Z团队、Xue YX、Liu YH团队,分别是该校皮肤病学、内分泌学、肿瘤学、神经科学的学科带头人。医大目前有5个国家重点学科:内科学(呼吸系病,1989)、皮肤病与性病学(2002)、内科学(内分泌与代谢病,2007)、外科学(普外,2007)、劳动卫生与环境卫生(2007)。二者对比,可以看出近五年重点学科的科研实力和优势明显显现出来,且学科队伍建设逐渐完善。目前该校有22个省级重点学科,2个省级重点培育学科,分别是遗传学、细胞生物学、生物化学与分子生物学、人体解剖与组织胚胎学、免疫学、病理学与病理生理学 、内科学(传染病)、内科学(消化系病)、内科学(心血管病)、儿科学、神经病学、临床检验诊断学、外科学(骨外)、外科学(泌尿外)、外科学(神外)、妇产科学、眼科学、肿瘤学、麻醉学、口腔临床医学、药理学、内科学(肾病)、内科学(血液病)。从共现学科领域网络图谱中可以看出,肿瘤学、生物化学和分子生物学、药理学、神经科学、细胞生物学等始终是研究的热点学科,而这几个学科均是该校的省级重点学科,与可视化的结果相吻合。共现学科依赖论文所属学科间的相互联系构建图谱,因此中心性越高说明与其他学科间的联系越密切。2003-2007年肿瘤学研究中心性最高,2008-2012年延续到肿瘤学是研究热点学科。免疫学、药理学、外科学始终是中心性较高的学科,说明这些学科与其它学科间的合作和交流比较紧密。2003-2007年生物化学和分子生物学的中心性排在第二位,而2008-2012年该学科已在前10名之外,取而代之的是细胞生物学、生物技术和应用微生物学,可以看出研究手段和方法的发展。
3.3 以肿瘤学为中心带动学科结构的发展目前该校共有国家级、省级、校级重点学科及重点培育学科共46个,几乎覆盖了基础和临床医学的各个方面,但从本研究结果看有些学科仍然比较薄弱,如解剖学、儿科学、妇产科学、传染病学、口腔科学等,SCIE的论文数较少,与其他学科的合作较少。而与肿瘤学相关的学科如生物化学和分子生物学、外科学、神经科学、乳腺肿瘤、胃肠病学等学科发展较快,学科间的合作比较密切。对SCIE发文较少的学科应进一步比较其与国内外高校相关学科在研究方向、课题资助、学科带头人等方面的差异,发掘该学科的特色,制定发展规划,这亦是本文下一步的研究方向。
4 小 结本文通过绘制医大发表科技论文的期刊分布、合作者、学科领域、文献共词的可视化图谱,以图谱方式初步揭示了医大近十年学科结构的发展变化,学科带头人、核心期刊、研究热点等信息情报,探讨该校学科领域分布、发展趋势。希望在满足科研用户学术信息查找、利用需求的同时,能为研究者制定学科规划、提供学科竞争力提供有价值的情报,并将尝试用该方法分析单个学科的发展轨迹、演变趋势、研究热点优势等,从而使可视化分析更好地服务学科情报研究。
参考文献
[1]毛莉,陈惠兰.从JCR期刊分区看高校学科与科研发展[J].科技管理研究,2010,17:101-105.
[2]陈悦,侯剑华,梁永霞.CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,28(3):401-421.
[3]邱均平.文献计量学[M].武汉:武汉大学出版社,2007:73.
[4]万跃华.中国学者SCI发文最偏好期刊:2012[EB].http:∥blog.sciencenet.cn/blog-57081-658988.html.
[5]姜世华.知识可视化和可视化分析在学科情报研究中的应用[J].图书馆学研究,2009,(3):90-92.
(本文责任编辑:孙国雷)endprint