基于自建数据库的文献自动计量分析系统研究
2009-10-13谭淑琴
谭淑琴
〔摘 要〕本文着眼于高校科研院所对科学评价的需要,为提高计量分析效率,满足科研人员对计量分析结果实时的需要,提出一种基于自建数据库的文献自动计量分析系统的设计开发,并对系统功能实现进行了阐述。
〔关键词〕自建数据库;文献;自动计量分析
〔中图分类号〕G255.2 〔文献标识码〕C 〔文章编号〕1008-0821(2009)08-0164-02
Research on the Bibliometrics Automatic Analysis
System of the Self-built Literatures DatabaseTan Shuqin
(Library,Qingdao University of Science & Technology,Qingdao 266042,China)
〔Abstract〕This paper focused on the needs of scientific research institutions in the universities on the scientific evaluation.In order to improve the efficiencyof the analysis and meet the needs of the researchers on the results of the analysis of real-time needs,a bibliometrics automatic analysis system based on a self- built literatures database was set up.Furthermore,the models and functions of the bibliometrics automatic analysis system were described.
〔Key words〕self-built database;literature;automatic bibliometric analysis
目前,文献计量分析工具的研究开发成为情报学界研究的热点,随着科学评价的日渐深入,针对高校科研创新及管理人员的个性化需求,开发自动化程度更高的文献计量分析工具显得尤为必要。
1 问题的提出——文献计量学应用研究的现状分析
文献计量学从上世纪60年代发展到今天,已经完全进入应用阶段,对CNKI 2003-2008年千余篇“文献计量分析”文献研究发现,除了极少的关于分析方法和工具的研究文献,计量学的具体应用研究占了绝对比例,就其使用的研究方法来说,尚存在以下几方面的问题。
1.1 数据的准确性不够以致于影响到结论的客观性
计量分析的结果是科研评价的重要依据,研究结论的客观性是其终极目标。目前大量文献计量分析尽管其研究领域及切入点各不相同,但使用的方法和手段类似,基本是以手工为主,计算机为辅助工具,利用一些数据库如CNKI自带的统计分析功能进行。大多针对某一学科领域在某一时间段内的文献,有的仅以一种或数种期刊为对象,以3~5年(较长的为10年)为期进行统计分析,计量分析的视角小,时间跨度短,文献类型单一,难免以偏概全,得出流于主观的分析结论。要提高文献计量分析结果的客观准确性,进行大数据量的统计分析,必须改变手工作业的现状,提高计量统计分析的自动化程度。
1.2 研究结果的时效不强难于满足人们对信息的实时需求信息有很强的时效性,目前文献计量分析结果的发布时间随意性较大,时间间隔较长,有的根据情报人员的研究兴趣,有的应用户的要求提供,有定期的或不定期的,大都滞后时间较长,关注文献计量结果的科研创新及管理部门常常是被动地等待计量统计分析报告的出台,难以满足他们对信息实时的需要。提高文献计量分析系统的自动化程度,将统计结果实时地提供给用户,是提高信息服务质量的需要。
1.3 重复研究造成人力物力的浪费
应用型计量分析研究的对象和所揭示的规律一般都可数学模型化,适合计算机程序处理。目前大量的计量统计分析报告,呈现研究项目相同,报道内容类似,对同一领域的研究数据随时间变动等特点,如青岛科技大学信息中心定期发布的年度科技论文统计与分析报告等,常常只是数据的变动,用计算机系统自动处理,可以减少大量的重复劳动,节省人力物力,提高情报人员的工作效率。
2 问题的解决——开发基于自建数据库的文献计量分析系统
针对以上问题,我们提出开发基于自建数据库开发自动文献计量分析系统。由于各高校科研院所的目标定位、性质任务不相同,科研活动的具体情况及侧重点也不相同,学科领域也各有不同的特点,个性化需求亟待体现,因此根据科研管理部门的具体情况,量身定做适合自身的自动计量分析系统显得尤为必要。
2.1 系统设计的原则
自动计量分析系统应满足可靠性、实用性和开放性的设计原则。
应用型计量分析研究主要是数据相关的,如青岛科技大学的学术论文数据库作为校学术成果统计、评价和管理的依据,已投入使用多年,数据的准确可靠及完备性已经为科研及管理部门认可,这是系统可靠性的基础。
其次,作为基于自建数据库的分析系统,实用性是其最突出的特点,设计时应以满足科技管理、科研创新以及情报人员等各阶层的现实需要为出发点,根据具体情况设计开发不同的系统功能。
系统的开放性和扩展性必须得到保证,尽管目前以满足现实需要为出发点,但是随着自建数据库的不断扩充,信息量不断增加,功能需求必将越来越多,系统的整体架构、软硬件平台、应用模块也必须相应地扩展,功能可以随时增加和改进,使其能与其他相关系统相互兼容、协调工作,又具有能够升级换代的适应能力,避免重复研究。
2.2 系统功能描述
系统最终目的是根据需要,提供各种统计信息,如Top N统计、奇异值统计、数量分布统计、年度增长统计以及其它关联统计等,结果以表格和曲线图、柱状图、饼状图等多种形式提供。
系统最显著的优势是实时性,可以就科研及管理部门普遍关注的热点,把计量统计结果以直观的形式实时呈现给用户,因为数据库是动态变化的,统计分析结果必须动态地实时提供,使用户随时掌握相关信息。
另外,还可以地根据各类用户的不同需要设计相应的功能模块,用户根据自己的需要利用系统提供的分析模块,选择输入数学模型,根据实际数据绘图与现有的文献计量规律进行比较分析,可以对文献的增长变化,学科的发展趋向做出一些预测。
需要说明的是,尽管SAS、SPSS、BMDP、MINITAB等统计软件正被情报人员所认识,尤其SPSS以其操作界面友好、功能强大、易学易用的优点广泛应用于各领域,也被图书情报界用做一些统计分析,但其扩展功能较差,而SAS虽具备相应的扩展功能,但SAS编程语言较难掌握,并且视窗化程度、人机对话界面不尽如人意,经过比较分析,我们认为,用MATLAB实现基于自建数据库的计量分析系统功能,更加经济可行,也更便于系统的维护。
如我校的学术论文数据库已投入使用多年,数据准确、完备,对开发人员来说,数据库完全开放,数据结构熟悉,在此基础上开发相应的自动计量分析功能,开发环境较好。
系统的实现,可使大量文献计量分析结果由计算机提供而不再由情报人员来写,能减少大量的重复工作,节省人力物力,提高计量分析的自动化程度,减少报告的主观性;其实时性可使关注文献计量的非情报人员第一手地获取所需的文献计量信息,实时了解本学科领域的研究现状、薄弱环节,进一步明晰其研究及应用目标;可使管理决策部门及时把握学科的整体状况,对科研管理起到重要的参考价值;在科研评价、学科评价、人才评价等方面,将会更加客观、全面,为科学研究、奖励、管理提供依据。
3 前景展望
总之,基于自建数据库的自动文献计量分析系统是现阶段高校满足自身文献计量信息需求的有效途径,尽管目前一些数据库提供商正在逐渐完善其计量分析功能,但是不能满足高校科研院所的个性化需求,并且跨数据库的文献自动计量分析系统的实现较为复杂,尚有一定困难,这种情况下,基于自建数据库的分析系统的研究开发尤为必要,我校“高校学术论文统计、评价与管理模式研究”作为多次获奖的省部级优秀成果已产生很好的社会影响,在此基础上开发自动计量分析系统,倘能在其他院校和科研机构推广应用,可以更加发挥其成本和效率方面的优越性,有望取得很好的社会效益。
参考文献
[1]张蕊,邱均平,周黎明.计算机辅助内容分析软件进展研究[J].图书情报工作,2005,(6):29-32.
[2]王日芬,颜端武,路菲.文献计量与内容分析综合应用软件的开发与实验[J].图书情报工作,2005,(6):24-28.
[3]化柏林.文献计量分析研究的分类与处理流程[J].情报科学,2007,(9):1332-1336.
[4]郑文晖.文献计量法与内容分析法的比较研究[J].情报杂志,2006,(5):31-33.
[5]董琳,刘清.国外学科评价及其文献计量评价指标研究[J].情报理论与实践,2008,(1):37-40.
[6]金新建.文献计量学在我国科技论文评价中的应用[J].现代情报,2008,(5):17-18,21.