我国信息生态系统研究计量分析
2021-03-18康蠡马爽
康 蠡 马 爽
20世纪90年代,受学科交叉思潮的影响,国内学界开始对信息生态系统展开研究,其后关于该领域研究成果的回顾性总结也逐渐出现。目前,已有部分学者从不同的角度就信息生态系统研究的状况进行了梳理[1-4],他们的工作对于廓清信息生态系统研究内容、明确信息生态系统研究进展很有意义,但从考察这些论述中不难看出,它们大多属于定性分析,且多是放在 “ 信息生态 ” 这个总的框架下展开的,尚缺乏对该领域研究现状的定量剖析,这就使得研究结论难免带有主观性和缺乏客观数据的支撑。为弥补这一缺憾,完整呈现国内信息生态系统研究的全貌,本文拟从文献计量角度审视我国信息生态系统领域的研究成果,以掌握其演进脉络和发展态势,并给出相应的建议,为推进该领域研究提供支持。
一、数据获取与分析方法
由文献阅读发现,国内信息生态系统研究主要来自图书、情报与档案学三个学科,且有学者将 “ 信息生态 ” 等同于 “ 信息生态系统 ” ,故分别以 “ 信息生态或档案生态或档案馆生态或信息生态系统或档案生态系统或档案馆生态系统 ” 为主题和题名,在中国知网、维普网和万方数据三大数据库中进行检索,检索时段为2020年3月5—10日。为保证检全率和数据的科学性,检索时对文献的领域范围和类型不做限定,文献发表时间设为2020年之前,然后根据以下规则筛选数据[4]:凡以信息生态、档案生态或档案馆生态等为题,但主要内容指向信息生态系统或档案(馆)生态系统之类的,都视为符合要求,予以保留;期刊论文与硕博士论文内容重合时,将其合计为1 篇,只以硕博士论文作为统计分析对象。经过以上处理,并剔除重复发表、简报、综述及书评等,最终获得相关学术论文546 篇。在此基础上,运用Excel、SATI 和Ucinet 软件对以上文献进行挖掘和解析。
二、统计结果分析
为把握国内信息生态系统研究现状与特点,本文重点围绕该领域研究文献的年度产出、研究力量和高频关键词等指标展开统计分析。
1.年度产出分析。分析文献的年度分布,可以有效揭示信息生态系统研究的年际产出变化,了解该领域的研究阶段和研究热度。就时间上来看(图1),我国信息生态系统研究最早出现于1995年,此后该领域开始逐渐受到研究者的注意。根据图1 所示,虽然部分年度的文献产出有所下降,但其整体上呈现出上升的态势,并且依据文献产出特点可以划分为三个阶段:(1)2006年之前是该领域研究的起步阶段,其总体进展缓慢。此期每年的发文量都比较少,平均只有2.09 篇,而且在1997年和1999年出现过短暂的中断,11年间共发文23 篇,占文献总量的4.21%。表明这段时间学者们对信息生态系统的探讨相当有限。(2)2006年起,该领域研究开始了一个连续增长的过程,年文献产量从2006年的10 篇快速攀升到2009年的38 篇,大幅高于前一阶段。这4年累计发文89 篇(年均发文22.25 篇),占文献总量的16.30%,说明这段时间研究人员对信息生态系统的关注日益增加,信息生态系统研究的范围不断拓展,该领域研究开始进入成长阶段。(3)2009年以后,得益于前期的积累和更多研究者的加入,国内信息生态系统研究步入快速发展阶段,期间每年的发文量均不少于35 篇,并在2017年达到了文献产出的最高峰(62 篇),至2019年共发文434 篇,占文献总量的79.49%。通过图中数据可以看出,相对于前一阶段年文献量持续增长的局面,此阶段的发文表现出了在波动中前进的趋势,每年的发文量有升有降,但维持在相对高位状态,说明在信息技术快速跃迁的最近十年,国内学者对信息生态系统的研究热度不减,保持了良好的发展势头。
图1 信息生态系统研究文献年度分布
2.研究作者分析。对研究作者及其发文情况进行分析,可以了解相关领域研究人员的种群分布,掌握作者的活跃程度与知识贡献。根据统计结果,在546 篇信息生态系统研究文献中,共有署名作者798 人(其中以第一作者发文的有416 人),这说明信息生态系统问题在我国已得到众多学者的关注和重视。在所有文献中,署名为单独作者的有275 篇,占文献总量的50.37%;署名2 人作者的有122 篇,占文献总量的22.34%;署名3 人及以上作者的有149 篇,占文献总量的27.29%。根据普莱斯定律,核心作者(只计第一作者)发文量(M)的计算公式为:M=0.749×(Nmax)1/2,式中Nmax 表示发文量最多的作者的文献产量。本次统计中最高单人发文量为13 篇,根据普莱斯定律公式得出该领域的核心作者发文量M=2.70,按照取整原则可知发文量3 篇及以上的第一作者为核心作者,共有21 位(表1)。这些作者对该领域的研究较多,关注度较高,是我国信息生态系统研究的领军人物,为该领域研究作出了重要贡献。但从他们的总发文量(100 篇)来看,目前只占到文献总量的18.32%,低于文献计量学中 “ 核心作者发文量应占发文总量20% ” 的比例下限,显示我国信息生态系统研究尚处于发展阶段,还没有形成一支稳定的核心作者群。
表1 核心作者发文情况
为展示作者间的合作情况,将SATI3.2 软件生成的合作作者(取频次≥3 的作者)矩阵导入Ucinet 软件,得出高频作者的合作关系知识图谱(见下页图2)。图2 中,每个节点代表一位作者,节点之间的连线代表作者的合作关系,节点大小代表作者合作发表的文献数量。由图2 可看出,目前整个作者群大致形成了18个主要的合作团体。在这18 个团体中,以王晰巍为中心所形成的合作群体规模最大,含括了17 位作者,说明王晰巍与其他作者的合作最多,合作频率最高。其次是张海涛和马捷两位作者,他们所在的节点面积也较大,其周围分别聚集了9 位和8 位合作者,可见他们的合作也较多。上述三位重要成员通过与靖继鹏、张向先或冷晓彦的合作,带动其所在的团队又形成一个更大的作者团体。交叉对比文献的基金支持和作者发文情况,可以看到王晰巍、马捷、张海涛三人正好又是核心作者中发文量较(最)高的,且他们的成果基本上都有基金支持,这表明基金项目为作者之间的合作创造了条件,提高了文献的产出效率。但值得注意的是,目前不同团体间的连通主要依赖于团体中少数核心成员之间的合作,如果核心成员的合作意愿下降,将很容易造成合作网络的分裂,影响合作团体的稳定性。同时应当留意的是,虽然这个大团体中的其他成员与其中的一位或多位核心成员都有合作关系,但他们自身之间的合作却比较少。再者,从整个作者群体来看,其合作关系并没有构成一个连通的网络,除上面提到的团体外,其余各个小团体都是单独存在、分散布局,彼此之间并无关联。说明国内信息生态系统研究的作者有局部合作的特点,他们之间的合作大多局限于同一单位或区域的小团体之间,跨团体、跨区域的大型且广泛的合作颇为稀少。
图2 主要作者合作网络
3.研究机构分析。分析信息生态系统领域的主要研究机构,旨在明确该领域成果的空间来源,把握各机构对该领域的投入程度和研究偏好。经统计,目前参与信息生态系统研究的国内机构共有324 家(2 篇未署名的论文除外),其中以第一署名机构发文的有266 家。在这266 家机构中,发文量1 篇的有183 家,占研究机构总数的68.79%;发文量2 篇的有47 家,占研究机构总数的17.67%;发文量3 篇及以上的有36 家,占研究机构总数的12.24%,这36 家机构总发文量为274 篇,占文献总量的50.18%。就具体发文情况来看,吉林大学管理学院由于多年来一直高度关注信息生态系统问题,加之拥有独特的团队优势,因而产生的成果最多,共发表文献91篇,占文献总量的16.67%,遥遥领先于其他机构。发文量排在第二、三位的分别是华中师范大学信息管理学院(系)和武汉大学信息管理学院,这两家机构因为学科规划比较超前,科研实力强劲,对信息生态系统研究保持了较高的兴趣,因而建树颇丰,分别产出文献22 篇和13篇,占到了文献总量的4.03%和2.38%。其他产文量较多的研究机构还有上海大学图书馆(9 篇,占1.65%)、吉林大学高等教育研究所(7 篇,占1.28%)、黑龙江大学信息管理学院(7 篇,占1.28%)和安徽财经大学管理科学与工程学院(7 篇,占1.28%)。以上7 家机构累计发文156篇,占到了文献总量的28.57%,说明它们在信息生态系统研究中贡献突出,占有重要的学术地位。
表2 文献的机构来源分布
对研究机构的产文统计表明,我国信息生态系统研究的绝大多数成果是由高等院校下属的二级学院(系部)、图书馆及其他部门完成的(表2),可见该领域研究在国内主要受到高校教学单位和实务部门人员的重视,这两个群体在信息生态系统研究的兴起与推进中起到了决定性作用。另外,从地域分布来看,国内不同区域间信息生态系统研究的成果产出差异明显。其中,产文量最高的是东北地区,有175 篇(占文献总量的32.05%);华东地区次之,为139 篇(占25.46%);排在第三、第四位的是华中和华北地区,分别有90 篇(占16.48%)和68 篇(占12.45%);华南(29 篇,占5.31%)、西南和西北(均为17 篇,各占3.11%)地区发文量较少。这除了与不同区域间科研机构(主要是高校)的聚集度及其实力有关外,也可能与各地区研究机构对信息生态问题的关注程度不同有关。
4.发文期刊分析。研究文献的来源期刊是了解该领域的空间分布特点,掌握该领域的核心期刊群的最有效的方法[5],可为研究资料的收集和利用提供依据,同时亦可从侧面反映文章的学术质量和水平。从统计结果看,我国信息生态系统研究成果的出版形式多样,但以期刊论文为主。在546 篇论文中,有期刊论文450篇,硕博士论文92 篇,会议论文2 篇,辑刊论文1 篇,报纸文献1 篇。进一步考察发现,所有期刊论文分布在176 种刊物上,各期刊的载文量差距显著:有124 种刊物只发表过1 篇与信息生态系统有关的文章,载文量2篇的刊物有19 种,载文量3 篇的刊物有6 种,载文量4篇及以上的有27 种。所有刊物中,载文量最多的是《情报科学》,共刊文56 篇;其次是《图书情报工作》和《情报理论与实践》,载文量分别为37 篇和29 篇,其余发文较多的期刊如图3 所示。考察期刊的学科属性,发现载文量较高的期刊几乎都出自图书、情报与档案学领域,且多为核心期刊(含CSSCI 来源刊和全国中文核心期刊),说明信息生态系统研究成果的期刊分布具有较高的学科集中度。这与该领域主要受到国内图书、情报与档案界的关注有关,同时也意味着这三个学科的期刊在该领域研究成果的传播方面发挥着关键作用。
图3 载文较多的期刊及其载文情况
5.高频关键词分析。作为对文章核心内容的浓缩和提炼,关键词的变化可以反映相关领域研究主题的变化[6],对关键词展开分析能够揭示特定时期特定领域的研究热点和重点,因而借用关键词词频统计、关键词共现与聚类结果来呈现我国信息生态系统研究的热点内容和主题。将从数据库中得到的546 篇论文的题录信息导入SATI3.2 软件,并将含义相同或相近的关键词(如信息人与信息主体、信息生态平衡与信息生态系统平衡等)予以合并,最终得到有效关键词943 个,累计出现频次2148 次,其中只出现过1 次的有718 个。采用杨爱青提出的词频g 指数[7]计算高频关键词,得到高频关键词个数为29,出现频率最高的关键词是信息生态、信息生态系统和生态系统,其累计频次(434 次)占到了关键词总频次的20.20%。这三个关键词出现的频次之所以位居前三,主要在于信息生态系统是信息生态系统研究的核心对象,且不少研究者经常将信息生态等同于信息生态系统,因而二者在文献中频频出现;而生态系统思想则构成了信息生态系统研究的理论来源和思想基石,故也经常被研究者提及。
经降序排列和统计,发现前50 个关键词的总频次达972 次,占到了所有关键词总频次的49.25%,能较好地代表目标文献的研究内容,故取这50 个关键词构造共词矩阵,再利用Ucinet 软件得到其共现网络,如图4所示。图4 中,每个节点对应一个关键词,节点之间的连线代表关键词间的共现关系,节点大小与关键词的频次正相关。由图4 可看出,国内信息生态系统研究的高频关键词网络具有集中与分散并存的特征。位于网络中心的关键词是信息生态和信息生态系统,二者几乎与其他所有的关键词都存在共现关系,故与其他关键词的联系最为密切(连线最多)。位于网络次中心的关键词是生态系统、信息生态学、信息生态环境和信息生态链,这些词周围的连线主要指向信息服务、信息资源、信息管理与优化策略等,显示跟这些关键词存在很强的关联。信息人、图书馆、高校图书馆、信息生态平衡四个节点虽然处在网络的边缘位置,但与其他节点的连线也较多,说明也受到研究者较多的关注。其他众多出现频率相对较低的关键词如信息安全、商务网站、数字档案馆等处在网络的外围,并且与其他部分关键词发生着不同程度的联系,预示着信息生态系统研究中方兴未艾的新话题。以上关键词共现态势表明,我国信息生态系统研究既有高度集中的关注点,也涉及不少其他的议题。
图4 高频关键词共现网络
为更加清楚、直观地呈现研究的主题和热点,在SATI 软件的 “ NetDraw ” 功能中,采用K-core 聚类算法对关键词予以聚类(原图略),可以看到,近年来我国信息生态系统研究的主题和对象具有多指向性特征。其中的热点主要集中在信息生态系统基础问题、信息生态系统平衡(失衡)、信息生态系统的评价和信息生态系统的建设四个方面,而指涉对象则涵盖了图书馆、档案馆、企业、网络、教育等多个领域的信息生态系统。
三、结论与建议
经分析发现,过去20 多年国内信息生态系统研究在波动中前进,呈现出总体上升的趋势,并在近年保持着较高的研究热度。就研究力量而言,已经形成以吉林大学管理学院、华中师范大学信息管理学院(系)等为核心的研究机构群,以及以王晰巍、马捷、倪代川等为代表的高产作者群体,但不同机构间研究人员的合作尚不理想;综合观之,该领域研究具有主题聚焦化、视角多元化等特点,其一众成果为推动信息生态系统理论和建设实践的发展作出了积极贡献。但与此同时,我们也发现该领域研究除了需继续完善和丰富内容体系外[7],还存在以下几个亟须突破的地方。
1.优化研究队伍结构。从前文分析可知,我国信息生态系统研究的作者绝大多数为高校图书、情报与档案学教学部门的老师与学生,高校之外的图书馆、档案馆、情报研究所等机构以及计算机、生态学等学科领域的作者则屈指可数,并且至今没有形成稳定的核心作者群,作者之间的合作也较少。这不但造成了研究资源的浪费,而且不利于理论与实践的融合。为此,未来应注意研究力量的培育,促进研究人员(机构)间合作网络的建设,提升研究队伍的复合化程度,其重点则要加强政府、高校和其他机构的三方联动:一方面,鉴于基金项目能够有效促进作者合作网络的形成,三方机构尤其是政府应当加大对信息生态系统研究的支持力度,通过基金立项的方式吸引更多高校研究机构之外的相关单位和人员的参与,同时引导不同机构、不同学科的研究人员互鉴所长,加强优势互补,形成信息生态系统研究共同体。另一方面,走在前列、实力强劲的学术机构要发挥 “ 领头羊 ” 的作用,着力打造学术论坛、学术会议等平台,促进不同地区、不同机构和专业的研究人员就信息生态系统问题展开对话与交流,让学者们在频繁的对话和交流中发现合作机会,增强合作意愿。
2.积极拓展研究视界。受研究人员从业背景和学缘结构的影响,当前国内学界对图书馆、企业、网络、电子商务、电子政务以及档案领域的信息生态系统研究较多,对教育、学术、舆情领域的信息生态系统虽有涉及,但仍比较薄弱,其他如农村、医疗、卫生等领域的信息生态系统等则尚未触及。同时,研究和建构信息生态系统离不开对成熟理论、方法和经验的借鉴,发达国家由于信息化起步时间早,技术水平更加先进,在信息生态系统研究和实践方面积累了大量的成果,是值得国内研究和借鉴的有益资源。但目前国内的研究多局限于本土信息生态系统,鲜少关涉国外相关研究成果,尤其缺少对国外典型信息生态系统的案例研究,对国外信息生态系统的发展经验和教训缺乏应有的关注和总结,这在一定程度上制约了国内研究和实践的发展。因此,需在今后的研究中拓宽视野,将目光投向更加广阔的空间:一方面加大对前述薄弱(空白)领域的投入和聚焦力度,进一步丰富研究对象,以更多的对象作为切入点,形成多类型信息生态系统研究齐头并举、纵深推进的格局。另一方面,加强对国外优秀研究成果的译介和引入工作,促进国外优秀研究成果在国内的传播和扩散;同时要强化对国外信息生态系统建设案例的研究,总结其成功经验和失败的教训,为国内信息生态系统建设提供借鉴与支持。通过理论融合和实践参考,促进我国信息生态系统研究的深化和实际问题的解决。
3.努力提高成果质量。作为最近二十多年才在国内兴起的学术领域,信息生态系统的很多话题尚处于起步阶段,加之研究人群分散,研究者知识能力水平参差不齐,不少研究者的研究都是偶尔为之(只发过1 篇文献的第一作者有312 人),故该领域研究成果虽然数量可观,但其碎片化特征也很突出,围绕某一话题所产生的系列性、专题性文献并不多见。由于缺乏持之以恒的长期探索,很多人对信息生态系统的认识浮于表面,没有深入到信息生态系统内部,未能挖掘出潜藏其中的深层次问题;或者缺乏对不同信息生态系统特征的精细考察和分类解剖,在相关问题的阐述中泛泛而论,停留于一般化的描述和解释,导致结论大而空,欠缺针对性。有的则从理论到理论,缺少扎实的案例支撑和实证检验,相关论点与实践脱节,难以在实际中推广应用;甚至陷入重复研究的境地,采取直接照搬他人观点的做法,无法形成独立的思考和见解。这些现象的存在拉低了研究成果的整体质量,不利于信息生态系统理论的拓展与实践的改进。为杜绝这些现象,后续研究需要研究者增强创新意识和专精意识,自觉提升研究能力,创新研究方法,大力借鉴生态学、统计学、社会学、计算机科学等学科的研究成果,将研究触角投向广博深刻的信息生态系统建设实践,抓住其中的某个或某些问题展开深入系统的研究,力争提出自己独到的观点,不断提升研究成果的创新水平和适用性。