基于创新扩散理论的知识图谱软件扩散规律研究
2022-04-28朱猛男
[摘要]本研究从创新扩散理论的角度来分析知识图谱软件的扩散规律发现,知识图谱软件的意见领袖推动其广泛扩散;软件宣传、培训等多元的社会传播渠道加快其扩散;专家学者和高校学生是扩散主体,他们更容易接受知识图谱软件并扩散;知识图谱软件具有再创新的特征,软件的再创新又促进知识图谱软件的持续扩散。
[关键词]创新扩散;知识图谱;知识图谱软件;扩散特征
一、知识图谱应用研究现状
技术创新是研究人员的智慧成果,其推动学术研究的发展,实现知识的传承与延续。由此,科学知识图谱(Mapping knowledge domain)的方法与技术应运而生,其能够运用计算机技术、可视化技术来绘制动态清晰、直观可视化的知识图谱。借助知识图谱工具,研究人员能够构建各学科领域的知识结构,全面解读学科的国内外发展趋势、研究进展及其动态演化关系,预测科学技术和知识前沿发展态势[1]。据不完全统计,目前国内外已经开发、免费供科研人员使用的知识图谱软件工具多达几十种,其中,CiteSpace、VOSviewer、SCI2、HistCite、Gephi、Pajek、NetDraw、Ucinet等是较为流行的科学知识图谱研究工具。研究人员利用知识图谱软件对收集的海量数据进行分析处理和可视化展现,并基于引文分析、同被引分析、共现分析、聚类分析、词频分析、社会网络分析等多维度可视化分析方法[2],动态直观地展现各研究领域的发展趋势[3]、研究进展[4]、研究热点、研究前沿[5]、学科结构、作者间的引证关系,以及识别主要国家、机构及其之间的合作关系等。
笔者通过检索式“KY=知识图谱or可视化图谱”,检索中国学术期刊全文数据库(CNKI)的核心期刊与CSSCI数据库,截至2021年12月31日,共检索到相关文献数量3717篇,大部分文献出现可视化图谱,其中运用较多的知识图谱软件工具有CiteSpace、VOSviewer、Gephi、Pajek、NetDraw、Ucinet等,出现频率最高的知识图谱软件为CiteSpace。许多学者采用CiteSpace软件计量分析收集的文献数据,从关键词、作者、机构、时间等不同维度绘制关键词共现图谱、高频关键词共现聚类图谱、作者合作网络图谱、机构共现图谱、引文共被引聚类图谱和时间演化图谱等,从而直观地展现学科研究的重要领域、研究基础和研究前沿等。
知识图谱早期多运用于情报学领域,随着知识图谱技术的成熟,其研究成果逐渐增多,研究范围扩展至生物学、医学、金融、管理学等领域。2006年,侯海燕等运用引文分析法绘制1995—2004年不同时间段的科学学研究热点知识图谱,直观地展现国际科学研究前沿集中的七大领域,且各领域相互交叉、融合、分析、更新[6]。2007年,侯剑华、陈悦使用Citespace可视化软件对《战略管理月刊》1980—2005年文献数据进行可视化分析,绘制文章共引聚类合并网络图谱及作者共引关键路径网络图,发现战略管理学领域演进的路径及关键学术人物[7]。后来,知识图谱的应用愈加广泛。汪竹芸等将知识图谱应用于中医药领域,借助CiteSpace软件工具,直观地展现近20年国内外青蒿研究的发文特征[8]。井媛媛等利用Citespace软件分析中医药文献,通过构建作者合作网络、研究机构合作网络、关键词共现分析图,分析中医药不同学科领域的研究热点、发展趋势、学术团队及研究机构分布情况[9]。周贞云、邱均平采用VOSviewer等工具对人工智能学科的知识图谱文献进行研究,从期刊、基金、作者、关键词等维度绘制相应的图谱,分析其结构特征及研究趋势[10]。在文学领域,况宇翔等利用Citespace软件分析文化创意产品的相关文献,从研究作者、研究机构、国家/地区分布、关键词等维度绘制相应的知识图谱,发现国内外研究学者间的合作关系、主要研究机构及其合作关系,以及国家/地区分布状况,并通过共现关键词图谱发现国内外频次最高的关键词都是文化创意产品[11]。此外,国外的知识图谱应用成果也较为丰富,如Sigifredo Laengle等将知识图谱软件工具VOSviewer应用于群体决策与谈判,分析期刊共被引、关键词共引、作者共引等情况,论证核心期刊的影响力[12]。Jean Paul Kamdem等使用VOSviewer分析食品化学领域近40年的研究热点和研究趋势[13]。Merigó J M.等应用知识图谱对安全科学领域近40年的文献进行文献计量分析,识别该领域的科学知识结构、期刊的影响力以及重要作者、机构、地区[14]。
可见,知识图谱软件应用于各领域研究,已经成为科学计量学的研究热点之一。然而,目前我国知识图谱的应用研究仍缺乏理论分析,很少有学者对知识图谱软件的扩散过程进行研究。因此,本文从创新扩散理论的角度出发,对知识图谱软件在社会系统中的扩散过程进行研究,探讨其扩散的特征、过程,以期促进知识图谱软件的学术价值传播,帮助科研人员把握学科研究方向,促进知识图谱软件的更新迭代和可持续创新发展。
二、创新扩散理论概述
罗杰斯(Everett M.Rogers)提出创新扩散理论(Innovation Diffusion Theory),他认为创新扩散是一种社会传播过程,创新需要经过一定的时间,并通过某种渠道在特定的社会系统中进行传播。技术创新具有不确定性,技术扩散会受到技术自身的相對优势、相容性、复杂性、可实验性和可观察性的影响,还会受到时间、扩散渠道和社会系统的影响[15]。大多数技术创新的年累积采纳曲线呈现为S形曲线,对应不同的扩散阶段。罗杰斯将S形扩散曲线划分为:起步阶段、迅速上升(起飞)阶段、稳定阶段[15]。宋歌在其基础上将S形曲线划分为:起步阶段、起飞阶段、成熟阶段、衰退阶段[16]。创新扩散有四个主要元素,即创新、传播渠道、时间和社会系统[15]。第一,创新指新观点、新方法、新技术或新发明,同时其需要得到个人或群体的认可。第二,扩散是动态的传播过程,即新观点或新技术等通过大众传媒和人际关系在人群中传播。大众传媒是信息通过报纸、杂志、电视、广播、互联网、新媒体等传播渠道实现在人群中快速扩散的手段;人际关系传播是人与人之间的沟通交流,比如口头交流、会谈或是借助社交软件进行传播。第三,时间是研究创新扩散过程的重要分析维度。第四,社会系统界定了扩散范围。社会系统的成员是相互联系的,且具有某些共同的社会属性,可能是个体和企业、单位、高校,也可能是民间组织、官方机构等。
三、知识图谱软件的扩散规律
知识图谱是一种技术创新,从创新扩散的理论角度来定义知识图谱软件扩散,即在一个社会系统中,知识图谱软件在一定的时间范围内,通过不同的社会渠道进行传播,并逐渐被研究学者、数据分析员等潜在使用者接受。笔者对知识图谱软件的扩散规律归纳如下。
(一)意见领袖推动扩散
罗杰斯提出个体是否采纳创新会受到社会关系或其所在社会系统中的意见领袖的影响,创新者和早期采纳者是创新扩散过程中的意见领袖。最早提出引文分析思想的是加菲尔德(Eugene Garfield),他提出可以将引文索引应用于检索文献[17]。普赖斯(Derek John de Solla Price)是知识图谱研究的早期开拓者,他首次提出知识图谱的概念,并指出如果把引证网络上文献间的引用关系研究清楚就可以绘制“地形图”,使用引文网络分析法来研究当代科学发展脉络[18]。著名计量学家赫尔德若·克里奇默(Hildrun Kretschmer)也是知识图谱发展的重要推动者,他创建了合著网络中作者合作三维空间模型[19],该研究是知识图谱發展的一个重要里程碑。
科学知识图谱的概念源于2003年5月美国国家科学院组织的一次研讨会,当时会议的组织者和参与者包括最为知名的科学计量和数据可视化领域的专家学者,如史蒂夫·莫利斯(Steven Morris)等。2005年,邱均平、陈悦、刘则渊在我国引入知识图谱概念。此外,如陈超美、荷兰莱顿大学团队(VOSviewer)等都是知识图谱软件扩散的创新者,他们极大地促进了知识图谱软件的传播。
(二)多元的社会传播渠道加快扩散
多元的传播渠道能够让更多的潜在采纳者接受知识图谱软件,并促进其二次传播扩散。一是相同研究领域的学者间交流与学习会促进知识图谱软件的扩散。二是导师指导学生使用知识图谱软件进行引文分析、研究主题等会极大推动知识图谱软件的使用及传播。三是知识图谱软件的宣传视频、使用指南使知识图谱软件得以快速扩散。四是知识图谱软件的相关培训能够加快知识图谱软件的扩散。目前,国内培训最多的软件是CiteSpace、SCI2和VOSviewer,另外,还有一些学校、情报研究所等机构开展知识图谱软件的应用实践课程,如中国科技大学图书馆在文献检索课程中专门有对CiteSpace进行介绍和实践使用的内容[20]。
(三)专家学者和高校学生是扩散主体
在知识图谱软件的扩散过程中,高等院校和研究院所是其主要的扩散系统,知识图谱软件的采纳者以专家学者和高校学生为主,他们是知识图谱软件扩散的主体。国内代表的高校有大连理工大学、武汉大学等,研究院所则主要有武汉大学信息资源研究中心、中国科学技术信息研究所等。国内开展知识图谱软件研究的群体有大连理工大学的陈超美、刘则渊等;武汉大学的马费成、邱均平、赵蓉英等;南京大学的叶鹰、宗乾进等;浙江大学的刘启元、赵星等。诸多专家学者和高校学生通过发表知识图谱相关研究论文和人际交流,使知识图谱软件在更广泛的人群中大规模地扩散。
(四)再创新促进再扩散
知识图谱软件具有再创新的特征,其软件功能和版本不断优化完善、迭代升级,促进知识图谱软件的持续扩散。Pajek首次发布于1996年的版本为Pajek0.01,目前其最新版本为2021年9月发布的Pajek5.14。CiteSpace于2003年9月对外发布,其是更新速度最快的软件,2021年11月推出CiteSpace5.8。Gephi数次版本迭代,其最新版本为Gephi0.9.2。VOSviewer于2021年7月22日发布了1.6.17版本。笔者通过调查8个知识图谱软件的版本更新信息发现,其增加数据库,支持跨库查询,增强数据联通性,可追踪文献链接等;其支持多种文件格式,可进行数据格式转换,增加多种导出文件格式;其增加新功能,删除或修改旧功能,如修复漏洞和细节修改,美化可视化知识图谱或支持个性化定制图谱,增强数据计算和处理能力,扩展同类知识图谱软件,升级软件程序及安装操作等。
知识图谱软件要实现不断创新、持续优化与发展,一要快速适应采纳者需求,由传统软件产品的瀑布式开发模式转变为敏捷式开发模式,缩短开发周期;二要满足用户需求,不断完善用户的使用体验。
四、结语
知识图谱软件的数据处理能力和可视化图谱功能逐渐受到科学研究领域专家学者的重视。在创新扩散理论视角下,知识图谱软件的扩散是一个交流、学习和模仿的过程。当前,知识图谱软件依然具有巨大的发展潜力,软件开发人员或机构需要不断优化其软件版本,完善软件功能,使之能够支持多元的数据库格式,从而推动知识图谱软件快速扩散。同时,其技术研发队伍需要加强建设,让知识图谱软件的众多采纳者成为创新者,以加快技术研发和创新,带动学术研究发展,最终实现知识图谱软件应用价值的最大化。
[参考文献]
[1]陈悦,刘则渊,陈劲,等.科学知识图谱的发展历程[J].科学学研究,2008(03):449-460.
[2]岳丽欣,刘自强,许海云.基于交互式可视化的领域知识图谱构建研究[J].情报科学,2020(06):145-150.
[3]赵蓉英,王菊.图书馆学知识图谱分析[J].中国图书馆学报,2011(02):40-50.
[4]赵蓉英,许丽敏.文献计量学发展演进与研究前沿的知识图谱探析[J].中国图书馆学报,2010(05):60-68.
[5]孙建军.链接分析:知识基础、研究主体、研究热点与前沿综述:基于科学知识图谱的途径[J].情报学报,2014(06):659-672.
[6]侯海燕,刘则渊,陈悦,等.当代国际科学学研究热点演进趋势知识图谱[J].科研管理,2006(03):90-96.
[7]侯剑华,陈悦.战略管理学前沿演进可视化研究[J].科学学研究,2007(S1):15-21.
[8]汪竹芸,阳勇,张小梅,等.青蒿研究进展的CiteSpace 知识图谱建立[J].中成药,2022(01):300-305.
[9]井媛媛,王连心,李敬华,等.基于文献计量的知识图谱在中医药领域中的应用分析[J].世界科学技术-中医药现代化,2021(10):3779-3787.
[10]周贞云,邱均平.面向人工智能的我国知识图谱研究的分布特点与发展趋势[J].情报科学,2022(01):184-192.
[11]况宇翔,李泽梅,黄倩雯.基于知识图谱的文化创意产品研究热点和趋势分析[J].包装工程,2020(18):154-164.
[12]Laengle S,Modak N M,Merigo J M,et al.Twenty-Five Years of Group Decision and Negotiation: A Bibliometric Overview[J].Group Decision and Negotiation,2018(04):505-542.
[13]Kamdem J P,Duarte A E,Lima K R R,et al.Research trends in food chemistry: A bibliometric review of its 40 years anniversary (1976-2016)[J].Food Chemistry,2019(294):448-457.
[14]Merigó J M,Miranda J,Modak N M,et al.Forty years of Safety Science: A bibliometric overview[J].Safety Science,2019(115):66-88.
[15]埃弗雷特·M.羅杰斯.创新的扩散[M].辛欣,译.北京:中央编译出版社,2002.
[16]宋歌.学术创新的扩散过程研究[J].中国图书馆学报,2015(01):62-75.
[17]Garfield E.Citation Indexes for Science :A New Dimension in Documentation through Association of Ideas[J].Science,1955(3159):108-111.
[18]Price D J.Networks of Scientific Papers[J].Science,1965(3683):510-515.
[19]Kretschmer H.Coauthorship networks of invisible colleges and institutionalized communities[J].Scientometrics,1994(01):363-369.
[20]侯剑华,胡志刚.CiteSpace软件应用研究的回顾与展望[J].现代情报,2013(04): 99-103.
[基金项目]中国高等教育学会“高等教育信息化研究”专项课题“项目制教学模式下高校融媒体智慧教室建设研究”阶段性研究成果(项目编号:21ZSGZYJYB038)。
[作者简介]朱猛男(1993—),女,江苏徐州人,上海出版印刷高等专科学校信息化办公室助理工程师。