中图分类号的学科应用及其可视化
2022-06-06周贞云邱均平
周贞云 邱均平
摘 要:[目的/意义]长期以来,中图分类号缺少学科分类和文献计量的应用研究。为充分发挥两大应用价值,利用中圖分类号实现数据可视化,将成为中图分类号研究的一种新方法。[方法/过程]聚焦我国知识图谱研究,将CNKI文献作为数据样本,根据文献数据集、中图号集合、中图号矩阵的构建原理,利用Python工具进行数据处理。在此基础上,运用ECharts等软件编程,实现了中图分类号可视化的4种应用。[结果/结论]学科旭日图、学科河流图、学科共现图、学科耦合图,分别从静态、动态、共现、耦合视角揭示了在不同的应用层级和优化条件下中图分类号背后的学科规律及其特征。针对我国知识图谱研究,挖掘出计算机的应用(TP39)、情报资料的处理(G353)、人工智能理论(TP18)三大学科及数据特征,进而识别出文字信息处理、科学文献综述、人工神经网络与计算等七大主题及其前沿动态。
关键词:中图分类号;学科分类;文献计量;数据可视化;知识图谱
DOI:10.3969/j.issn.1008-0821.2022.05.001
〔中图分类号〕G304;G250 〔文献标识码〕A 〔文章编号〕1008-0821(2022)05-0003-10
Abstract:[Purpose/Significance]Chinese library classification(CLC)number lacks the application research of discipline classification and literature metrology for a long time,In order to give full play to these two application values,it will be a new research paradigm to realize data visualization application by using CLC number.[Method/Process]Focusing on the research of knowledge graph(KG)in China,taking CNKI literature as the data sample,the study used Python tools to process data according to the construction principle of literature data set,CLC number set and CLC number matrix.On this basis,ECharts software was used to program and realize four kinds of applications of CLC number data visualization.[Result/Conclusion]From static,dynamic,co-occurrence and coupling perspectives,Sunburst Chart,Stream Graph,Co-occurrence Map and Sankey Diagram for the discipline respectively reveal the discipline rules and characteristics of CLC number under different application levels and optimization conditions.In view of the research of KG in China,characteristics of three major disciplines,namely computer application(TP39),information processing(G353)and artificial intelligence theory(TP18)were extracted,and seven important themes,including word information processing,scientific literature review,artificial neural network and computing were identified.
Key words:chinese library classification number;literature metrology;discipline classification;data visualization;knowledge graph
中图分类号(简称“中图号”,亦称“分类号”)是一种基于《中国图书馆分类法》(简称《中图法》)的学科分类代号。《中图法》是一部以学科分类为基础,并结合图书资料的内容和特点的大型综合性分类法[1],作为《中国学术期刊(光盘版)检索与评价数据规范》(简称《数据规范》)的参考规范文件[2]。实际上,中图号不仅具有学科分类的标识作用,而且具有文献计量的表征功能。然而,中图号的相关研究,主要集中于分类标识和主题分析,缺乏在文献计量中的学科应用。因此,聚焦特定领域的研究文献,利用中图号进行文献计量,依据其学科分类体系,如何实现特定学科应用及其可视化,这个科学问题值得深入探究。
1 相关研究
通过CNKI数据库,采用“分类法”或“分类号”为主题进行检索发现:1980—2021年,期刊发表论文总量不到1 300篇,年均30余篇;1998—2021年,CSSCI收录论文总数不到300篇,年均10余篇;近5年来,发文量和收录数都明显低于平均值,并且呈现逐年下降趋势。长期以来,主要侧重于中图法使用与修订[3]、学科分类评议与比较[4],类目设置与分类标引[5]、分类法与主题法[6]、学科交叉与自动分类[7]。这些推动了中图法的分类标识和主题分析的功能实现,却对中图号的学科分类和文献计量的价值挖掘不够充分。BBEA31D2-E0EF-42B6-B849-1EB59A5D01A0
近年来,一些专家借鉴了文献计量方法在关键词中的应用,着手中图号在文献计量中的研究。2013年,构建了分类号和关键词的共现矩阵,以此统计共现频率并计算紧密程度,进而实现基于共现模式的分类号和关键词对应关系研究[8]。2016年,利用中图分类号将研究文献分成若干学科,借助LDA主题模型对此类学科进行主题抽取以及热点挖掘[9]。2017年,构建中图号和关键词隶属关系网络及多重共现网络,对分类号和关键词的对应关系进行计量分析和可视化展示[10];除此以外,还构建了基于中图分类号和关键词的作者耦合关系网络,采用二次指派程序(QAP)等相关方法,比较分析了作者分类号和作者关键词的耦合效果[11]。
尽管中图号在学科挖掘、共现分析、耦合研究以及可视化展示有所积累和进展,然而中图号在文献计量中如何实现学科应用还有待于深度研究和推进。
综上,中图号的关注程度与其信息重要性不够匹配,研究价值与其功能重要性极不相称。当务之急,致力于提升中图号在学科分类中的应用地位,进一步拓展中图号在文献计量中的研究范畴。为充分发挥中图号的学科分类的作用和文献计量的功能,现结合研究文献数据集和中图号集合来构建中图号矩阵,主要运用文献统计分析法、共现分析法、耦合分析法和可视化分析法,进而实现中图号数据可视化及其应用,这将为中图号新应用提供科学理论基础和有效研究路径。因此,如何利用中图号进行文献计量的可视化分析,继而开展特定领域的学科识别、特征提取以及主题挖掘,这种研究与应用将成为一种新的方法。
2 样本数据和研究过程
2.1 樣本数据
知识图谱(Knowledge Graph,KG)是由Google公司于2012年正式提出[12]。教育部于2017年调整了学科目录,首次将知识图谱设置为学科方向,定位为大规模知识工程,归属人工智能学科范畴[13]。当前,知识图谱在产业应用中蓬勃发展,同时在学术研究中方兴未艾。近年来,知识图谱研究呈现“激增”和“跨界”现象,不仅局限于人工智能领域,并且高度集中于计算机和图情档等领域。然而,文献激增背后的学科关系及其构成,研究跨界视角的学科交叉以及应用,这些都有待于进一步探究。
为实现中图号数据可视化应用,为明晰知识图谱研究的跨学科应用,现以我国知识图谱研究为例。研究文献采用中国知网(CNKI)数据库,以“知识图谱”篇名来精准检索,截至2020年12月31日。为确保文献的学科性和权威性,遴选中国科学引文数据库(CSCD)和中文社会科学引文索引(CSSCI)论文,并剔除与人工智能学科领域的无关文章,形成261篇论文作为研究文献,同时生成中图分类号(CLC)在内的文献数据集。
鉴于知识图谱研究的学术影响和中图分类号的应用价值,聚焦知识图谱研究相关的期刊论文进行中图分类号的数据可视化分析,这对于阐明我国知识图谱研究的学科发展具有重要意义,并且对于拓宽中图分类号在文献计量中的研究范畴具有重要价值。
2.2 研究过程
2.2.1 文献数据集的构建与表示
为利于文献数据进行交换、处理、检索、统计、评价和利用,学术期刊数据库应对检索和评价的数据项都有相应的技术规范[2]。根据特定数据规范,针对特定的研究文献,可构建文献数据集(LDS)。它可由采用文献集合法或项目集合法来构建和表示,具体如表1所示。
2.2.3 中图号矩阵的构建与表示
《数据规范》指出,文章一般标注1个分类号,多个主题的文章可标注两个或3个分类号;主分类号排在第1位,多个分类号之间应以分号分隔[2]。对照中图号的数据集合(CLCN),数据项dix一般包含1~3个中图号。在实际应用中,中图号标引存在缺失或者众多。
为实现中图号数据可视化,应利用中图号集合和文献数据集,进一步构建基于中图号的数据特征矩阵。根据学科分类和文献计量的研究与应用,可以构建不同的中图号数据矩阵。最为典型的中图号矩阵主要包括:文献—中图号矩阵、时间—中图号矩阵、中图号共现矩阵、文献—中图号耦合矩阵。在数据处理中,一般需要经过特定程序[16]:①科学确定中图号频率;②正确选择中图号层级;③合理优化中图号矩阵;④有效进行可视化应用。中图号矩阵的构建与表示,如表3所示。
3 基于中图号的数据可视化应用
聚焦我国知识图谱研究,采用CNKI文献数据集为数据样本,借鉴文献数据集、中图号集合、中图号矩阵等构建原理,使用Python软件[17-18]进行数据处理,并主要运用ECharts工具[19-20]编程来完成中图号可视化的相关应用:学科旭日图、学科河流图、学科共现图、学科耦合图,从而实现中图号的学科分类和文献计量的研究价值。
3.1 知识图谱研究的学科旭日图
3.1.1 学科旭日图的演变与创新
旭日图(Sunburst Chart)是一种现代饼图[20-21],视为多层级的环形图,超越了传统的饼图、环图和树形图。通过面积、颜色和排列,它不仅像饼图和环图一样能够体现数据比例构成,并且像树形图一样能够体现数据层级关系。在数据结构上,内圈与外圈属于父子层次,具有归属关系;最内层的圆环级别最高、分类最粗,最外层的圆环级别最低、分类最细。因此,旭日图特别适用于层级较多的比例数据关系。
学科旭日图是一种系统研究学科分布的特殊旭日图,属于特定空间静态视图。在文中,学科旭日图特指基于中图分类号的学科分布图,从宏观视角呈现文献数据集的学科领域分布。聚焦特定研究文献,通过文献—中图号矩阵的数据挖掘、层级选择和降维处理,它不仅能够科学表征研究文献的学科构成比例,并且能够有效表征特定研究的学科层级关系。
3.1.2 学科旭日图的应用与分析
根据表3矩阵构建的一般步骤,利用Python软件构建文献—中图号矩阵,采用ECharts工具绘制学科旭日图,具体如图1(a)与(b)所示。BBEA31D2-E0EF-42B6-B849-1EB59A5D01A0
图1(a)和(b)从优化条件fr≥10和fr≥20分别呈现了我国知识图谱研究的学科领域分布。通过旭日图内三环分析,发现我国知识图谱研究的3个重要学科领域:计算技术、计算机技术(TP3),情报学、情报工作(G35),自动化基础理论(TP1)。三者分别有146项次、64项次和61项次,小计243项次占总量的69.13%。
值得关注的是,情报学、情报工作(G35)加上图书馆学、图书馆事业(G25)以及档案学、档案事业(G27),“图情档”学科领域有81项次占20.66%,已然成为知识图谱研究成果的第二大来源。除此之外,信息与知识传播(G2)、教育(G4)、医学与其他学科的关系(R-05)以及经济计划与管理(F2),已成为我国知识图谱研究不可忽视的重要领域。
3.2 知识图谱研究的学科河流图
3.2.1 学科河流图的演变与创新
河流图(Stream Graph)是一种象形图表[20-21],由面积图、堆积面积图不断演变而来。它用不同的颜色表示不同的类别,用相应的数值表示相应的宽度。每个类别因数值变化形成粗细不同的小河,多种类别如同多条小河汇集成多种颜色的河流。它通过“流动”的形状,展示不同类别的数据随时间的变化情况。相比较堆积面积图,河流图具有优美的视觉结构,特别适合于数据种类繁多、数据量巨大且波动幅度较大的情境。
学科河流图是一种专门研究学科演变的特殊河流图,属于特定时间动态视图。在这里,学科河流图是指基于中图分类号的学科演变图,从中观视角展示文献数据集的学科发展趋势。针对特定研究文献,通过时间—中图号矩阵的数据挖掘、层级选择和降维处理,它不但能夠直观呈现特定时间、特定学科的静态特征,同时能够形象反映不同时间、不同学科的动态特征。
3.2.2 学科河流图的应用与分析
根据表3矩阵构建的流程,利用Python软件构建时间—中图号矩阵,采用ECharts工具绘制学科河流图,如图2(a)与(b)所示。
图2(a)是基于中图号(h=0)的可视化分析,展示了我国知识图谱研究随不同年份的学科动态变化及其分布。所有研究文献,集中在社会科学(CLC3)和自然科学(CLC4)两大学科领域。以自然科学为主的知识图谱研究达184项次占总数的70.50%,以社会科学为主的知识图谱研究,也有77项次,占29.50%。从文献信息增长规律来分析,我国知识图谱研究正处于急剧增长阶段,未来几年还将继续在CLC3和CLC4两大学科领域中激增。
图2(b)是基于中图号(h=4)的可视化呈现,计算机的应用(TP39)、情报资料的处理(G353)、人工智能理论(TP18)累计分别有128项次、63项次和61项次,合计243项次,约占总量的61.99%;涉及194篇论文,占研究文献总量74.33%。面向我国知识图谱研究,TP39、G353和TP18已成为基于中图分类号的主流学科领域。从布拉德福定律来看,我国知识图谱研究文献,普遍地分散于多个学科领域,并高度地集中于计算机的应用、情报资料的处理、人工智能理论3个领域。
3.3 知识图谱研究的学科共现图
3.3.1 学科共现图的演变与创新
共现图(Co-occurrence Map)是一种关系网络图[22],不仅通过节点大小反映特定数据项的频次,并且通过连线粗细表征数据项之间的关系。这种共现图常用于关键词、主题、WoS分类的共现网络分析,以及作者、机构、国家(地区)的合作网络分析。CiteSpace和VOSviewer等文献可视化工具功能比较强大,能够实现这些关系网络分析;然而,当前缺乏基于中图号的学科共现分析。
学科共现图是一种深入研究学科共现的关系网络图,采用特定学科分类标准来考察研究文献中学科分类状态。在这里,学科共现图是指基于中图分类号的学科共现图,从微观视角挖掘文献数据集的学科跨界特点。围绕特定研究文献,通过中图号共现矩阵的数据挖掘、层级选择和优化处理,它不仅能合理表达特定研究的学科多样性,并且能够明确表示研究文献的学科交叉性。
3.3.2 学科共现图的应用与分析
依据表3矩阵构建的步骤,利用Python软件构建中图号共现矩阵,并采用Gephi工具绘制学科共现图,如图3(a)与(b)所示。
图3(a)和(b)从中图号(h=3)和(h=4)分别展示了我国知识图谱研究的学科共现。
图3(a)清晰呈现,最大3个节点正是TP3、G35和TP1,分别对应三大学科:计算技术、计算机技术,情报学、情报工作,自动化基础理论。它们的总链接数分别为240、123、112,合计475,占全部节点总链接数的69.04%。其中,TP3 & G35、TP1 & G35和TP3 & TP1的链接数分别为23、10和30。
在图3(b)中,三大节点对应三大学科:计算机的应用(TP39)、情报资料的处理(G353)、人工智能理论(TP18)。TP39、G353和TP18总链接数分别为212、119、109,合计440,占全部节点总链接数的64.90%。其中,TP39 & G353、TP18 & G353和TP39 & TP81的链接数分别为21、10和28。TP39、T18和G353共现比较显著:共现文献高达53篇,占研究文献总数的20.31%。可见,人工智能理论与计算机的应用相结合研究,计算机的应用、人工智能理论采用情报资料的处理来研究,成为我国知识图谱研究的重要内容。
3.4 知识图谱研究的学科耦合图
3.4.1 学科耦合图的演变与创新
桑基图(Sankey Diagram)是一种特定类型的分流图[20,23],将类型作为节点,用边连接源头节点与分流节点,使得源头的宽度与分流的宽度始终保持相等。它源于1898年爱尔兰裔工程师、英国陆军工兵上尉Sankey于绘制蒸汽机的能源效率图,常用于能源、材料、金融等数据可视化分析。利用可视化软件,现代桑基图使不同宽度的节点采用不同颜色加以区分,更加直观地反映不同类型的大小。BBEA31D2-E0EF-42B6-B849-1EB59A5D01A0
学科耦合图是一种特殊的桑基图,用中图号数据可视化来分析特定研究领域的学科分类及其文献耦合关系。这种学科耦合图,不仅能够反映学科的分层关系,并且能够呈现学科的耦合聚类;不仅可用节点的宽度和颜色来表征文献耦合幅度,还可用节点的特殊名称来蕴涵学科耦合强度[24]。
3.4.2 学科耦合图的应用与分析
根据表3矩阵构建的流程,利用Python软件构建文献—中图号耦合矩阵,采用ECharts工具绘制学科耦合图,如图4(a)与(b)所示。图4(a)呈现了基于中图号(h=1)的文献学科耦合关系。Total代表261篇研究文献,其中社会科学(CLC3)文献55篇,自然科学(CLC4)文献155篇,社会科学&自然学科(CLC3 & CLC4)文献48篇。举例而言,G指文化、科学、教育、体育,源自于CLC3和CLC3 & CLC4;此时耦合强度为1个单位,耦合宽度为62篇文献,占研究文献总数的23.75%。T指工业技术,源自于CLC4和CLC3 & CLC4;此时耦合强度为1个单位,耦合宽度为155篇文献,占59.39%。
图4(b)刻画了中图号(h=4)之间的文献学科耦合关系。TP39、G353和TP18的耦合强度为1个单位,其耦合幅度分别为80、35和26篇文献。TP39 & TP18、TP39 & G353和TP18 & G353的耦合强度为2个单位,其耦合幅度分别为25、18和7篇文献。TP39 & G353 & TP18的耦合强度为3个单位,其耦合幅度为3篇文献。
4 结果与讨论
为进一步探究中图号数据可视化的使用条件和应用价值,挖掘知识图谱研究的学科特征和学科主题,现从两个视角对研究结果进行深入讨论。
4.1 中图号数据可视化应用的比较分析
为更加全面地分析可视化应用效果,可引入覆盖率[25]和查全率[26]两个指标。文献覆盖率是指特定应用层级(h)特定优化条件(r)下中图号矩阵对应的文献数量占研究文献总数的百分比率,记作LCR。学科查全率特指中图号查全率,是特定优化条件(r)下中图号出现的次数占同一层级条件(h)下中图号所出现总次数的百分比率,记作DRR。中图号数据可视化应用的比较分析,如表4所示。
中图号数据矩阵构建的过程与原理,是中图号数据可视化应用的基础和前提。典型图例源于特定可视化分析图,取决于中图号的应用层级和数据矩阵的优化条件,这样有助于更加科学地呈现特定领域的学科发展与演变。采用文献覆盖率和学科查全率,能更加严谨地表征特定文献的学科关系与结构。正因如此,学科旭日图、学科河流图、学科共现图和学科耦合图等中图号数据可视化应用,方能在不同条件下揭示学科规律和特征。
4.2 我国知识图谱研究的学科特征及重要主题
根据中图号数据可视化应用,可以进一步挖掘学科特征并识别学科主题。现将我国知识图谱研究的学科特征及重要主题进行梳理,如表5所示。为了进一步说明耦合关系,采用耦合强度和耦合幅度[24,27]来表述。学科耦合强度特指基于中图号的文献学科耦合强度,记作LDCI;文献耦合幅度特指基于中图号的文献学科耦合幅度,记作LDCA。
基于数据可视化应用与分析,中图号(h=4)能够细粒度反映我国知识图谱研究的学科特征。无论从静态到动态视角,还是从共现到耦合分析,TP39、G353和TP18自然而然成为我国知识图谱研究的三大主流学科;这三大学科对应的LCR和DRR都非常高,LCCS=1条件下LDCA也非常高。同时,TP39 & TP18、TP39 & G353、TP18 & G353成为我国知识图谱研究的三大交叉学科;此时LCR相对较低,但DRR相对较高,LDCI=2条件下LDCA相对较高。进一步发现,TP39 & TP18 & G353成为LDCI=3条件下DRR最高的交叉学科。
通过对TP39、G353和TP18主流学科及其交叉学科的研判,并结合中图号(h=5和h=6)剖析,我国知识图谱研究的学科领域主要集中于七大重要主题。①文字信息处理:基于语义网技术、语义关联分析、语义关系挖掘来构建知识图谱[28-30],基于自然语言处理的知识图谱问答系统[31],以及面向知识图谱问答的语义查询扩展方法[32],已成为这一学科主题的前沿动态;②智能信息检索:知识图谱为智能信息检索提供一种全新的模式,开启了实体搜索与关系检索[33]、三元组模式查询与语义查询[34]、智能检索与实体推荐[35]等研究与应用的新阶段。目前,景点、电影、商品、论文、新闻等智能推荐[36-40]为业界所关注;③科学文献综述:我国知识图谱研究综述,注重知识图谱构建与知识图谱应用。在知识图谱构建方面,以构建技术[41]和补全方法[42]为主;而在知识图谱应用方面,则以推荐系统[43]和可视化技术[44]为主;④科学技术总结:大体分为探索性总结和应用性总结,前者包括学术师承知识图谱可视化[45]、人物关系知识图谱推理[46]、金融知识图谱新闻推荐[40]以及“一带一路”投资知识图谱问答系统[47];后者涉及医疗知识图谱研究与应用[48]、科技大数据知识图谱构建及应用[49]、在线学术资源知识图谱应用[50];⑤自动推理与机器学习:高度集中于表示学习[51]、知识推理[52]、深度學习[53]以及基于个性化学习[54]、图嵌入学习[55]、迁移学习[56]等知识图谱推理研究;⑥专家系统与知识工程:专家系统促进了知识工程的发展,继而推动了知识图谱的应用。目前,国内知识图谱研究,尤以本体[57]、推荐系统[58]、知识表示[59]、知识推理[52]为主;⑦人工神经网络与计算:融合知识图谱和神经网络的研究大量涌现,注意力网络[60]、卷积神经网络[34]、循环神经网络[61]和长短期记忆网络[62]已经成为研究高频术语。BBEA31D2-E0EF-42B6-B849-1EB59A5D01A0
5 结束语
中图分类号在图书情报领域具有重要价值,一方面在图书资料的标引与排架中已发挥了重要作用;另一方面还未能充分发挥学科分类和文献计量的内在价值。聚焦特定研究文献,着重对中图号数据进行文献计量分析,实现基于中图号的学科分类及可视化应用,从而提取学科特征及识别学科主题。实际上,这种研究与应用的新方法,在理论界尚未形成广泛共识,在应用界也未达成广为使用。学科旭日图、学科河流图、学科共现图、学科耦合图等的构建与创新,将有助于拓宽中图号在学科分类和文献计量中的研究与应用。以我国知识图谱研究为例,不仅用样本数据验证了中图号数据可视化应用,而且识别了计算机的应用(TP39)、人工智能理论(TP18)、情报资料的处理(G353)三大学科及其关键特征,在此基础上挖掘出文字信息处理、科学文献综述、人工神经网络与计算等七大主题及其前沿动态。
基于中图号的学科应用及可视化,这种研究方法值得推广,使学科分类和文献计量得以有效挖掘。然而,应用中图号实现学科识别的理论阐述不够充分,采用中图号实现文献计量的方法运用不够丰富,使用中图号实现可视化分析的应用工具还不够通用。这三大不足将从理论、方法和应用视角指明了中图号在学科分类和文献计量中研究与应用的未来图景。通过这种新方法的抛砖引玉,期待共同研究、应用和推广,将为提升中图号在学科分类中的应用地位和拓宽在文献计量中的研究范畴作不懈努力。
参考文献
[1]卜书庆.《中国图书馆分类法》发展史述要[J].图书馆建设,2019,42(6):42-57.
[2]中国学术期刊(光盘版)编辑委员会.CAJ-CD B/T 1-2006中国学术期刊(光盘版)技术规范检索与评价数据规范[S].北京:中国标准出版社,2006:1-4.
[3]陈志新.分类法研究的十五个问题——我国2009至2016年分类法研究综述[J].情报科学,2018,36(6):149-155.
[4]童刘奕,张鹏翼.《中国图书馆分类法》和《美国国会图书馆图书分类法》人工映射分析与差异性探究[J].数字图书馆论坛,2018,14(3):53-58.
[5]符银莲.《中国图书馆分类法》第5版计算机类目分类体系与编码问题探讨[J].新世纪图书馆,2021,42(2):44-49.
[6]李育嫦.网络信息组织中的分类法与主题法[J].情报资料工作,2004,45(3):31-33.
[7]黄莉,李湘东.基于《中图法》的自动分类研究现状与展望[J].图书情报知识,2012,29(4):30-36.
[8]钟伟金.基于共现模式的分类号—关键词对应关系研究[J].情报理论与实践,2013,36(5):116-119.
[9]王曰芬,傅柱,陈必坤.采用LDA主题模型的国内知识流研究结构探讨:以学科分类主题抽取为视角[J].现代图书情报技术,2016,(4):8-19.
[10]温芳芳.基于共现分析的中图分类号与关键词对应关系研究[J].情报科学,2017,35(11):121-125.
[11]温芳芳.作者分类号耦合分析与作者关键词耦合分析的比较研究[J].情报杂志,2017,36(11):186-191.
[12]闫树,魏凯,洪万福,等.知识图谱技术与应用[M].北京:人民邮电出版社,2019:2-7.
[13]肖仰光,徐波,林欣,等.知识图谱:概念与技术[M].北京:电子工业出版社,2020:8-10.
[14]国家图书馆《中国图书馆分类法》编辑委员会.中国图书馆分类法[M].北京:国家图书馆出版社,2010:1-1019.
[15]中国国家图书馆.中图分类查询[EB/OL].https://www.clcindex.com,2021-06-18.
[16]李杰,陈超美.CiteSpace:科技文本挖掘及可视化(第二版)[M].北京:首都经济贸易大学出版社,2017:199-212.
[17]嵩天,礼欣,黄天羽.Python语言程序设计基础(第2版)[M].北京:高等教育出版社,2017:209-217.
[18]刘宇宙,刘艳.Python 3.7从零开始学[M].北京:清华大学出版社,2018.10:74-89.
[19]王大伟.ECharts数据可视化:入门、实战与进阶[M].北京:机械工业出版社,2020:49-96.
[20]The Apache Software Foundation.Apache ECharts[EB/OL].https://echarts.apache/zh/index.html,2021-11-09.
[21]北京创新乐知网络技术有限公司.CSDN专业开发者社区[EB/OL].https://www.csdn.net,2021.10.15.
[22]邱均平,赵蓉英,董克,等.科学计量学[M].北京:科学出版社,2016:194-362.
[23]百度百科.桑基图[EB/OL].https://baike.baidu.com/item,2021-11-27.
[24]邱均平,赵蓉英,宋艳辉,等.信息计量学概论[M].武漢:武汉大学出版社,2019:123-237.
[25]百度百科.文献覆盖率[EB/OL].https://baike.baidu.com/item,2021-03-14.
[26]百度百科.查全率[EB/OL].https://baike.baidu.com/item,2021-11-09.
[27]邱均平.文献计量学(第二版)[M].北京:科学出版社,2019:201-314.BBEA31D2-E0EF-42B6-B849-1EB59A5D01A0
[28]金贵阳,吕福在,项占琴.基于知识图谱和语义网技术的企业信息集成方法[J].东南大学学报:自然科学版,2014,44(2):250-255.
[29]杨玉基,许斌,胡家威,等.一种准确而高效的领域知识图谱构建方法[J].软件学报,2018,29(10):2931-2947.
[30]熊晶,钟珞,王爱民.甲骨文知识图谱构建中的实体关系发现研究[J].计算机工程与科学,2015,37(11):2188-2194.
[31]陈金菊,王义真,欧石燕.基于道路法规知识图谱的多轮自动问答研究[J].现代情报,2020,40(8):98-110,120.
[32]苏永浩,张驰,程文亮,等.CLEQS——基于知识图谱构建的跨语言实体查询系统[J].计算机应用,2016,36(S1):204-206,223.
[33]王秋月,覃雄派,曹巍,等.扩展知识图谱上的实体关系检索[J].计算机应用,2016,36(4):985-991.
[34]孟明明,张坤,论兵,等.一种面向知识图谱问答的语义查询扩展方法[J].计算机工程,2019,45(9):276-283,290.
[35]丁浩宸,王忠明.基于本体的油茶中文知识图谱构建与应用[J].世界林业研究,2020,33(4):50-55.
[36]高嘉良,仇培元,余丽,等.基于旅游知识图谱的可解释景点推荐[J].中国科学:信息科学,2020,50(7):1055-1068.
[37]李浩,张亚钏,康雁,等.融合循环知识图谱和协同过滤电影推荐算法[J].计算机工程与应用,2020,56(2):106-114.
[38]汤伟韬,余敦辉,魏世伟.融合知识图谱与用户评论的商品推荐算法[J].计算机工程,2020,46(8):93-100.
[39]唐浩,刘柏嵩,刘晓玲,等.基于协同知识图谱特征学习的论文推荐方法[J].计算机工程,2020,46(9):306-312.
[40]陶天一,王清钦,付聿炜,等.基于知识图谱的金融新闻个性化推荐算法[J].计算机工程,2021,47(6):98-103,114.
[41]李肖俊,邵必林.多源异构数据情境中学术知识图谱模型构建研究[J].现代情报,2020,40(6):88-97.
[42]王维美,史一民,李冠宇.改进的胶囊网络知识图谱补全方法[J].计算机工程,2020,46(8):21-26.
[43]秦川,祝恒书,庄福振,等.基于知识图谱的推荐系统研究综述[J].中国科学:信息科学,2020,50(7):937-956.
[44]王鑫,傅强,王林,等.知识图谱可视化查询技术综述[J].计算机工程,2020,46(6):1-11.
[45]杨海慈,王军.宋代学术师承知识图谱的构建与可视化[J].数据分析与知识发现,2019,3(6):109-116.
[46]于娟,黄恒琪,席运江,等.基于图数据库的人物关系知识图谱推理方法研究[J].情报科学,2019,37(10):8-12.
[47]陈璟浩,曾桢,李纲.基于知识图谱的“一带一路”投资问答系统构建[J].图书情报工作,2020,64(12):95-105.
[48]韓普,马健,张嘉明,等.基于多数据源融合的医疗知识图谱框架构建研究[J].现代情报,2019,39(6):81-90.
[49]王颖,钱力,谢靖,等.科技大数据知识图谱构建模型与方法研究[J].数据分析与知识发现,2019,3(1):15-26.
[50]熊回香,景紫薇,杨梦婷.在线学术资源中知识图谱的应用研究综述[J].情报资料工作,2020,41(3):61-68.
[51]熊盛武,陈振东,段鹏飞,等.基于可信向量的知识图谱上下文感知表示学习[J].武汉大学学报:理学版,2019,65(5):488-494.
[52]官赛萍,靳小龙,贾岩涛,等.面向知识图谱的知识推理研究进展[J].软件学报,2018,29(10):2966-2994.
[53]杜博,万国佳,纪颖.基于几何深度学习的知识图谱关键技术研究进展[J].航空兵器,2020,27(3):1-10.
[54]苏喻,张丹,刘青文,等.学生得分预测:一种基于知识图谱的卷积自编码器[J].中国科学技术大学学报,2019,49(1):21-30.
[55]杨晓慧,万睿,张海滨,等.基于符号语义映射的知识图谱表示学习算法[J].计算机研究与发展,2018,55(8):1773-1784.
[56]鲁强,刘兴昱.基于迁移学习的知识图谱问答语义匹配模型[J].计算机应用,2018,38(7):1846-1852.
[57]漆桂林,欧阳丹彤,李涓子.本体工程与知识图谱专题前言[J].软件学报,2018,29(10):2897-2898.
[58]程淑玉,黄淑桦,印鉴.融合知识图谱与循环神经网络的推荐模型[J].小型微型计算机系统,2020,41(8):1670-1675.
[59]方阳,赵翔,谭真,等.一种改进的基于翻译的知识图谱表示方法[J].计算机研究与发展,2018,55(1):139-150.
[60]邓立明,魏晶晶,吴运兵,等.基于知识图谱与循环注意力网络的视角级情感分析[J].模式识别与人工智能,2020,33(6):479-487.
[61]张楚婷,常亮,王文凯,等.基于BiLSTM-CRF的细粒度知识图谱问答[J].计算机工程,2020,46(2):41-47.
[62]张善文,王振,王祖良.结合知识图谱与双向长短时记忆网络的小麦条锈病预测[J].农业工程学报,2020,36(12):172-178.
(责任编辑:郭沫含)BBEA31D2-E0EF-42B6-B849-1EB59A5D01A0