大数据环境下信息检索与文献计量的共生发展综述*
2016-09-01杨思洛程爱娟湘潭大学公共管理学院湖南湘潭411105
杨思洛 程爱娟 冯 雅(湘潭大学公共管理学院 湖南湘潭 411105)
·综述·
大数据环境下信息检索与文献计量的共生发展综述*
杨思洛程爱娟冯雅
(湘潭大学公共管理学院 湖南湘潭411105)
文章通过梳理信息检索和文献计量相关理论与应用研究成果,对两者的发展历程、相互关系和共生趋势进行归纳和总结。指出文献计量辅助信息检索,信息检索服务文献计量,两者有内容的并行发展、工具的整合发展以及实践的融合发展三方面的共生发展趋势。
大数据信息检索文献计量共生发展
〔引用本文格式〕杨思洛,程爱娟,冯雅.大数据环境下信息检索与文献计量的共生发展综述[J].图书馆,2016(8):68-73, 90
1 引言
共生又叫互利共生,原指两种不同生物之间所形成的紧密互利关系[1]。信息检索和文献计量作为情报学的两大分支,由于信息检索偏向于根据用户的需要找出有关信息的过程和技术;文献计量偏向于文献的评估和定量分析,目标的差异使人们忽略了两者之间的联系。从表面上看,两者之间除了同属于情报学之外联系甚少,但透过表面探究实质时,会发现其实两者是互利的,有着非生物意义上的共生关系[2]。
早在1987年,在比利时林堡大学举行的第一届ISSI会议,就以“International Conference on Bibliometrics and Theoretical Aspects of Information Retrieval”为主题,试图将信息检索与文献计量相结合[3]。但是这一提议逐渐被人们淡忘,将两者结合起来的研究也为之甚少。随着计算机、网络技术的发展,各种信息检索、文献计量工具的完善,以及在大数据环境下,高效率获取信息的迫切需要,人们认识到将信息检索与文献计量相结合能达到更好效果。因此,将两者结合的主题被重新讨论。于2013年7月在奥地利维也纳召开的第14届ISSI会议上,开展了两者结合的研讨会,旨在讨论怎样运用计量学方法来完善检索,提高人们对计量与检索联系的认识,并为检索创造更加科学的模型打下基础[4]。随后,2014年3月在荷兰阿姆斯特丹开展了主题为“Bibliometric-enhanced Information Retrieval”的第36 次ECIR(European Conference on Information Retrieval)会议,提出:随着数字化的发展,传统检索已不能很好的满足用户的需求,因为在网络环境下,检索结果庞大并且复杂,因此,应该把两者相结合,在计量的基础上优化检索[5]。
随着大数据时代的到来,美国政策的战略层面提出:要大力推动与大数据相关的信息收集、组织,改善与大数据相关的分析工具及技术,提高提取、分析信息的能力[6]。我国“十三五规划”中也将大数据上升到国家战略层面[7]。为了在价值密度较低的海量数据中挖掘出有意义的信息,需要信息检索,也需要文献计量与评价,更需要两者的互利共生发展。一方面,在互利关系下两者的相互影响和应用程度需要提高;另一方面,在互利关系下两者各自的发展需要有所突破。
2 信息检索与文献计量的关系
信息检索与文献计量存在着密切联系。首先,两者在发展历程上契合度较高。信息检索起源于19世纪下半叶的图书馆参考咨询和文摘索引工作,并在20世纪50年代,随着计算机技术的发展,逐渐成为独立领域[8]。文献计量学的产生可回溯到20世纪初,并在20世纪60年代成为专门领域。其次,两者研究对象都是文献信息,在起源上同源,同属于情报学。在1981年White和Griffith通过作者共被引分析可视化学科结构,把情报学分为了信息检索与文献计量两大组成部分[9]。而在后续对情报学更新时期的研究中,情报学领域分为计量与信息检索两大块得到了进一步论证[10]。第三,研究两者的相关人员存在交叉现象。在1998年White 和 McCain对24年间情报学领域学者的可视化动态分析中得出:总体上,在20世纪70年代研究信息检索的学者高于研究计量的学者,然而研究信息检索的学者在向计量领域偏移,到20世纪90年代,两者的研究人数达到均衡状态[10]。最近的研究表明,文献计量研究队伍有进一步扩大趋势[11]。
然而,信息检索与文献计量也存在显著差异:在受众方面,信息检索面向的使用互联网、图书情报档案信息系统等的广大用户,而文献计量针对学术人员、专门机构或政府部门的管理者或决策者;在目标上,信息检索是特定用户通过一定的策略尽可能高效地在广大的知识空间中找出与要求相匹配的信息,而文献计量重在敏锐并精确地评价或描绘出某一知识单元或领域的状态;在规模上,信息检索不仅用于学术交流和文献书目数据库,还与智能化、商业信息、图书馆目录、搜索引擎等相关,而文献计量多与期刊论文管理与评价以及网络中的学术交流相关;在教育途径上,信息检索在计算机科学、I-Schools或者信息学院等都有涉及,甚至作为全校性的信息素养课程出现,而文献计量则集中在图书情报、科技政策与管理等专业课程,在大学课程中较少涉及[12]。
3 文献计量辅助信息检索
检索的过程实际上是文献信息相关性匹配的过程,单独的信息检索存在着局限,而文献计量能对信息检索提供较好的辅助。一方面,文献计量中某些定律的运用能在很大程度上弥补信息检索的局限。另一方面,在大数据环境下,用户面对巨大的信息量,会出现一种茫然的状态,而文献计量能够在一定程度上对用户在检索、选择信息时予以指示。
3.1检索原理及局限
结合已有研究[13, 14],得到信息检索原理及过程图,如图1所示。信息检索包括信息存储与用户检索两大过程。在存储过程中,首先要分析文献信息,找出文献信息特征,著录标引,再形成文献信息标识即检索点,最后将这些标识和检索点输入检索系统。而在检索过程中,用户首先分析需求,形成检索主题,然后构建检索式(检索词),计算机将用户输入的检索词和系统内容进行匹配,得出检索结果。在这一过程中,存在许多缺陷。首先,在构建检索式方面,用户如果不能很准确地描述要检索的问题,在分析问题、形成提问、选用检索词等环节都会受到表达能力不足的影响,如从用户需求到提问是一个内容相关过程,用户受表达能力不足的影响,不能很好地使提问覆盖整个需求;从用户提问到形成检索概念是一个主题相关过程,用户受表达能力限制,不能很好地使形成的检索概念概括提问;从检索概念到确定检索词是一个概念相关过程,用户受表达能力的影响,可能使检索词不能很好地诠释概念。其次,在检索逻辑方面,信息检索存在着二值(是与否)相关性判断的局限,如在输入检索词到检索出文献这一过程中,计算机就对用户输入的检索词与系统中存在的相关文献信息标识进行了二值相关性判断,最终输出判断结论为“是”的内容,这种机器得出的相关性判断结果并不具备能动性,可能会输出大量与用户需求不符的结果或者输出的结果与用户表达的意思不符,因此查全率、查准率得不到保障,不能满足用户的需求。
图1 信息检索原理及过程
3.2文献计量对信息检索的辅助
3.2.1确定检索点
在大数据环境下,海量信息的有序化存储以及合理的归类是信息得以传播利用并发挥价值的重要前提,而这种有序化存储以及合理的归类在某种程度上要借助文献计量的相关知识。在信息检索过程中,文献信息标识即检索点选取是否恰当,不仅关系着一篇文章在海量信息中是否被分配到了合理的位置,并且关系着该文章能否被用户快速检出。那么对文献进行标引时,怎么选取合适的词呢?齐普夫定律在这里就起到了很好的作用。将一篇文章录入系统后,根据该定律:文章中包含的N个词按照其频率递减顺序排列,并用自然数从1到L给词编号,若f表示某词频次,r表示该词的序号,则f·r=C(C为常数),就能很好地确定中频词。而研究表明,特定学者的用词与所关注的学科领域有很大关系,而该领域学者所关注的学科范围中的词,绝大部分集中在中频词的后段和低频词的前段,大多为长词[15]。如果根据齐普夫定律来取词,就减少词表取词的盲目性,提高取词效率。并且在大数据环境下,根据该定律还可以实现对文章的自动标引,简化了信息存储的过程。另外该定律对用户挑选检索词有指导意义——避免利用高频词和低频词,选取中频词检索。
3.2.2缩小检索范围
大数据环境下海量的信息使人在检索时无从下手,同时价值量小的单个信息使人在研究问题时力不从心。而将文献计量的相关规律运用到信息检索的过程中,可以在一定程度上缓解这一状态。首先,根据布拉德福定律:将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,可以把期刊分区。各个区的文章数量相等,此时核心区、相关区、非相关区期刊数量成的关系。从而在检索相关文献时,优先选择核心期刊进行检索,缩小检索范围,缓解面对海量文献无从下手的状态。其次,清楚文献的老化规律。随着时间的改变,大量的文献由于种种原因,可能已不适合时代的需要。为了找到更新颖、更合适的信息,将文献老化规律用来限定检索年限,从而排除一些过时的或对目前研究价值不大的内容。最后,为了找到价值量较高的信息,还可以在检索中对引用量进行限定,从而提高检索文献的质量;或者将加菲尔德创建的与以往传统主题法不同的文献检索法——引文索引法运用到检索的过程中,充分利用其研发的引文数据库,如SCI 、SSCI和A&HCI[16]。这种引文数据库中录入的数据能揭示学科发展过程,是追溯学科知识进化的可靠依据;并且这种引文索引体系便捷地组建了特定主题的参考文献网络,便于用户对所研究或感兴趣领域文献的获取;另外,这种引文索引体系还能从文献引证的角度评估文章的学术价值,综合提高文献检索的效率与针对性。
3.2.3构建检索模型
在大数据环境下,面对海量信息,均衡检索的查全率与查准率是一个重要课题,因此对新检索模型的构建显得十分必要。检索实际上是一个相关性匹配的过程,而文献是否相关的界限是模糊的。在完全相关文献与完全不相关文献之间还存在着大量的文献,这一部分文献是否被采用往往取决于特定检索要求的需要或者用户的行为。为了更好地完成检索任务,必须根据需求调整检索策略,构建合理的检索模型。而在检索模型中添加“计量”成分,往往能达到较好的检索效果。国外已有Glänzel[17]和Zitt[18]等进行研究,并得出检索模型:
其中,k≥0,m,n >0或m =n=0。这个模型包括两个部分,第一部分是为了确保查准率,利用核心期刊或核心作者等检索到相关性高但查全率不高的文献,即公式中的。第二部分是为了提高查全率,在非核心期刊、非核心作者或与检索目标相关的领域等情况下查找文献,即公式中的,并且这一部分文献在某些方面要与第一部分有联系,即公式中的。此模型在某种程度上超越了传统检索,不仅能够包括所有类型的检索字段,如标题、关键词、期刊名称、作者地址等,还能融入计量方法,如直接引用、共同引用、文献耦合、阈值选定等等[18]。例如具体检索式可设定如下[19]:UC1: Journal in WoS = BIOINFORMATICS…; UC2: Journal in MEDLINE = IN SILICO BIOLOGY…; UC3: Keywords in title = BIOINFORMATICS…; CC1: Records cited by UC1; CC2: Records citing UC1; CC3: thresholds Ti
得到的检索公式为:
可通过调节CC3的阈值,最终得到较为理想的结果。
4 信息检索服务文献计量
4.1文献计量的发展
文献计量学是以布拉德福、洛特卡、齐普夫为基本定律,定量统计各种文献信息的学科[20]。随着时代的发展,文献计量已经不仅仅停留在以篇、册、本为单位的文献单元的计量上,而开始深入到文献的内部对知识单元和文献的相关信息进行计量研究,如题名、主题词、关键词、词频、知识项、引文信息、著者、出版者、日期、语言、格式等[21]。为了满足文献计量不断发展的要求,必须利用文献检索手段,更好地完成文献计量任务。另外,近年来文献计量不仅在自身领域内取得了较大进展,如在科学评价、学科结构分析与可视化、科学交流等方面发挥重要作用,并随着信息检索技术、水平的提高,共同推动了计量相关学科的研究与实践进展,如表1所示。文献计量学是信息计量学发展的基础,也是科学计量学发展的基础,而信息计量学与科学计量学,则是文献计量学发展的方向[22]。随着知识经济的不断发展,在建设知识社会实际需求的拉动下,在相关计量学进一步发展的内在需求下,根植于文献、信息和科学计量学的知识计量学得到了发展。另外,伴随着大数据时代的到来,引文分析无法衡量大量新型文献产生的影响,例如 Twitter、Facebook 和博客等社交网络中的文献,并且出现了学术成果新形式,如数据集、软件工具、算法或分子结构等,不容易甚至无法通过传统计量指标来分析[23]。替代计量学应运而生,在某种程度上它是文献计量的一种补充。而这些计量学的发展都离不开信息检索。
表1 相关计量学的产生
4.2信息检索对文献计量的服务
信息检索对文献计量学等相关计量学科的发展起着不可替代的作用,因为在计量过程中,完整、高效地获取有组织的计量数据,在很大程度上依赖于信息检索。信息检索包括信息存储和检索两大过程,信息的存储为计量工作提供了可靠的数据源,而各种检索技术、工具、系统的完善,为计量工作提供了便捷的平台。
4.2.1保障数据样本源
信息检索是进行文献计量研究的基础[24]。文献计量的前提是有大量数据或资料,因此数据或资料的可获取性显得十分重要;这种可获取性不仅仅指“得到”,还要求数据或资料通过某种标准控制之后,呈现出具有代表性的内容。进入大数据时代,每天都有成千上万的新文献进入信息空间,大量且单个价值密度较低的资料如果不能按一定的标准组织、分类、存储,通过文献计量揭示其联系以及规律就会导致获取十分困难。如果在检索的信息存储过程中,对存入的内容进行了一系列标准化处理,如对存入的内容进行标引、著录等,并且对信息进行保存管理,就可建立完善的查询机制并为计量提供可靠的数据源。
4.2.2实现计量自动化
在大数据环境下,面对大量、多样、价值密度较低的文献或资料,如果单纯依靠人工对其进行计量,效率低,质量上也得不到保证,因此必须借助各种信息检索平台。而按一定标准存储信息的检索系统或数据库中,首先,都有简单的计量功能,能够按照某一字段,如主题、作者、机构、来源期刊等对相关文献进行统计(数量、年度分布等);其次,某些数据库还提供对这些符合要求的资料进行进一步分析的功能,如通过引文,形成简单的该领域作者之间的引文关系图,或针对单篇文章形成引文网络(如知网中提供的“本文链接的文献网络图示”)等。另外,在某些搜索引擎中也提供了文献计量的功能,如Google Scholar中,就对引文有较完善的计量统计,不仅可以查看引文年代分布图、最新的引用数据(论文总被引量、h-index、i-10 index),还可以通过查看其他学者或学术合作伙伴研究成果的被引情况了解其研究进展,并且这些数据会自动更新。检索系统、数据库以及搜索引擎提供的这些功能,使计量向自动化方向发展,满足了普通用户对文献计量的要求。
4.2.3促进计量学科发展
大数据环境下,用户急需提高检索效率,在此需求下检索技术、手段、工具等都有了质的飞跃,进而在很大程度上促进了文献计量的发展。首先,检索系统的更新与完善使检索结果能以不同的形式呈现在用户面前,如知网可将文献信息以endnote等格式导出,再直接导入文献计量分析工具中,如SATI等,从而进行关键词抽取,为下一步的聚类、可视化打下基础,促使文献计量向可视化方向发展。而可视化图谱等方法揭示了研究领域发展的历程、现状、前沿以及发展趋势,扩大文献计量学的应用范围,对学科发展起着促进作用。其次,在大数据环境下,计算机成为信息传递的重要媒介,这种利用互联网进行检索获取信息的趋势,促使文献计量在网络环境下开辟新领域,出现网络化趋势[25]。早在20世纪90年代末,谷歌和其他一些先驱者从Pinski 和Narin对网络期刊“影响权重(Influence Weights)”这一研究工作中受到启迪,看到了关键性文章链接获取的重要性,推出超链接[26],借鉴引文分析的理论与方法,结合链接自身的特点,对网络上的文献进行分析,形成网页链接图谱等等,促使文献计量学向网络信息计量学方向发展。另外,随着社交网络时代的到来,文献计量学有向Altmetrics发展的趋势,各类检索系统中存在的统计数据如浏览量、下载量、链接数、推荐数、评级等都成为了统计指标,因此,各类检索系统中这些数据的完善与保障在一定程度上也推动了计量学学科的发展。
5 信息检索与文献计量的共生发展趋势
在大数据环境下,信息检索和文献计量都面临着挑战,为了更好地满足用户的要求,必须将两者结合起来,在互利共生的条件下实现并行发展、整合发展、融合发展。
5.1内容的并行发展
在大数据时代,作为两个独立的领域,信息检索和文献计量必须在互利的基础上,实现各自的突破。一方面,从文献计量的角度来说,文献计量符合新时代的要求,发展基于语义的文献计量方法及应用;并与面向基于学术信息交流和利用全过程的计量(包括浏览、下载、收录、链接、评论、引用等)——替代计量结合起来,弥补文献计量用于科研评价时滞长等缺陷[27],从而实现短期、中期、长期全时段的计量。另一方面,从信息检索的角度来说,检索技术将加速其智能化的发展。在利用相关文献计量成果、定律的基础上,实现以下突破:①提高信息自然语言的处理能力,使检索系统对自然语言的理解提升到语义甚至语用阶段。②对非结构化的信息实现自动标引,信息检索技术与智能化技术达到较高耦合水平。③实现相关领域引用内容的检索,从而为用户提供与引文最相关、最直接的信息,提高检索效率。④根据不同身份的用户,能够在不同程度上对提问进行定位,提供满足不同层次需求的检索结果。⑤提供多种系统操作环境,在不同的环境下为用户提供个性化的检索。如在个人账户登录状态下,系统可分析该用户的检索记录,得出用户的偏好,从而提供个性化服务;在集团登录状态下,可为用户提供该集团信息的使用偏好,从而对用户选取信息提供参考。
然而两者的各自发展并不是独立的,它们之间有着紧密联系。文献计量的新发展——替代计量中各种指标值是检索系统为用户提供个性化检索、推荐的有力参考证明,通过分析各用户替代计量指标值,检索系统可以向用户进行精确推荐,提供相关性高的资料,定位用户。另外,实现相关领域的引用内容检索要求信息检索与文献计量密切结合。而检索系统的完善、技术的突破会提高各替代计量指标值的可靠性,替代计量的发展在一定程度上也依赖于信息检索的进展。
5.2工具的整合发展
面对日益复杂、冗余的信息,为了更快速、高效、便捷地获取有用信息,信息检索和文献计量在工具上将会出现整合,信息检索和文献计量两用型的多功能工具增多。目前已经有部分数据库在一定程度上探索了检索和计量功能。如《中国引文数据库》可以对相关文献、作者、机构、期刊、基金等进行查找,满足检索要求;另外它收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据产品的参考文献,通过其“作者引证报告”、“数据分析器”等版块,揭示各种类型文献之间的相互引证关系,研究热点和趋势,机构学术产出和学术影响力等等,提供新的计量分析功能。这种信息检索与文献计量整合型工具在很大程度上促进了大数据环境下文献信息的高效利用,因此,整合发展将是未来的发展趋势;并且工具的应用将突破语言的限制,实现多语言的统一检索和计量,这些也要求多学科领域的共同努力,乃至全球协作。
5.3实践的融合发展
图2 信息检索与文献计量的实践融合流程
在大数据环境下,信息检索与文献计量以用户需求为中心,在实践上融合从而谋求共生发展,具体有两种方式:融合文献计量的信息检索实践、融合信息检索的文献计量实践,如图2信息检索与文献计量的实践融合流程所示[26]。从融合文献计量的信息检索实践角度来说:当用户有信息需求,并根据需求列出系列检索提问后,进入信息检索循环,根据了解到的内容补充或调整信息检索循环中的原始提问或检索提问,再利用文献计量的某些理论、方法,对检索结果进行筛选、可视化,即图2中的②、③,在这一过程中,对问题的认识程度可能会上升到另一个层面,在新的认识高度下对问题的理解将更加透彻,从而进一步补充或调整原始提问,即图2中的①。这样就可以将计量成分融入检索中,让基于计量的“后验”结果降低信息检索“先验”结果下,用户自身对问题表达能力不足或明显信息选择偏向形成的干扰,从而完善检索循环过程,并将检索结果反馈给用户。另外,当用户有了检索需求,也可以先利用某些数据库中的图表查询等功能,查看相关领域已有的计量分析的可视化结果,从而了解该领域的动态,认识各个研究方向之间的关系[28];或充分利用文献聚类等功能,宏观上浏览文献,找到感兴趣的内容或补充检索提问[29],然后再进行检索循环。从融合信息检索的文献计量实践的角度来说:文献计量数据样本的获取、结果的精炼等都离不开信息检索,在文献计量工作展开之前要进行信息检索循环,并且,在检索不断深入的过程中,用户对需要计量的领域可能有更深、更新的理解,从而为文献计量中提炼领域、扩展目标等服务,即图2中的④,通过检索到再计量,更新该领域已有的计量结果,再将结果反馈给用户,使用户明确新动态、新趋势。在这一系列实践过程中,囊括了信息检索循环与文献计量循环,形成了检索——计量混合应用,将计量结果融入检索中,使实践中对目标的描述有了除主观因素以外的客观技术支撑,让检索建立在大量相关专业人士研究结论的基础之上,在实践中充分发挥文献计量的映射作用,并且通过信息检索调整计量的范围、目标等,使计量与检索在融合中交替进行,从而更好地满足用户期望,促进信息检索与文献计量的融合发展。
(来稿时间:2016年3月)
1. 共生[EB/OL]. [2015-12-20]. http://baike.haosou.com/doc/ 1265769-1338499.html
2. Wolfram D. The symbiotic relationship between information retrieval and informetrics[J]. Scientometrics, 2015, 102(3):2201-2214
3. ISSI[EB/OL]. [2015-10-21].http://www.issi-society.org/ past.html
4. ISSI 2013[EB/OL]. [2015-10-21]. http://www.issi2013.org/ work.html
5. BIR 2014 : Bibliometric-enhanced Information Retrieval [EB/OL]. [2015-10-21].http://www.wikicfp.com/cfp/servlet/event. showcfp?eventid=34006
6. 赛迪智库软件与信息服务研究所. 美国将发展大数据提升到战略层面[N]. 中国电子报,2012-07-17(3)
7. 中共中央十三五规划建议(全文) [EB/OL]. [2015-12-20]. http://news.ifeng.com/a/20151103/46094489_0.shtml
8. 赖茂生,赵丹群,韩圣龙,等.计算机情报检索[M].北京:北京大学出版社,2006:4-17
9. White H D, Griffith B C. Author co-citation: A literature measure of intellectual structure[J]. Journal of the American Society for Information Science,1981, 32(3):163-171
10. Howard D W, Katherine W M. Visualizing a Discipline: An Author Co-Citation Analysis of Information Science, 1972-1995[J]. Journal of the American Society for Information Science,1998, 49(4):327-355
11. Zhao D, Strotmann A. The knowledge base and research front of information science 2006-2010: An author cocitation and bibliographic coupling analysis[J]. Journal of the Association for Information Science and Technology, 2014, 65(5):995-1006
12. Mayr P, Scharnhorst A. Combining bibliometrics and information retrieval: preface[J]. Scientometrics, 2015, 102(3): 2191-2192
13. 潘萍. 基于网络环境的信息检索策略[J]. 现代电子技术,2007(4):161-164
14. 袁林.信息检索[EB/OL]. [2015-11-14].http://wenku.baidu. com/view/0f02354dcf84b9d528ea7a24.html
15. 杨波,阎素兰. 齐普夫定律的汉语适用性研究及其在自动标引中的应用[J]. 情报理论与实践,2004(3):252-255
16. 汪沪双. 论引文索引在信息检索中的重要性[J]. 大学图书情报学刊,2005(5):86-87
17. Zitt M, Bassecoulard E. Delineating complex scientific fields by hybrid lexical-citation method: An application to nanoscience[J]. Information Processing and Management, 2006, 42 (6):1513-1531
18. Glänzel W. Bibliometrics-aided retrieval: where information retrieval meets scientometrics[J]. Scientometrics, 2015,102(3):2215-2222
19. Glänzel W, Janssens F, Thijs B. A comparative analysis of publication activity and citation impact based on the core literature in bioinformatics[J]. Scientometrics, 2009, 79(1):109-129
20. 顾立平. 数据级别计量——概念辨析与实践进展[J].中国图书馆学报,2015(2):56-71
21. 邱均平. 信息计量学(十) 第十讲 计算机辅助文献信息计量分析方法与工具[J]. 情报理论与实践,2001(4):316-320
22. 邱均平. 网络信息计量学导论[J].“国立”成功大学图书馆馆刊, 2007(16):15-23
23. National Information Standard Organization. NISO to develop standards and recommended practices for Altmetrics[EB/ OL]. [2015-12-02]. http://www.niso.org/news/pr/View?item_key
24. Mayr P, Scharnhorst A. Scientometrics and information retrieval: weak-links revitalized[J]. Scientometrics, 2015, 102(3):2193-2199
25. 范全青,郭维真,凤元杰. 我国文献计量学研究30年之发展[J]. 情报资料工作,2009(3):30-33, 60
26.Zitt M. Meso-level retrieval: IR-bibliometrics interplay and hybrid citation-words methods in scientific fields delineation[J]. Scientometrics, 2015, 102(3): 2223-2245
27. 杨思洛,程爱娟. 社交网络环境下的计量学:Altmetrics研究进展综述[J].情报资料工作,2015(4):33-37
28. 廖胜姣. 知识图谱在图书馆中的应用[J]. 嘉兴学院学报,2011(5):124-127
29. 苏冲. 基于最大频繁项集的搜索引擎查询结果聚类方法[D]. 哈尔滨:哈尔滨工业大学硕士论文,2009
The Symbiotic Development Review of Information Retrieval and Bibliometrics in Big Data Environment
Yang SiluoCheng AijuanFeng Ya
( Public Management School of Xiangtan University )
〕In this paper, by analyzing the theoretical and applied research results of information retrieval and bibliometrics, the development history, the relationship and the symbiotic trend of the two are summarized. Conclusion show that bibliometrics can assist information retrieval, information retrieval can serve bibliometrics, and from the content, tool and practice three aspects information retrieval and bibliometrics have symbiotic development trend.
〕Big dataInformation retrievalBibliometricsSymbiotic development
·综述·
G350
* 本文系全国优博论文作者专项资助项目“网络环境下学者合著与引证行为规律研究”(项目编号:2014094)阶段性成果。
杨思洛(1979-),男,湘潭大学公共管理学院副教授,研究方向:网络信息资源管理;程爱娟(1991-),女,湘潭大学公共管理学院硕士生,研究方向:图书馆学;冯雅(1993-),女,湘潭大学公共管理学院硕士生,研究方向:网络信息资源管理。