学术信息检索存在的问题及对策研究
2023-05-30郑燕
摘 要:学术信息检索作为获取信息和资源的主要途径,可以帮助人们快速、高效地获取所需要的文献和资料。随着互联网技术的发展,学术信息检索的效率有所提高,但是在检索过程中一些问题也随之产生。文章针对网络学术信息检索中存在的问题及其对策进行研究,阐述了学术信息检索中存在的分类设置不规范、检索准确率和查全率低及无法满足个性化需求等问题,并针对这些问题提出了相应的解决对策。
关键词:学术信息检索;知识检索;信息素养;智慧图书馆
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2023)02-0099-03
信息时代,信息成为人类识别和了解事物的关键,信息检索既是社会成员必须具备的基本生存能力,也是学习型社会中实现终身学习的必备素质。学术信息检索作为获取信息和资源的主要途径,可以帮助人们快速、高效地获取所需要的文献和资料。随着互联网技术的迅速发展,网络上存在大量重复的表层信息,单一的学术信息检索已经不能满足用户的多元化信息需求。笔者介绍了学术信息检索的定义及常用的检索工具,分析了目前学术信息检索存在的主要问题,并提出了相应的解决对策,以期为相关研究提供参考。
1 学术信息检索概述
1.1 学术信息检索的定义
学术信息是研究者对自然界和人类社会的新认识。学术信息检索就是将信息依照特定的方式组织和存储起来,即从所存储的信息集合中迅速地获取所需信息的过程[1]。中国互联网络信息中心(CNNIC)发布的第50次《中国互联网络发展状况统计报告》显示,截至2022年6月,我国网民规模为10.51亿,手机网民规模达10.47亿,互联网普及率达74.4%。网络化的信息检索是主要的检索方式之一,是指利用计算机技术对检索者所提出的问题进行检索,具有方便、快捷的特点。
1.2 常用的学术信息检索工具
1.2.1 搜索引擎。互联网信息是无序且海量的,搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。搜索引擎可以面向互联网广泛收集信息,收集的信息具有全面、时效性强等特点,常用的学术搜索引擎有谷歌学术搜索、百度学术等。
1.2.2 学科信息门户。学科信息门户是一种为研究人员、教师和学生提供高质量的、经过筛选和定期更新的学科信息目录和入口的专业性网站[2]。一般由馆员和学科专家对互联网上某一学科相关的资料进行系统整理和规范加工,形成可供用户检索和浏览的目录数据库,为科研和教学提供权威可靠的网络信息导航服务。我国重要的学科信息门户有CALIS重要学科网络资源门户、国家科技图书文献中心(NSTL)热点门户、中国科学院国家科学数字图书馆学科信息门户、方略知识管理系统等。
1.2.3 RSS阅读工具。RSS是一种用于发布和获取网络内容的XML格式的工具,RSS阅读工具用于发布和获取网络内容,可以自动将用户订阅的RSS原内容聚合成一个网页,并自动进行不间断的更新,用户无须一个个打开有关的目标网页即可浏览其中所需的内容。例如,用户可以通过RSS源和RSS阅读器进行Web of Science关键词的订阅,在Web of Science核心合集的关键词检索结果页面创建跟踪服务,即可创建RSS源,通过RSS阅读器就可自动获取指定关键词的最新内容。
1.2.4 网络免费数据库。文献信息数据库收录的信息是经过专业人员编制的结构化数据,是有序的、优质的、具有学术价值的信息集合。因此,网络免费数据库是重要的学术信息检索工具。知网、维普、Wiley等商业数据库需要付费使用,且都有独特的资源特点和检索技巧,用户期待从网络上获取免费的学术信息资源,因此,笔者讨论的网络数据库是指可在线免费获取的、具有学术价值的数据库和开放获取资源。网络免费学术资源具有时效性强、传递方便快捷等特点,已成为科研工作者获取信息的重要途径,常用的网络免费数据库有DOAJ、SOCOLAR平台、古登堡计划、HighWire电子期刊库、HathiTrust数字图书馆、国家哲学社会科学学术期刊数据库等。
2 学术信息检索存在的问题
2.1 网络信息分类标准不一致
用户一般通过检索目录获取所需信息,因此,相关部门需要对信息进行分类、组织和维护,并制作不同的分类目录。在实际操作中,由于网络学术信息的收集、加工、存储标准不一致、学术信息发布的质量控制和管理机制标准不一致、不同信息源采用的类目划分标准不一致等,信息分类存在较大差异。各大类学科之间存在交叉、不同检索工具收录信息资源范围存在交叉,给用户查找信息带来诸多不便。
2.2 网络信息动态性强
互联网上的各类信息地址、信息链接、信息内容都处于动态变化中,信息的更迭和消亡无法预测。相关研究显示,约50%的网页6个月内的访问状态发生了变化,随着时间的推移,可访问性越来越低[3]。网络信息的发布具有一定的自由性和隨意性,缺乏必要的过滤监督和审核机制,正式出版物信息和非正式出版物信息交织在一起、学术信息和商业信息混为一体,信息质量良莠不齐,极大地影响了用户对网络学术信息的选择和利用。
2.3 以关键词为检索点的检索准确率低
关键词是一篇文章主要内容的概括,是学术信息检索过程中最常用的检索点。用户以关键词为检索点进行文献检索,虽然能够获取与关键词相关的文献,但查找的范围广、信息量大,信息的准确率较低。由于网络信息存在自动标引不完善、信息关联难以控制、重复链接过多等问题,以关键词为检索点的学术信息检索通常无法识别信息之间的内在关联,用户不能全面准确地获取所需要的信息。以关键词为检索点的信息检索对用户的信息素养要求较高,用户只有具备较高的信息素养,能够输入准确、规范的检索词,才能获取所需信息。
2.4 用户的知识水平和检索能力存在差异
高效的学术信息检索需要三种不同的知识类型:学科领域知识、IR知识和系统知识[4]。学科领域知识帮助用户对信息需求有更深的了解。IR即信息检索,IR知识帮助用户形成观念策略和执行策略。系统知识帮助用户选择有效的检索系统,让信息检索执行得更顺畅。在实际的检索行为中,由于信息素养、专业知识、理解能力、检索经验存在差异,用户在知识水平和检索能力方面也存在较大差异,进而直接影响网络学术信息检索的效果。
2.5 无法满足用户的个性化信息需求
随着互联网技术的发展,用户的信息需求越来越多元化,目前,大多数的网络检索系统仅提供大众化的检索服务,不能充分解析用户真实的信息需求,无法为用户提供精准的信息检索服务。
3 解决对策
3.1 构建标准的信息分类体系
针对目前复杂多变的网络信息环境,相关部门可制定科学的互联网信息分类标准,对网络信息进行分类管理,制作相对规范化的分类目录,构建标准的信息分类体系,提高信息检索的效率。此外,相关部门还要不断优化检索界面,规范网络术语,缩短检索时间,推动网络信息资源的共建共享。
3.2 提高信息鉴别能力
网络信息资源良莠不齐,为了获取可靠和准确的信息,用户需要具备较强的信息鉴别能力。用户可通过检查网页内容、查看网站备案号、查看网站工商与税务信息等方式识别虚假山寨网站;根据信息来源网站域名,判断所获信息的真伪,如:政府网站和权威媒体网站的信息相对权威可靠;参考知名公众号和网站对各专业网络信息资源的评价、介绍、综述,以及一些热门站点的推荐,如:专业媒体上的站点推荐、较著名的资源评价网站、专业的网络资源评价调查报告等。
3.3 提高信息检索能力
学术信息检索服务的主要对象为研究人员、教师和学生,因此,科研机构和高校图书馆应充分发挥其在信息资源、人才资源等方面的优势,加强信息素养教育,从信息意识、信息能力和信息道德等方面帮助用户快速获取信息、正确识别信息、高效分析和利用信息,提升他们的信息检索能力[5]。
3.4 建设智慧图书馆
智慧图书馆是指把智能技术运用到图书馆建设中而形成的一种智能化建筑,是图书馆发展的高级阶段,是复合图书馆、数字图书馆发展成熟后的一种全新形态,具有智慧感知、泛在互联、高效协同等特征[6]。智慧图书馆拥有智能机器人、智能化感应屏幕及VR阅读设備等设施,能够对用户信息进行数字化分析,根据他们的兴趣爱好主动推送信息,优化他们的阅读体验,最大限度地满足他们的多元化阅读需求。
参考文献:
[1] 王兰成.论知识集成环境下的档案信息组织与检索发展[J].档案学研究,2008(5):45-50.
[2] 张鹏飞.信息检索与利用[M].北京:北京工业大学出版社,2021:9.
[3] 吴建华.信息素养修炼教程[M].北京:科学出版社,2020:51.
[4] 王春梅,马丽华.文献信息检索与知识建构[M].北京:高等教育出版社,2012:220.
[5] 郑志学.大学生学术信息检索行为实验研究[D].郑州:郑州大学,2018.
[6] 段美珍,初景利,张冬荣,等.智慧图书馆的内涵特点及其认知模型研究[J].图书情报工作,2021(12):57-64.
(编校:孙新梅)
收稿日期:2023-01-13
作者简介:郑燕(1987— ),河南科技学院图书馆馆员。
本文系2022年度河南省图书情报研究项目“图书馆业务与读者信息素养培养研究”的阶段性研究成果之一,项目编号:HNTQL-2022-136。