融合大数据和人工智能技术的学科服务模式创新研究
2021-03-10袁庆莉
袁庆莉
摘 要:根据大数据环境下图书馆现有学科服务的现状,结合大数据和人工智能技术,从数据的获取、处理、存储、分析和应用5个层面入手,分析用户行为信息并赋予数据标签,从而预测用户的个性化学科需求。基于图书馆的文献和业务等数据,讨论大数据处理的流程和实现途径,快速为用户提供所需学科知识,提高图书馆资源利用率,构建图书馆学科服务新模式。
关键词:大数据;人工智能;学科服务
中图分类号:G251 文献标识码:A 文章编号:1003-5168(2021)19-0152-04
Abstract: Aiming at the current status of library subject services under the big data environment, the article integrates big data and artificial intelligence technology, starting from five levels of data acquisition, processing, storage, analysis and application, analyzing user information behavior, and assigning tags. Predict their individual subject needs; discuss the process and realization of these big data based on the library's literature and business data; find the subject knowledge that can meet their needs for users, and maximize the utilization of library resources, Construct a new library subject service model.
Keywords: big data;artificial intelligence;subject service
图书馆是高校信息传播和知识创新中心,围绕学生的专业学习、教师的课堂教学和研究人员的科学研究开展服务。图书馆学科服务是助力本科院校对标“双一流”建设、高职院校对标“双高”建设的重要途径。大数据时代,移动智能设备和网络环境的快速发展丰富了用户的信息获取渠道,而图书馆传统的学科服务方式和内容已无法满足用户日益凸显的个性化需求,导致图书馆面临用户流失的尴尬局面,因此创新图书馆学科服务模式迫在眉睫。
1 现有学科服务模式的不足
自1998年清华大学图书馆率先建立学科馆员制度以来[1],国内多数高校也陆续开展了学科服务,并取得了一定进展。我国高校现有学科服务模式大致分为学科馆员对接学院模式和嵌入式学科服务模式两种。学科馆员对接学院即图书馆给二级院系配备固定的学科馆员,院系有需求时直接联系对应的学科馆员,学科馆员主动了解院系的学科资源需求[2],并围绕需求搜集整合资源,然后反馈给院系用户。嵌入式学科服务指学科馆员跟踪科研的思路萌芽、申请书撰写、研究实施以及成果验收全过程,满足科研各阶段的学科信息需求[3-4],并参与教师教学全过程,搭建课程参考资源库、开展融入课堂和专业的信息素养培训讲座等[5-6]。
1.1 对学科馆员的依赖程度较高
学科馆员需要直接与用户沟通,引导用户表达自己的学科信息需求。若用户对自己的信息需求表述不清或并不清楚自身的真实需求,学科馆员将难以准确掌握用户的需求信息[7]。若学科馆员专业素质不够,不能准确理解用户的表述,也会影响服务的开展。这种纯人工式的需求收集和反馈具有强烈的主观性,对学科馆员的信息资源了解度、信息检索能力以及组织能力有很高的要求。
1.2 高校图书馆学科服务内容深度不足
目前,多数高校的图书馆学科服务内容还停留在基础的学科馆员联络方式、学科资源推介、文献资源推送以及参考咨询等层面,学科前沿热点追踪、学术评价等服务的开展不够广泛[8-9]。大数据时代,用户可以通过各种渠道轻松获取基础学科信息。然而,用户急需又难以获得经过加工组织的学科信息,即基础信息服务还没有上升到传递知识服务。
1.3 用户对现行模式下的学科服务黏度不强
图书馆学科服务对学科建设具有重要作用,但是由于学科服务层次浅、人工沟通耗时长以及无法有效满足用户需求,用户对学科服务的信任度逐渐降低,造成用户流失。
2 大数据和人工智能技术对学科服务的影响
大数据作为一个抽象概念,因具有数据规模大、数据种类多、处理速度快和价值密度低等特性得到了人们的广泛认同[10]。人工智能是指在理解自然智能(特别是人类智能)的基础上创造具有一定智能水平的机器,能弥补人类在计算、精确度以及速度等方面的不足[11]。大数据和人工智能技术紧密联系却又有着本质区别。在数据收集、处理和存储过程中,大数据属于输入方,人工智能技术处理属于输出方。人工智能需要大量数据作为基础来实现深度学习、思考、模仿或者预测等功能,而数据的价值需要人工智能来实现和凸显。
大数据技术的发展增加了数据的描述维度,使得数据对事物的描述越来越接近实际,导致数据量呈爆炸式增长。学科服务的数据基础不再局限于馆藏文献资源和所购买的数据库,还有更多的政府机构信息、行业协会信息以及科研交流信息等,使得可利用的数据量激增。
现阶段,传统的結构化数据已经不能满足人类对事物认知的需求,图像、音频以及视频等非结构化数据和生活中的一些半结构化数据已经占据了数据总量的绝大部分。数据的异构化和多维化对图书馆学科服务的数据整合与处理能力提出了更高要求,如果学科服务仍停留在结构化数据时代,那么将难以满足用户的差异化信息需求。
数据量的激增要求提升数据处理速度。如果数据处理不及时,数据的价值就会消失。大数据时代,用户对服务的响应速度要求越来越高,如学科服务的反应速度直接影响用户的体验。传统的学科服务靠人工进行需求的收集与分析、资源的选择与整理,最后反馈给用户。整个服务过程耗时较长且可能结果并不如意,容易造成用户的不满和资源的浪费。
数据量的增加使得数据的相对价值密度变低。从用户方面来讲,由于信息接收渠道的多样化,从大量数据中找出所需的信息变得困难,且无法判断其有效性和权威性。人工智能技术对学科服务的影响主要体现在它通过对数据的深度学习和对用户的全面分析,能比人工更准确地把握用户需求并快速进行反馈,满足用户对服务的便捷性和自主化要求,弥补了人工效率低和时限短等缺陷。
3 融合大数据和人工智能技术的学科服务模式研究
3.1 服务需求分析
高校的学科服务用户大致可分为学习型、教学型和科研型3种。每种类型的用户都有其不同的学科服务需求[12]。
学习型用户对图书馆的信息资源与服务接触少,了解不全面,缺乏利用学科服务助力学业的意识。图书馆需要在提升这类用户信息意识、提高他们的检索应用能力等方面加强服务。
教学型用户需要大量学科资源作为备课资料和课堂交流的支撑,在教学过程中调动学生的积极性和学习兴趣,提升学生的自学能力。这类用户需要大量的学科素材,如文字信息、图片说明以及视频材料等。多类型素材可以丰富用户的课堂设计,吸引学生注意力,为用户提高工作效率。
科研型用户在项目前期需要阅读大量相关领域国内外文献,研究中期不断补充知识和调整研究策略,研究后期关注成果的刊载、转化、验收等,及时掌握学科最新研究进展和成果,了解研究领域的发展趋势和研究热点。这类用户需要学科服务为其做好文献资源的支撑工作,利用计量分析为其提供领域发展现状和前沿的分析,并根据研究内容提供投稿推荐期刊等。
此外,不同类型的用户需求会随着时间的推移、学习阶段的推进以及身份的转变而改变,学科服务不能一成不变。随着信息技术的发展,用户更希望得到耗时短、流程简便、节约精力的学科服务。传统学科服务受用户表达能力、学科馆员能力以及时间因素的限制,难以满足用户需求。随着大数据和人工智能等技术的发展,通过收集并分析用户的搜索行为和阅读轨迹等数据,可以提高对用户需求信息把握的精确度和客观性,同时打破空间时间的限制,真正体现学科服务的价值,提高用户黏度。
3.2 学科服务模式创新
从数据的获取、处理、存储、分析和应用5个层面入手,融合大数据和人工智能技术,如图1所示。从图书馆和用户两个角度进行数据处理,完成需求与资源的自动匹配,创新学科服务模式,准确把握用户需求,解决学科服务差异性,提高资源利用率。
3.2.1 数据获取层。大数据时代,学科服务不能仅仅依赖图书馆原有的文献和数据库资源,要面向网络整合多方资源,通过资源聚合优化馆藏数据结构。在新模式下,用户数据被作为需求分析的基础进行收集。在数据获取层,图书馆和用户方面需要获取的数据如表1所示。图书馆方面,馆藏数据可以直接获取;业务数据通过图书馆综合管理系统获取;服务数据通过查询机、进出管理系统(人脸识别技术)、移动图书馆、图书馆官网、视频监控器以及射频识别技术(Radio Frequency Identification,RFID)等获取;网络资源利用网络爬虫技术,从政府和行业网站、办公自动化科研交流平台以及学术搜索引擎等系统获取。用户方面,基本个人信息通过图书馆后台数据和教务部门获取;社交平台的行为数据要在经过平台许可后,利用流量抓包、网络爬虫等技术获取;而馆内活动轨迹可以利用感知技术(如语音命令、眼球追踪、手势命令等)收集。
3.2.2 数据处理层。图书馆数据资源涉及图文和音视频等多种数据类型,必须进行处理使其规范化和条理化。图书馆大量的纸质资源不利于传播和服务,需要进行数字化处理。借助人工智能机器人进行数字化工作能够提高处理效率,节省人力资源。由于图书馆数据来自不同的业务系统,数据标准和描述维度都会有所不同,需要进行清洗和降维处理,增强数据的有效性和条理性。例如,可以使用ETL(Extract-Transform-Load)技术清洗数据,借助缺失值比率、低方差滤波和高相关滤波等方法进行数据降维。
用户信息同样要先进行数据清洗,清除与学科服务无关的数据,提高数据的价值密度。例如,删除用户在社交平台中对娱乐明星的点赞记录、图片收藏等无关数据。在用户大量的行为数据基础上,使用机器学习技术对用户的知识结构、行为以及爱好等方面进行分析,提取用户特征,结合用户的基本信息和所处情景为用户赋予标签。标签会随用户行为、身份以及知识结构的变化而发生改变,使得图书馆提供的学科服务随之改变。
3.2.3 数据存储层。图书馆传统的结构化数据库无法满足大数据时代异构数据的存储需求和学科用户不限地域时间的信息需求。为了学科服务的长远发展,需要建立大容量、高效率的新型数据库。学科服务的数据存储层要建立图书馆馆藏资源库,采用非关系型数据库(NoSQL)进行数据存储。它能存储文字、图像以及音视频等多源异构数据,解决图书馆馆藏数据和用户数据的存储问题。另外,如果图书馆囿于资金、技术和人才的限制,无法使用大型服务器来存储过多数据,也可以购买第三方储存空间,利用云存储这种分布式存储方式进行数据存储。
3.2.4 数据分析层。经过清洗、降维等处理后的数据统一存储在馆藏资源库。由于数据的规模庞大、来源多样以及结构各异,若不经过分析、关联,则无法充分挖掘数据的知识价值,不能为用户提供知识结构完整的学科服务。例如,文章A引用文章B中的内容,那么文章B中所包含的知识其实是文章A部分内容的来源。如果不将文章A和文章B结合分析进行关联推送,那么给用户推送的知识就不完整。因此,在融合大數据和人工智能技术的学科服务新模式下,要利用文本挖掘技术分析数字文献,利用自然语言处理技术、图像识别技术等分析音视频和图片,利用数据挖掘技术和语义网技术对图书馆存储的数据进行深度加工,将不同类型的数据所代表的知识关联起来形成知识链或者知识图谱,实现对资源的充分利用。
用户信息方面,前期已经根据用户的基本信息、行为轨迹和所处情景进行了标签化,在此基础上利用神经网络算法预测用户的学科服务需求。例如,用户A是会计专业的大二学生,最近在网络中检索了英语四级报考日期的信息,并借阅了《大学英语四级词汇表》。根据这些信息可以推测用户A准备报考英语四级,可以为用户推送相关资料。
3.2.5 数据应用层。完成图书馆馆藏数据和用户需求的分析后,将用户需求和馆藏资源进行匹配,满足用户学科信息需求。根据用户的检索、借阅等行为数据预测得到的需求信息可以应用于学科资源采购,优化资源架构,以实现资源采购的高效化。对图书馆资源和用户需求进行双向处理和分析后,能够更好地满足用户的个性化学科服务需求,实现信息的精准推送。
4 结语
大数据时代,用户的学科信息需求千变万化,对高校图书馆学科服务提出了更高的要求。同时,大数据和人工智能技术的发展为学科服务模式的创新提供了技术支撑。从数据的获取、处理、存储、分析和应用5个层面着手,融合大数据和人工智能技术,分别从图书馆和用户角度进行数据处理与分析,创新学科服务模式,实现用户个性化学科信息需求的精准满足,解决学科馆员带来的学科服务差异性问题,提高资源利用率。
参考文献:
[1]李大林.高校图书馆学科化服务探讨[J].中华医学图书情报杂志,2009(1):45-46.
[2]魏佳.“双一流”大学图书馆学科服务网络调查研究[J].图书馆杂志,2021(4):69-76.
[3]黄敏,张霞,周喆,等.高校图书馆嵌入科研过程的学科服务模式研究[J].图书馆学研究,2018(8):88-91.
[4]孙波,刘万国,谢亚南,等.“双一流”背景下面向PI的高校图书馆嵌入式学科服务探索:以东北师范大学为例[J].图书情报工作,2019(4):54-60.
[5]程惠兰,段萌语,胡小华.高校图书馆嵌入院系的学科服务模式研究:以中国地质大学(武汉)地球科学学院为例[J].图书馆学研究,2019(1):62-66.
[6]沈洋.我国高校图书馆嵌入式学科服务的调查与研究[J].图书馆建设,2016(11):56-61.
[7]肖欣伟,王晨,张凤荣.基于大数据的高校图书馆学科服务平台的构建研究[J].情报科学,2017(6):34-38.
[8]娄冰.“双一流”高校图书館学科服务现状分析及对策研究[J].图书馆工作与研究,2021(2):106-112.
[9]沈洋,李小平.新时代高校图书馆学科服务四位一体发展研究[J].图书馆工作与研究,2019(3):124-128.
[10]马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013(2):10-17.
[11]钟义信.人工智能:概念·方法·机遇[J].科学通报,2017(22):2473-2479.
[12]于曦,高洁.基于用户需求的高校图书馆嵌入式学科服务策略研究[J].情报理论与实践,2014(5):73-76.
3366500338239