基于数据共享空间的图书馆知识服务模式研究
2022-02-18马昀
马 昀
(山西师范大学 图书馆,山西 临汾 041000)
0 引言
当前,信息化、网络化、高科技化的设施设备日益增多,源源不断地生成海量数据。图书馆必须采取大数据、云计算等先进技术手段,对大数据、图书信息和文献资源进行处理、挖掘、分析,以更好地满足读者的知识信息需求,助力其学习、科研、运用等数据生命周期。数据共享空间(Data Commons,DC)以快捷简便、成本更低、效益良好的手段为用户提供知识服务。为促进图书馆数据管理的效果提升和改善,图书馆DC服务平台持续完善和优化数据管理、分析、应用、共享的机制体制,不断满足读者日益增长的数据、知识、信息需求。
1 Data Commons的概念与特征
1.1 DC的概念
Robert L. Grossman等[1]认为,DC是协助用户使用和供应开放性数据的法律性载体,它可定位、存储数据,利用各种通用工具进行相关计算活动。为研究机构分析、挖掘、分享数据而建成相应的网络平台,可互操作能力比较突出。Metro Boston[2]指出,作为一个开放型存储库,DC在社交、教育、图书馆、艺术、医疗等领域中,提供所辖客户的丰富数据(质量控制以及元数据),包容用作研究的各种原始数据和新数据,消除非结构化数据以及结构化数据的不平等,促进数据、知识、信息的发现以及传播。作为开放式平台的DC,它为各个方面共享有效数据集、信息和知识提供有力载体。它支持元数据的开发、存储、共享、访问、搜索、检索等,协助创建数字对象的相关标识符,实现数据可视化,引用数据链接到可用的各种出版物或数据存储库,有效协调各种数据集,建设具备多向增值功能的数据共享空间。
1.2 DC的特征
国外DC建成的数据共享平台非常强大,可开展数据精确分析活动,是具备工具、数据库与可扩展功能的大型先进知识网络,它集数据监控、数据集成、数据共享、计量评价、数据分析等功能于一体。在当前国外图书馆、医疗卫生、科学研究等领域中,DC服务平台是具有扎实基础的数据管理设施。DC数据共享平台可以完善和发展图书馆的信息、知识、数据服务机制体制和模式方式,为用户带来个性化、多元化、精准化的功能以及服务。综合来讲,DC建设具有下列特征:(1)管理、策划与收集质量较高、价值较大的数据;(2)增强数据信息的可访问性,特别是更易于做出预测、解答难题的各种可增值数据;(3)用作科研与开发分析更多的算法、方法与软件,使它们用在数据分析中[3];(4)独立建设各方共建共用共享生态型、可循环数据平台;(5)具有功能强大的存储库,通过自定义方式对抽象化对象进行映射,支持长时间跨存储;(6)通过相关查询方法以及名称实现动态化查询,DC数据、信息资源的更改、创建和审核等日益透明化[1];(7)打破版权所有者垄断版权产品的现象,使用者获取数据的成本减少;(8)促进与鼓励用户间、学者专家之间、机构间的沟通、学习和交流。
2 图书馆DC服务、功能与机制
2.1 图书馆 DC 服务
图书馆DC服务指的是图书馆与DC有机结合,以优化和改进图书馆现有结构与数据服务为主旨,优化改善图书馆用户利用、学习、研究、分享知识、信息和数据的服务模式。图书馆利用DC技术缓解和解决自身数据控制与开放、自身与系列化规则、集中化存储与碎片化供给之间的矛盾,改善馆内馆外的数据管理、分析、分享、分配与应用状况,将更多资金、精力投向提供具有深度价值的知识、数据、信息分享、开发、运用、分析、管理活动中。
2.2 图书馆 DC服务平台的数据管理机制
图书馆 DC服务平台为了让用户享受更优质的知识服务,让数据集与用户间无缝隙对接,知识访问与知识发现要从以下方面着手。第一,DC平台有效存储、聚合各类数据,对其实施分类化、标准化处理。第二,DC平台要制定图书馆数据共享的技术标准与合规文件,明确它的元数据、内容访问策略以及文件格式等,以让图书馆、用户及时更新和修正现有知识和数据,实现从数据到信息再到知识的顺利转换[4]。第三,基于用户的知识需求,借助可视化、数据分析等可互操作科技手段来管理DC数据。第四,结合技术进步、用户意见与建议,持续改进和完善数据共享、分析、管理、集成、获取、运用等生态周期。
2.3 图书馆DC服务平台的功能
图书馆DC知识服务平台的组成部分由下到上依次是数据资源层、DC子平台、用户信息库、用户需求感知、DC知识服务和知识服务结果的输出。基于DC的图书馆知识服务平台由以下4个子平台组成[1]。首先是数据管理平台。它具有同步监控、云计算、转换、协作、数据标准化等多种功能。其次是数据分析平台。它配备了Mahout、Rapid Miner、R语言等工具,进行高效率的数据分析,便于数据复用等。再次是数据应用平台。它包括数据产品的发布、数据可视化,培训和指导读者科学地处置DC数据。最后是数据共享平台。它具有数据资源的集成、低成本共享,数据可复用性与可互操作性。
3 用户信息库的构建和感知用户信息需求
3.1 构建用户信息库
图书馆为有效发挥DC知识服务平台的功能,要求用户提供自己的性别、年龄、教育经历、文化程度、职业工作、专业课程、科研状况、信息偏好、信息获取渠道、信息关联等,希望能够借此深度挖掘和分析用户的知识技能需求和需要的系统图书馆资源。
3.2 用户信息需求感知
DC服务平台要准确把握读者的信息需求,为读者提供信息的搜索、比对、获取、咨询、交流、分享、应用、传递、增删等服务。在感知用户信息需求的过程中,图书馆DC知识服务平台要结合用户的信息库和信息需求资料,分析用户信息行为,以特定目的为出发点搜索、分析、比对、交流、运用、咨询、获取、分享生活、学习、工作等多种数据资源的“痕迹”,查看和分析用户浏览、甄别、检索数据的手段、方法等。从用户的这些信息行为中把握用户需要哪些数据、青睐何种服务,这些都需要通过图书馆DC服务平台的四大子平台精准呈现出来,完整而系统地分析和判断用户的信息、数据、知识需求后,准确把握、抓取、匹配馆内外资源中客户信息需求的关键词、主题、所处范围等,形成科学化、条理化、规范化的数据信息输出。
图书馆DC知识服务和用户需求感知有效连接起从用户形成信息需求到信息需求满足的全过程。平台综合信息库、信息运用目的、数据交流记录、数据足迹、相关模型等,深入分析和实时反馈、深度挖掘解读用户的信息行为、信息数据以及知识需求,加工、挖掘、调用相关的信息数据、信息以及数据集等。利用语义挖掘技术合理描述读者的信息痕迹路线,积极校对前面的使用记录,为用户后续分享、应用、获取所需要的数据、知识和信息提供便捷的渠道和路径。
4 基于DC融合的高校图书馆知识服务模式研究
4.1 统一融合图书馆内外数据信息
采用多源数据融合的相关算法工具,全面搜集、调查、研判相关信息,对多种信息数据进行科学分析、有效评价和分类聚合,从丰富的信息资源中汲取更高价值。其核心目标是综合处置来源、类型、结构各不相同的数据信息,吸收它们各自的优势。与单一数据相比,DC服务平台可从海量图书馆数据中汲取价值更大、针对性更强、科学性更突出的知识、数据和信息,进而满足读者对数据、知识、信息的旺盛需求。多源数据通过DC数据服务平台,增强图书馆融合、分析、清洗、搜集数据的能力,增强知识服务的实际效能,使读者更便捷地获取、使用、分享知识数据。
4.2 专家系统服务模式
DC数据服务平台融合图书馆的专家系统。根据智库理论的最优化理论库或最佳思想,先由DC数据服务平台向专家系统提供合乎用户信息需求的资源,再由专家系统选择和判定最优质的知识服务内容,想方设法满足客户的信息需求,帮助他们处理经济、社会、政治、军事、科技等领域的问题[5]。该平台需要各个领域的学者、专家和专业化人才参与研发和完善专家系统,以更丰富的知识、更高的信息数据质量、更突出的解决问题能力,满足读者迫切需要获取、分享、应用图书馆信息、数据、知识的需要。该平台有利于促进人工智能、大数据、云计算、各种算法和DC数据共享技术的科学运用与深度融合。
4.3 专题定题服务模式
这种服务模式有利于满足图书馆用户对专题定题等特定的数据、信息、知识的需求,具有显而易见的针对性、个性化、主动性和创造性特征。图书馆的不少用户尤其需要某学科或某领域的专业知识,其信息需求整体上体现出国内外实务研究、学术课题前沿的历史发展状况、后续发展趋势与当前发展水平。为此,馆员要深入了解和把握这些学科的知识和内容,开展全过程、嵌入式、跟踪式的知识服务,配合科研工作者从课题立项、课题申报,到最后的成果鉴定、课题结项,尽可能为这些用户提供相关领域与学科的最新研究动态,对其发展方向做出预测,为科研工作者提供相关学科和专业的大量核心信息等,真正实现其“为科研教学服务”的目标。如今,知识服务越来越注重“再生知识”“新生知识”领域的服务,馆员要不断筛选、提炼分散在相关学科、某领域的专业知识,不断跟踪、搜集、整理这方面的内容,融入用户的知识需求服务,为用户提供从知识的重组、获取、新生、再生、科研到运用和反馈的一站式知识服务。
4.4 创客空间服务模式
虚拟化的创客空间融合加工、设计功能于一体,也是信息化背景下图书馆数据共享趋势的全新发展模式,它让“具有同样爱好兴趣的师生聚集起来分享观点、交流经验与协同创造”[6]。不少高校图书馆配备了训练有素的专业馆员、高水平的电脑专家与咨询馆员,让读者可以享用创客空间的一站式知识服务。高校图书馆和有关院系强化合作,师生集体开发动手实践类培训课程和内容,一条龙式地辅助实践、教学、科研等活动的完成。在此过程中要聚焦用户的知识需求,促进学科发展、强化知识服务能力,使创客空间增强服务效能。创客空间服务要结合师生们的制作设想、精彩创意等,提供针对性的知识服务,让静态的知识、数据、信息动起来,不断提升知识科研成果和项目的转化率。
4.5 集成知识服务模式
如今科研用户纷纷聚焦于知识发现,图书馆DC数据服务平台应该密切关注和充分优化自身的知识挖掘、分析、互动、关联、组织、生成、匹配等知识服务。深化对数据、信息、文献的加工挖掘、关联匹配、组织生成,尽可能挖掘与展现知识内容间的关系,将DC知识平台建设成效率高、能力强的知识发现工具。注重资源聚合,进行以单元知识为核心的数据、知识、信息整合,设计开发的DC知识服务平台实现动态操作、交互处理、实时参与等,做好支持跨数据库、跨文献的知识挖掘、关联与发现。
5 结语
DC技术的显著优势和明显特征使它和图书馆日益密切地结合起来。图书馆DC知识服务平台应该持续改进和完善,综合运用云计算、大数据、计算机、信息化等科技,立足用户的信息行为、痕迹和基本信息,深度把握和预测感知用户的信息知识需求,开展针对性的DC知识服务。在此基础上,高校图书馆要不断优化基于DC融合的知识服务模式,强化它们的知识服务能力,稳步满足读者精神文化生活的迫切需要。