APP下载

面向科研用户小数据的微知识服务研究(上)

2016-09-29李立睿邓仲华

图书与情报 2016年3期
关键词:知识服务科学研究

李立睿 邓仲华

摘 要:在“互联网+”环境下,泛在互联为科研用户小数据的获取以及微知识服务的推送提供了便利。文章首先介绍了科研用户小数据的内涵,辨析了科研用户小数据与小科学数据的关系。在此基础上,分析了科研用户小数据与微知识服务的契合性,据此重点探讨了面向科研用户小数据的微知识服务模式及其典型特征,以及需要进一步注意和解决的问题。

关键词:小数据;科研用户;微知识;知识服务;科学研究

中图分类号: G250.7;G252 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016040

Study on Micro-knowledge Service Based on Small Data of Researcher (I)

Abstract It is convenient to access the small data from researcher due to ubiquitous interconnection in the context of “Internet +”. This study firstly introduces connotation of small data of the researcher and compares small data with data of small science. On this basis, it expounds the relationship of small data of research and micro-knowledge services. Furthermore, it detailed analyzes the key pattern and typical characteristics of micro-knowledge services based on small data of researcher. Finally, it discusses some problems which are paid for attention and solved.

Keywords small data; researcher; micro-knowledge; knowledge service; scientific research

当前,随着“互联网+”相关技术的发展和以密集型科学数据驱动为主要特征的科学研究模式日趋扩大化和深入化,促使支撑科研过程的知识服务变得愈加趋于精细化和快捷化。仅仅依靠科研用户主动描述自身需求,并单独由学科馆员进行知识组织和服务,在很大程度上,导致所推送的服务产品过于粗粒度化,而且服务周期长,因此,这一服务模式已经很难满足新型科研范式下用户的知识服务期望。因此,如何精准获取科研用户实时需求,以前瞻性视角快速进行专业化知识服务的推送,是关系到图书情报机构服务创新和转型的重要突破口。不难发现,小数据作为科研用户的个体化数据,既是科研用户在研究过程中的虚拟化数据描述[1],又是其个体独特性需求的表征,为科研用户的需求挖掘和预测提供了基础,通过组建一支跨时空、跨组织的专业知识服务团队,针对科研用户具体化和细微化研究问题,发挥微知识的精炼化、通俗化优势,以知识协同的视角来重组个性化知识推送服务流程,对于提高服务效果是具有重要意义的。

1 面向科研用户的小数据概念

1.1 科研用户小数据的内涵

美国康奈尔大学的Estrin教授认为用户的小数据是其日常行为活动的全部表征,从医学的视角来看,用户的日常行为可以作为病理诊断的一种医学证据,因此,医护人员可以通过对用户每时每刻的行为数据进行收集、监测和跟踪,以分析出用户在不同时间段的个人健康状况[2]。就理解而言,小数据是个人信息的虚拟化表示,是通过各种方式(如移动终端、可穿戴式产品、网络行为监测、视频监控等)对涉及个体数据的全方位收集,通过对这些不断累积的数据进行整合,从而为个性化服务决策提供依据。基于此,科研用户小数据就是个体研究工作者在项目推进过程中全部行为和状态的数字记录集合。从数据本质角度来看,面向科研用户的小数据主要涵盖了个体的基本信息、行为记录、习惯偏好、情绪变化、性格特点、研究问题等,通过对这些数据进行追踪、收集、分析和应用,可以实现科研用户立体化和全方位的数据描述。

尽管科研用户小数据仅仅只是针对个体所涉及的数据集合,但是随着时间的推移及其项目研究过程的推进,科研用户所产生的小数据量会变得越来越大,这为支持科研用户的需求决策提供了数据基础。如,浙江省图书馆根据读者借阅的各项原始小数据,并结合时下流行的星座元素,准确呈现了每个星座读者群体的阅读偏好和借阅习惯,据此为不同人群进行了定制化的阅读推荐[3]。

1.2 科研用户小数据与小科学数据的关系

相对大科学而言,小科学通常是指个体科研用户或科学小组开展以研究为主要特征的小规模科学活动[4],其研究过程主要包括科研用户自行设定问题、独立执行和探索式解决[5]。因此,小科学项目主要解决特定的科学问题,以假设驱动,并且多集中于单一学科,科研资源和人员相对投入较少。在小科学项目的研究活动中所产生的全部科学数据被称为小科学数据,其中主要包括实验数据、仿真数据、结果数据等。然而,科研用户小数据是围绕个体研究人员而言的,是科研用户在进行研究活动时,全面描述科研用户的数据。由此可见,小科学数据是围绕整个小科学项目,并针对科研问题提出、分析和解决,所产出的科学数据集合,而科研用户小数据是涉及个体科研用户的全部行为或活动数据,更加注重以科研用户为唯一对象的个体性特征数据。在一定程度上,小科学数据是对科学问题的描述,能够从侧面体现出科研用户的需求,此时这部分小科学数据又可以作为科研用户小数据集合的一部分,解释科研用户的行为模式或者情景变化过程。例如,当科研用户在攻克项目难题时,针对其中某个具体问题的分析和总结所做的文本记录数据,既属于科研用户小数据,又属于小科学数据。因此,科研用户小数据与小科学数据既相互区别,又具有一定联系,小科学数据可以为科研用户小数据的采集、分析、处理、应用和决策过程提供支持,提升小数据的价值总量和可用性。

2 科研用户小数据与微知识服务的契合性

学科的交融与发展,推动着以科学数据为驱动的知识发现和知识创新的科学研究模式产生,这也进一步促使了科研用户行为和需求的转变。如今,科学数据已经成为科研用户的重要研究对象。2008年,Heidorn首次提出了科学数据的长尾理论,并认为,如果将所有的科研项目按照其规模,以从大至小的方式沿着一条轴线进行排列,可以发现,那些较小的科研项目构成了整体科研的长尾[6]。在这一科研长尾上,科研用户所产生的科学数据通常是趋向于异质并未被系统整合和管理,其行为模式更具有不确定性[7],这样导致科研用户需求也是经常被忽略。然而,与科研长尾上的科研用户不同,对于开展大规模复杂研究项目的科研用户而言,在长期的研究过程中,这类用户所产生的科研需求更加趋于密集型的知识服务内容,以及正式化的沟通反馈方式,因此,这些科研用户的行为模式通常也具有一定规律性,并已经形成了自身固定的分析问题和解决问题的习惯方式。此外,对于科研长尾以外的科研用户,其知识服务的需求更加重视系统化和深入化。由于受图书情报服务机构本身预算和能力的限制,加上处于科研长尾上用户的需求层次不一,同时具有很大的不确定性,可能部分需求是零散的,这样导致图书情报服务机构恰好被忽视了这一部分科研用户的需求,而主要将知识服务重点围绕在大型项目的科研用户上。因此,科研用户小数据是其全方位状态的具体表征,能够高效地分析和获取科研用户的需求,为个性化和专业化的服务奠定基础。

微知识服务充分发挥了微知识和微服务的优势,一方面,微知识是针对科研用户在研究过程中所遇到具体问题的答案,具有碎片化、精炼化的特点,与此同时,微知识是将大块单知识进行分解、萃取,再以问题的形式对其进行深度标引的结果,是经过提纯加工的浓缩知识[8],强调了知识的特质化与细致化;另一方面,微服务是以用户需求为导向,支持用户解决具体问题,利用当前快捷的社会化媒体工具(如微博、微信、微视频、微课堂等),进而实时动态为特定用户推送个性化服务。由此可见,对于科研用户小数据的充分挖掘,有利于高效分析科研用户的实时需求,甚至以前瞻性的视角预测需求的变化趋势,而微知识服务团队可以通过全面融合不同层次的微知识库,发挥自身知识整合处理能力优势,在分析科研用户领域知识库的基础上,实时为科研用户提供知识服务,并根据其反馈结果,对微知识库进行动态化更新。总之,微知识服务重视科研用户的细分,并强调了将各类科研用户看成服务工作的主体,面向科研用户的小数据与微知识服务的结合,对于图书情报机构个性化服务的提升具有重要理论意义和实践意义。

3 面向科研用户小数据的微知识服务模式

面向科研用户小数据的微知识服务重点强化了以单个科研用户的个性化服务为原则,强调科研用户小数据的全面收集和处理,通过对科研用户整个研究过程的行为状态、角色状态进行数据描述,以此获取科研用户当前知识需求,在服务团队与科研用户知识协同的基础上,以一种全局性的视角对科研用户的需求变化趋势进行预测,并结合微知识库,对知识推送服务产品进行优化,从而多渠道、全方位、多层次满足科研用户动态化、碎片化需求(见图1)。

(1)面向科研用户的小数据收集是开展微知识服务的关键环节。不同的科研用户在研究过程中,由于其专业背景、认知能力和研究任务的不同,所导致的行为方式、需求层次、心理反应也是不同的[9],因此,描述科研用户的小数据集合也是形式多样、内容各异。如袁静等[10]认为与用户相关的信息主要包括用户基本信息、用户行为情景信息、用户社会关系信息。William[11]将用户的个人信息类型划分为纸质文档、网页、电子文档、邮件以及引文、链接等。李爱国等[12]以学习者信息模型为基础,将用户信息按照内容分为用户基本信息、用户需求信息、用户行为信息和用户反馈信息。综上所述,笔者通过对科研用户的研究过程进行梳理,按照描述科研用户的小数据属性,将其分为两类,即具有物理属性的科研用户小数据和具有虚拟属性的科研用户小数据(见表1)。一方面,微知识服务团队根据科研用户的研究任务和问题,以时间维度或空间维度作为参考,对科研用户小数据的内容进行分类,确定针对科研用户不同视角的数据描述;另一方面,在科研用户小数据的同一类别中,将具有物理属性和虚拟属性的小数据集合进行全面关联和聚类,从而形成具有一定逻辑结构的小数据集合。

(2)在初步建立的小数据资源库的基础上,以科研用户需求为导向,对其进行分析处理,从而建立相应的小数据知识库。其具体过程主要包括:①小数据整合。主要是结合科研用户研究的时序,将不同载体和形态的小数据进行整理、滤重、转换等一系列交互活动,建立小数据的规范化表示形式;②小数据挖掘。主要是通过对小数据进行特征分析和提取,围绕科研用户的各类具体问题解决过程,利用时序分析方式进行小数据集合的内在关联挖掘,使之内化为具有高度内聚的集合体;③小数据契合。主要是指通过结合科研用户实时情景和对应的数据媒介,将关联后的数据与当前科研用户情景进行融合,据此生成围绕科研用户不同类型和层次需求的数据链,这些不同的数据链可以从多样化视角来描述科研用户的需求状态。由于科研用户的同一需求事实或需求规律可以隐藏在不同数据链中,不同的数据链也可以揭示同一需求事实或需求规律的不同侧重点,因此,这为判断科研用户的需求强度提供了契机,也为服务团队有意识地融合多样化数据链提供了保障;④小数据监护。主要是指小数据的维护和管理,一方面,由于科研用户的小数据集合是随着时间而不断累积的,进而需要对数据进行实时的更新和管理;另一方面,科研用户在研究过程中,可能会因为突发事件,导致其在某一层面上科研任务的中断,此时服务团队需要对小数据链进行偏差的纠正以及缺失数据的处理,以此保证各个小数据链的完整和统一。

(3)基于小数据知识库的科研用户需求获取和微知识服务推送。小数据知识库作为一种特定形式的数据知识库[13],是科研用户特征知识空间的集合,可以充分展现科研用户在时间维度和空间维度的需求视图。服务团队可以结合科研用户的实时情景状态,对小数据知识库进行交互的同时,对需求特征知识进行再挖掘和再利用,这样能够深入地感知科研用户的知识需求,及时的预测用户需求的变化趋势,从而利用自身的专业技能和学科优势,有针对性的提供个性化微知识服务。与此同时,根据科研用户的研究需要以及相同或相似层次其他相关研究项目或人员的研究现状,通过与科研用户进行协同,构建特色化的微知识库。其中微知识库是以专业领域知识库为基础,并结合不同层次的科研用户在不同类型的研究过程中的学科化知识,通过对这些复杂知识进行分解、提取和重新组织,进而呈现的一些碎片化科学问题解决方案知识库。此外,在微知识服务推送过程中,一方面,由于微知识已经具有独立功能的“模块”,服务团队可以充分利用这些“模块”根据需求将其进行有机的组织或串接,以完成特定功能的高度内聚化的知识形式,在对微知识库进行不断更新、完善和管理的同时,并协同专家知识和能力,可以在短时间内以最灵活的服务方式为科研用户提供相应的专业化知识服务,以此充分利用科研用户的碎片化时间,提升科研用户的体验度。

4 面向科研用户小数据的微知识服务典型特征

4.1 全方位的用户需求呈现

科研用户在不同的研究阶段,其知识需求的产生、发展是一个渐变的过程,尽管这些需求可以通过科研用户的情景状态、行为模式以及科研任务而以不同的角度呈现出来。但是,在不同的时刻,这种表现力强度也是不尽相同,在不同程度上,会体现出相关关系、因果关系,甚至会产生矛盾,而且在短期内,科研用户的需求可能表现出零散性和不确定性,因此服务团队难以系统掌握科研用户需求,而且即使服务团队感知到了此类需求,也会花费大量时间,这样缩短了服务内容的选择和服务产品的优化时间,导致服务满意度偏低。鉴于此,面向科研用户的小数据作为其全方位的数字描述,通过对小数据的整合、分析和处理,无论是从时间维度,还是空间维度上,服务团队都能够在短时间内准确获取科研用户的需求及其相关变化情况,尤其是在研究过程中的学科知识需求,并据此不断优化微知识库,为科研用户微服务提供基础。

此外,科研用户的研究活动虽然在总体需求趋势上,会体现出一定的规律性和可预测性,但是随着科研用户项目进展的深入,以及自身专业背景和认识能力的影响,在特定环境下,对于一些涉及跨学科或跨领域的细致化专业问题的微知识需求,会呈现出随机性和复杂性。但是通过科研用户小数据的融合,对某些不确定的需求,可以借助服务团队与科研用户的协同沟通反馈,以对小数据进行系统化梳理和层次化整合,排除具有干扰性的影响因素,从而促进科研用户需求全方位、多层次的挖掘和呈现。

4.2 个性化的专业服务推送

在整个服务流程中,从科研用户小数据的收集、分析以及需求获取都是围绕个体科研用户而展开的;在服务方式方面,微知识服务是以微知识库为基础,以科研用户的专业知识需求为出发点,以协同互动为手段而进行的专业化服务;从服务内容来看,微知识库是以科研用户及其研究任务为导向而构建的动态知识库,是把传统的庞杂学科知识进行再分解、深萃取,并根据科研用户的专业项目问题,对微知识进行系统组织、深度标引,最后结合科研用户研究情景,经过服务团队的综合评估,最终推送于用户的精炼化知识产品;从服务主体来看,整个服务团队具有跨学科的专业背景,包括学科馆员、数据馆员、信息专家等,这些服务人员能够以知识协同的方式,对服务于科研用户的微知识进行吸收、扩展、组织和管理,大大优化了服务流程,保证了专业化的微知识服务质量;从服务方式来看,服务团队根据科研用户的细微化和个体化特征,结合科研用户的兴趣偏好,利用社交媒体、移动网络等微服务工具,采用综合化信息手段,进行适合于科研用户的差异化服务推送。因此,微知识服务充分发挥了服务团队的协同能力,通过运用相关的微服务技术手段,对庞杂的文献资源、网络资源等进行系统化的分析和组织,针对研究环境的转变,注重科研用户的体验,从而为其快速准确地推送即时化、碎片化的微知识产品。

4.3 实时化的动态反馈跟踪

在面对数据密集型科研范式的环境下,微知识服务是为特定科研用户提供的细微化、个体化和差异化的数据或知识服务,其充分借助了移动技术、网络技术和全媒体技术的优势,嵌入到科研用户的研究环境,实现微知识库的动态构建以及个性化服务的实时推送。因此,服务团队与科研用户的协同反馈和实时跟踪体现在科研用户的整个研究生命周期中,并表现在:①小数据收集过程中,除了获取科研用户日常的网络数据和智能设备的感知数据之外,服务团队需要对用户进行交流,获取关于科研用户心理状态、研究经验以及目标计划等相关具有隐性特征的数据,同时在服务推送过程中,需要时刻跟进服务进度,通过科研用户反馈,评估微知识服务的效果和效率;②小数据分析过程中,小数据集合作为挖掘科研用户潜在需求的基础,必须与科研用户的期望目标紧密结合,包括短期研究目标和长期研究计划,而服务团队对科研用户的密切协作,实时跟踪科研用户当前所处情景状态的服务模式,为服务期望的确定提供了保证;③微知识服务流程中,服务的过程其实是科研用户与服务团队深入交互的过程,其中全面的交流和沟通是必不可少的环节,另外,围绕科研用户微知识库的全局化构建,也是在实时化服务反馈跟踪过程中,知识协同作用的结果。不难发现,与科研用户的深度沟通、动态反馈是提升服务满意度的关键举措,而借助微知识的精简性、专业化和便捷化的传递方式,无形将反馈跟踪嵌入到整个研究活动中,提升了服务的效度。

5 需要注意和解决的问题

由于小数据集合是科研用户知识需求的客观表现,而对这些小数据集合的处理是一个多层次、多维度的分析和管理过程,服务团队必须以跨学科的视角来对这些不同类别的小数据集合进行整合、关联、评估等;另一方面,微知识服务在传统知识服务的基础上,更加强化了知识的粒度化和个性化,而如何根据科研用户需求,把控知识的粒度层次,也是在服务实践必须克服的。因此,在整个微知识服务的推送过程中主要有以下关键问题需要进行关注和解决。

(1)科研用户小数据的全生命周期管理。“互联网+”及其相关技术的发展,不仅深刻影响了科研用户的行为方式和研究过程,而且正在改变科研用户的思维理念和决策模式,因此,科研用户小数据是其情景化需求的最主要表现,需通过对这些零散的小数据进行全面收集,进而将不同来源的数据依据不同的时间点和空间点进行有针对性的滤重、筛选、关联和融合。如,在小数据融合过程中,可以围绕科研用户的一个研究问题或一个研究时间段,从关联级融合(包括数据映射、异构加权、数据滤重、数据更新等)、特征级融合(包括数据集成、属性分析、特征提取、特征关联等)和需求级融合(特征分类、特征聚合、特征挖掘、态势判断等)对小数据进行逐层递进的分析,挖掘不同生命周期阶段的小数据特性[14]。不难发现,如何从小数据的产生、发展和演变的全生命周期视角进行分析和管理,从时间和空间维度挖掘科研用户的需求产生根源及其变化方式,从而预测科研用户的潜在需求,是值得继续研究和探讨的。

(2)科研用户小数据的安全保护。小数据是科研用户个体特征化的全面描述,涵盖了科研用户的虚拟行为数据和现实活动数据,而这些数据直接关系到科研用户的个人隐私问题。然而,科研用户小数据的质量又是分析和获取科研用户隐性知识需求的基础,直接影响了微知识服务的整体效果,因此,如何平衡科研用户的小数据与隐私安全之间的矛盾,提升小数据的价值密度和安全程度,是个性化微知识服务必须解决的问题。对于这一问题的解决,可以根据国家相关法律规范或标准,针对科研用户的隐私敏感层次,建立科研用户小数据的保护协议和规范,其中应该包括小数据的采集目的、防范计划、问责机制等一系列保护机制。

(3)微知识的粒度化表示。知识粒度是对知识不同细化层次的度量,因此对知识粒度粗细进行调整实质上是对非结构化的知识进行分解和重构的过程,有利于知识的形式化表达[15]。而微知识是服务团队根据科研用户的需求,经过深度萃取、精炼化之后的高质量知识形态,不难发现,服务团队对微知识的处理过程即是知识的粒度化表示,通过对微知识进行不同视角和不同层次的粒度化表示,既能避免微知识粒度过粗导致服务产品的模糊化,又能防止微知识粒度过细引起科研用户的问题解答效率过低的现象。因此,服务团队如何根据科研用户需求,对其中所涉及的问题进行分解,并从不同的知识粒度层面进行分析,进而保证微知识的粒度能够恰当地满足当前用户的需求状态,对于提升科研用户的专深化和个性化服务的效果具有重要意义。如,服务团队可以根据不同的知识粒度化规范(如文献标引规范、知识表示规范、知识融合规范等),以科研用户的情景化需求为导向,对微知识粒度进行不断优化,同时通过本体或语义网络描述的方式,进行微知识服务产品的组织、转化和表达。

6 结语

就科研用户而言,其科学研究更加趋向知识协作化、数据密集化和智能计算化,这样导致与此相应的知识服务的反应时间更加突出实时性和动态性,知识内容更加强调精炼性、高密度性和易吸收性,在知识推送方式更加重视快捷性和多样性。然而,面向科研用户小数据的全面收集和深度挖掘为服务团队分析科研用户行为、获取科研用户需求以及预测需求变化趋势提供了强有力的支撑。此外,基于微知识库的服务推送能够充分发挥新型社会媒体工具的优势,利用微知识易于理解、易于吸收的特征,避免了知识的重复性组织和处理,极大降低了知识服务的周期,有效改善了科研用户服务体验,对于图书情报机构个性化知识服务工作的开展提供了新思路,具有重要的参考价值。

参考文献:

[1] 马晓亭,陈臣.基于可信小数据的图书馆个性化服务研究[J].图书情报工作,2015(1):85-88.

[2] Estrin D,Thompson C W.Internet of You: Data Big and Small[J].IEEE Internet Computing,2015,19(6):8-10.

[3] 陆祝政.2014年度浙江图书馆读者阅读“小数据”[J].图书馆研究与工作,2015(2):9-12.

[4] 熊志军.试论小科学与大科学的关系[J].科学学与科学技术管理,2004(12):5-8

[5] 申丹娜. 大科学与小科学的争论评述[J].科学技术哲学研究,2009,26(1):101-107.

[6] Heidorn P B.Shedding light on the dark data in the long tail of science[J].Library Trends,2008,57(2):280-299.

[7] 杨平,田野.长尾数据共享研究进展[J].图书情报工作,2014,58(8):133-138.

[8] 侯志江.微知识服务——问答式网站的启示[J].图书馆建设,2015(3):77-79.

[9] 邓仲华,李立睿.面向科研的嵌入式知识推送服务研究(上)——产生、环节与内涵[J].图书馆杂志,2015(7):19-23.

[10] 袁静,贾聪聪,李思艺.高校图书馆情景敏感服务中的用户隐私保护研究[J].图书馆,2015(1):73-77.

[11] William J.Personal information management[J].Annual Review of Information Science and Technology,2007,41(1):453-504.

[12] 李爱国,汪社教,孟祥保.图书馆用户信息模型框架构建[J].图书情报工作,2015,59(13):13-19.

[13] The Edinburgh University.Data Repository:DataShare[EB/OL].[2015-11-13].http://www.ed.ac.uk/ schools-departments/information-services/services/research-support/data-library/data-repository/definitions.

[14] 李立睿,邓仲华.“互联网+”背景下科研用户的小数据融合研究[J].图书情报工作,2016,60(6):58-63.

[15] 冯琴荣,苗夺谦,程昳,等.知识的划分粒度表示法[J].模式识别与人工智能,2009,22(1):64-69.

作者简介:李立睿(1989-),男,武汉大学信息管理学院博士研究生,研究方向:信息组织与知识服务;邓仲华(1957-),男,武汉大学信息管理学院教授,博士生导师,研究方向:信息组织与信息系统。

猜你喜欢

知识服务科学研究
Can you eat yourself more happily? 吃出快乐
A Brief Analysis about the Content and Current Situation of Vocational Students Oral English Skills Competition
基于知识服务的档案管理模式研究
高校预算绩效评价探讨
跨境电商供应链中的知识服务供需匹配模型研究
构建图书馆知识服务理论体系的思考
嵌入心理契约的馆员知识服务能力建设研究
从西方国家保护消费者权益政策看用户信息消费的安全管理
科教结合:高校创新人才培养新途径
浅论科研对本科教学和人才培养的重要性