APP下载

大数据环境下嵌入科研过程的信息服务模式研究*

2014-01-11邓仲华李立睿陆颖隽

图书与情报 2014年1期
关键词:科学研究科研人员用户

邓仲华 李立睿 陆颖隽

(武汉大学信息管理学院 湖北武汉 430072)

1 引言

如今,大数据这个术语已是耳熟能详,它通常是海量的、形式多样的、非结构化数据的代名词,是信息化、网络化快速发展下要经历的必然过程。与此同时,在现代科学研究过程中,数据量的生成呈现指数增长也是显而易见,不管是由于高通量的科学试验,还是千万亿次的科学计算,高分辨率的传感器,以及错综复杂的网络科学研究环境。

因此,在大数据环境下,科学研究人员的信息需求和科学研究模式发生了显著性的变化,而嵌入科研过程的信息服务在科学研究的整个流程中,始终坚持以科研人员为中心的原则,从其课题选定到结束的整个过程提供具有广度的信息展示,个性化的信息推送和深度的信息互动。而科学研究的本质是信息的整理和分析,鉴于此,为顺应科研环境的转变,如何为科学研究人员提供高效的数据管理和新型的信息服务模式,是值得思考和探讨的。

2 科学研究过程中信息服务的需求分析

2.1 科学研究模式的转变

科学研究正在进入一个崭新的阶段,在信息与网络技术迅速发展的推动下,大量从宏观到微观、从自然到社会的观察、感知、计算、模拟、传播等设施和活动产生了大量的数据。同时,学科的发展逐渐呈现交融化、协同化和复杂化,研究人员逐渐把数据作为科学研究的对象和工具,基于数据来思考、设计和实施科学研究,因此促进了数据密集型科学的兴起,使密集型数据成为科学研究活的基础,并逐步总结形成了科学研究第四范式的研究模式。

从科研人员的原始数据,相关数据到科技文献的产出,研究过程中的数据和信息既是研究创新活动的参考资源和知识创造工具,又是新的研究的起点,科研人员必须在此基础上依赖资源的数字化、交流手段的网络化、科研工作的协同化以及科研数据的共享化来把握科学的发展规律,洞悉海量数据背后的信息和知识。然而科研人员研究对象和环境的转变,使其对信息的发现和分析能力愈加欠缺,直接导致在数据的挖掘和信息的管理方面面临着挑战。以数据为驱动的数据密集型科学研究改变了科研人员的信息行为模式,同时也产生了新的信息服务的需求。

2.2 大数据环境下科学研究用户的信息需求

当前,密集型科学数据作为大数据的重要组成部分,在具备大数据特征的同时,在数据分析和管理方面有更高的要求,必然导致科研人员对研究过程的个性化、专深化、集成化和协同化的信息需求不断增强。

(1)大数据环境下科学研究对象的虚拟化,导致科研人员拥有更强的数字化交互式的信息管理能力需求。网络快速传播迅速产生的海量科学数据以及大量来自互联网的数据和信息成为科学研究的主要组成对象,使得研究转变成以网络为基础的高度协作性活动,如何对海量虚拟化的数据和信息进行有效管理,成为科研人员必须面临的问题。

(2)大数据环境下科学研究需求的深度知识化,导致科研人员拥有海量数据实时的分析挖掘需求。一方面,以网络为基础的数字信息资源改变了科研人员的研究行为,数据的获取不是问题的关键,而关键在于数据背后的深度知识挖掘;另一方面,科研人员需求泛化的同时,更加专深化。如何根据每个科研人员独特的研究特征进行数据的跟踪、比对和分析,使专业化和针对性的知识实时获取,成为科研人员必须面临的问题。

(3)大数据环境下科学研究交流方式的便捷化和多样化,导致科研人员拥有科学数据融汇和多学科协同的信息资源共享需求。在数据密集型的科学研究学术交流过程中,交流方式随着信息技术的不断深入,而愈加便捷,但是对于整合所有科学数据和文献,形成一个具有全球开放获取的互操作世界,仍有相当大的差距。如何使科研人员在查看文献的同时能够找到文献的所有原始数据,并可以在此数据基础上,重现作者的分析过程,成为科研人员必须面临的问题。

3 嵌入科研过程的信息服务模式的分析

3.1 嵌入科研过程的信息服务模式的含义

模式通常被解释为某种事物的标准形式或使用人可以照着做的标准样式。即模式是将解决某类问题的方法总结归纳到一定的理论高度,并用来帮助指导人们设计优良的解决方案和完成某类任务的方法论。因此,模式是方法的抽象概括和总结,是解决某一类问题的方法论。而信息服务,在传统上认为的是以信息资源为基础,利用各种方法或技术手段对信息进行收集、整理、使用并提供相关信息产品和服务的一种活动。并且伴随着科研用户需求的多样化,逐渐转变成通过研究用户,以用户的需求为导向来收集相关的数据和信息,进行信息组织和分析后,将有价值的信息传递给用户最终帮助用户解决问题,来实现信息增值。从这种意义出发,服务主体、服务客体、服务方法和服务内容是信息服务模式的主要组成部分,这些要素及其相关关系成了区别不同模式的主要依据。

另外,嵌入式理论提倡把事物的产生、发展和特点与其周遭环境联系起来,放到更大的背景中去考察。而嵌入科研过程就是融入科学研究的整个细节和流程中,考虑科研用户需求的产生与发展,从课题选定到结束的整个过程中提供满足科研人员的具有全局性和个性化的信息与知识需求。将嵌入式理论应用到科研信息服务中,在一定程度上满足了在网络环境下科研人员面对的数据量体量大、结构多样化、生成速度快、价值密度低的研究问题的个性化服务需求。

因此,嵌入科学研究过程的信息服务模式将数据管理与信息服务融入到科研用户一线,嵌入到用户科研环境和科研过程,是以专业的信息服务人员为基础,采用先进的计算机技术(如云计算、语义网和Web3.0等),构建具有强大的资源整合能力、海量信息分析能力、大数据挖掘能力和多维度信息可视化能力的集成平台,以科研用户需求环境和需求趋势为导向,是一种面向用户发现问题、分析问题、解决问题和提供解决问题决策的信息展示、交互和推送的服务模式。

3.2 嵌入科研过程的信息服务模式的要素

信息服务模式是对信息服务活动的组成要素及这些要素之间相互关系的概况。基于此,笔者将大数据环境下科学研究过程中的服务需求,组成嵌入科研过程的信息服务模式的服务主体、服务客体、服务方法及服务内容四个要素相结合并逐一进行分析。

3.2.1 服务主体

嵌入科研过程的信息服务模式的服务主体是信息服务活动的实施者,即信息服务人员,其根据科研人员的需要,采取相应的服务策略,提供满足研究者需要的信息服务产品。在嵌入科研过程服务的环境下,一方面,服务主体要求嵌入科研人员情景中,并作为研究团队成员,通过现场交互(包括现场和网络渠道),来把握知识需求、组织知识环境、定制知识工具和提供服务成果。另一方面,服务主体提供的信息服务产品具有实时性、多样性、针对性和易用性的特点,更加注重将科研人员自身的知识背景,研究工具、研究领域的实时动2态以及研究目标与信息服务产品的有机结合。

鉴于此,嵌入科研过程服务的提供者应需要包括:①具有对信息内容强大而灵活的分析能力的信息分析师;②具有支持信息资源知识化处理能力的知识建构师;③具有精通各种发现、分析和组织知识的方法与工具的检索与组织专家;④具有对特定领域深入了解的情报分析专家和学科专家。这样通过其之间的合作与互补,将大量跨领域科研人员、海量密集型的科学数据、信息内容和分析过程有机地融汇起来,促进科研人员高效推动成果的创新。

3.2.2 服务客体

嵌入科研过程的信息服务模式的服务客体是指信息服务的需求者,在一个特定的项目实施过程中,服务的需求者可根据应对研究问题的规模和复杂程度的人员数量进行划分,包括了科研团队群体需求者和单一科研人员需求者。

而鉴于嵌入科研过程的信息服务模式对于服务主体、服务方法和服务内容有更严格的要求,其成本也是相对较高的。因此,对于服务客体也有特定的要求,其中主要应包括以下两个方面的科研人员:一方面,对于攻克涉及多学科,跨领域的重点研究项目的研究团队,其面临的课题更具开放性与不确定性,研究过程中随之而来会遇到更多复杂的技术、方法等方面的难题,对于多学科的深层次信息服务拥有更强烈的需求;另一方面,对于引导学科发展方向的先驱,其面临的课题更具专深化与前沿性,研究过程中随之而来的是以战略眼光审视研究问题,对于特定性的实时动态信息服务拥有更强烈的需求。这样,嵌入科研过程的信息服务模式对于跨学科、跨国界和跨领域的重大科研项目以及具有前沿战略性的研究工作无疑是一种值得考虑的服务模式。

3.2.3 服务方法

嵌入科研过程的信息服务模式的服务方法是针对科学研究的信息服务手段,其主要是为服务主体完成信息服务行为提供有效的工具。服务方法随着科学研究方式的转变而不断变化,如今,现代科学研究朝着数据化和计算化的方向发展,从计算科学中逐步分离出了数据密集型科学,所有资源对象都被信息化、数字化表征,海量科学数据被迅速和大量创造,并经过网络快速传播。这样,促使了新型的信息服务方法根据研究人员的研究场景,将研究过程中的信息或知识深度地嵌入到解决科学问题的各个过程,促使科研人员的知识发现和知识创造。基于嵌入式理念,在总结传统信息服务方式的文献代查、专题报告总结的基础上,笔者进一步深化了嵌入科研过程的信息服务模式的服务方法。

通过对研究问题的处理流程进行分析,在此将嵌入科研过程的信息服务模式的服务方法从四个方面进行展开:①嵌入科学研究过程的语义关联的信息资源发现服务,在各类数字资源中嵌入语义导航体系,并融入科研人员与系统交流,构建关联主题图,触发知识的偶然发现;②基于用户情景的开放式信息资源获取服务,采用模块化组装思想,进行信息关联与协同化组织管理,根据科研人员当时当地具体情境自适应地提供获取服务;③集成信息资源云平台的大数据交互式的挖掘服务,科研人员针对个人分析问题、解决问题的独特方式,借助云平台中开放的分析挖掘工具进行相关的大数据深度分析,对于潜在问题进行定向分析;④融于可视化技术的动态多维信息资源呈现服务,从科研人员体验入手,支持图像界面、语音界面和触摸屏界面,以构建、传达和表示复杂信息或知识,通过丰富的数据观察方式帮助科研人员识别隐性信息。

3.2.4 服务内容

嵌入科研过程的信息服务模式的服务内容是确定的信息产品,是服务主体交付给服务客体的最终成果或其享受到的各种信息服务。其主要保障科研人员在研究过程中项目的顺利推进以及促进科研人员的自主创新和交叉融汇创新。在项目处理生命周期中嵌入科研过程的信息服务内容(见图1)。

(1)评价与预测性信息推送。在识别问题的基础上,服务主体一方面通过当前现状的调查和相关问题的数据集分析挖掘,向科研人员提供其研究发展前沿与趋势的预测性研究成果;另一方面,分析国内外当前类似项目组的科研状况与进展,评价其优势与劣势,为项目的选定提供参考性和建设性建议。

(2)方案规划信息参考咨询。将服务主体嵌入到项目规划中,不仅有助于服务主体能对项目在一定程度上有整体性和全局性的把握,而且有利于服务主体与服务客体的沟通,形成优势互补。同时,服务主体以用户需求为导向,通过多层次的探讨,采用相应的工具,提供个性化的参考咨询,保证项目规划的科学性。

图1 嵌入科研过程的信息服务模式内容

(3)过程管理与信息重构。数据密集型科研环境下实施项目,必须利用海量信息分类聚类、抽取要点和发现关系,来分析揭示隐藏的知识结构。而通过对信息网络的重构,进行趋势分析、问题鉴别和路径探索是服务主体的优势。利用这一优势可以减轻科研人员的负担,使其能够集中精力于自己的研究领域。同时,在实施过程中遇到的困难,服务主体将实施情况与规划对比,关注偏差,实时采用相应的服务方法帮助科研人员分析原因,提供可借鉴的解决方案。

(4)专题信息关联性管理。在项目结题过程中,服务主体一方面依据数据生命周期全面分析整理并记录科研用户的数据处理情况,另一方面依据研究生命周期细致总结各阶段研究成果,并将相关的数据、信息和知识进行关联、回溯与保存。

4 嵌入科研过程的信息服务模式的特征

嵌入科研过程的信息服务模式是以信息服务为轴心,以科研用户为中心,以数据资源为核心,以科研用户需求为导向,以嵌入式信息服务团队为重心开展工作。信息服务是嵌入科研过程的信息服务团队提供的工作内容,服务团队的工作是围绕信息服务这一根本而展开的。满足服务客体的实际需求和潜在需求是嵌入式信息服务团队工作的最终目标,而为了达到这一目的,嵌入式信息服务团队需要掌握核心的数据资源技术,以便能够在课题查新、文献检索、隐性知识挖掘方面提供个性化、专业化的服务。

4.1 覆盖协同多领域

科学研究是一个创新的过程,其需要具备的信息亦是多样的,这样嵌入式信息服务团队对于科研的促进作用也是显而易见的。一方面,学科的交融,科研项目的合作紧密化,科研用户除了需要本学科研究的信息外,还需要大量交叉学科的知识,嵌入式信息团队中的学科专家能够采用辅助或合作的形式为科研用户提供满足其需求的个性化相关学科的信息或知识;另一方面,多领域科研用户的合作,必须保证科研团队间的目标协同和科研资源的组织协同,嵌入式信息服务团队能够与科研用户加强交流互动,与用户建立长期稳定的协作关系,并构建协同工作机制,来保证服务内容的有效性和针对性,服务方式的准确性和高效性。

4.2 贯穿科研全过程

科学研究是在现有的研究基础之上来对未知事物的探索性活动,这就导致了科研用户的研究活动具有动态的信息需求,在科研项目的选定阶段,嵌入式信息服务团队能够以伙伴合作型方式推送课题项目的研究背景、研究综述和研究进展;在科研项目的规划阶段,嵌入式服务团队能够整体和全局地把握课题项目所使用的相关技术或研究计划方案;在科研项目的实施阶段,嵌入式服务团队能够根据用户的需要,跟踪国内外研究进展和动态信息,对海量信息进行深入分析,对隐性知识进行全面挖掘;在科研项目的结题阶段,嵌入式信息服务团队能够根据信息的生命周期,将信息进行归类、关联与保存。

4.3 情景感知个性化

科学研究的主体是科研用户,而科研用户情景是指用于表征与交互环境相关的实体状态的信息集合,包括用户位置、所处时间、用户情绪、心理状态及其相互关系等,能够实时动态地获取科研用户情景信息,把握其具体需求,是科学研究活动高效推进的重要保障。与之对应,情景感知是对用户情景的获取与应用,嵌入科研过程的信息服务模式通过以下两个方面的用户情景感知来提供个性化服务:一方面,科研用户与系统的交互,嵌入式信息服务团队通过监控用户在学科社区、博客和学科群等挖掘科研用户偏好和相关隐性信息需求;另一方面,嵌入式信息服务团队通过与科研用户协同交流,及时感知获取用户的长期目标和短期目标,根据科研用户的潜在需求来组织信息环境、定制信息工具、提供个性化的推送服务。

5 嵌入科研过程的信息服务模式所面临的挑战

数据密集型科学下的科研范式,更加强调科研人员在网络环境下的协同交流、资源开放、信息共享、智能关联与协同应用。嵌入科研过程的信息服务模式在促进现代科学研究创新的同时,也面临着一系列的问题和挑战,寻求合适的标准规范和技术对策有助于切实推动新型信息服务模式的转变,促进科研过程的推进与创新。

(1)嵌入到用户科研过程并且根据用户研究背景提供个性化信息推送对情报研究人员的挑战。一方面,大科学的兴起,科研人员的研究课题通常会涉及多学科和多领域的研究,这就要求情报研究人员具有跨学科的综合分析和信息获取能力,从多视角、多层次为科研用户提供信息服务;另一方面,将情报研究人员嵌入到科研过程,其必须具有战略性的眼光,对研究的整个过程有全面的认识,明确每个阶段为科研人员提供的信息服务类型,通过自身的优势提供其所需的信息资源,必要时能够进行科研项目的管理,以情报分析的严谨性来引导科研过程的科学性。

(2)新型技术的应用对密集型科学数据的全面整合与共享的挑战。首先,大数据时代的到来,使科学研究正在被大量密集型的数据所淹没,在数据的分级、归档、备份和保护的问题上对数据共享的性能提出了挑战;其次科学研究大数据集涵盖了各类学科、各类层次研究人员或团队、各个研究阶段以及各类来源的数据集合,这些数据集合的多样性与复杂性对其整合提出了挑战;最后科学研究范式发展成为以数据为驱动的研究模式,强调将科研数据集合长期保存,并且将数据与关于数据的文件集合成一体,数据的流动、交互、融合、引用和回溯都将记录并保存下来,这对数据资源的整合与共享提出了又一新的挑战。

(3)研究环境的变化以及相应信息服务方法的转变对数据分析挖掘能力的挑战。一方面,密集型数据分析挖掘成为信息服务必不可少的支撑点,而密集型数据在具备大数据特性的同时,必然使传统的分析挖掘工具和算法面临着挑战;另一方面,嵌入科研过程的信息服务模式的服务主体需要利用数据对科研创新合作过程及交互型信息服务过程将要发生什么进行分析和预测,以便为服务客体实时提供相应的辅助决策,这种综合性和多维性的预测对数据实时与深度挖掘提出了挑战。

6 结语

大数据不仅仅是数据量的剧增,也不仅仅是信息技术的飞跃,而是人类对客观世界认知飞跃的前奏,科学研究已进入数据密集型科学知识发现,因此,研究构建对科学数据、模型工具以及大数据挖掘平台,支撑跨区域、跨学科和跨团队的协同研究,满足现代科学研究需求的信息服务模式,对于促进科研创新是非常重要和迫切的。

另外,深层次的嵌入科研过程的信息服务模式由于成本、技术和人员素质要求等限制,只能针对特定的有高度需求的科研人员或群体。但是,一方面对于嵌入科研信息服务模式的服务主体学科背景知识、新型技术的运用能力、嵌入服务意识、沟通能力和协作能力提出了更高的要求;另一方面,对于不同的科研人员和工作环境如何采用多样化的服务方法来提供个性化的服务内容,促使其提升科研效率,也面临着极大的挑战。毫无疑问,面对全新科研范式带来的强大动力,利用信息服务模式的转变来推动科学研究的不断创新和发展将是大势所趋。

[1]刘明,李娜.大数据趋势与专业图书馆[J].中华医学图书情报杂志,2013,22(2):1-6.

[2]王凭慧.科学研究项目评估方法综述[J].科研管理,1999,20(3):18-24.

[3]王学勤,Amy Stout,Howard Silver.建立数据驱动的 e-Science图书馆服务:机遇和挑战[J].图书情报工作,2011,55(13):80-83.

[4]Delserone L M.At the watershed:Preparing for research data management and stewardship at the University of Minnesota Libraries[J].Library Trends,2008,57(2):202-210.

[5]Tony Hey.潘教峰译.第四范式:数据密集型科学发现[M].北京:科学出版社,2012.

[6]中国社会科学院语言研究所词典编辑室.现代汉语词典[M].北京:商务印书馆,2005:301-302.

[7]张树华,王京山,刘录茵,等.数字时代的图书馆信息服务[M].北京:北京图书馆出版社,2005:1-9.

[8]秦铁辉.嵌入性理论对情报学研究的启示[J].图书情报工作,2009,(12):1-3.

[9]刘媛筠,李志民.当代图书馆的三种信息服务模式[J].图书馆杂志,2013,(1):26-31.

[10]张晓林.研究图书馆2020:嵌入式协作化知识实验室[J].中国图书馆学报,2012,38(197):11-20.

[11]张晓林.走向知识服务:寻找新世纪图书情报工作的生长点[J].中国图书馆学报,2000,(5):32-37.

[12]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012,(11):63-68.

[13]万亚红,黄樟钦,陈旭辉,等.基于主动推理的情景感知系统框架[J].计算机工程,2004,30(12):8-9,70.

[14]KM S W,PARK S H,LEE J B.Sensible Appliance:Applying Context-awareness to Appliance Design [J].Personal and Ubiquitous Computing,2004,8(3):184-191.

[15]Science Staff.Challenges and Opportunities[J].Science Special Issue:Dealing with Data,2011,(331):692-693.

[16]Felice Frankel,Rosalind Reid.Big data:Distilling meaning from data[J].Nature,2008,7209,(455):30-33.

猜你喜欢

科学研究科研人员用户
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
欢迎订阅《纺织科学研究》
纺织科学研究
企业科研人员激励问题及对策研究
A Brief Analysis about the Content and Current Situation of Vocational Students Oral English Skills Competition
关注用户
关注用户
关注用户