大数据知识服务的内涵及其特征
2014-09-27张植卿苏艳红
张植卿+苏艳红
摘 要:大数据知识服务是为适应信息服务业的发展趋势而形成的一种嵌入式协作化知识服务新模式,是现代信息服务理念的具体体现。研究和掌握大数据知识服务的内涵及其特征,对适应大数据时代的发展趋势具有重要意义。
关键词:大数据;知识服务;内涵;特征
中图分类号:TP311.13 文献标志码:A 文章编号:1673-291X(2014)17-0049-02
大数据时代的到来,使得社会各个领域都面临着一场革命。新一轮信息化的浪潮已然随着硬件的高速革新和软件的高度智能化无法抗拒地推到了我们面前。然而没有数据的留存和深度挖掘,信息化只能流于形式。大数据知识服务是在大数据时代发展过程中,为适应信息服务业智慧化、协作化、绿色化等发展趋势而产生的一种基于网络,用以解决数据多维度处理的信息服务新模式,是嵌入式协作化知识服务模式的一种新发展,是现代信息服务理念的具体体现。对大数据知识,无论从其服务的内涵,还是其内在特征,都需要我们高度关注,进行深入研究和认识。
一、大数据知识服务的内涵
为了更好地应对大数据的发展带来的一场新革命,更好地把握和运用好大数据,确保在未来的竞争中获得更多主动权,首先需要弄清大数据知识服务的内涵及其相关的概念。
(一)大数据知识服务中的“数据”与“数字” 不是同一概念
这里所讲的“数据”与“数字”是两个概念。在线教育和数字化校园应该只是数字,网络是能够传输数字的,而数据的集中,是需要物联网、云等综合技术的成熟。仅仅是一个数字,那是结果,几乎没有意义,很容易造成事情简单化。而数据,是过程性和综合的考虑,更能够考量真实世界背后的逻辑关系。由此可见,“数字”与“数据”是有不同区别的。比如,一个学生考试得了78分,这只是一个数字,而如果把这个学生的78分背后的非结构化的诸元数据考虑进去,包括学生的家庭、努力程度、学习态度、智力水平等的所有数据进行统筹考虑,包含78分一起,就可以成为一种数据。
(二)大数据知识服务内涵的表述及其要点
大数据知识服务是为适应信息服务业智慧化、协作化、绿色化、先觉化和泛在化的发展趋势而产生的一种基于网络的,用以解决结构化、半结构化及非结构化数据多维度处理的信息服务新模式,是嵌入式协作化知识服务模式的一种新发展,是现代信息服务理念的具体体现。大数据知识服务内涵展现了3个要点。
一是大数据是指那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、管理和分析的大容量数据,一般以“以太节”为单位。大数据之大,并不仅仅在于容量之大,更大的意义在于通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”。
二是大数据知识服务模式强调有机融合和智能控制。大数据知识服务模式强调知识、能力、资源和过程以服务的形式进行有机融合,并基于网络自由流通,实现大数据知识服务体系中的知识动态协调构建、能力智慧管理、资源按需使用、过程智能控制。
三是大数据知识服务体系是大数据生态系统中最重要和核心的内容之一。一方面,全球将近87.5%的数据未得到真正利用,85%以上的是非结构化数据和半结构化数据,传统知识服务模式仅仅能够提供极小部分数据给用户有效地使用,并且能提供的数据处理服务也极其有限。通过大数据知识服务模式的引入,可使得复杂的结构化、半结构化和非结构化数据处理变得可行和经济高效,从而实现知识横向扩展以满足急剧扩张的知识服务需求。另一方面,为满足用户专业化、集成化、敏捷化和个性化的知识服务需求,需要大数据知识服务平台提供高质量、低成本、可扩展、多维度和多粒度的知识服务。
二、大数据时代知识服务的主要特征
与已有的信息服务模式相比,大数据时代的知识服务模式和构建过程,越来越趋向于个性化、自主化、虚拟化、智能化、透明化和体验化,知识创造模式、组织模式、传播模式和应用模式也呈现出规模化、集约化、数字化和网络化的趋势,在数字化、网络化、规模化和集约化等共性技术特征的基础上,大数据知识服务模式的主要特征可以概括为以下几点。
(一)大数据知识服务是面向智慧和自主需求的知识服务
大数据知识服务模式实现的核心是知识服务全生命周期活动中用户、技术、管理、知识、能力、资源和过程的有机集成和优化。为此,大数据知识服务体系融合了物联网、传感网、云计算、可信计算和信息物理融合系统等新兴信息技术,提出要实现大数据用户、技术、管理、知识、能力、资源和过程的全方位、全生命周期地接入和感知,尤其是关注资源,如软硬件资源、信息资源、网络资源、服务资源等,包括半结构化、非结构化和结构化数据,关注能力,如大数据获取、存储、组织、分析、决策和显示等的接入和智能感知。
在大数据知识服务模式下,各类资源能够通过各种传感器、适配器、人机交互等实现资源半自动或全自动感知,然后借助3G或4G网络、互联网络、电信网、广播电视网等传输信息,在对各类资源进行管理和处理的基础上,汇集资源、能力、过程、知识,构建跨领域、跨行业、智能的多学科知识库。随着大数据知识服务体系的持续进化并不断扩大,从而进一步服务于大数据知识服务的业务执行过程。
(二)大数据知识服务是强调用户参与的知识服务
大数据的数据来源、知识服务能力、服务资源、服务过程及知识本身都是嵌入到网络和大数据环境中的,且所有大数据主要都是来自于大数据用户,使得大数据知识服务关注的重心应该转移或回归到用户自身的需求。大数据生态系统致力于构建一个用户、大数据制造方、大数据运营方及大数据处理方等可以充分进行大数据获取、存储、组织、分析和决策的公用服务环境。在大数据知识服务模式下,强调用户参与不仅仅局限于传统的用户提出需求和用户评价,而是渗透到大数据知识服务过程及大数据自身全生命周期管理的每一个环节。endprint
(三)大数据知识服务是支持按需使用、按需付费的知识服务模式
大数据知识服务是一种由用户需求驱动的、按需付费的知识服务新模式。用户往往需要通过海量非结构化、半结构化数据了解现在发生了什么,甚至需要利用数据预测未来将要发生什么,以便在行动上做出利于发展的主动准备。例如,通过预测用户的流失预先采取行动,或预测竞争对手下一步行动以便采取主动等。在这些过程中,用户不需要过多关注大数据处理的细节,只需要根据自身的数据处理需求调用或知识服务组合,占用大数据知识服务资源,并支付相应的费用即可。彼此之间的关系是一种按需使用、按需付费、用完即解散的关系。
(四)大数据知识服务是共性技术目标与异性技术特征相辅相成的知识服务模式
大数据知识服务通过第三方构建服务平台,将大数据获取、存储、组织、分析和决策过程中所涉及的所有资源、知识、能力及过程都虚拟化为大单项数据知识服务,再聚合成大数据知识服务虚拟资源池,进行统一的管理与处理。针对不同的行业、领域或不同需求,大数据的获取、存储、组织、分析和决策的管理和处理方法有共性,但必然也存在着异性,因此,针对不同行业、领域及大数据处理需求,就需要在原有共性技术体系的基础上,形成专业性较强的专业化大数据知识服务体系,从而针对独特的专业化要求,形成其独有的大数据异性技术体系。以美国国防部高级研究计划局为例,其大数据研究项目在美国政府的大数据研究与发展的共性技术目标要求之外,具备了国防部独有的技术特征;但在国防部内部又依据不同领域的大数据处理需求,形成了具备异性技术特征的大数据知识服务体系。
(五)大数据知识服务是基于知识、能力、资源、过程共享和交易的知识服务模式
与传统的知识服务模式相比,大数据知识服务模式共享的不仅仅是服务资源,还有知识、能力及服务过程。随着大数据时代的来临,对大数据获取、存储、组织、分析和决策过程进行管理的基本策略不是移动数据,而是将计算、知识及服务推向数据,在相应的知识库、专家库、数据处理模型、数据处理框架的支持下,实现资源、知识、能力及过程的虚拟化封装、描述、发布、配置、调用和显示,真正实现大数据获取、存储、组织、分析和决策过程中的知识、能力、资源、过程的全面共享和交易。
(六)大数据知识服务是基于群体创新的知识服务模式
正如美国国家科学基金会(NSF)的大数据研究和发展计划所言,大数据知识服务旨在促进管理、分析、可视化和从大量多样分散异构的数据集中提取有用信息,并充分利用群体创新的力量,创造有意义的网络基础设施以及一体化水平的数据和工具,以支持科学和教育。
(七)大数据知识服务是更为绿色环保的知识服务模式
大数据知识服务的目标之一是围绕结构化、半结构化及非结构化大数据处理需求,实现大数据获取、存储、组织、分析和决策过程中的知识、能力、资源和过程等的全面共享,提高大数据的利用率,实现数据、知识及服务增值。换句话说,就是实现绿色低碳的环保型大数据知识服务模式。
参考文献:
[1] 张晓林.研究图书馆2020:嵌入式协作化知识实验室[J].中国图书馆学报,2012,(1):11-19.
[2] 覃雄派,王会举,杜小勇,等.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-45.
[3] 吕竹筠,张兴旺,李晨晖,等.信息资源管理与云服务融合的内涵及共性技术体系研究[J].情报理论与实践,2012,35(9):26-32.
[责任编辑 安 琪]endprint