APP下载

大数据时代下的信息组织与知识组织

2020-09-10吕端士

看世界·学术下半月 2020年3期
关键词:知识网络大数据

吕端士

摘要:大数据背景下,信息组织和知识组织在其研究方法和发展趋势上发生巨大的变化,如何利用好海量复杂的数据成为当下信息组织与知识组织研究的热点。本文通过对信息组织和知识组织的相关内容梳理,结合当前大数据时代特点,分析信息组织和知识组织结合大数据技术所能发挥的新作用,并指出当前信息组织和知识组织所面临的困难与挑战,为现代信息工作者提供一些研究思路和理論支撑。

关键词:大数据;信息组织;知识组织;知识网络;知识组织系统

一、相关概念

(一)信息组织

人们可以通过各种各样的渠道接触到信息,但这些信息往往是冗杂的、无序的,需要经过加工整理才能被人们所利用,这就是信息组织的任务。信息组织是利用一定的科学方法,通过信息外在特征和内容特征将无序状态的信息转换成有序状态的信息[1]。信息组织一种普遍的社会行为,是信息收集工作下一步的重要工作,为后续信息研究与应用奠定了基础。

(二)知识组织

相当于信息组织而言,知识组织更偏重知识挖掘的过程[2]。知识组织最早由英国图书馆学家布利斯在1929年提出,他在《图书馆的知识组织》《知识组织和科学系统》两本著作中从图书馆文献分类的角度描述了知识组织的思想。目前对知识组织的定义尚没有达到统一,图书情报界对知识组织的定义主要有以下几种:①知识组织是指对事物的本质及事物间的关系进行揭示的有序结构,即知识的序化。②知识组织是指对知识客体所进行的诸如整理、加工、揭示、控制等一系列组织化过程及其方法。③知识组织是对知识进行整序和提供,既处理大量的现有知识,又能相对降低存储知识的物理载体的盲目增长以免知识过于分散化。

二、信息组织与知识组织在大数据环境中的作用

(一)大数据环境特点

大数据并非新技术,也不算是新产品,而是新的现象。在大数据时代,信息的规模越来越大,要处理的数据量急剧上升。对于大数据环境特点,不同的研究组织有不同的解读,但一个普遍的认知是:大数据环境具有4V特征,即容量大(Volume)、速度快(Velocity)、种类多(Variety)、价值密度低(Value)[3][4]。容量大指的是大数据环境具有庞大的数据量;速度快可以理解为处理用户数据迅速,延迟小,实时性高;种类多即大数据环境下数据来源广,数据种类与格式已经不局限于结构化数据范畴,还包含半结构化和非结构化数据;由于大数据环境下数据繁杂,包含的对用户真正有价值的数据并不多,因此数据价值密度低是目前大数据环境下最显著的特点。

(二)信息组织在大数据环境中的作用

由于大数据环境下的信息量呈指数型增长,人们对获取有价值信息的实时性和准确性要求更高,一方面人们利用智能的终端设备可以获取到以往难以获取的信息,另一方面也存在信息贫乏或者难以获得的现象,形成信息爆炸和信息孤岛并存的局面,因此信息组织工作在这种局面下显得尤为重要。马费成[5] 提到信息组织至少应该在数据分类、描述、约减、评估、交换共享等方面发挥重要作用。

分类是信息组织的基础性方法。最初用于图书馆的资源分类,例如中国图书馆分类法使得读者得以迅速有效地查阅图书馆相关资源。在大数据环境下,对网络信息的分类应当更加发挥更重要的作用。网络信息分类的对象是数以百万计的网站或是搜索引擎,这些对象几乎包含了人类所能认知的一切知识,由于数据量庞大,因此应当根据数据的序化程度进行分级,序化程度较低的数据,分类的重点在对其描述揭示;序化程度较高的数据,分类重点在于整合和互联。资源的描述通过对信息资源进行特征分析来描述资源的主要内容,但由于网络信息具有极高的自由度和随意性,且信息的来源往往没有真实性保证,因此对网络信息资源的描述方法研究十分必要。目前对网络信息的描述方法主要有MARC、DC、MODS三种[6]。对大数据资源的约减工作与记录描述一样,都是将一次信息转化为二次信息,使得复杂无序的信息约减为简单的替代记录。信息组织还可以通过元数据对大数据资源进行评估与管理,保存信息资源的使用情况,研究人员可以利用这些资源对信息统计分析,对其使用价值和重要性进行判定,并将情况反馈给资源管理者,使其更好地服务用户。此外,信息组织促进大数据资源的交换共享,各个本体都可看作信息系统,各个信息系统之间存在交换与共享,进而创造更大的价值,如我国建设数据统一交换平台,来促进大数据产业发展。

(三)知识组织在大数据环境中的作用

传统的社会发展方式依靠劳动资源和资本资源,换句话说谁拥有大量劳动力和生产机器,谁就得以迅速发展。然而,当前的社会是知识经济时代[7],知识作为一种竞争资源可以起到决定性作用,对知识的有效管理以及开发利用已经成为大数据环境下推动产业发展和技术革新的基础性工作[8]。由于大数据环境下知识呈现无序状态,因此对知识的有效管理以促进知识有效利用和传播是知识组织在大数据时代的根本目标。笔者通过研究近十年在中国知网收录的知识组织相关文献,总结出知识组织在当前大数据环境下主要通过构建知识组织系统和建立知识网络来发挥作用。

1.知识组织系统

知识组织系统可以理解为对人类知识结构进行表达和有组织地阐述的各种语义工具的统称。作为一种可以有效组织管理知识的框架体系,知识组织系统不仅能够为研究人员提供序化知识,还能够实现对知识的有序化检索与导航,使得知识可以被有效检索和利用。中山大学曹树金教授[9]曾提到知识组织在大数据时代有两个根本任务,其一是从各领域实际需求和实践中出发,概括出一般的、可跨领域的应用知识理论方法;其二是结合用户情景对更细粒度信息单元进行揭示与关联。在此基础上,笔者认为知识组织系统在大数据环境下可以在信息检索和术语服务两个层面发挥作用。知识组织系统可利用叙词表中的概念语义关系为网络信息检索提高其性能,或利用分类聚类体系形成一个信息浏览框架,提供信息的分类导航服务。例如Google学术、知网等学术检索网站;BBS、豆瓣网等主题分类网站。术语服务是知识组织系统网络化的一个有效方法,其主要作用是展示和应用各种类型的知识组织资源,在主题标引、分类以及机器翻译领域发挥着重要作用。

2.知识网络

知识网络是涉及科学知识生产和传播过程中的相关机构或活动,也可以理解为它是集不同知识要素的共性特征的集合。基于知识网络的知识组织对企业或组织内部的知识创新、实现多模网络知识管理和研究知识扩散路径与规律具有重要作用。基于知识网络的知识图谱构建对精准获取用户需求、规范整合信息资源与提高知识库精准性与智能性提供了有效解决途径。特别是人工智能时代,由于知识图谱逻辑推理性强,可解释性高,具有透明共享和可视化的优势,基于知识图谱的知识组织会有广阔的研究前景。在可预见的未来,知识网络对解决大数据时代信息爆炸危机和提高情报研究效率方面将会提供非常有效的方法。

三、大数据环境下信息组织与知识组织面临的挑战

(一)信息组织面临的挑战

(1)信息组织的作用极易被忽视

在大数据的应用场景中,大量的数据经过挖掘后可以直接生成供信息工作者使用的情报,并没有经过信息组织过程。同时由于在大数据时代,信息强调实时性,大量的数据还没有经过存储和组织就已经失去了效用。因此,信息组织的作用在大数据环境下显性化,信息组织从数据获取到生产决策方案的过程中的作用被隐藏或忽略。

(2)信息描述标准的建立存在困难

大数据环境下,数据和数据载体变得丰富多样化。越来越多的数据来源于科学实验、基因组测试、社交媒体,这些数据表现形式各不相同,由于信息组织需要有上层的统一的描述标准和规范来保证数据组织和描述达到一致,且保证不同标准之间具有关联性,所以建立跨领域和跨数据类型的统一描述标准存在较大困难。

(3)传统信息组织工具难以适应当前需求

传统的信息组织工具动态性较差,以往采用的分类法、叙词表或本体这些工具一经建立,再想改动就极其复杂,且更新很慢。大数据环境下的数据量呈指数增长,其数据更新速度极快,因此传统的信息组织工具面临着极大的挑战。

(二)知识组织面临的挑战

(1)数据的非结构化

大数据环境下加速了知识生产建设,知识的多元化进一步促使网络数据库中存在大量的半结构化和非结构化数据。非结构化数据如自然语言文本、多媒體数据等等,由于结构和内涵上的语义不明确,在进行语义分析时往往具有更大的不确定性,这种不确定性的表达在知识组织流程中会影响到知识表示,不利于用户发现和吸收知识。可见传统的关系型数据库和联机检索机制都已经无法胜任,这就对现有的组织方式和检索语言提出了更高的要求,需要创新知识组织方法与技术,高度重视专家团队的参与来提供足够的技术支持进行高质量、高价值的知识交流,对检索语言进行技术改变和应用模式的探索,从而提升知识运动的效率。

(2)知识用户需求多样性。

知识组织的最终目的是为提供适度且具有定向性的用户知识服务。知识用户在获取知识的方式和内容是多层次、多角度的,呈现出多样性的特点。长尾理论告诉我们应该重视用户需求曲线中的尾巴部分,要尽可能地实现资源与需求的最大化匹配,实现知识组织效果的最大化。知识用户需求的多样性对知识组织准确性和高效性工作提出了挑战,大数据环境下带来的是传统媒体的新变革和新升级,要求必须改变传统的规范化的知识组织方式,运用大数据进行信息挖掘和个性化知识服务,对用户搜索内容进行自动统计分析,生成偏好设定,有针对性的为每位用户推送与其专业需求相关的知识,从被动服务向个性化主动服务演化,真正地提高知识获取效率。

(3)知识的碎片化。

与传统的单一数据库不同,在大数据环境下的知识数据种类繁多,其知识服务主要是平台服务,而信息用户无论是使用微博还是微信等网络平台发布文字、图片、视频等,都呈现出了知识碎片化和关联化的特点,这就对跨平台的知识整合提出了更高的要求。因此,如何使用知识组织方法进行数据融合,利用互联网搭建知识组织平台来揭示显性知识和隐性知识,挖掘知识关联是目前大数据环境下所面临的一大挑战。通过整合与集成知识组织碎片化的问题,来实现知识跨平台组织、共建共享,提高用户知识发现和知识吸收。

四、结语

在大数据环境下,互联网的飞速发展推进着信息组织和知识组织的升级与变革,数据在各个层面都加大了开放程度。当今社会对信息知识的灵敏性和精确性的要求越来越高,数据信息知识的互通互联已成为一大趋势,信息组织和知识组织持续发挥着其巨大的作用。随着相关研究的不断深入,无论是制定组织标准还是进行知识集成构建,信息组织和知识组织在大数据环境下都将面临巨大的挑战,如何结合传统的组织方法和技术手段,更加深入系统地研究信息组织和知识组织的组织管理和应用的方法和技术,还有待进一步探索。

参考文献:

[1]黄如花.国内外信息组织研究述评[J].中国图书馆学报,2002(01):63-66.

[2]蒋永福.论知识组织[J].图书情报工作,2000(06):5-10.

[3]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013,23(4):168-172.

[4]陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012(17):14-15.

猜你喜欢

知识网络大数据
知识网络环境下高职高专思想政治教育创新
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
高考数学第一轮复习中的做法和反思
思维导图在小学语文阅读教学中的运用探究