试论基于科学知识图谱的大数据研究
2021-11-28程璐楠安奉弋
程璐楠,程 涛,张 博,安奉弋
(1.国网大学(国网高培中心),北京100192;2.领规科技(北京)有限公司,北京100083)
在现阶段的大数据时代当中,需要在大量的数据信息中,有效地将符合自身需求的信息数据内容提取出来,进而实现大数据下的科学知识图谱设计。在现阶段的发展过程中,各行各业都在对大数据技术进行深入的研究。利用大数据技术,可以对该领域当中的知识图谱进行相应的绘制,这一方法成为研究过程中的有效解决方式。
1 大数据概念
在近些年的发展过程中,伴随着计算机网络技术普及,社交网络成为当下新兴服务和云计算技术,成为高新技术类型。在当下的社会发展过程中,数据信息的种类和规模在不断扩大当中,大数据的出现,对人们的生活以及生产造成了较为明显的影响,使得人们的生产方式和工作方式发生了较大的转变。同时,在一些学术界和政府部门也在工作当中面临着诸多全新的挑战,使大数据受到了全社会的重视。
对于大数据技术而言,现阶段由于其技术的优势,受到了方方面面的重视,但是始终却对大数据技术缺乏一个统一的定义。对于大数据而言,其是一种抽象的概念,仅仅从数据的数量上下定义,往往无法很好地进行理解。大数据表面上是大量数据的集成体,但是也不同于海量数据、大量数据这样的定义。早在2010 年,就有组织对大数据进行了定义,将其称为普通计算机软件,无法在有效的时间内对其数据信息进行捕捉、管理以及处理的一种规模巨大的数据集。而中国的一个组织将其大数据定义为,大数据的实际规模已经超过了典型数据库软件的实际采集、存储、管理以及分析的能力范畴。为此,在这样的定义当中,也对大数据的两个不同特征进行了诠释。分别为数据的规模能够发生着一定的变化,同时在现阶段的计算机软件使用过程中,始终无法很好地对出现的大数据进行有效的管理。
2 知识图谱介绍
伴随着现阶段科学技术的高速发展,互联网技术在全世界范围内正在高速发展当中。使得在全球的发展过程中,信息数据呈现着爆炸式的增长,为此,人们在使用信息技术处理海量复杂的信息时,有效地提取自身需要的信息数据变得越发困难。在这样的信息数据发展背景下,知识图谱技术应运而生。知识图谱能够有效地将现代科学技术知识当中的复杂领域进行数据挖掘、信息处理、知识计量等操作,将其通过图像方式,将其中的交叉学科良好地显现出来。在该技术的使用过程中,始终坚持以科学为主的技术环节,并涉及到数学、信息科学以及计算机科学等诸多学科内容。在现阶段的发展过程中,该技术拥有较为良好的发展前景。
现阶段,对于知识图谱而言,由于是一种全新的技术领域,使得在该技术应用过程中,还没有形成相应的完善技术标准。所以人们对于知识图谱的应用还在不断地发展当中。知识图谱本质上是语义知识库的结构化处理。可以很好地应用一些符号形式,使当下物理世界当中的一些概念产生相互的关联,可以有效地让实体之间能够产生相互连接的效果,进而形成网状的知识结构体系。
3 知识图谱应用
3.1 科研领域
知识图谱可以有效地通过引文聚类的分析方式,特别是通过在引文当中形成的网状关系进行深入的研究,进而可以有效地体现出每一个学科之间的亲缘关系以及具体的结构类型,还可以很好地对作者集体进行划分。同时,在分析的过程中,可以较为准确地对不同学科当中存在的交叉、渗透以及延伸的趋势进行分析。甚至还可以在分析的过程中,充分地掌握学科产生的背景、发展以及一些具有着突破性的成就,体现科学动态结构以及内在的一些发展规律。
对于形成的科学图谱而言,就是通过形成的引文网络图,有效地对学科其前沿与学科当中的实际关系进行连接和梳理,进而充分保障研究人员能够在科研的过程中,有着较为可靠的技术支持。
3.2 社会问题的解决
在知识图谱的应用过程中,由于其技术的高效性,可以广泛地应用到诸多领域当中。在处理社会问题的过程中,可以对于一个争论的焦点,制作出一个单独的知识图谱,以此将各种理解和影响因素放置在图谱当中,这样便可以帮助人员更加直观地认识事物,同时也能够有效地对分析的事物进行全面的研究和了解,并加以对因素进行对比分析。通过这种方法,可以清晰地展示出相应的内在逻辑,并建立起较为明确的视觉结构,从而能够在细节处理过程中了解到分析主体的主题。在分析的过程中,还可以有效地将不同的观点进行整合,便于对现阶段的话题进行客观、理性的分析和评价。在解决这种问题的过程中,由于利用了较为清晰的一体化图像表达,对价值以及看法进行了压缩,使得参与者能够对观点进行更加有效的分析。
3.3 语义搜索
在现阶段网络当中搜索引擎的发展,是建立在互联网碎片化的信息、关联数据集的基础上的,使得行业当中的数据、领域知识都能够有效地构建通用,或者采用较为权威的行业知识图谱进行相应的展现。同时,在搜索的过程中,可以有效结合其语义关系、索引以及排序,形成高效率的语义搜索引擎。在搜索的过程中,可以实现多任务人机协作、推荐系统等方式,有效地对用户的实际意图进行智能化的搜索。同时,也能够在发展的过程中,对一些潜在的信息数据进行有效的识别和获取,充分挖掘信息的价值。通常情况下,可以通过知识卡片的方式,对其搜索结果进行展现,进而有效提升搜索的质量。
3.4 深度问答
在知识图谱的结构化知识以及统一的接口设计方面,在应用的过程中,有效地实现了自然语言的理解,因此,能够很好地对其进行实体深度的分析。在应用的过程中,也有效地融合了深度学习、知识推力等方式,能够建立起相应的多维人机交互的系统,进而基于智能化的方式,对用户的问题进行智能的理解和分析,有效地提升搜索的效果。在对其结果进行排序、知识挖掘之后,有效地将其答案展现出来。
4 互联网思维
对于互联网思维而言,就是在现阶段的发展过程中,能够基于互联网技术。在大数据技术和云计算等信息技术的加持下,针对市场、用户、产品以及企业自身的价值角度,对当下的整体市场进行商业生态方面的思考。
在当下的互联网当中,其形成的思维方式不再局限于现阶段的互联网产品以及互联网的企业当中。在互联网的发展过程中,已经不再局限于桌面互联网领域,或者也不再局限于移动互联网,而是一种泛互联网。这是由于在发展的过程中,所能够形成的网络形态不再单单的是一种形式,而是可以有效结合起各种类型的终端,形成相应的网络形式。例如,在形成的互联网当中,可以涉及到台式机、平板、手机、平板以及眼镜等形式。在形成的互联网思维当中,需要降低互联网的维度,能够让互联网产业可以涉及到更多的实体产业当中,实现更为长远的发展。
5 企业数字化转型
在现阶段的企业发展过程中,为了进行数字化的转型,就需要进行信息化的建设。在信息化建设和发展的过程中,可以采用纵向整合以及网络化的方式。对于企业当中的IT系统的整合,需要能够结合企业现阶段的实际发展情况,在整合的过程中,需要充分地满足企业的网络化发展需求。但是在当下的众多企业发展过程中,由于IT 基础设施的整体性较为落后,以此呈现出一定的碎片化状态,这样便无法很好地进行网络化的建设和发展。为此,需要在企业的发展过程中,建立具有着较强包容性的系统。以此在具体的应用过程中,可以很好地将其系统的模块、通信系统、传感器和用户界面进行有效的联系。之后再对其不同的模块进行有效的优化和整合,以此能够充分保障企业在发展的过程中,可以有效地发挥出IT 系统的核心竞争力。
综上所述,在对基于科学知识图谱的大数据研究过程中,其科学知识图谱的应用能够有效地为各个领域的发展作出较高的贡献。当下的社会已经进入到了信息化的时代当中,为此需要有效地充分利用大数据的技术优势,推动各行各业的发展和建设。