APP下载

基于搜索引擎的供电信息资源多用户调度管理平台

2021-06-14吴海江唐鹤骆国铭

电子设计工程 2021年10期
关键词:数据源搜索引擎异构

吴海江,唐鹤,骆国铭

(广东电网公司佛山供电局,广东佛山 528000)

随着近年来电力企业发展进程的不断加快,信息化发展态势愈来愈快,数据成为各专业应用的重要核心。我国电力行业历经长时间的持续化信息发展,目前已经逐渐发展成为大量专业信息系统,譬如OA、电力交易运营、电力营销、电力调度、配电管理、生产管理、项目管理等系统。分别由不同厂家负责生产,不同系统之间互相独立,所以极易产生“信息孤岛”,导致无法真正高效实现数据共享。随着我国电力机制改革进程的逐步深入,电力企业的信息化建设也获得了飞速发展,电力企业领导层逐渐提高对自身管理决策综合水平的要求,对于各信息数据需求也要求更加充分、准确且及时,能够实时统一地完成信息的传递共享,因此建立能够满足传递共享的综合调度管理数据平台,已经逐渐发展成为如今电力行业信息化发展的主要方向。近年来,网络搜索引擎技术也取得了极大进展,譬如Google、百度等搜索引擎,能够满足短时间内数据信息的快速获取,更受到各大行业领域的普遍认可。但往往该类搜索引擎,并不能满足搜寻企业内部信息需求,更无法实现搜寻用户信息实现统一共享调度。因此,检索成为如今电力行业信息资源共享的核心技术点,文中提出的基于搜索引擎的供电信息资源多用户调度管理平台,能够解决以上信息资源调度共享的问题。

1 搜索引擎原理概述

1.1 搜索引擎基本结构

搜索引擎主要包括了以下程序设备:信息收集程序,分析、索引和检索设备,以及查询接口。搜索引擎的结构原理如图1 所示。

图1 搜索引擎结构原理示意图

1.2 工作原理

1)在信息收集程序中。该结构主要实现网络所覆盖所有公开领域内,信息站点记录具体网址,并将站点的链接指针成功找出后,寻找新型信息空间,然后将创建形成的新信息空间文档顺利取出。

2)分析器。该结构针对信息收集程序中所成功收集的文档信息,通过运用分词、过滤、转换等不同操作方法进行索引。

3)索引器。索引文档作为一种新型的检索方式,成功存储于建立的索引数据库内,具体索引操作可以依照倒排文件这一存放格式。

4)检索器。该结构根据索引数据库,成功找出密切相关用户查询需求的文档,并根据设定的相关度递减这一排列顺序,将相关度较阈值明显偏大的文档成功排列并最终返回至用户。

5)查询接口。该结构是为了能够方便提供用户信息查询输入及输出的结果界面。

2 异构数据集成技术

2.1 数据集成

异构数据集成实现了用户信息数据调度集成,是一种能够有效维护数据源一致性,真正提升并实现数据信息共享效率的技术,能够为电力行业供电信息资源多用户提供统一集成的数据访问源及接口,并且执行相应的用户对数据源提出的访问请求。图2 为异构用户数据集成系统模型。

图2 异构数据集成系统模型示意图

2.2 集成方案

一是采用虚拟视图法,基于该方法建立的数据集成系统,可以在用户经系统提出查询请求时,系统能够自主根据用户的数据源执行操作,该方法也被称为Lazy 方法。

二是联邦数据库系统,主要包括了紧耦合FDBS、松耦合FDBS 共两类(见图3)作为联邦数据库体系结构。前者拥有一个或多个统一模式,能够经模式集成技术实现半自动生成,还可以经用户实现手工构造。只需将逻辑异构关系妥善解决,便可以实现同领域专家决定数据库模式对应关系,但是紧耦合也存在静态升级困难这一问题。后者并未形成统一模式,但是提供了部分数据库统一查询语言,FDBS 数据库内相关数据的自洽性,能够对语义异构妥善解决,但是这种耦合并不具备全局模式。

图3 联邦数据库体系结构

三是中介系统,能够提供全部的异构数据源虚拟化视图实现用户数据集成。在这里所指的数据源包括了数据库、遗产系统、Web 数据库等各类模式。能够建立数据源与全局模式之间的衔接桥梁,并且满足用户的透明化异构操作,无需全部得知数据源所在的模式、位置和所要采用的访问方式。Mrdiated系统典型结构示意图如图4 所示。

图4 Mrdiated系统典型结构示意图

3 平台架构及功能详细设计

3.1 系统结构

电力调度专业搜索供电信息资源用户调度管理平台的建立,需要基于搜索引擎这项技术来实现,建立知识库也与搜索引擎存在依赖关系。除此之外,还能够提供用户平时高频次访问的相应站点的异构数据集成,建立图5 所示的系统结构框架。

图5 平台系统架构示意图

如图5 所示,在该平台信息展现功能方面,实现资讯数据集成,经资讯集成该功能模块,可以集中统一展现用户关心的数据信息统一调度,省去原本需要不断登录各网站进行搜索的麻烦。在信息分类模块则能够将用户搜索信息调度分类,以便用户能够在平台应用中及时方便查询。用户模块基于Web2.0 技术能够个性化定制数据信息,并且最终可以成功展现个性化信息。建立基于搜索引擎的供电信息资源多用户调度管理平台,能够为用户在应用过程中,提供多样化信息展现途径,并创建便捷高效化的工作方式。

3.2 系统检索范围

该系统平台主要实现的系统检索功能,基于网络爬虫、索引器、检索器三大硬件实现。

1)外网搜索。平台用户可以在应用中确保网络环境安全的前提下,为用户提供外网相关信息的搜索引擎功能服务,能够实现电力有关信息网站的全面检索。

2)内网搜索。平台可以为用户提供电力行业内部网络信息资源搜索,以IP 地址作为搜索依据,设定具体的检索范围。

3)本地搜索。通过为平台用户提供本地搜索源,譬如可以搜索成功保存于计算机终端的硬盘文件。并且可以集成文件管理系统,并为内部网站提供相应的站内检索这一功能。此功能设计代码示例如下:

3.3 系统检索指标

文档类型:该平台能够实现Word、PDF、网页等全文检索功能。

检索规模速度:该平台的配置技术水平,直接对检索速度和最终规模起决定影响作用,能够满足用户应用该平台的检索操作要求。

本地缓存:该系统可以为用户在应用过程中,提供所需的快照功能,方便对阅读文档做html 版本处理,这样一来用户可以在应用中迅速查询自己所需的相关信息。

更新周期:通过在该平台增设了增量更新这一全新模式,包含具体的检索范围以及确定的系统硬件设备。通常情况下企业用户能够满足在有限时间(1 周内),作为搜索引擎信息调度的完整更新周期,并运用广度优先这一方式,真正实现每一个分布站点的信息更新。

3.4 资讯集成

用户在应用该平台过程中,随着网站数量的逐渐增加,也会导致数据集成的整体效率不断降低。所以为了提高用户的调度平台应用效率及便捷性,通过提供资讯集成类服务在统一页面中显示用户感兴趣的主要页面,并实现该页面的及时更新,如图6所示。

图6 搜索引擎体系结构框图

1)资讯源作为用户信息调度的兴趣主站点,譬如包括了用户主要关心的站点,供电公司网站、供电系统地调网站等站点,通过设置这些作为实时监测站点,并在每一个站点中实现多URL 信息监视。

2)该系统的更新周期可以以人工设定为主,设定相应的调度平台更新周期后,即可确定是否实时更新相关信息及资讯链接。

3)内容展现。在统一模块中集中向用户展现统一的资讯源信息,并且依照不同的信息发布时长完成排序。

4 平台功能实现

4.1 供电网页搜索

用户在应用该平台中实现的内网搜索功能主要是面向当地供电官网、省级供电调度通讯主页、市级调度中心主页的相关信息搜索,如图7 所示。

图7 站点或基于局域网内部的网页资源的检索系统

4.2 内部文档资料搜索

在电力行业的供电系统平台内部,包含大量文档资料,譬如Word、Office、PDF、TXT 等不同文档资料,具备了大量、复杂化特点,存储于供电内网PC 终端设备中,用户可以通过在该平台搜索关键词来查询所需文档资料,便于用户满足自己的信息资料调度所需。并且该平台还实现了用户名及网址的双重认证,严格保证了用户拥有搜索的权限,与文档保密性要求相符。

4.3 动态搜索

供电公司网站相关要闻检索,能够根据不同用户的应用所需,自主选择需要的相关内容添加至个性化主页中。

4.4 高级搜索

该平台可实现的高级搜索功能,可以满足用户在具体应用中根据自主需求,自定义不同的文件格式、重命名、关键词、日期以及具体的搜索范围。

5 结束语

总而言之,随着供电系统平台功能的逐渐完善,在后续应用中也会不断增加大量电力行业相关图文资料及专业搜索功能,最大化满足用户的搜索数据集成功能需求。

猜你喜欢

数据源搜索引擎异构
试论同课异构之“同”与“异”
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
异构醇醚在超浓缩洗衣液中的应用探索
overlay SDN实现异构兼容的关键技术
LTE异构网技术与组网研究
网络搜索引擎亟待规范
基于真值发现的冲突数据源质量评价算法
基于Nutch的医疗搜索引擎的研究与开发
分布式异构数据源标准化查询设计与实现