APP下载

可视化客户安全用电智能分析辅助决策系统研究

2022-09-26叶泳泰

农村电气化 2022年9期
关键词:工单分词关联

叶泳泰

(广东电网有限责任公司惠州供电局,广东 惠州 516001)

1 国内外研究情况

如何划分用户安全用电等级,规范用电等级、用户用电信用等级等分析,对有隐患的用户系统告警提示,为运维人员用电检查提供选择依据,防止安全事故的发生,是智能安全用电分析重点关注的内容,智能用电安全分析可能会直接影响电网的能源使用效率、经济运行和有序用电情况。

1.1 国外对安全用电的研究情况

目前国外研究机构在满足提高电网运营效率、改善供电服务质量等需要的前提下,陆续地开展智能用电服务的研究和实践。研究成果大部分在配电和用户侧实施,这也与国外当前智能电网发展的大气候吻合的。其中由于电力用户数量非常庞大,由智能电表产生的很多数据分析成为了当前电力公司与研究人员所面临一个重要挑战。Erte Pan 对休斯敦地区智能电表收集的电力大数据情况进行了分析。通过对数据负荷特性的研究更好地理解用户的安全用电行为。除此以外,通过数据的无参数聚类和内核PCA分析,对用户如何更有效地用电给出了全面的指导性意见。

1.2 国内研究机构对本项目的研究情况

目前国家电网与南方电网对用电检查业务的支撑,主要来自营销系统的功能建设,实现周期检查计划管理、周期检查执行管理、专项检查计划管理、专项检查执行管理、客户事故调查、违约用电查处、窃电查处等功能,支撑用电检查的日常管理工作的常态化开展。大量的用电信息和其他方面的信息资源都来自平时的用电检查工作,工作人员在详细检查及记录供电质量情况和客户反馈信息经过长时间的积累形成了海量的用户用电信息资源,这些信息的处理及分析,则需要使用处理程序及其应用系统的信息处理功能,构建检查信息数据的存储库,利用应用系统所提供的查询和检索等功能来正确使用信息资源。

目前,南方电网暂无辅助系统可以支持用电检查人员对用户进行用电风险的综合评价,包括评价用户的日常用电情况,用户用电信用情况,用户是否存在窃电、违约用电情况等。难以给用电检查人员提供对日常用检工作具有针对性的对象范围,无法第一时间对安全隐患的设备进行检查、处理。

2 安全用电智能分析主要技术方案

2.1 技术关键点1:用户用电安全评估模型构建

在大数据安全用电分析决策的场景下,很多关联并不像传统方法中这么强,有很多指标特征是弱关联,相互有关联但是彼此之间并不是那么直接。本项目基于广泛的数据来源,运用先进的数据处理和算法技术,研究在传统评估方法基础上重点将多个弱关联特征联合在一起转变成较强的预测评估变量,并运用多算法融合的方式构建用电安全评估模型,判断客户用电过程是守约还是违约。如图1所示。

图1 用户用电安全评估模型构建

2.2 技术关键点2:用电检查工单文本解析技术

在用电检查执行过程形成的工单包含具体检查内容与结果等非结构化的文本数据,对于用检安全等级评估以及潜在安全隐患的预判都有较为重要作用,以往受限于非结构化数据处理技术无法有效支撑分析场景的实现造成这部分文本数据处于静默状态。

用电检查工单文本解析技术的应用,成为用电安全风险评估、潜在隐患预判以及用电检查方案生成流程自动化的关键技术。文本解析指文本内容的精准识别与解析,其目的是通过文本解析,实现对用电检查工单中描述用电状态、设备属性、用电检查结果等信息的结构化翻译与描述。

用电检查工单文本解析的核心技术路线为:依托自然语言处理技术对用电检查工单中的非结构化文本内容进行结构化处理,运用分词算法、通过词性标注等算法构建用电检查工单文本智能解析模型,实现对用电检查工单内容的精准细分。如图2~4所示。研究技术细节包括:

研究构建用电检查业务领域的专业基础文本词库。

分析通用词库以及海量用电检查工单历史记录,利用人工标注+自动切词算法实现词库的扩展,构建用电检查专业文本词库。

依托专业分词技术,训练形成可识别的用电检查专业短语。

研究融合词典分词、统计分词以及深度学习分词等算法构建用电检查工单文本的自动分词复合模型,实现专业词、短语、长短句的识别与拆分。

词性分析与标注研究。研究运用规则方法、统计方法以及无监督学习方法结合深度学习算法构建词性标注融合模型,实现用电检查工单文本的精准标注,为后面更高层次的文本处理与分析提供数据资料。

图3 构建词性标注融合模型

图4 用检工单文本内容分类方法

对用电检查工单文本内容进行分类研究,基于文本特征的表示构建特征空间,并进行特征的转换与降维;构建多算法融合的分类模型,自动分配预先定义的类别标签。

本项目研究的文本解析技术,是一种结合深度学习算法的高级分词模型,通过以词向量作为初始输入,在准确刻画词语之间的相似度信息的同时,持续提升词性标注结果。传统的词性标注方法特征的抽取过程主要是将固定上下文窗口的词进行人工组合,而深度学习方法则是可以自动利用非线性激活函数完成相关目标。本研究结合循环神经网络,如双向LSTM,抽取到的信息不再受到固定窗口的约束,而是会考虑到整个句子。

在本项技术研究过程中,将采用先进分词技术与用电检查工单海量数据相结构,逐步实证与词汇标注的方式,螺旋式提升文件解析模型的准确性与有效性。

2.3 关键技术3:安全用电风险与隐患多维关联知识图谱

利用知识图谱技术对安全用电风险与隐患评估体系和客户关系分别进行图谱化还原,以网络图的方式客观呈现用电安全风险评估过程以及影响关系的全貌,根据行业、企业和人之间的关系,形成企业/个人的关系图谱,以利于关联分析及风险控制。关系图谱是将数据全量客观有效呈现向业务层面全过程客观有效呈现的跨越,可有效指导客户进行关联分析与探查。

用电安全知识图谱运用人工智能、信息可视化技术等理论和方法,依托用电检查数据、客户用电行为数据、用电设备数据等,通过用电安全特征分析、用电安全因素,对可能的用电安全风险进行判别、预警,高效地控制用电风险,降低违窃以及用电事故发生率。用电安全知识图谱技术先进且具有极强创新性与通用性,在公司范围内尚属于空白领域,具有广阔的应用市场与前景。如图5所示。

图5 多维关联知识图谱

2.4 关键技术4:基于时空大数据的安全用电风险云图技术

当前,用电客户有潜在安全用电关联风险特征,即某一客户出现问题、风险或危机,将沿着各种关联关系传导到其他关联客户,直至传染到整个关联客户群,从而形成多米诺骨牌效应。

本项目研发的风险关联云图,是基于三户模型泛化,通过分析挖掘经营、结算等关系揭示企业之间的关联内容,基于风险种子的风险传播,评估地域、行业、产业链、企业群、企业、个人等多种维度的关联风险,揭示错综复杂的客户关联关系及风险。

2.5 项目创新点

基于人工智能分类算法,融合海量多维度客户用电数据,实现用电风险的智能感知与识别;构建安全用电风险与隐患多维关联知识图谱,实现潜在安全用电隐患识别和预判;运用RPA(流程自动化机器人)技术,实现用电检查计划方案的自动化生成;运用时空大数据可视化技术,构建安全用电风险云图,实现用电检查的全景可视化。

3 项目预期效益

实现对全量客户进行实时智能用电风险评估、预警及可视化展示,根据风险评估结果,提出用户用电检查计划及专项检查计划建议方案,根据预警情况提出现场用电检查建议方案,确保对用户的用电行为及早预控管制,排除用电风险,消除安全隐患,降低供电企业经营损失风险。

项目完成研发及整体验收后,先在惠州区域内对全客户开展用电安全风险评估及结果应用,减少窃电或违约用电发生,同时可有效防范并降低用户故障出门次数。本项目具有很好的推广意义和前景,可在广东电网、南方电网乃至全国推广应用。

猜你喜欢

工单分词关联
客服工单监控技术的开发与研究
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
高职院校计算机类专业“工单制”教学的研究与探索
基于RPA技术的机器人在配网调度工单发布工作中的应用
分词在英语教学中的妙用
“一带一路”递进,关联民生更紧
结巴分词在词云中的应用
结巴分词在词云中的应用
基于分布式数据库Cedar的高效工单管理系统设计与实现
奇趣搭配