APP下载

基于态势感知的电力专利数据自动分类方法研究

2021-04-30蔡榕周长江祝和明王存超郭晏

电子设计工程 2021年7期
关键词:态势类别准确率

蔡榕,周长江,祝和明,王存超,郭晏

(国网江苏省电力有限公司,江苏南京 210000)

目前,我国的专利分类主要分为3 种,分别为发明、实用新型、外观设计3 种。我国电力领域的电力专利数据也可分为以上3 种类别,其中发明类别是指电力产品制造、电力方法运用的电力专利数据[1-3];实用新型类别是指电力产品的形状、构造以及电力方法运用具有突破性改进的电力专利数据;外观设计类别则是指电力产品通过外观、图案、色彩相结合变得富有美感并可加以运用的电力专利数据,国外针对电力专利数据的整体分类与我国大致相同,但都存在着人工分类缓慢、自动分类易错的现象,尤其是面对复杂数据群时,传统方法的弊端凸显得更加明显。

基于态势感知理念设计了一种电力专利数据自动分类方法,该方法可以通过对我国电力专利大数据网的数据分别进行提取与分析,达到未来态势分析、自动分类计划制定、合理自动分类的目的。受目前电力专利数据复杂程度的影响,可将态势感知分为基础感知与综合感知两个层次,从不同层次分类数据群,从而提高分类结果的准确率。

1 基于态势感知的电力专利数据自动提取

电力专利数据是电力领域知识与技术信息的载体,也是该领域创新活动的直接体现[4]。将我国的电力专利数据进行归纳,如图1 所示。

图1 电力专利数据归纳图

以上3 种电力专利数据构成了我国的电力专利大数据网,而首先要做的就是通过态势感知理念对电力专利大数据网中的电力专利数据进行自动提取,这属于态势感知中的基础感知层次[5]。

在进行态势感知的过程中,通过式(1)对电力专利数据进行提取计算:

其中,V表示通过相关合法渠道获得的电力专利数据组,N表示V的通用代入项,P表示我国授予的电力专利数据官方证明承认数据组,T表示各专利数据所提交的对应时间,经过计算得到的L则为该文通过态势感知理念相关公式计算得到的相关电力数据组,这些数据组经过加工后具有的独特性与专有性不会发生改变,但是却可以变为能够应用态势感知理念分析分类的感知识别组,方便接下来的应用[6]。

2 基于态势感知的电力专利数据自动分析

在对提取的能够应用态势感知理念分析分类的感知识别组进行分析之前,将L划分为A、B、C3 组数据。需要对态势感知进行多维设计,主要可分为“处理元”、“分析元”、“计划制定元”,三者彼此之间应用pige 数据传输管道进行单元数据传输联系[7]。

“处理元”主要负责处理感知识别组A、B、C的数据,在这一过程中,“检测元”首先会对这些电力专利数据进行来源标记,即这些电力专利数据组的所属来源分别为a1、a2…an,b1、b2…bn,c1、c2…cn,然后对这些电力专利数据组进行统一打乱与合并,形成大数据组L,并交由“分析元”处理[8]。

“分析元”并不会对这些电力专利数据的来源即专利数据拥有者予以关注,它只负责通过态势感知理念对这些电力专利数据的类别进行计算,以分析这些电力数据究竟属于发明、实用新型、外观设计哪一种类别[9],类别计算公式如下:

其中,S为“分析元”分析数据所应用的专属单元,X、Y、Z则为经过“分析元”具体分析后得到的电力专利数据3 类小组,它们分别对应发明、实用新型、外观设计3 种类别归纳数据组[10]。类别归纳数据组X、Y、Z与感知识别组A、B、C的关系归纳图如图2 所示。

图2 关系归纳图

在得到具体的3 种类别归纳数据组即X、Y、Z后,“分析元”会将这些数据组递交给“计划制定元”处理[11]。

“计划制定元”在接收到电力专利数据的发明、实用新型、外观设计3 种类别归纳数据组后,会查看各数据组中电力专利数据的来源标记,来确定它们的来源,再通过态势感知理念从未来态势角度进行分析,最终得到具体的自动分类制定计划[12]。基于态势感知的电力专利数据自动分析的具体流程如图3所示。

经过分析后得到的自动分类制定计划也是该文研究的基于态势感知的电力专利数据自动分类方法接下来进行自动分类的主要依据[13]。

图3 电力专利数据自动分析具体流程图

3 基于态势感知的电力专利数据自动分类

自动分类制定计划中主要包括了各电力专利数据的具体来源、自动分类建议、未来态势分析3 项数据,在得到自动分类制定计划后,首先需要基于态势感知理念对自动分类制定计划中各电力专利数据的3项数据即具体来源、自动分类建议、未来态势分析进行整合[14]。在态势感知理念下,将上述电力专利数据分别归纳成数据组M、N、K,并通过式(3)进行计算:

其中,G为人为介入的客观因素,主要为在电力专利数据自动分类过程中需要满足的具体要求,该因素会对电力专利数据自动分类增加一定的限制,但不会干扰该文对态势感知理念的运用,在经过计算后得到的数据组m、n、k即为最终的自动分类制定计划,在该过程中,自动分类制定计划中的原数据M、N、K与经过计算后得到的数据组m、n、k的数据形态对比图如图4 所示。

图4 原数据与最终数据组的数据形态对比

在电力专利数据自动分类过程中,根据通过态势感知理念获得的自动分类制定计划对电力专利数据类别归纳数据组即X、Y、Z进行最后的分析与解读,并依据态势感知理念通过sqoop 抽取技术对X、Y、Z中的电力专利数据进行数据抽取,然后通过pige数据传输管道传输到各自的类别归纳空间x、y、z中,完成电力专利数据的自动分类[15]。文中所应用的sqoop 抽取技术可以在不破坏类别归纳数据组X、Y、Z中的其他电力专利数据组的前提下完成对针对性的电力专利数据的单一抽取,具有极高的稳定性与针对性,而最终的类别归纳空间x、y、z则由HDFS 海量数据集成技术作为支撑,可以满足大量电力专利数据的类别归纳存储条件[16-17]。

4 实验研究

为了检测文中研究的基于态势感知的电力专利数据自动分类方法的实际应用效果,选用传统的电力专利数据分类方法和文中研究的方法进行对比实验,利用Linux 算法对两种方法进行测试,对比两种方法对电力专利数据分类的准确性以及工作效率。

为满足实验目的,文中设计实验环境包括数据提取、数据分析、数据分类3 个单元,3 个单元间通过pige 数据传输管道进行数据传输,其中数据为已知数据,当系统开始运行时,首先对电力专利数据进行提取,然后进行分析,最后进行分类,得出分类结果,采用Linux算法可以计算出两种方法在3个单元的工作时间以及工作结果,可以直观地对比出两种电力专利数据分类方法的准确性以及工作效率。

针对基于态势感知的电力专利数据自动分类方法的复杂性,需对其进行实验参数的设置,实验参数如表1 所示。

表1 实验参数

4.1 分类准确率对比

根据上述实验参数,在设置的实验环境中进行对比实验,利用Linux 算法计算出文中研究的基于态势感知的电力专利数据自动分类方法和传统的电力专利数据分类方法的分类准确性,首先在电力专利数据环境中投入10 组电力专利数据,得到的分类准确性对比如图5 所示。

图5 分类准确率对比图

由图5 可以看出,在对10 组电力专利数据的自动分类过程中,文中研究的基于态势感知的电力专利数据自动分类方法对电力专利数据的分类准确率较高,自动分类准确率在90%以上,而传统的分类方法由于误差较多,整体的自动分类准确率在80%左右。

上述实验证明了电力专利数据环境中投入10组电力专利数据的情况下,文中研究的基于态势感知的电力专利数据自动分类方法对电力专利数据的分类准确率较高。

4.2 分类效率对比

我国电力专利数据的数量十分庞大,因此该文接下来在电力专利数据环境中投入500 组的电力专利数据后,应用文中研究的自动分类方法与传统方法的分类准确率对比如图6 所示。

图6 自动分类效率对比图

从图6 可以看出,无论是在电力专利数据环境中投入10 组电力专利数据还是500 组电力专利数据,文中研究的自动分类方法对电力专利数据的自动分类准确性都始终在90%以上,而传统方法在对500 组电力专利数据进行分类的准确率却已低于50%。造成这种对比结果可能有以下几种原因,文中研究的分类方法能够对电力专利数据进行详细深入的分析,应用态势感知进行“检测元”、“分析元”、“计划制定元”等多维设计,经过深入分析的数据使系统能够准确将数据进行分类,使得对电力专利数据的分类准确率变得十分准确,而传统的电力专利数据方法对数据的分析不够全面,使得分类时界限相对模糊,从而影响数据分类准确率。

5 结束语

对基于态势感知的电力专利数据自动分类方法进行了深入研究,对基于态势感知的电力专利数据自动提取、自动分析和自动分类过程进行了详细介绍,并针对其准确性,选用传统的电力数据分类方法进行对比实验,根据实验结果可知,文中研究的方法具有较高的准确性,能够有效弥补传统方法的缺点,更适用于电力专利数据的分类。

猜你喜欢

态势类别准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
我国天然气供需呈现紧平衡态势
高速公路车牌识别标识站准确率验证法
壮字喃字同形字的三种类别及简要分析
服务类别
县乡一体化探索呈加速态势