APP下载

基于数据挖掘和区块链技术的碳排放信息定向提取模型

2023-09-28陈小鹏

工业加热 2023年7期
关键词:同态加密算法定向

陈小鹏

(国网山东省电力公司滨州供电公司,山东 滨州 256600)

碳排放信息可以为分析温室气体气候变化,进而调整降低碳排放量提供帮助[1-3],研究碳排放信息定向提取具有重要意义。

许多相关学者对信息定向提取展开研究,如王一洲等[4]采用密度统计的方法,根据信息结构特征对信息进行聚类,完成信息提取,但在面向大规模信息时具有局限性。如延安等[5]通过概念运算,获取提取规则,但运算量较大且过于复杂,不具有全面性。

数据挖掘是用一种方法,从海量的数据中寻找隐藏的信息。区块链技术由分布式信息存储、传输、加密算法等计算机技术构成。加密算法包括对称和非对称加密算法,区块链中一般采用非对称加密算法。

为此本文有效结合数据挖掘和区块链技术提出一种定向提取碳排放信息的方法,在定向提取信息时,信息集属性之间是相互独立的,具有较高的稳定性,可以处理多分类的信息,算法简单,且具有普遍性,在信息有不同特征时,其性能不会出现大的不同。

1 碳排放信息定向提取模型

在设计碳排放信息定向提取模型时[6],主要从碳排放信息的使用、管理、安全性设计模型,在模型设计时,考虑数据传递、储存,运用区块链技术完成传输加密处理。本文采用MapReduce计算模式下朴素贝叶斯提取信息及同态加密的计算方法实现碳排放信息的提取和加密传输。碳排放信息定向提取模型结构如图1所示。

图1 碳排放信息定向提取模型结构

碳排放信息来源于工业碳排放及碳排放绩效信息[7],构建碳排放信息库,通过数据挖掘技术对碳排放信息定向提取,运用区块链进行加密传输,最终碳排放信息传输到碳排放信息管理网络,与管理者及用户实现信息交互。

1.1 碳排放信息获取

1.1.1 工业碳排放信息

工业碳排放信息由能源活动及生产的碳排放信息构成[8],工业能源活动碳排放计算公式为

Hind-energy=∑Gi×∑HGi

(1)

(2)

工业生产碳排放Hco2计算公式为

(3)

1.1.2 碳排放绩效信息

碳排放绩效信息的获取涉及多种指标,本文选取能源结构、经济结构等指标评估获取碳排放绩效信息。权重作为表述所有碳排放绩效指标重要程度的变量[9],可表达出所有指标重要程度差异,因此为获取碳排放绩效信息,提出熵值法,通过全部碳排放绩效指标传输到管理者的信息量确认权重,信息熵是碳排放绩效不确定性的度量,基于信息熵理论,熵值越小时,表示碳排放绩效信息量和管理时的作用越大,其权重也越大。

设碳排放区域有n个,指标为m个,正向指标和逆向指标分别描述碳排放的综合评价结果越好对碳排放绩效的正效影响和负效影响越大,碳排放数据运用极值法标准化处理,减少指标不同单位的影响。碳排放绩效指标矩阵如表1所示。

表1 碳排放绩效指标矩阵

(i=1,2,…,n;j=1,2,…,,m)

(4)

(i=1,2,…,n;j=1,2,…,m)

(5)

第j项指标在第i个区域在该指标所占的比重计算公式为

(6)

式中:Yij为碳排放绩效指标;Sij为其所占比重;第j项指标的信息熵用bj表示,表达式如下:

(i=1,2,…,n;j=1,2,…,m)

(7)

运用熵值方法确定权重,权重vj计算公式为

(8)

线性加权求和公式表示为

(9)

综上可知计算权重流程如图2所示。

图2 权重计算流程图

1.2 碳排放信息的定向提取

根据工业碳排放信息和碳排放绩效信息构建的碳排放信息库,提出朴素贝叶斯定向提取的方法[10-11],获取碳排放信息待分类定向数据及其分配概率,实现碳排放信息的定向提取。对碳排放定向信息到最大分类概率的类别进行划分,完成碳排放信息定向提取。

设碳排放信息类别F1,F2,…,Fm,类别的数量用m表示,所有碳排放信息相应属性数量用n表示,定向碳排放信息可用n+1维碳排放信息属性向量R表达,定向碳排放信息R表达式为

R={r1,r2,…,rm,F}

(10)

待分类定向碳排放信息R′从属于类别Fi的结果,满足条件表述为

W(Fi|R′)|>W(Fj|R′),1≤j≤m,j≠i

(11)

对W(Fi|R′)进行最大化处理,令R′属于Fi的概率比其余类别高,处理公式表示为

(12)

式中:W(R′)为常数;W(Fi)推算公式为

(13)

W(R′|Fi)推算公式为

W(R′|Fi)=W(r′1|Fi)×W(r′2|Fi)×…×

W(r′n|Fi)

(14)

式中:数据库A里的类别为Fi的训练元组数用|Fi,A|表示。

如W(r′k|Fi)为计算目标,对其属性ηk进行判定,在ηk处于离散状态时,W(r′k|Fi)为属性取在r′k的Fi类别元祖数量和全部定向碳排放信息Fi的元组数量的百分比,在ηk是连续状态下,遵循高斯分布,其均值和标准差分别用λ及γ表示,W(r′k|Fi)界定表达公式为

(15)

式中:e为指数函数,依据以上求解的最大概率类别,完成碳排放信息的定向分类及提取。

Map和Reduce函数并行推算下进行朴素贝叶斯定向提取,Main和Reduce函数描述如下:

Map函数:定向信息id号和传输内容分别是key和walue,熟知信息集里的定向信息及其属性,如属性属于离散型,把定向碳排放信息类别的属性取值数量求和,若属于连续型,求解属性取值总和及平方和,当前分片经过遍历、统计,将所得的定向提取信息结果进行输出。

Reduce函数:获取Mapper的临时提取信息,对离散型统计结果进行整理,得到概率,对于O个定向信息的连续属性,如为平方和,利用以下公式求加属性均值和标准差,计算公式分别为

(16)

(17)

对项目进行统计,对MapReduce程序输出最终碳排放信息定向提取结果。

1.3 区块链同态加密传输

根据1.2的提取到的碳排放信息,在信息传输过程中加入区块链技术,区块链技术是一种利用分布式的数据储存方法来进行信息的处理[12],并通过点到点传输、共识机制、加密算法等方法来完成信息的处理与运用。在本文的设计中,使用区块链实现一个分布式的、没有人管理的信息库,其使用与传统的管理员信息管理方法有很大的不同;将此技术用于定向提取碳排放信息的传输,节约大量的人力、物力。在区块链技术中,引入一种加密算法,完成碳排放信息的加密和解密,如图3所示。

图3 区块链加密流程图

利用同态加密算法实现碳排放信息加密[13-14],加密信息是以文字与数字构成的记忆词,使用者只有透过固定的记忆词,方可获得登录密码的数据。在加密时,利用解密进行运算,得到密码信息。碳排放信息加密与解密处理时,对碳排放信息释放进行设置,将释放的信息置于内存空间中;在实际使用时,它是以malloc功能为基础,随着内存的增大,碳排放信息被释放,在释放时,malloc调用时,获取空闲空间,按照使用者的要求进行下一阶段的输出。它所能提供的信息的数量与所能提供的存储空间是一样的,所以它能有选择地加密信息。

区块链技术将定向提取的碳排放信息利用同态加密方法传输给管理网络[15],保证传输信息的准确性,在Map函数分布计算中,不能将Mapper信息交互,用最终生成的中间结果,保证信息定向提取的独立性,将定向提取的碳排放信息运用同态加密进行推算,利用代数推算,在相同的明文情况下操作信息代数,完成加密碳排放定量提取的信息。把同态加密全过程设置成JK,加密过程通过生产密钥、加密、解密及信息评估共4个环节构成,4个环节分别表示为:KG、Enc、Decc及Eval,加密过程为

JK=(KG,Enc,Dec,Eval)

(18)

若AK和BK私钥相互作用产生信息安全参数,私钥分别应用加密及解密密文。设置明文U∈Sn,n表示整数,Sn表示整数的集合。把明文U的同态加密用Xod(ι)表示,推算公式为

Xod(ι1+ι2)=Xod(ι1)⊕Xod(ι2)

(19)

式中:ι1、ι2为碳排放信息。

以上公式为碳排放信息的加密传输,传输完成后开展信息解密,利用私钥解密密文υ,解密结果σ表示为

σ=Dec(υ,AK)

(20)

最终,评估解密结果完成碳排放定向提取信息的加密传输。若评估函数为ψ,密文设置为υ,评估密钥用φ表示,评估算法运用φ的评估函数ψ开展评估,形成评估密文L,评估密文公式表示为

L=Eval(φ,ψ,υ)

(21)

基于以上公式,完成碳排放信息的同态加密传输,实现信息安全传输及保证信息的精准传输。

利用以上过程对碳排放信息加密处理,确保定向提取碳排放信息的正常传输,在信息传输过程中,加入IoT设备,运用不对称加密的公钥,把公钥信息设置为129字节的加密信息。利用同态加密的路径传输到Raft集群中,且对公钥信息进行保存,利用私钥解密,获得ID号,连接信息防止缓存中及本文区块链,完成信息传输。

2 实验分析

以某地区碳排放管理中心为实验对象,其中包含abalone、covtype、Data1和Data2四种碳排放信息集,采用本文方法在不同信息集下定向提取碳排放信息。碳排放信息集数据见表2。

表2 实验数据

设置集群节点数分别为2、6、10、16个,在不同集群节点数量下,测试本文方法的从不同碳排放信息集中定向提取碳排放信息的速度,测试结果如图4所示。

图4 碳排放提取时间变化图

由图4可知,集群节点数量不同情况下,碳排放信息集abalone、covtype的定向提取时间整体变化波动不大,整体表现为平稳趋势,原因在于这两个碳排放信息集数据量较小,信息定向提取效率受集群节点数量影响较小;碳排放信息集Data1和Data2的定向提取出时间受集群节点数量影响较大,集群节点数量越多提取效率越快。实验证明本文模型在大规模的碳排放信息定向提取效率方面具有明显优势。

为验证本文模型定向提取碳排放信息的加密效果,以从Data2碳排放信息集中提取的包含的A、B、C、D、E及F区域的定向碳排放信息为实验对象,6个区定向提取的原始信息如表3所示,用本文模型同态加密结果如表4所示。

表3 6个区定向提取碳排放信息的原始数据

表4 6个区定向提取碳排放信息加密结果

由表3和表4可知,本文模型应用后,可实现6个地区的碳排放信息数据的加密处理,6个区所有碳排放量数值中间两位显示为*,未出现定向提取碳排放信息的加密遗漏现象,可有效保障定向碳排放信息输出安全性。实验结果表明,本文模型对碳排放信息的加密效果好,可保护碳排放信息的安全传输,避免出现在传输过程中碳排放信息泄露的现象。

在企业碳排放信息管理系统中,用本文模型定向提取某地区企业每年的碳排放申报信息,如图5所示。

图5 企业碳排放信息提取结果展示

由图5可知,提取某地企业从2016年—2022年碳排放申报信息。填报类型分为初次填报和核查申报,2016年—2019年的填报状态均已审核通过,2022年的已填交状态,可编辑操作。

将文献[4]方法、文献[5]方法作为本文方法的对比方法,测试三种方法在数据量不同的情况下,进行数据挖掘时所需的时间,分析结果如图6所示。

图6 三种方法的对比结果

由图6可知,随着数据量的增加,三种方法完成挖掘所需时间随之增加,但本文模型数据挖掘过程的所需时间始终小于两种对比方法,当数据量数量达到20 000个时,本文方法的挖掘时间仅为330 ms,数据挖掘效率高。

3 结 论

本文研究数据挖掘和区块链技术的碳排放信息定向提取模型,设计碳排放信息定向提取框架,依据采集到的工业碳排放及碳排放绩效信息,构建碳排放信息库,利用大数据技术中的朴素贝叶斯的方法对信息库的信息进行定向提取,在提取传输信息时,利用同态加密方法保护碳排放信息传输的安全性,定向提取速度快,适用于大规模的碳排放信息提取。在区块链中利用同态加密算法进行传输数据加密,可有效确保碳排放信息安全传输。

猜你喜欢

同态加密算法定向
关于半模同态的分解*
拉回和推出的若干注记
偏序集上的相对定向集及其应用
定向越野
一种基于LWE的同态加密方案
HES:一种更小公钥的同态加密算法
基于小波变换和混沌映射的图像加密算法
Hill加密算法的改进
定向驯化筛选耐毒酵母
对称加密算法RC5的架构设计与电路实现