基于云安全与深度学习的区域大数据分析方法研究
2021-06-14杨睿
杨睿
(西安职业技术学院,陕西西安 710077)
我国采取了一系列有效的手段积极促进经济发展,促使不同地区发展具有本土特色的经济增长模式。随着知识经济模式的发展,传统的劳动力密集型经济发展模式红利逐渐消失,技术创新型产业已成为我国经济的下一个增长点。因此,对于区域经济准确分析尤为重要。
文中使用区块链技术建立了安全的经济数据共享平台,并基于该平台采用SI-RNN 网络建立了一套大数据的分析系统,最终实现了对经济数据的智能化处理。
1 基于终端的云安全设计
利用图1 所示的主要智能设备,开发基于区块链的云安全系统。
图1 智能设备网络
本地设备或覆盖节点之间的通信称为事件[1]。每个基于区块链(BC)的智能终端均为特定功能而设计,存储交易由设备生成以存储数据,储存在SP中。SP 用于生成监视事件,定期监视设备信息[2]。通过新建交易将新设备添加到智能网络中或通过删除交易将设备删除,所有上述交易均使用共享密钥来保护通信[3]。
1.1 局部区块链
每个智能终端中均有一个本地私有BC,该BC 跟踪交易并具有策略标头,以强制用户执行传入与传出交易的策略。从创世交易开始,每台设备的交易均链接在一起,成为BC 的不变分类帐[4]。本地BC 中的每个块均包含两个头,分别是块头与策略标头。该块头具有前一个块的哈希,以保持BC 不可变。策略标头用于对设备进行授权并强制所有者对其执行控制策略[5],策略标头具有4 个参数,请求参数用于覆盖交易中的请求者信息,对于本地设备而言,此字段即为设备ID。策略标头中的第二列数据用于指示事件中请求的操作,其可以是本地存储数据、云存储数据或者是特定设备的实时数据。策略标头中的第三列数据是智能终端的ID,最后一列数据为与先前属性匹配的执行操作。
除BC 标头外,每个块还包含众多事件。每个交易均有5 个参数存储在本地BC 中[6],前两个参数用于链接同一设备的交易,且唯一标识每个交易。
1.2 终端服务器
智能终端服务器是一种集中处理与智能终端之间的来往交易设备。该服务器可以与网关或独立设备集成,可放置在设备与网关之间[7]。智能终端服务器类似于现有的中央安全设备,服务器对交易进行认证、授权与审计。
2 网络安全关键技术
在建立的网络基础上,使用图2 给出的区块链操作流程保证网络内部设备与数据的安全。
图2 区块链操作流程
2.1 授权流程
授权流程的第一阶段中,智能终端创建一个智能合约并将其发布到区块链。在第二阶段中,请求访问受保护资源的客户端,通过将交易发送到合同地址来激活相应的智能合同。
授权流程的第三阶段中,合同交易区块已添加到区块链,动态令牌已添加到合同内部存储。客户端从密钥服务器请求解密资源所需的加密密钥,密钥服务器具有区块链的副本,负责查询访问令牌。为了验证客户端的真实性,密钥服务器根据令牌中引用的客户端地址创建质询响应,只有触发智能合约的合法客户才能访问数据。为防止临时区块链分叉出现问题,密钥服务器必须在令牌块之上构建N个区块(N是安全性参数)。
在授权流程的第四阶段中,客户端可以从代理服务器或直接从资源服务器下载加密的资源。资源服务器提供了RESTful CoAP API,该API 允许含有统一资源标识符(URI)的终端获取、储存与发布资源。当直接从资源服务器获取受保护资源时,可以使用对称密钥来保护资源的完整性。
2.2 智能终端管理
为了方便授权与撤销客户端,密钥服务器定期发布新的加密密钥,令牌有效期为一个月。密钥服务器每日将新的密钥分发到资源服务器,资源服务器始终使用最新的密钥来加密新资源。
客户端的令牌可以有效保证,其每天从密钥服务器中恢复新密钥。当令牌过期时,客户端必须在区块链上重新运行智能合约,以生成新的有效令牌并获取密钥的访问权限,如图3 所示。当客户端行为不当时,授权服务器通过添加交易块,从智能合约内部存储服务器中删除客户端访问令牌。
图3 区块链令牌寿命
3 经济数据分析系统设计
文中选取循环卷积神经网络模型(RCNN)并使用经济新闻文章与技术指标作为输入,来预测经济时间序列中的日内运动方向[10],称为SI-RCNN[11]。
3.1 输入层
如图4 所示,SI-RCNN 模型使用两种类型的输入,第一种是经济技术指数,第二种是经济消息序列[12]。为了区分两者,将输入层重命名为技术指数层与嵌入层[13]。
图4 SI-RNN
技术指数层以按时间顺序排列的7 个经济技术指标的延迟序列作为输入,输入定义为矩阵I∈ℝ7×n。其中,n是延迟窗口的长度。
嵌入层将经过编码的文本序列作为输入,该序列对应从时间t开始,按时间顺序排列的L个经济消息标题集。句子的编码分两个步骤执行:首先使用Word2vec 模型生成单词嵌入,此嵌入是训练语料库中每个单词长度为m的连续向量[14];第二步计算标题中所有单词向量的平均值,获得整个标题的唯一向量,称为句子向量。为遍历访问这些句子向量,使用热编码的方法对数据集中的每个标题进行编码,最终创建完成一个嵌入列表。
3.2 卷积层
卷积层由4 个连续的操作组成:卷积、子采样合并、激活与退出。在这项工作中,本次设计的卷积算符为一维卷积,也称为时间卷积,可以通过组合句子向量获取局部信息[15]。
随后应用时间最大池化,此操作可以捕获序列中最重要的信息。
最终为了将非线性引入模型,使用整流器线性单元作为激活函数,如式(3)所示。
由于该层涉及大量参数,模型容易出现过拟合,因此使用概率p=0.5 的Dropout 正则化技术。
3.3 循环层
使用两个单独的循环层,分别在卷积层前后,以便将卷积层的输出解释为一系列L+R+1个时间步长;其次是技术指标层。在两种情况下,RNN均可以对输入序列中的时间特性进行建模。
LTSM 流程,如式(4)~(9)与图5 所示。其中vt是循环层的输入,ht是循环单元的输出,W是权重矩阵[16]。
图5 LTSM流程
3.4 输出层
最后,模型使用传统的完全连接层作为输出层,并将Softmax 作为激活函数,其输出结果为标签上的概率分布。
4 实验结果
使用本次建立的RCNN 经济分析模型,搭载在云安全终端网络下进行系统实验。使用某地区一年的水体大数据,对其与经济发展之间的关系、影响进行分析和统计。表1 为该地区对外直接水资源投入的行业分布数据。
表1 某地各行业用水统计
如表2 所示,在7 个需求中包含的总水量为3.48×109m3,城镇居民生活用水量最大(1.42 km3),占总用水量的40.91%,其次是向其他国内地区的流通用水量(0.71 km3)。固定资本形成、政府消费与向国外出口所体现水的价值几乎相同,约为4.00×108m3。出口的水总量为31.85%,家庭用水(农村与城市用水)占总量的43.65%,其中城市居民用水(1.42×109m3)远高于农村居民用水(0.95×109m3)。
表2 需求类别统计
从产业划分角度看,第二与第三产业占出口用水的大部分(第二产业占37.17%,第三产业占54.63%);而第一产业中的水量较小(8.20%)。在第一产业中,出口到国外的水约占总量的99.33%,远高于国内。由于该地区在中国高科技产业中的重要作用,第三产业向国内其他地区的出口比重较大。与国家统计局的经济分析结果进行对比,如表3 所示。
表3 经济分析结果对比
表3 数据可知,由于农业数据来源不可靠、实时性较差,因此准确率较低,而系统对信息化程度较高的第二、第三产业分析准确率可以达到99.5%以上。
5 结束语
为建立起安全、可靠的经济数据共享网络,该文使用常用设备架构了智能终端网络,采用区块链技术建立了安全的数据传输网络,保证了设备的稳定运行。使用SI-RNN 网络建立了大数据的分析方法,支持研究者对区域经济的分析管理。而如何提高数据识别网络的泛化能力,支持更多的经济数据模式分析将是未来研究的重点。