基于大数据特征的深度计算评估模型算法设计与研究
2018-10-22唐新宇陈晓明
唐新宇 陈晓明
摘 要:本文重點探讨深度计算评估模型的算法设计原理,从模型构建与程序开发两方面做出研究,结合大数据学习特征,探讨计算评估模型建立的主体方向。并以具体算法应用为例,对设计构建内容进行整理,帮助提升大数据环境下的信息资源更新获取效率,为深度计算评估模型算法应用提供技术参照。
关键词:大数据特征学习;深度计算;评估模型
中图分类号:TP301 文献标识码:A
文章编号:2096-1472(2018)-07-39-03
1 引言(Introduction)
大数据分析环境下,计算机软件程序所面对的信息处理任务量较大,数据处理面向信息更新所开展,但在一些软件使用中也需要对历史参数进行保留,用于接下来的软件自我检测维护。实现参数自我保留功能,需要在原有的历史数据模型基础上,对数据进行更新计算,增量性数据分析计算模型是当前比较常用的一种方法[1]。应用增量深度计算模型,能够在原有数据库基础上自动构建出新的数据库,并对内部信息进行编码补充,这一系列任务均在网络环境中自动完成。同时增量式数据处理模型也能够适应大数据网络环境下的信息获取特征,在资源获取,以及请求对接方面更具有实效性,更新后的数据资源库,在信息自动获取方面并不会产生冲突,而是能够以一种融合的方法共同存在处在应用软件中。当程序软件使用中需要对历史数据与更新后的数据进行调动时,内部数据库则会自动做出匹配,将所需数据通过传输局要发送至程序控制中心,常规状态下历史数据与更新后的数据是相互独立保存的,由此可见该用方法具有极强的信息审核时效性,应用在大数据分析环境下对模型自动更新,以及数据信息自动检索都有极大的帮助。
2 大数据特征学习中的增量式计算模型基础构建
2.1 增量式计算评估模型中的参数更新
大数据特征学习环境下开展深度计算评估模型建立,首先需要对参数更新部分进行设计。增量式计算评估模型中,采用历史信息保留同时更新新的数据资源模式,在此基础上所开展的参数更新部分模型设计,需要先对历史保存功能进行构建[2]。历史数据与更新数据应该存储在两个独立的数据库中,增量式计算评估模式运行中威保障最高计算速度,数据库划分结构也要尽可能的简便,通过这种方法来降低检索任务量。自动编码机的第一层通过编码函数f将输入层数据X映射到隐藏层特征h:
计算公式中Sf为一个非线性激活函数,常用的激活函数为Sigmoid函数,即f(z)=1/(1+e-z)。第二层通过解码画数将隐藏层特征h映射到网络的实际输出z:
大数据环境下,信息更新可以自动完成,在网络环境下获取计算所需要的参数资源,通过大数据运算方法来将其融合到评估模型的结构层次中。大数据处理中结构更新如图1所示。
参数自动更新可以理解为是一种学习能力,为提升深度计算评估效率,在模型构建中采用特征提取的方法来对参数进行更新[3]。在系统结构内部会自动整理出所需要更新部分信息的特征,与网络环境下所获取的数据信息进行对比,特征保持一致后则会自动更新检索,这一方法不仅能够快速定位所需要更新的范围,也能提升更新后的数据精准度。实现数据更新环境下的网络资源与内部数据库之间的高度融合。
2.2 增量式计算评估模型中的结构更新
结构更新需要在网络平台下自动检索更新补丁,对原有结构中存在的漏洞进行修补,增量式深度计算评估模式中对于结构的更新,是基于环境威胁分析基础上所构建的。对应用软件程序所处运行环境中存在的风险做出评估,将风险类型与内部结构做出对比,从而判断出当前结构是否能够满足大数据环境下的信息更新要求。一旦结构中存在风险隐患,则会作为接下来补丁检索更新的依据,通过风险控制来实现结构构建。对于深度计算模型的每一层而言,假设输入层和隐藏层分别具有I1·I2·…·In和J1·J2·…·JN的计算特征。当同一系统结构多次使用,可能会出现数据分析计算速度下降的问题,此时必须要进行自动结构检索更新,更新设计后的结构能够适应数据深度挖掘需求,原有结构中所存在的数据计算分析速度下降问题也将得到解决。增量式深度数据计算评估模型中,同样采用保留技术结构同时更新组成方法的模式,为避免冗余结构影响到系统运行速度,在自动更新检索中也会对冗余部分进行删除处理,确保完成自动更新后的软件结构形式是最优化合理的。
2.3 实现增量更新的计算模型构建
数据更新与结构更新实现后需要对深度计算评估模型进行构建,实现深度计算功能的模型构建中主要从两方面进行。首先是预训练,预训练是对结构,以及参数更新算法的确定,确定所需要保留的基本信息,在此基础上来对每个模块中所要更新的内容进行自动编码,形成增量式的高阶编码更新形式。
其中,W等于综合算法大数据分析模型结果、基础模型,以及所需要更新的各个结构层次均得到确定后,深度评估计算模型建立也能在此基础上高效开展。其次是微调,微调则是针对基础训练模拟中所存在的漏洞部分进行调整,将计算模型调整成为最适合大数据分析特征的形式,通过这种方法才能够在网络环境下高校获取信息,将其更新并进入到自动对接环节中[4]。微调过程中会对数据进行标签确定,每一项参数均独立的编号,这样便不会影响到最终的深度计算分析、数据微调,以及标签调整对最终参数获取都有极大的影响。深度计算分析模型设计中还需要将数据资源整合,在结构内实现数据模型对比堆叠,从而实现分析模块向总设计系统中的融合。参数更新是一个比较笼统的概念,微调则是对最终数据获取精准度的保障,微调是在预训练基础上所开展的,两项功能连续开展可以将深度评估计算消耗的时间降至最低。
3 深度计算评估模型算法设计中的数据安全控制措施
3.1 同态加密设计构建
由于大数据特征学习环境下所进行的深度计算评估,建立在网络环境下开展,因此在更新参数,以及结构期间也可能会产生一部分网络安全威胁。如果在参数更新过程中对于带有风险的数据不能有效隔离控制,可能会影响到深度计算评估过程中的安全性,造成数据丢失或者计算评估软件瘫痪等问题。为预防网络风险,在开展数据深度计算评估任务期间,会进行同态加密结构构建设计,随着参数更新实时对数据进行加密保护,确保所下载更新的信息在安全性上可以达到防护标准。大数据这种,采用了DDPCM一维压缩,压缩比为8∶1,压缩标志2b01;Tile2压缩失败采用原始格式存储,压缩标志2b00;Tile3采用了DDPCM的自适应压缩压缩比为5.3∶1,压缩标志2b10;Tile4采用了DO压缩格式存储,压缩比为4∶1,数据按照这一比例压缩,进入到更高效的状态中。同态加密设计体现出数据更新的时效性,能够随着参数信息产生零间隔进行加密,经过加密,以及风险预防控制的信息进入到深度计算环节内,也能够更高效地进行数据转换,安全加密结构如图2所示。
通过安全加密結构避免风险隐患造成分析运算系统瘫痪的问题,大数据特征学习环境下首先需要保障数据更新时间,因此同态加密设计中应该重点从同等时间内提升安全性层面来进行。大数据分析与传统控制方法在最终目的上是一致,但深度计算分析过程却有很大区别,开展同态加密设计中需要体现出这一不同,能够面向不同数据分析环境来开展基础功能层构建。
3.2 同态加密算法应用
由于大数据特征学习环境下所进行的深度计算评估建立在网络环境下开展,因此在更新参数和结构期间也可能会产生一部分网络安全威胁,选择适合高阶反向传播算法的同态加密方案,由于高阶反向传播算法在求解深度计算模型过程中,需要同时用到多次连乘操作和多次连续加法操作,因此必须选择全同态方案对高阶反向传播算法进行加密。如果在参数更新过程中对于带有风险的数据不能有效隔离控制,可能会影响到深度计算评估过程中的安全性,造成数据丢失或者计算评估软件瘫痪等问题。为预防网络风险,在开展数据深度计算评估任务期间,会进行同态加密结构构建设计,随着参数更新实时对数据进行加密保护,确保所下载更新的信息在安全性上可以达到防护标准。在对数据进行压缩时,按照8×8的Tile进行压缩,原始数据8×8×32bit=2048bit,DDPCM的压缩后数据:32+32+32+61×2=218bit,由于外部DDR存储器带宽一般是2的整数幂,设计上采用128bit总线传输,所以DDPCM的压缩后数据占用的实际带宽需求为256bit,实际的DDPCM压缩率为8∶1。同态加密设计体现出数据更新的时效性,能够随着参数信息产生零间隔进行加密,经过加密和风险预防控制的信息进入到深度计算环节内,也能够更高效地进行数据转换。从而避免风险隐患造成分析运算系统瘫痪的问题,大数据特征学习环境下数据更新时间是首先需要保障的,因此同态加密设计中应该重点从同等时间内提升安全性层面来进行。大数据分析与传统控制方法在最终目的上是一致,但深度计算分析过程却有很大区别,开展同态加密设计中需要体现出这一不同,能够面向不同数据分析环境来开展基础功能层构建。
3.3 基于同态加密的计算评估算法设计
同态加密与深度计算评估算法相结合,所构建的基础模型不仅具有大数据环境下学习能力,也能够实现模型与数据间的融合,提升深度计算评估软件的适应能力。随着深度计算评估任务进行来开展同态加密,对数据的评估和分析是在双重指标引导下共同进行的,尤其是在加密过程中对数据深度挖掘速度的提升,充分运用模糊数据处理模式来提升速度。可以采用一种高级安全的反向传播算法模式来构建模型,反向传播对数据安全审核是双重进行的,单向传播并且进入到控制系统内发现存在风险威胁时,会将就威胁的信息再次返回到获取模块中进行风险评估判断,确保绝对安全后信息处理任务才能够得以进行。高阶反向传播算法包括连续加法和连续乘法操作,因此需要采用全同态加密算法对数据进行加密,保证云端在密文上操作的正确性。确定大数据学习特征下参数风险来源,结构和数据自动更新检索设计中也能进行规避,开展更为高效的数据分析处理任务。计算评估算法的软件程序汇编与硬件结构组成需要保持一致,通过这种方法来达到强化效果,从而确保最终的管理控制任务能够安全高效开展。
3.4 云端数据高效获取模型
云端数据获取能够扩大大数据计算评估模型中信息更新的范围,云端信息处理量十分大,自动更新检索期间需要保证在单位时间内数据处理任务量,可以与云端获取量保持一致。提出云端安全深度计算模型,将加密后的数据安全的推送到云端,利用云端强大的计算能力,通过安全高阶反向传播算法在密文上进行操作,高效训练深度计算模型的参数。云端大数据获取和分析检索任务进行过程中,通过优化信息数据获取模式来提升资源可靠性。在设计基础模型和软件程序中,采用双系统程序设计方法来完成,通过这种方法来提升软件使用功能稳定性,能够同时在不同环境下对数据进行检索和更新获取。云端环境中分析是面对海量数据资源所进行的,基于特征进行数据资源提取时,也可以首先判断数据特征获取范围,确定宏观或许范围后,再进行围观的特征调整,从而达到大数据信息资源获取效率提升目标,云端环境下深度计算评估结构构建如图3所示。
采用安全加法操作计算原理来进行结构优化,只对通过系统安全验证的参数进行叠加处理,这样才能够保证最终的安全处理速度。安全加法计算所建立的模型对于安全性与风险性区分十分明确,但在面向加法操作过程中开展的数据来源确定分析,还需要对网络数据获取环境进一步确定。只有了解环境中所存在的信息安全威胁,开展基础模型建立中,对于结构安全确定才能更加合理。将加密后的数据推送到云端,云端在密文上执行安全高阶反向传播算法,训练深度计算模型参数,获得参数的密文,然后将密文发送回客户端。计算方法应用时,也可以根据所叠加的基础结构特征来进行数据安全检索,体现出环境信息安全威胁在结构中的优化控制。
4 结论(Conclusion)
深度学习模型在大数据特征学习方面依然存在许多关键的科学问题。本文围绕着大数据的本质特征,深入研究了面向大数据特征学习的深度计算模型,提出了一系列针对大数据特征学习的深度计算模型算法。深度学习工作在向量空间,仅适合学习单一类型数据的特征,无法有效的学习异构数据的特征。如何扩展深度学习模型,有效挖掘异构数据的特征,是面向大数据特征学习首要解决的科学问题。针对大数据的异构性,研究了基于张量数据的深度计算模型,从而实现如何将深度学习模型从向量空间扩展到张量空间,设计面向异构数据特征学习的深度计算模型,学习异构数据的特征。设计张量空间中的反向传播算法,训练深度计算模型的参数。研究张量空间的距离度量方式,将张量距离引入深度计算模型的误差函数,捕捉异构数据在张量空间的分布特征。理论分析表明深度学习模型是深度计算模型的特例,深度计算模型则是深度学习模型在高阶空间的扩展与泛化。
参考文献(References)
[1] 谢天宇,曹继忠,赵姝婷,等.基于大数据深度学习的中医“证候”到“方剂”的新型算法研究[J].亚太传统医药,2018(1):51-53.
[2] 张佩珩,卜东波,熊劲,等.“面向深度测序大数据量的计算模型与体系结构研究”立项报告[J].科技创新导报,2016(11):163.
[3] 刘晶,和述群,朱清香,等.基于深度学习的线上农产品销量预测模型研究[J].计算机应用研究,2017,34(8):2291-2293.
[4] 刘洋,刘博,王峰.基于ParameterServer框架的大数据挖掘优化算法[J].山东大学学报:工学版,2017,47(4):1-6.
作者简介:
唐新宇(1981-),女,硕士,副教授.研究领域:大数据分析,计算机应用.
陈晓明(1981-),男,硕士,高级讲师.研究领域:大数据分析,计算机网络.