APP下载

云服务器中的不稳定数据挖掘系统的研究与设计

2016-05-14王曙霞胡瑞敏梁意文熊曾刚

现代电子技术 2016年6期

王曙霞 胡瑞敏 梁意文 熊曾刚

摘 要: 针对当前的云计算服务器缺少对不稳定数据的识别与检测,设计并实现一种云服务器中不稳定数据挖掘系统。介绍系统的总体结构,利用数据采样预处理模块实现从源数据到挖掘数据的映射,完成离散化、数据过滤等处理过程。依据2.0 mm ERmet Hard Metric 连接器,采用 RapidIO协议,通过接口模块完成数据间的传输,以达到信号传输效率与稳定性的要求。通过数据挖掘模块对云服务器中不稳定数据的确认与挖掘,将挖掘结果传输至控制模块进行处理。软件设计过程中,对云服务器中不稳定数据挖掘系统进行了详细地分析,并给出不稳定数据挖掘的实现过程以及系统部分程序代码。实验结果表明,所设计的系统具有很高的实用性和可靠性。

关键词: 云服务器; 不稳定数据挖掘; 数据采样预处理; 数据过滤

中图分类号: TN915?34; TP311 文献标识码: A 文章编号: 1004?373X(2016)06?0049?04

Research and design of unstable data mining system in cloud server

WANG Shuxia1, HU Ruimin2, LIANG Yiwen2, XIONG Zenggang1

(1. School of Computer and Information Science, Hubei Engineering University, Xiaogan 432000, China;

2. School of Computer, Wuhan University, Wuhan 430072, China)

Abstract: Since the current cloud computing server lacks recognition and detection of unstable data, a mining system of unstable data in cloud server was designed and realized. The overall structure of the system is introduced. With the data sampling pretreatment module, the mapping from the source data to the mining data is implemented, and the process of discretization and data filtering is completed. Based on 2.0 mm ERmet Hard Metric connector, the RapidIO protocol is used to complete the data transmission through the interface module, and meet the requirements of the signal transmission efficiency and stability. The unstable data in the cloud server is validated and mined by means of data mining module. The mining results are transmitted to the control module for processing. In the process of software design, the unstable data mining system in the cloud server was analyzed in detail. The implementation process of unstable data mining and the part program codes of the system are given. The experimental result shows that the system has high practicability and reliability.

Keywords: cloud server; unstable data mining; data sampling pretreatment; data filtering

随着计算机的逐渐发展及信息技术的不断推进,人们对服务器运行稳定性的要求越来越高[1?2]。云服务器作为一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务,被越来越广泛的应用[3?5]。但是,当前的云计算服务器都只是从入侵的角度考虑服务器的安全性,没有充分考虑不稳定数据带来的影响。因此,研究一种不稳定数据挖掘系统,使云服务器能够更加稳定、安全地服务于用户,向客户提供高质量的服务具有重要意义,已经成为相关学者研究的重点课题[6?8]。本文设计并实现了一种云服务器中不稳定数据挖掘系统,介绍了系统的总体结构、硬件结构以及软件结构,为实现云服务器的稳定运行提供有效依据。实验结果表明,所设计的系统具有很高的实用性和可靠性。

1 不稳定数据挖掘系统总体逻辑结构

本文设计的云服务器中不稳定数据挖掘系统主要由控制模块、数据采样预处理模块、接口模块、数据挖掘模块和云服务器中不稳定数据挖掘模块等构成,系统总体逻辑结构如图1所示。

2 硬件模块的选择与设计

2.1 云服务器不稳定数据采样处理模块设计

数据采样预处理模块主要用于从源数据到挖掘数据的映射,实现离散化、数据过滤等处理过程。数据采样预处理模块主要由FPGA、SSRAM、模/数转换器、以太网接口等构成,详细硬件结构如图2所示。

数据采样预处理模块以ADS1178芯片为核心,其属于delta?sigma(Δ?Σ)型模/数转换器,共存在8 个差分输入通道,可同时对8个云通道的输入数据进行数据采用,采样电路的数据输出端与 FPGA相连。为后期的不稳定数据的识别打下基础。系统将Cyclone Ⅳ GX 系列的 EP4CGX110CF23C7N 型号芯片作为FPGA 芯片,该芯片为Altera公司Cyclone系列FPGA 的新一代产品,不仅功耗低,而且成本不高。系统选择的SSRAM型号是GS864018?300,其为72 Mb同步突发传输静态存储器。FPGA和以太网接口之间选择的网桥芯片详细型号是 DP83848C。

2.2 不稳定数据的传递接口模块

接口模块主要用于对不稳定数据进行传输,主要由信号调直机、高速数据传输系统、Ermet Hard 354142型接口和Ermet Hard 973046型接口等构成,详细硬件结构如图3所示。因为本文设计系统之间的数据传输采用 RapidIO协议,因此,本文数据传输接口选择ERNI公司生产的2.0 mm ERmet Hard Metric 连接器。为了达到信号传输效率与稳定性的要求,本文系统将连接器作为系统输入端口,将型号是973046的连接器作为系统传输端口。数据采集电路对采集的数据进行判断,一旦发现是疑似不稳定数据,会存储到SSRAM,判断的过程是EP4CGX110CF23C7N完成的。

2.3 不稳定数据的判断模块

判断模块是整个云服务器中不稳定数据挖掘系统的核心,主要用于设置相关不稳定数据挖掘参数,同时调用数据挖掘模块完成数据挖掘。不仅如此,判断模块还存在各子模块相关数据的维护与管理。对不稳定数据判断模块的结构图如图4所示。

DSP处理器采用美国TI公司生产的TMS320C54X芯片,其主要用参数设置,完成对不稳定数据的判断;IPC选择Diamond系列的IPC芯片,其负责数据的传输。DSP处理器类似于磁盘阵列中阵列控制器,在驱动器和SAN间添加了一个智能层,它与外部连接到SAN。

2.4 不稳定数据挖掘模块的设计

数据挖掘模块主要负责对云服务器中的不稳定数据进行深层次的挖掘,同时将挖掘结果发送至控制模块进行处理。数据挖掘模块主要由处理器、智能接口控制器、数字I/O和职能I/O构成,详细硬件结构如图5所示。

数字I/O选择的型号为IONI USB?6501 ,其为低价位USB数字I/O设备。职能I/O选择的型号为Eclipse Java,其大大缩减挖掘过程,提高了挖掘效率。

3 系统软件设计

3.1 总流程图设计

在对云服务器中不稳定数据挖掘系统所需执行任务进行分析的基础上,结合系统软件设计的特性和要求,设计了云服务器中不稳定数据挖掘系统的软件流程图,如图6所示。

在云服务器中,用户在登陆界面上登陆系统后,如果不稳定数据挖掘所需的算法及数据都存在,则利用数据挖掘模块进行数据的挖掘,获取结果。

3.2 代码设计

根据上述软件系统流程图进行代码设计。本文设计的云服务器中不稳定数据挖掘系统的软件,在Windows 7.0环境下,通过C++完成,详细的软件程序设计流程如下所述:

4 仿真实验分析

4.1 测试环境

为了验证本文设计的云服务器中不稳定数据挖掘系统的有效性,需要进行相关的实验分析。实验将基于蚁群算法的不稳定数据挖掘系统作为对比进行分析。本实验研究的云服务器是由一个主(Master)节点和三个从(Slave)节点构成的,节点硬件环境见表1、表2。

云服务器和客户端均连接在千兆局域网内,网络拓扑图如图7所示。

4.2 实验结果分析

分别采用本文系统和基于蚁群算法的不稳定数据挖掘系统对上述测试环境下云服务器的不稳定数据进行挖掘;在数据集数量逐渐升高的情况下,对两种系统的挖掘时间和挖掘准确率进行比较,得到的结果见表3。

分析表3可以看出,随着数据量的逐渐增加,本文系统和基于蚁群算法的不稳定数据挖掘系统的挖掘时间均逐渐升高,但与基于蚁群算法的不稳定数据挖掘系统相比,本文系统挖掘时间的增长幅度明显降低,而且一直低于基于蚁群算法的不稳定数据挖掘系统。不仅如此,本文系统的的挖掘准确率一直高于基于蚁群算法的不稳定数据挖掘系统,说明本文系统具有很高的挖掘性能,验证了本文系统的可行性和实用性。

5 结 语

本文设计并实现了一种云服务器中不稳定数据挖掘系统,介绍了系统的总体结构,将控制模块作为整个云服务器中不稳定数据挖掘系统的核心,通过控制模块设置相关的数据挖掘参数、调用数据挖掘模块完成数据挖掘以及对各子模块相关数据进行维护与管理。

利用数据采样预处理模块实现从源数据到挖掘数据的映射,完成离散化、数据过滤等处理过程。依据2.0 mm ERmet Hard Metric 连接器,采用 RapidIO协议,通过接口模块完成数据间的传输,以达到信号传输效率与稳定性的要求。通过数据挖掘模块对云服务器中不稳定数据进行挖掘,将挖掘结果传输至控制模块进行处理。软件设计过程中,对云服务器中不稳定数据挖掘系统进行了详细的分析,并给出不稳定数据挖掘的实现过程以及系统部分程序代码。实验结果表明,所设计的系统具有很高的实用性和可靠性。

参考文献

[1] 魏中贺,李少波.基于云制造的数据挖掘研究[J].贵州大学学报(自然科学版),2015,32(1):75?80.

[2] 时念云,王文佳,马力.基于普适云的大数据挖掘[J].计算机系统应用,2013,22(11):7?12.

[3] 窦波,陈晓云,李均委.基于数据挖掘分析的电力营销稽查监控系统[J].新疆电力技术,2014(3):92?94.

[4] 甘杨兰,赵梅,牛森,等.基于云仿真环境数据挖掘的服务分类方法[J].计算机仿真,2014(10):460?465.

[5] 郭鑫,颜一鸣.一种动态云模型下树数据挖掘算法[J].小型微型计算机系统,2013,34(12):2749?2752.

[6] 李化明,王家云,马利华.基于知识依赖度约简数据挖掘的个性化服务研究[J].大学图书情报学刊,2015,33(1):90?94.

[7] 厉一梅.基于云计算的电力数据挖掘软件和优化服务[J].电子世界,2014(6):13?14.

[8] 李华,陈立云,张星.云计算条件下数据挖掘技术对高校信息服务水平的提升作用[J].电子技术与软件工程,2014(10):197.