大数据理论在高精度惯性导航系统测试技术中的应用
2018-02-28陈效真董燕琴魏宗康王常虹
陈效真,周 姣,董燕琴,魏宗康,王常虹
(1.国家惯性技术产品质量监督检验中心,北京100039;2.北京航天控制仪器研究所,北京100039;3.火箭军装备研究院,北京100094;4.哈尔滨工业大学空间控制与惯性技术研究中心,哈尔滨150080)
0 引言
高精度惯性导航系统作为战略导弹武器系统中制导和控制的关键部件,是武器系统实现精确打击的关键[1-4]。高精度惯性导航系统产品的研制、验收和应用分为4个阶段运行,期间生成了海量的数据。第一阶段是研制阶段,由设计和生产单位完成,生成了大量元件、仪表和单机的测试数据;第二阶段是控制系统综合测试阶段,生成了大量的静动态试验仿真数据、地面模拟飞行数据;第三阶段是飞行试验和靶试阶段,重点在于收集遥外测数据,验证天地一致性;第四阶段是装备服役阶段,生成了大量的储存、年检及性能退化数据。不同时期从不同侧面反映了产品特性,每个阶段数据各具特色,形成不同特征的数据包,但是各阶段自成体系,由此形成数据 “孤岛”。这些 “孤岛”之间缺乏沟通互补,虽为同类,但由于型号不同,组织建设的制约导致惯性导航系统借鉴和应用的藩篱,难以形成高精度惯性导航系统全寿命周期测试大数据体系。
惯性导航测试数据的分析是高精度惯性导航系统研制、验收和应用中的难题。目前,很大部分数据采用人工判读集合单机数据库存储的方式进行,这种依赖人工的数据分析在面对海量的大数据时,存在耗时、低效、成本高等诸多缺点,并且测试人员很难通过肉眼从海量的原始数据中理解问题的本质。如何将这些海量数据背后隐含的有价值信息挖掘出来,帮助测试人员分析和解决问题,提高惯性导航系统的精度已成为当务之急和应势之举。
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,它具有规模性(Volume)、实时高速性(Velocity)、 多样性(Variety)、 低价值密度(Value)和真实性(Veracity)5个特征。目前,高精度惯性导航系统在全寿命周期的数据也具备上述5个特征。同时,高精度惯性导航系统还具备新的特征,例如,在出厂阶段重点在于对惯性测量装置低阶误差系数的稳定性考核,在控制系统综合测试阶段重点在于对惯性测量系统高阶误差和动态导航精度的估计和评估,在装备服役阶段重点在于对测试数据的保持能力和飞行试验的遥外测数据收集和比对,验证高精度惯性导航系统的天地一致性。高精度惯性导航系统的数据同一产品子样少,同类型号多;数据生成周期长,同类产品试验频次多;数据高密度壁垒致使数据分散,关联度不紧密,显性度不够。因此,亟需建立一个高精度惯性导航系统全寿命周期测试大数据体系,通过数据挖掘实现同类产品数据对比和经验递推,以保障惯性导航系统精度、可靠性、寿命及天地一致性等应用性能。
本文首先介绍了大数据发展现状;其次详细分析了惯性导航测试系统数据采集、数据管理及数据应用中存在的问题,提出大数据管理分析系统的需求和目标;最后,结合数据管理和分析中的关键技术,构建了惯性导航测试系统以数据采集层、数据支撑层和数据应用层为3大模块的大数据分析平台基本框架。为高精度惯性导航系统优化设计、提升精度、保障产品可靠性、合理预估系统寿命及适应未来战争提供了发展思路。
1 大数据发展现状
在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率,这是大数据定理的基础。有规律的随机事件在大量重复出现的条件下,往往呈现几乎必然的统计特性。2010年,《Science》刊登文章指出,虽然人们的出行模式有很大不同,但大多数是可以预测的。这意味着能够根据个体之前的行为轨迹预测未来行踪的可能性,从此开启了大数据理论研究的先河。牛津大学网络学院互联网治理与监管专业教授舍恩伯格在 《大数据时代》一书中指出,大数据不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。在这样一个数据大量产生和积累的时代,从海量的数据金矿中发现暗藏的规律,就能够抢占先机,先发制人。
随着信息化与工业化的融合发展,信息技术渗透到了工业企业产业链的各个环节。生产和测试线上高速运转的机器所产生的数据量不亚于计算机数据,数据量大,种类多,实时性高。随着工业大数据的逐渐积累,数据挖掘将为企业取得更多的价值,促进企业进行经济效益提升、安全生产和节能减排等方面的改进。
时至今日,一款型号惯性导航系统的输出已由单一数据转变为由数据、符号、噪声等因素多信息的集成。大数据分析平台能够跨越视觉、文字、语言、图形、符号、听觉、音响、噪声等不同类型的媒体数据,对现实物理精密结构实体知识、机理、功能、精度、寿命进行统一表征,构建现实物理精密结构实体跨媒体知识图谱、模型、标准、理论,实现跨媒体现实物理精密结构实体的知识演化、推理、预警、预测、评价、评估、演绎、馈补、优化、简化,实现数据的深度挖掘和物理机理的深入关联理解。因此,利用新兴的大数据技术分析高精度惯性导航系统测试数据已成为提高测试效率和准确性、实践和检验现代自主智能控制理论、推动惯性技术应用优化的必然手段,是惯性导航技术适应现代多维立体交叉战争,实现多元装备自主智能多信息融合协同精确打击的有效解决办法。
2 高精度惯性导航系统测试技术大数据应用中存在的问题
当前,我国在高精度惯性导航系统研制仿真测试方面,虽然已经取得了长足的进步,但仍存在很多不足,与惯性导航技术产品的研制需求极不适应,例如机理不清、模型简单、精度不高、激励方法陈旧、流程繁琐、使用复杂等诸多关键问题。从技术上讲,高精度惯性导航系统在生产工艺上已经将产品的生产精度提高到极致,而目前大部分瓶颈问题在于高精度惯性导航系统测试技术没有足够的计算能力,处理海量数据困难,因此,要把这些庞大的工程数据利用起来,为数据分析提供高性能并行计算是必要的基础能力。大数据是现代信息技术的重要发展方向之一,实现大数据的共享和分析将为高精度惯性导航系统带来难以估量的经济价值和工作效率,同时也会对惯性导航技术发展产生巨大的推动作用。高精度惯性导航系统有必要顺应当前趋势,向着互联共享、虚拟化、自动化、模块化、集成化、综合化、智能化、网络化、协同化、实战化、标准化的方向发展,将海量的测试数据加以利用,因此,对高精度惯性导航系统大数据测试平台的建设需求十分紧迫。
2.1 高精度惯性导航系统数据采集中存在的问题
数据采集是数据挖掘和分析的前提,同时也是分析解决问题,提升产品性能的第一步。
在目前的高精度惯性导航测试过程中,数据的采集和应用存在严峻问题。其中包括:1)数据可信度不强。由于测试过程中环境、操作流程等数据没有完整记录,导致测试过程中产生的干扰被带入采集数据,数据的准确性降低,可信度不强。2)数据与物理行为映射关系不清。数据的产生受到多种物理行为的影响,在误差的分析过程中,有限的测试数据很难将各种物理因素的影响分离出来,因而在误差补偿过程中物理机理不明确,针对性差。3)全生命周期数据采集积累、统筹分析、系统协同应用管理、风险预测预判不力。其中,生产、测试和贮存各阶段中只关心阶段内的数据,各阶段之间衔接不紧密,缺乏全局总体的数据观测,导致风险预测能力差。4)行业壁垒严重。从元器件到装配及使用过程中,各部门间数据传递缺乏,原始数据和问题被保留,系统整体性差。这些问题导致惯性系统的物理机械性能测试不准确,进而直接降低高精度惯性导航系统精度、可靠性和储存寿命。
2.2 高精度惯性导航系统数据管理中存在的问题
高精度惯性导航系统测试过程中产生的数据具有数据量大、类型复杂多样及关联性强的特点,如何在这些数据之间建立连接,为测试人员提供便捷的数据浏览界面是测试数据分析是否成功的重要因素。若能够实现对全部历史数据的自由追溯查询,则质量过程控制的力度将大幅度提升,实现高精度惯性导航系统不同阶段间所有数据内容的横纵比对,必然将大幅提升高精度惯性导航系统的测试质量和效率。
惯性导航测试系统目前的数据处理手段和管理手段已经无法适应当前高精度惯性导航系统研制的要求,存在的主要问题包括:1)测试数据量大,但数据采集设备与数据管理服务器不互连,虽然使用TDM对数据进行了处理并存储在关系型数据库中,但依然可能导致数据不一致性问题。2)数据类型多,缺乏统一管理,数据导入过程复杂、效率低,导致数据更新的时效性差。3)对于大数据,无法使用存储介质进行设备与服务器之间的数据交换,导致大量数据浪费。4)数据利用率低,分析困难,无法利用大数据处理方法来进行高精度惯性导航系统可靠性评估与故障诊断。5)高精度惯性导航系统数据处理与分析方法不规范,共享性差,导致推广困难,重复工作。6)数据自动判读的深度与广度不够,导致测试覆盖性不全,容易漏掉产品的质量问题。据统计,一个测试任务结束时,往往会产生GB量级的文档甚至TB量级的测试数据,这些数据的利用还存在着严重不足。一方面,数据查找非常不方便,测试人员在资料收集上浪费大量时间;另一方面,一旦设备出现故障,这些数据可能会丢失,给企业带来损失。
面对高精度惯性导航系统测试过程中产生的诸多问题,大数据技术将成为提升高精度惯性导航系统测试效率和准确性的有效方案。因此,高精度惯性导航系统迫切需要建设一个高效统一的数据管理和分析系统,提升测试准确性和效率,完善企业的知识积累。
2.3 高精度惯性导航系统数据应用中存在的问题
在惯性导航测试技术中主要以精度、可靠性、储存维修指标和退役指标评价高精度惯性导航系统4类重要的应用性能。目前的惯性导航系统数据应用中,每一类指标的数据采集中都存在问题,具体如图1所示。下面针对高精度惯性导航系统的4类指标,分析惯性导航测试系统数据采集中存在的具体问题。
(1)精度
惯性导航测试系统中精度指标包括设计指标、测试指标、试验指标和环境指标。其中,设计指标来源于高精度惯性导航系统最初的理论设计,测试指标来源于生产制造过程,试验指标来源于出厂验收阶段,而环境指标则来源于应用过程。目前,对于各阶段精度的测试,指标体系不完善,概念不一致,行业应用存在差异。在行业体系的上下游指标要求不标准、设置不规范不配套、关系不科学、标准体系不完善、参数不配套、量化细化差,导致精度测试数据可操作性差。
(2)可靠性
高精度惯性导航系统的可靠性包括稳定性、可靠性和寿命3个方面。在高精度惯性导航系统可靠性的测试中,由于测试数据有限,小子样很难对系统的性能有效估计。同时,可靠性的经验公式通常在少量干扰下能够较准确地预估,而对于高精度惯性导航系统,结构和应用环境复杂,经验数据无法准确估计系统可靠性。在实际测试过程中,可靠性的3个方面通常单独考虑,而忽略了三者之间的物理联系。
(3)储存寿命
在储存过程中,高精度惯性导航系统需要满足功能的可靠性,同时还要求满足精度指标的稳定性。这些性能需要在检测和维修的数据中真实反应,但目前惯性导航测试系统中对于储存寿命的判读缺乏可信度。首先,储存环境中各因素对高精度惯性导航系统组件性能的影响因子无法准确确定;其次,缺乏高精度惯性导航系统失效判据,不能判别系统功能的可靠性,更无法判断系统精度的变化。
(4)退役
在高精度惯性导航系统退役检测中包括退役、鉴定和评判3项指标,由于数据积累较少,3项指标的准确性和完备性不足。对于3项指标标准的完善和统一,仍然需要大量试验和数据的积累。
3 高精度惯性导航系统大数据管理分析系统的需求和目标
惯性导航测试系统大数据管理分析系统的建立是为了提供并行计算平台,并且高效地对惯性导航平台产生的海量测试数据进行处理,进而对数据进行管理、融合、分析、挖掘,实现惯性导航测试数据分析处理的统一化、批量化、自动化、模板化、重用化。如图2所示,该目标的实现是完善当前高精度惯性导航系统测试,提高其准确性和高效性不可或缺的步骤。
(1)建立多型号全过程产品数据中心
为了高效合理地管控平台生产的海量测试数据,需要建立标准统一、体系完善的数据中心。多型号全过程产品数据中心是要将系列型号产品参数、系列品种产品参数生产过程中的原材料性能参数、物理成型几何参数、元器件性能参数、仪表集成过程参数、测试试验激励参数、系统集成性能参数、环境适应性参数、储存应用过程参数、功能精度失效参数等全方位多角度的产品参数通过测试采集下来,形成融合理论数据、设计数据、制造数据、测试数据、试验数据、应用数据、失效数据等大量数据的全参数媒体数据库;建立完善的指标体系和标准体系,解决试验测试中精度标准不统一、可操作性差、可靠性分析预估不准确、储存环境影响量化困难、寿命数据缺失等核心关键问题。实现数据采集存储格式统一化、历史数据纵向分析和横向对比批量化、平台数据处理算法重用化、单元测试与总装测试数据判读自动化、测试判读报告模块化,避免数据遗漏和缺失,显著提高数据检索效率,形成各类型号产品数据体系的完整 “档案”,实现准确高效的取用数据。
(2)建立大数据多媒体推理专用平台
如图3所示,为了更好地挖掘数据价值,有效地积累和利用测试数据,需要依托数据管理分析系统。结合完备的性能参数、过程参数,跨越视觉、文字、语言等不同类型的媒体数据,利用智能动态优化技术,建立惯性导航测试系统大数据网络媒体推理应用平台,实现数据的深度挖掘,实现对现实物理精密结构实体知识、机理、功能、精度、寿命的统一表征,实现数据和物理机理的深入关联和理解。
大数据网络媒体推理应用平台的建设需要实现测试数据的机器学习、自主学习、深度学习和强化学习,以智能动态优化(IDO)为支撑,利用遗传算法、粒子群算法、果蝇优化算法等先进的数据挖掘和分析方法,实现数据价值的深入挖掘,从而解决高精度惯性导航系统中表征体系的统一、关联映射的理解和推导、标准体系的优化与完善、误差模型的准确识别和科学模型的预估等关键重大问题。
在大数据挖掘和机器学习的基础上,大数据理论可以进一步推进产品设计改进和性能提升。一方面,依据对惯性导航系统机理、设计、生产、测试及应用过程中大数据的挖掘,可以全面分析系统性能。从产品和型号设计的角度,可以分析惯性导航系统设计精度指标分配是否合理,从而在生产过程中对精度的提升有的放矢;从产品和型号的生产角度,可以分析生产和设计的一致性是否充分发挥,机械和电气系统是否满足兼容性的要求,从而完善设计方案;从产品和型号的应用角度,可以分析系统机动性能、准备时长、使用精度等性能是否满足实际需求。另一方面,相对于过去的样本代替全体的统计方法,大数据将使用全局的数据,统计出来的结果更为准确。这样,利用大数据平台将惯性导航系统的设计、生产和应用环节紧密联系,实现一体化。
基于这样的高精度惯性导航系统大数据管理分析系统框架,一方面,从基本原理的角度可以构建现实物理精密结构实体跨媒体知识图谱、模型、标准、理论,实现跨媒体现实物理精密结构实体的知识演化、推理、预警、预测、评价、评估、演绎、馈补、优化、简化;另一方面,从实战应用的角度可以实现现代自主智能控制理论验证和实践,从而推动惯性技术应用优化,适应现代多维立体交叉战争中多元装备自主智能多信息融合协同精确打击模式的需求。因此,高精度惯性导航系统测试技术中大数据管理分析平台的建立是深入理解数据物理机理、优化系统设计、提高精度、提升产品可靠性及准确预估系统寿命等惯性导航关键技术的必经之路。
4 高精度惯性导航系统测试技术中的大数据关键技术和框架
为了实现高效地惯性导航系统数据管理,分析和挖掘体系,需要高精度惯性导航系统全寿命周期测试大数据平台。其中,应用的大数据关键技术包括大数据形成技术、大数据分析技术、大数据应用技术和大数据资源统筹共享技术这4个方面。
4.1 高精度惯性导航系统大数据形成技术
高精度惯性导航系统大数据的形成是大数据数据库建立的源头,是数据分析和挖掘的基础[5-6],数据的形成需要保证数据的可靠性和完备性。可靠性从测试机理、测试方法、测试激励和测试采集的过程中都要严格把关,保证每个环节数据真实有效地反映惯导系统的性能。完备性要记录和保留高精度惯性导航系统从研制、生产、验收和应用各环节的测试数据,形成完整的测试链条,建立产品和型号的完备档案。
4.2 高精度惯性导航系统大数据分析技术
为实现针对高精度惯性导航系统海量测试数据的有效利用分析,采用以Hadoop为基础的并行大数据计算分析平台,进而实现高精度惯性导航系统测试数据的管理、分析、挖掘,完成平台的可靠性预测与故障诊断等功能。
(1)数据存储
针对航天大数据的特点和处理需求,目前较多采用分布式文件系统来存储航天数据。将数据存储在物理上分散的多个节点上,对这些资源进行统一的管理和分配,并向用户提供文件系统访问接口,可以解决本地文件系统在大小、文件数量和打开文件数等方面受限的问题。
在高精度惯性导航系统测试数据存储方面,为面对不断增长的平台测试数据量及分析需求,可采用HDFS分布式数据存储代替传统的以Orcale为代表的单点存储模式。HDFS为流式数据访问,可以一次写入,多次读取,数据通常由数据源生成或从数据源复制而来,非常适合当前高精度惯性导航系统产生的海量数据存储与分析[7-9]。
(2)数据分析
在高精度惯性导航系统测试数据分析方面,Hive技术提供了一种类SQL语言(HiveQL),可以查询存储在HDFS中的数据。高精度惯性导航系统大数据分析可视为一种数据仓储应用程序,而传统的数据仓储往往使用SQL作为查询语言。Hive降低了在HDFS上进行惯性导航测试数据查询的难度,更便于开发人员进行数据库设计和业务分析[10-12]。
(3)数据展示
在高精度惯性导航系统大数据分析结果展示以及用户交互方面,基于JEE+Structs2的Web前端技术可以用来与Hive以及HDFS进行无缝连接。利用当前广泛使用的JDBC数据操作技术,测试人员可以方便地上传惯性导航平台测试数据到分布式系统,并进行存储分析,分析结果也可以通过Web页面方便快速地浏览。
(4)挖掘算法
高精度惯性导航系统大数据测试分析过程中,针对系统数据所涉及的挖掘算法是测试过程的核心[13-18],算法模型的普适性、扩展性、容错性是设计过程中必须考虑的要素。高精度惯性导航系统测试数据挖掘目标是从海量的测试数据中通过算法搜索出数据中的隐藏信息,再将这些信息用于指导高精度惯性导航系统的生产测试过程,这一过程可以被视为高精度惯性导航系统中的自动化故障诊断。高精度惯性导航系统测试数据的分析挖掘较适合使用基于统计的故障诊断方法,该方法以统计学和人工智能为技术基础,不需要提供除数据以外的任何先验知识,采用从数据中提取的客观规则对问题的不确定性进行描述,将大量数据融合成有序的层次化故障诊断知识。
故障诊断与健康预测是一个复杂的过程,牵涉到大量的试验数据与复杂的计算模型。故障诊断算法通常与设计、制造、装配以及维护保障等工作紧密结合,核心是对特定模型进行描述、归纳形成故障模式集。该集合可具备多种形态,如先验知识集、逻辑规则集、设备功能模型集等,分别从专家经验、设备运行过程以及设备数学模型等角度挖掘故障模式。
(5)数据安全
航天数据安全是一个复杂而重要的问题,军用航天中的关键数据通常采用加解密方式传输[19-20]。而大数据系统通常是分布式的网络系统,虽然具有数据高效共享的优点,但在数据安全方面却存在一定隐患。大数据的特点必然会给加解密方式带来新的挑战,但也有一些相应的可行方案,如利用大数据的数据价值密度低的特点,在续传输的相同帧图像中插入少量的密文,从而大幅提高数据的安全性。
结合数据存储、数据分析、数据展示、挖掘算法和数据安全这5个方面,可以初步构架大数据平台框架,如图4所示。
4.3 高精度惯性导航系统大数据应用技术
在初步设计框架基础上,应在后续工作中逐步完善惯性导航测试系统数据分析挖掘功能,完成高精度惯性导航系统数据分析的远期规划,最终将高精度惯性导航系统大数据分析平台应用在生产实践中,实现高精度惯性导航系统测试的自动化故障诊断,帮助测试人员快速提高测试效率和准确度。
大数据分析系统的整体框架包括多源数据采集层、数据平台支撑层和数据平台应用层3大数据模块[21-22],如图5所示。在多源数据采集层中,测试设备将各类测试数据采集汇入网络数据交换设备,通过数据预处理传递给数据平台支撑层。平台支撑层将数据存储进入数据库,并完成数据备份与修复。最后,当数据平台应用层发送数据请求,数据平台支撑层通过数据流准确快速地将数据传递给平台应用层。数据平台应用层一方面通过数据统计和分析生成形式多样、可读性好的判读报告,另一方面通过数据挖掘、机器学习、人工智能等手段分析系统性能,为产品质量的提升、高精度惯性导航系统精度的提高打下基础。
在高精度惯性导航系统应用及储存过程中,通过完整的大数据处理平台可以实现长期的监测惯性导航系统的健康检测和故障诊断。对于平台使用数据的异常能够由顶层到底层精确溯源,异常部位准确判断,快速精准解决问题,从而实现故障监测的及时性、早期故障检测的灵敏性、故障定位和评价的准确性及故障诊断的鲁棒性[23]。
4.4 高精度惯性导航系统大数据资源统筹共享技术
大数据资源统筹共享技术要求在保证数据安全的基础上,数据形成过程中的参与者打破壁垒,建立数据云,形成共享。数据共享平台通常采用分布式系统构架,由一个数据总中心和若干分中心组成,从而实现数据整合、数据交换和数据共享,形成资源统筹共享服务网络[24-25]。数据的采集、集成和整合由车间、研究所、控制系统、总装测试和靶场测试等底层元数据单元完成,并上传至分中心。各阶段用户通过数据总中心索引分中心数据,形成数据多点互通。
对于底层元数据单元,数据的加工处理规范化,形成包含数据标识信息、内容信息、时间和空间覆盖信息、人员和权责信息、关联信息、技术信息等各个方面信息的结构化数据,便于用户检索查找[26]。
5 结论
本文依据高精度惯性导航测试系统数据采集和数据管理中存在的大量严峻问题,分析了大数据在惯性导航测试系统中的使用需求。结合数据分析中数据采集、数据存储、数据分析、数据展示、挖掘算法、数据安全的关键技术,构建了惯性导航测试系统以多源数据采集层、数据平台支撑层和数据平台应用层为3大模块的大数据分析平台基本框架。利用大数据资源统筹共享技术进行数据挖掘和决策分析,从而优化产品应用。大数据平台为高精度惯性导航系统优化设计、提升精度、保障产品可靠性、合理预估系统寿命及适应未来战争提供了重要支撑,当以重视。
[1]张炎华,王立端,战兴群,等.惯性导航技术的新进展及发展趋势[J]. 中国造船, 2008, 49(s1): 134-144.ZHANG Yan-hua, WANG Li-duan, ZHAN Xing-qun, et al.The new advancement and trend of inertial navigation technology [J].Shipbuilding of China, 2008, 49(s1):134-144.
[2] 周世勤.新型惯性技术的发展[J].飞航导弹,2001(6): 70-77.ZHOU Shi-qin.The development of new types of inertial technology [J].Aerodynamic Missile Journal, 2001(6):70-77.
[3]谢世富.导航技术与系统发展述评[J].电子质量,1995(1): 9-16.XIE Shi-fu.The development overview of inertial technol-ogy and system [J].Electronics Quality, 1995(1): 9-16.
[4]薛连莉,陈少春,陈效真.2016年国外惯性技术发展与回顾[J]. 导航与控制, 2017, 16(3): 105-112+84.XUE Lian-li, CHEN Shao-chun, CHEN Xiao-zhen.Development and review of foreign inertial technology in 2016[J].Navigation and Control, 2017, 16(3): 105-112+84.
[5]李水平,陈意云,黄刘生.数据采掘技术回顾[J].小型微型计算机系统, 1998, 19(4): 74-81.LI Shui-ping, CHEN Yi-yun, HUANG Liu-sheng.A technology overview of data mining [J].Journal of Chinese Computer Systems, 1998, 19(4): 74-81.
[6]韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学, 2008, 35(2): 1-5+12.HAN Jing-yu, XU Li-zhen, DONG Yi-sheng. An overview of data quality research [J].Computer Science,2008, 35(2): 1-5+12.
[7]唐箭.云存储系统的分析与应用研究[J].电脑知识与技术, 2009, 5(20): 5337-5338+5340.TANG Jian.Research and application of the cloud computation storage system [J].Computer Knowledge and Technology, 2009, 5(20): 5337-5338+5340.
[8]陈全,邓倩妮.云计算及其关键技术[J].计算机应用, 2009, 29(9): 2562-2567.CHEN Quan,DENG Qian-ni.Cloud computing and its key techniques [J].Journal of Computer Applications,2009, 29(9): 2562-2567.
[9]罗春荣.国外网络数据库:当前特点与发展趋势[J].中国图书馆学报, 2003, 29(3): 44-47.LUO Chun-rong.Online databases in foreign countries:present characteristics and development trends[J].Journal of Library Science in China, 2003, 29(3): 44-47.
[10]高翔,王勇.数据融合技术综述[J].计算机测量与控制, 2002, 10(11): 706-709.GAO Xiang,WANG Yong.Survey of multisensor information fusion [J].Computer Measurement & Control,2002, 10(11): 706-709.
[11]林士敏,田凤占,陆玉昌.用于数据采掘的贝叶斯分类器研究[J]. 计算机科学, 2000, 27 (10):73-76.LIN Shi-min, TIAN Feng-zhan, LU Yu-chang.Studies on Bayesian classifier in data mining [J].Computer Science, 2000, 27(10): 73-76.
[12]胡金星,吴焕萍,潘懋,等.基于格网划分的海量DEM数据生成[J].计算机辅助设计与图形学学报,2004, 16(1): 41-44.HU Jin-xing, WU Huan-ping, PAN Mao, et al.Massive DEM creation with grid partitioning approach [J].Journal of Computer Aided Design & Computer Graphics,2004, 16(1): 41-44.
[13]黄解军,潘和平,万幼川.数据挖掘技术的应用研究[J]. 计算机工程与应用, 2003, 39(2): 45-48.HUANG Jie-jun, PAN He-ping, WAN You-chuan.Application research on the technology of data mining [J].Computer Engineering and Applications, 2003, 39(2):45-48.
[14]汪明.数据挖掘综述[J].河北软件职业技术学院学报, 2001, 14(1): 48-55.WANG Ming.Survey of data mining [J].Journal of Hebei Software Institute, 2001, 14(1): 48-55.
[15]谈恒贵,王文杰,李游华.数据挖掘分类算法综述[J]. 微型机与应用, 2005, 24(2): 4-6+9.TAN Heng-gui, WANG Wen-jie, LI You-hua.An overview of data mining sorting algorithms[J].Microcomputer & Its Applications, 2005, 24(2): 4-6+9.
[16]吕安民,林宗坚,李成名.数据挖掘和知识发现的技术方法[J]. 测绘科学, 2000, 25(4): 36-39.LV An-min, LIN Zong-jian, LI Cheng-ming.Technique methods of data mining and KDD [J].Developments in Surveying and Mapping, 2000, 25(4): 36-39.
[17]张雪英.国外先进数据挖掘工具的比较分析[J].计算机工程, 2003, 29(16): 1-3.ZHANG Xue-ying.Analysis and comparison of overseas leading data mining tools [J].Computer Engineering,2003, 29(16): 1-3.
[18]马江洪,张文修,徐宗本.数据挖掘与数据库知识发现: 统计学的观点[J]. 工程数学学报, 2002, 19(1):1-13.MA Jiang-hong, ZHANG Wen-xiu, XU Zong-ben.Data mining and knowledge discovery in database:a statistical viewpoint[J].Chinese Journal of Engineering Mathematics, 2002, 19(1): 1-13.
[19]周水庚,李丰,陶宇飞,等.面向数据库应用的隐私保护 研 究 综 述 [J]. 计 算 机 学 报, 2009, 32(5):847-861.ZHOU Shui-geng, LI Feng, TAO Yu-fei, et al.Privacy preservation in database applications: a survey [J].Chinese Journal of Computers, 2009, 32(5): 847-861.
[20]张云勇,陈清金,潘松柏,等.云计算安全关键技术分析[J]. 电信科学, 2010, 26(9): 64-69.ZHANG Yun-yong, CHEN Qing-jin, PAN Song-bai, et al.Key security technologies on cloud computing [J].Telecommunications Science, 2010, 26(9): 64-69.
[21]李敏强,纪仕光,陈富赞,等.数据仓库系统的结构与设计研究[J]. 决策与决策支持系统, 1997, 7(2):23-31.LI Min-qiang, JI Shi-guang, CHEN Fu-zan, et al.Date warehouse architecture and system design [J].Journal of Decision and Decision Support Systems, 1997, 7(2): 23-31.
[22]钱晓江.物流信息系统体系结构[J].东南大学学报(自然科学版), 2001, 31(6): 40-44.QIAN Xiao-jiang.Architecture design of logistics information system [J].Journal of Southeast University (Natural Science Edition), 2001, 31(6): 40-44.
[23]王宏鼎,童云海,谭少华,等.异常点挖掘研究进展[J]. 智能系统学报, 2006, 1(1): 67-73.WANG Hong-ding, TONG Yun-hai, TAN Shao-hua, et al.Research progress on outlier mining [J].CAAI Transactions on Intelligent Systems, 2006, 1(1): 67-73.
[24]王常力.分布式控制系统的现状与发展[J].电气时代, 2004(1): 82-86.WANG Chang-li.The status and development of distributed computer control dystems [J].Electric Age, 2004(1): 82-86.
[25]蒋良孝,蔡之华.分布式数据挖掘研究[J].计算机与现代化, 2002(9): 4-7.JIANG Liang-xiao,CAI Zhi-hua.The research of the distributed data mining [J].Computer and Modernization,2002(9): 4-7.
[26]连立贵,金凤,蔡家楣.数据仓库中的数据提取[J].计算机工程, 2001, 27(9): 61-62+99.LIAN Li-gui, JIN Feng, CAI Jia-mei.Data extraction in data warehouse [J].Computer Engineering, 2001, 27(9): 61-62+99.