APP下载

分级存储系统中的数据迁移技术专利综述

2018-09-26李娇邓泽微

数字技术与应用 2018年5期

李娇 邓泽微

摘要:本文通过分析分级存储系统中的数据迁移技术的历年申请趋势、发展脉络、优缺点等,从判断处理过程中数据迁移的单位对分级存储系统中的数据迁移技术进行分类,并对数据迁移的触发的时机的技术也进行了分类等,最后从分类所得的技术分支对涉及分级存储系统中的数据迁移专利技术进行了综述。

关键词:分级存储;数据迁移;迁移策略

中图分类号:TP333 文献标识码:A 文章编号:1007-9416(2018)05-0224-02

1 分级存储系统中的数据迁移技术概述

所谓分级存储,顾名思义就是“按级别”存储,就是根据数据不同的重要性、访问频次等指标分别存储在不同性能的存储设备上。通常将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据。在分级存储中,数据不可避免的要在各级存储设备之间动态转换,即迁移数据。这样一方面可大大减少非重要性数据在一级本地磁盘所占用的空间,还可加快整个系统的存储性能,总体实现整个存储系统的成本接近最低一级存储设备的价格,而数据存取访问速度接近性能最高一级存储设备。

2 分级存储系统中的数据迁移技术专利实证分析

专利信息实证分析是从专利文献中采集专利信息,对其主要指标进行加工、整理和分析,这些主要指标包括如专利类型分析、技术发展趋势分析、年度趋势分析、地域性分析、申请人(发明人)分析、技术分支分析等等。本文首先确定所需的专利检索的关键词和分类号,检索出形成本文分析所需的中英文专利申请共100篇文献,其中中文文献70篇,外文文献30篇,并标引分析。

2.1 申请时间和数量

通过对检索的100件国内外专利申请进行分析,得出国内外分级存储系统中的数据迁移技术专利申请随时间的申请量的变化的分析结果如图1所示。

2.2 主要技术分支和数量

通过对检索的100件国内外专利申请进行分析,得出国内外分级存储系统中的数据迁移技术中存储结构分类的技术分支的分析结果如图2所示。针对分级存储系统中的数据迁移技术专利申请的研究,其存储结构可主要分为三个技术分支:主存辅存分级、缓存内存分级以及辅助分级,由于申请的文献中有较多文献并未严格区分这几种级别,而只是使用了高低性能存储技术,因此最终这部分划为了4个分支。

3 分级存储系统中的数据迁移技术的主要分类与分析

以下从几个角度对分级存储系统以及分级存储系统下的数据迁移进行了分类,并结合分析了每个类型下的代表专利及同类型专利。

3.1 分級存储系统的类型

目前分级存储系统主要包括基于文件的分级存储系统、基于逻辑卷的分级存储系统、基于块的分级存储系统和基于对象的分级存储系统。基于文件的分级存储系统是目前使用最广泛的分级存储系统,代表性专利有:CN201110225815;基于逻辑卷的分级存储系统每次迁移以整个逻辑卷为单位,迀移粒度显的过大,代表性专利有:JP2012557110A;基于块的分级存储系统不适用于逻辑卷的大小在TB级或以上的情况下。代表性专利有:CN201110388104;对象存储技术就是在存储系统中以对象作为数据存储和组织管理的基本单位,向外提供对象资源和操作接口。在对象存储系统中,数据以对象为单位存放,对象可以提供数据的完整性。对象存储系统中以对象为粒度设计分级功能,以对象为粒度的分级架构由于迁移的对象不再是文件而是文件中的热点对象,这样就减少了迁移的数据量,简化了迁移过程中对数据的处理。代表性专利有:CN201310034756、CN201410595405等。

3.2 数据迁移分析

分级存储之间的转换只有两种操作处理,即“数据迁移”和“数据回迁”。数据迁移(又称降级迁移)是指数据由快速存储设备或高一级存储设备往慢速设 备或低一级设备迁移,而数据回迁(又称升级迁移)则恰好相反。对于数据迁移来说, 迁移过程中可能不会有I/O请求,而数据回迁则恰恰是发生在I/O请求最密集的时候, 为了保证在数据回迁时,尽可能的减少迁移进程对I/O请求的影响,可以采用读写锁来保证数据的一致性。迁移进程为当前迁移数据块申请读写锁保护,以保证数据的一致性。在分级存储系统中,均会同时存在数据迁移和数据回迁,因为根据数据访问频率的变化可能会成为热数据,也可能会成为冷数据。

数据在各级存储设备之间进行迁移操作时,一般是要在满足迁移条件时,才会被选为迁移对象,进入迁移队列,进行迁移操作。存储例如规定在线存储中的数据要求每天的用户访问量为50人,或数据的读写次数要大于100次等,但是数据的实际用户访问量或读写次数达不到此标准,则表明该数据不适合存储在该级别的存储介质中,需要进行迁移。代表性专利有:CN201110311219、CN2012102 75170、CN201210590581。当存储介质的存储空间已饱和或将要达到饱和,数据就需要进行迁移,例如定义的存储介质饱和度为总的空间的70%,当空间存储量达到这个值时,就需要将一定的数据迁移,否则,新产生的数据将不能及时存储,严重影响存储系统的整体性能。代表性专利有:US20050036628A、CN201010609767。

4 技术综述在审查实践中的应用

在撰写以上专利技术综述的过程中,通过对涉及分级存储系统中的数据迁移的国内外专利进行集中收集、阅读和梳理,审查员在较短时间内了解了该领域专利技术的发展脉络,掌握了国内外主要申请人的技术发展状况,有效提高了对于专利申请发明点的把握,为后续的审查实践中处理实际案例提供了指导和依据。

参考文献

[1]周永恒.一种基于综合频度指标的数据记录分级存储方法及研究实现[D].昆明理工大学,2013.

[2]徐琼瑶.分级存储中数据迁移机制的实现[D].华中科技大学,2013.