APP下载

EMC存储设备的系统作业功能分析

2022-02-18岳志玮

天津科技 2022年2期
关键词:快照数据安全命令

岳志玮

(天津海河传媒集团网络信息部 天津 300072)

0 引 言

科技的腾飞推动着社会的进步,存储技术的发展对于广播电视技术的革新起到重要的作用,高性能存储设备在节目制作系统中的地位逐渐凸显出来。天津广播电视台的综合云系统部署了稳定、安全、高可用性的EMC品牌的 Isilon X410存储,极大限度地保证了数据安全。本文结合系统运行情况,重点阐述集群存储的管理系统(OneFS)中的系统作业(System Jobs)功能。

1 System Jobs功能分析

OneFS是一种支持大数据吞吐需求的文件系统,包括作业引擎并行调度和作业管理框架等功能模块,使得数据保护和存储管理任务能够跨集群分布并高效运行,其最关键的功能是维护Isilon集群上数据的完整性,同时具备集群状态监控功能、文件系统性能优化功能、保障驱动器健康以及合理优化存储资源等功能。以上功能的实现肯定会产生数据流且占用一定的系统资源,因此需要一定的运行分析时间[1],这就涉及到了OneFS的作业引擎(Job Engine)的概念。OneFS中的“Job”可以理解为计划任务或者系统作业,是一种在系统后台执行的、由作业引擎驱动的任务类型。例如后台文件分析作业、快照管理作业以及节点间数据平衡分布作业等,由于各种作业所需的执行时间各不相同,且占用CPU和I/O资源(输入输出资源即读写资源)也有明显差异,为了合理分配各条作业的运行时间,作业引擎将各种功能的作业进行分类,按不同的优先级执行。同时,在实际业务需要的时候,还可启用管理员权限来进行作业流程控制。当系统硬件发生故障导致作业停止运行时,作业引擎还可以使用检查点系统进行作业任务的断点恢复。日常维护中,我们可以通过作业引擎系统监控、设置及管理每一条作业,同时可以查看统计信息和日志报 告等。

OneFS作业引擎可以跨集群运行,负责划分和处理大型存储的管理作业和数据保护任务。OneFS作业引擎将任务缩减为较小的工作项,分配或映射到各个节点上形成多线程运行处理,在作业执行过程中检测和报告进度,并在作业运行结束时提供详细报告和状态分析数据。作业引擎系统还包括自适应效果管理系统、智能驱动控制以及多线程工作的能力,需占用特定的磁盘空间以及硬件或网络资源在后台运行作业,通常可分为3类,如图1所示。

图1 作业类型 Fig.1 Job types

1.1 文件系统维护作业

这类作业执行后台文件系统维护的任务,通常需要访问所有节点且在默认配置下运行。一般来说,在集群发生降级时会触发此类作业运行。

①柔性保护作业(Flex Protect):当集群存储的硬件设备发生故障时,包括存储节点和硬盘损坏,FlexProtect作业启动运行,用以保证集群数据的安全及其他系统安全作业的正常运行,此时集群状态为degraded(降级)状态,直到系统修复完成。

②自适应平衡作业(Auto Balance):存储的级联方式包括内部级联和外部级联,外部级联是通过每个节点的万兆光纤线连接服务器和站点,保证数据访问速度;内部级联是通过Infiniband交换机(节点级联交换机)将所有节点联通,保证校验数据和应用数据在节点间的通信。当集群中有新加入的设备如节点或硬盘时,Auto Balance作业将启动,用以平衡集群中的数据使其均衡分布于节点硬盘上,以此来保证数据安全。

③完整性扫描作业(Integrity Scan):该作业用于验证集群系统的完整性,时刻保障集群系统的健康和数据安全。

④媒体数据扫描作业(Media Scan):作业运行时扫描存储磁盘,清除设备错误,保证数据安全。一般来说,广播电视节目制作系统使用存储频繁,数据交换每时每刻都在进行,而Media Scan作业需要占用一定的系统资源,因此设定为每周扫描较为合适。

此外,OneFS系统中还设定一些较为重要的作业定期运行来保障数据安全。例如:文件分析作业(FsAnalyze),在/ifs存储路径下,对文件系统进行分析并收集相关信息以优化存储,天津广播电视台综合云系统设定每晚22点执行此作业;快照删除作业(Snap Shot Delete),该作业用以执行快照文件的删除任务,快照机制利用数据指针的备份来保障数据安全,但快照文件会占用一定的存储空间,需要定期删除,OneFS系统支持手动删除和计划任务作业删除。

1.2 功能支持作业

在OneFS中配置并运行此类作业来辅助系统实现各类存储管理功能。

①智能存储池作业(Smart Pools):存储池作业将各个存储节点集成为存储池,OneFS系统对存储池进行管理,包括资源调配、虚拟热备盘及存储池策略管理等。

②快照管理作业(Snap Shot IQ):快照管理作业对快照文件进行管理,实现文件系统层面上的数据安全保护。当集群存储上的数据发生改变时,OneFS系统会形成数据指针的快照文件快照(Snap Shots)列表,用户可以根据业务需求使用快照文件恢复数据。该作业可对快照文件进行创建、删除、设定时刻表、修改属性等操作。

③智能评估作业(Smart Quotas):该作业可对存储空间进行管理。根据用户实际业务需要,在存储目录上进行配额限制,用来管理用户、制作组,以及栏目的配额权限。当空间配额不足时会发出报警。天津广播电视台的新闻云项目应用此项功能进行素材文 件、故事版文件以及共享素材盘的分离,实现了高效管理。

④同步管理作业(Sync IQ):该作业用以实现不同集群之间的数据复制。作业运行时,源集群上的目录文件将复制到目标集群上,且必须在当前作业执行完成后才能创建新的复制作业。复制策略分为同步策略和拷贝策略。

⑤监控管理作业(Insight IQ):该作业可监控集群性能和使用情况,以此来优化存储性能。

⑥智能重复数据消除作业(Smart Dedupe):利用Smart Dedupe作业可以消除集群上的重复校验信息和冗余数据,优化磁盘空间的利用率。重复数据消除在目录级别应用,针对单个或多个目录下的所有文件进行,通过扫描集群中相同的数据块,消除重复数据。用户可以手动启动Smart Dedupe作业,也可预先设定好计划时刻表重复执行,根据集群存储的数据规模而定。一般来说,1~2周执行1次即可。

1.3 用户操作作业

此类作业由存储管理员配置并运行,用以实现对存储数据的管理功能。

①目录树删除作业(Tree Delete):删除/ifs中制定的文件路径。

②权限许可修复作业(Permission Repair):通过运行此作业可以更改集群存储中文件和目录的使用权限,且必须手动启动此作业。

OneFS系统定义了一个后台执行的作业库来运行维护存储集群,包括各类文件系统维护、功能支持及用户操作等作业类型。用户可以根据实际环境需要预先设定好作业运行的时刻表,也可以随时手动更改。当存储发生意外故障时,OneFS系统会紧急启动部分作业任务来进行数据修复和补救,例如当执行智能故障检测恢复(SmartFail)操作时,柔性保护作业(FlexProtect)任务将紧急启动,系统将会扫描文件系统,确保所有数据仍在被保护的状态。OneFS系统的作业任务类型可在图2位置查询。

图2 OneFS系统中的作业 Fig.2 Jobs in OneFS system

2 System Jobs操作实施

OneFS的作业引擎系统时刻监控系统性能和作业的运行状况,为保证后台作业的运行不会影响正常的数据业务和存储的有效利用,以及I/O活动的正常进行,OneFS系统引入了优先级策略[2]。日常维护中,管理员可以通过优先级策略来管理作业的运行时间和所占用的资源,分为图3所示的4类策略。

图3 影响策略分类 Fig.3 Classification of influence strategies

根据天津广播电视台综合云项目的维护经验,系统提供的4类策略可以支撑日常业务的运行以及文件系统的维护工作。一旦出现节点故障时,Snap Shot Delete将会停止,而文件系统分析作业(FSAnalyze)仍在进行,造成快照文件不断增大,占用过多磁盘资源。直到节点修复重新接入集群后,快照作业才会继续运行。而此时,Snap Shot Delete作业的策略虽为medium,但其对系统资源的占用情况是可接受的,实际测试并未影响正常的数据读写效率。

2.1 作业的操作命令

可以通过作业引擎定期维护系统来确保OneFS文件系统的可靠性和数据的完整性。当维护作业运行时,引擎会持续监控作业运行的状态和系统资源的占用情况,确保日常任务的流畅运行[3]。系统管理员也可以人为干预作业任务的运行,包括启动、暂停、恢复、取消及更新等操作。

①启动作业:可以运行isi job jobs start命令来启动某个作业强制运行。若需设定运行策略和优先级,可运行isi job jobs start collect—policy medium—priority 3,其中medium为策略等级,priority 3为优先级。

②暂停作业:可以运行isi job jobs pause + 作业ID的命令来强制暂停某个ID作业,以此释放一些系统资源。

③修改作业:首先通过运行isi job jobs list命令查看作业ID号,确定后运行命令isi job jobs modify 7—priority 3—policy medium,将ID为7的作业优先级调整为3,策略调整为medium,修改作业时只对当前作业实例有效,之后的作业会以默认设置运行。

④恢复作业:可以运行isi job jobs resume+作业ID来执行。

⑤取消作业:可以运行isi job jobs cancel+作业ID来执行。

⑥修改作业类型:可以通过运行命令isi job types modify +“作业类型”+“优先级”+“策略”,将作业类型修改为默认优先级和策略级别;通过运行命令isi job types modify +“作业类型”—schedule '时间表'—force,修改定期计划;通过运行isi job types modify +“作业类型”—clear-schedule—force命令删除计划。

⑦查看作业历史:通过运行isi job events list命令来查看特定作业的运行记录。

2.2 作业策略的操作命令

OneFS中的作业策略可以很好地辅助作业引擎管理作业,通常情况下,我们可以创建和分配策略来控制作业系统的性能影响。

①创建策略:可以运行isi job policies create命令来创建一个特定时间范围和影响级别的自定义策略,然后运行isi job policies list命令查看是否创建成功。

②查看策略设置:可以运行isi job policies view命令。

③修改策略:运行isi job policies modify 命令将当前策略重置属性,再运行 isi job policies modify 命令来制定策略的属性,最后运行isi job policies view MY_POLICY命令查看是否修改成功。

④删除策略:通过运行isi job policies delete命令来执行,但无法删除OneFS中默认的4种策略。

2.3 作业日志的管理

作业引擎控制的大多数系统作业使用低优先级和低影响策略执行,因此通常不占用过多的系统资源,但另有一部分核心功能作业,例如Flex protect和Flex Protect Lin、FS Analyze、Snap ShotDelete 以及 Tree Delete,这些作业任务运行优先级较高,影响策略适中。日常维护中,可以根据作业系统的日志报告来优化资源分配。

①查看运行中的作业统计信息:可以通过运行isi job statistics view 命令来显示某个作业任务的运行信息。

②查看已完成作业的报告:可以通过运行isi job reports view命令实现。

3 结 语

存储是非编网络的核心,无论是传统的双网架构非编网,还是现今被广泛应用的云架构系统,存储的稳定性和高可用性一直都是技术攻关的关键点。EMC品牌的Isilon X410系列存储在数据安全、网络带宽、交互的效率,以及可控可管性等方面都有着不错的表现。文章针对Isilon系统OneFS中的System Jobs功能模块予以说明,重点阐述了Job的原理以及简单的管理操作,希望在日常的运维管理中,把存储的基本管理和实际业务流程紧密结合,以更加高效地发挥Isilon存储的优势。■

猜你喜欢

快照数据安全命令
联邦学习在金融数据安全领域的研究与应用
面向Linux 非逻辑卷块设备的快照系统①
EMC存储快照功能分析
管理Windows10的PowerShell命令行使用记录
疫情就是命令 防控就是责任
巧破困局,快速恢复本本活力
建立激励相容机制保护数据安全
数据安全政策与相关标准分享
解析Windows10的内部命令
让时间停止 保留网页游戏进度