企业云存储平台的应用研究
2022-03-01来进翠
张 珊,梁 倩,杨 倩,郝 鹏,来进翠
(中国石油天然气股份有限公司长庆油田分公司数字化与信息中心,西安 710106)
0 引言
企业生产过程中产生的文档文件大多是传统的纸质资料,存储和保管会耗费大量时间和人力,在资料查阅和传播过程中也存在诸多不便。随着互联网应用的普及,生产数字化是企业发展的必然选择。企业生产过程中的数据包括企业资源计划(Enterprise Resource Planning,ERP)、财务数据等结构化的数据,但更多的是过程文档、操作手册和项目方案等非结构化的数据。这些数据存储难度大,同时对安全性也有一定的要求,随着云计算的推广普及,企业可以利用云存储技术对生产数据进行存储和管理。
1 云计算和云存储的概念
1.1 云计算概念
随着科学技术的发展进步,人们对云计算的认识也在不断发生变化,目前云计算仍然没有统一的定义。云计算是通过网络提供计算服务的方法,这些计算服务包括存储、服务器、数据库、软件和分析等。同时,云计算也是一种信息技术,它允许以最少的管理工作访问共享计算源。借助云计算,人们可以在网络上在线利用计算资源,而无须投入资金建设和维护基础设施。
1.2 云存储概念
云存储可以说是云计算技术的一种应用形式,它涉及云计算服务的基础设施即服务、平台即服务、软件即服务3 个服务层面,后续会进一步向更高的服务应用商务智能靠拢。云存储也没有统一的概念和定义,目前比较认可的一种说法为:云存储是指通过集群应用、网络技术或分布式文件系统等功能,使不同类型的存储设备协同工作,提供数据存储和业务访问的网络存储技术,也是以数据存储和管理为核心的云计算系统。对用户而言,云存储是一个由多种存储设备和多个后台服务器构成的整体,而不是某一个具体的存储硬件设备。用户使用云存储可以享受到整个系统带来的数据存储、数据管理和业务访问等服务。
2 云存储平台的架构
随着油气田企业数字化、智能化的深入发展,企业在日常生产运行过程中会产生大量的数据,企业庞大的数据资源可以分为两类:一种是结构化数据,另一种是非结构化数据。结构化数据主要包括企业ERP和财务系统中的数据,此类数据按照统一的标准规范和格式进行存储,通过关系型数据库进行管理,对外表达和逻辑实现采用的是二维表的结构,目前结构化数据的存储和管理机制完善,在企业长期数据存储管理应用实践中取得了良好的效果。
但是,结构化数据在企业数据中的占比较低,企业日常产生的大部分数据都是Office 办公文档、各类报表、操作手册、电子邮件、合同文本、发票单据、图片、扫描件、音频及视频等非结构化数据。此类数据在企业日常数据存储和管理工作中存在很多问题,如在数据存储层面,纸质版的文档、报表众多资源浪费严重,文档的查阅、调阅不便,无法及时发放回收;在数据管理层面,文档分散,版本众多易混淆,无法集中管理,审核效率低下,管理体系繁杂,没有统一的管理标准落地。
2.1 云存储平台应满足的需求
针对企业的数据特点及在管理过程中存在的问题,云存储平台应用需要满足如下使用要求。
(1)云存储平台整合企业日常业务数据和文档,通过无纸化办公节约纸张资源和存放空间,便于查找历史文件,提高企业工作效率。
(2)通过业务流转功能,可实现所有文件的审批流程监督、集成的邮件提醒,可通知相关人员及时处理工作,提高了审批工作效率。
(3)云存储平台提供内外网访问,实现网页、客户端及移动应用程序(Application,App)多种访问方式。无论在公司还是出差,都可以随时查阅工作资料和处理员工工作业务。
2.2 云存储平台的总体架构
根据需求,企业云存储平台总体架构可划分为4个层次,自上而下依次是:用户访问层、数据服务层、数据管理层以及数据存储层。云存储结构模型如图1所示。
图1 云存储结构模型
(1)用户访问层:通过该层,授权用户可以通过终端登录云存储平台,享受云存储服务。
(2)数据服务层:该层在云存储平台架构中直接面向用户,具备开发和扩展功能,可以通过后期开发为用户提供多种服务。
(3)数据管理层:该层起到承上启下的作用,通过数据管理层可以将底层的数据存储与上层的各种应用服务有效衔接起来,一方面实现多种存储系统之间的共同协作,另一方面也为上层管理提供统一界面,实现不同应用服务之间的统一公共管理。
(4)数据存储层:目前在用的数据存储架构主要有两种,一种是基于单服务器的数据存储,另一种是基于多存储服务器的数据存储。其中,基于单服务器的数据存储无法满足现有网络多用户条件下存储容量的需求;基于多存储服务器的数据存储技术克服了单服务器的缺点,可以在无限扩展存储容量的同时拥有强大的吞吐性能,还可以通过构建分布式数据中心的方式满足不同地区的大用户量使用条件下的高质量服务需求。此外,还有一种基于P2P 架构的数据存储,基于P2P 架构的数据存储相比基于单服务器的数据存储而言,虽然提高了吞吐性能和存储容量,但需要庞大的节点数量和复杂编码算法来确保数据可靠性和安全性。
数据存储层作为云存储平台的基础架构,是将不同类型的存储设备连接起来,实现海量数据的统一管理,同时实现对存储设备的集中管理、状态监控以及容量的动态扩展,实质上是一种面向服务的分布式存储系统。
2.3 云存储平台数据安全的实现方式
云存储平台采用分布式存储系统,通过分布式系统软件中的数据冗余存储、自动恢复机制,有效地保证了数据可靠性。数据冗余存储、自动恢复机制,提高了存储数据抵抗外界不可抗风险的能力,有效提高存储、操作和访问数据的可靠性。
对于平台存储的数据可以通过副本冗余技术、历史版本、云端回收站以及权责分离机制等方式保证数据的存储安全。
(1)副本冗余技术:通过副本冗余技术可以有效实现存储资源的修复。
(2)历史版本:个人计算机(Personal Computer,PC)客户端操作的文件,系统全程记录文件的修改历史,形成不同的文件版本,用户可通过历史版本找回所修改的文件内容。
(3)云端回收站:支持误删除文件的回收,避免本地误操作。
(4)权责分离机制:多用户组织单元配合管理授权,系统管理员仅需维护系统文档和各项服务,文档管理与访问授权可分发给各业务单元和部门负责。
3 云存储系统的设计
一种有效的云存储系统的设计可分为服务器端和客户端,具体部署如图2 所示。
图2 云存储系统总体构架图
3.1 服务器端的设计
服务器端总体架构分为4 层:系统服务层、云存储层、云共享服务层、管理服务层。其中:系统服务层负责操作系统层的基本服务;云存储层负责整个服务器后端的集群管理、分布式存储,确保了服务器端存储和管理的可扩展性;云共享服务层服务运行在管理节点之上,用户数据、权限体系数据信息均存放在分布式数据库系统上,不会因为单个节点损坏导致应用元数据丢失;管理服务层包括运营管理服务与WEB 文档服务。
云存储层和共享服务层均提供开放应用程序编程接口(Application Programming Interface,API),云存储层负责数据开放API,基于权限提供数据服务;云共享服务层开放API,提供用户、权限等信息。
3.2 客户端的设计
客户端分为PC 客户端和移动客户端,客户端与服务器端均通过开放API 实现文件的访问、同步、缓存、权限和用户管理。
云存储系统利用内部网络可以对服务器集群进行分布式部署,可将多个服务器变为存储节点,系统可任意添加服务器扩展存储节点。内部网络的互联互通保证了存储集群间的有效协作,提高了数据存储和访问效率,开放的API 通过外部网络将各种客户端的数据访问和管理需求同步到服务器集群,实现多种访问形式下数据的存储管理。
4 结语
云存储以其成本低廉、可扩展性高、易于管理等优点已成为未来存储发展的一种趋势。构建云存储平台使企业生产过程中产生的分散性、非结构性的数据资源得到集中存储和管理;分布式存储架构和平台设计满足了企业对数据安全性、操作高效性、系统可用性的要求,在企业中有很好的推广价值。