甘肃:“云”上的文化传承
2015-01-12张诤张亮亮
张诤 张亮亮
插云天的皑皑雪峰、一望无垠的辽阔草
原、莽莽漠漠的戈壁瀚海、郁郁葱葱的次生森林,大好风光孕育出甘肃的灿烂文明。2013年2月,国务院办公厅正式批复支持甘肃省建设华夏文明传承创新区,更是翻开了甘肃新的文化篇章。甘肃省文化资源数据库建设是华夏文明传承创新区建设的基础工程,对推进甘肃省文化资源的数字化保存、管理、开发、利用,具有重要的现实意义。
高要求建设数据库
为了实现全省文化资源数据22个大类、416个小类的优化储存和管理,甘肃省对文化资源数据库建设提出了高要求。
实现结构化与非结构化文化资源数据的混合关联存储。由于每类文化资源数据既包括对该类文化资源进行描述的结构化数据信息,也包括非结构化的图片、音频、视频等多媒体文化资源信息。因此,甘肃省文化资源数据库建设首先必须能够实现文化资源的结构化数据和非结构化数据的混合存储;其次必须实现每类文化资源结构化数据和非结构化数据的关联性,在文化资源数据的检索过程中,可以方便地实现结构化数据和非结构化数据的关联检索。
实现文化资源数据库规模的动态扩充。由于普查前事先无法准确预测全省各地报送的文化资源数据的大小,而且整个普查过程时间跨度较长,因此在甘肃省文化资源数据库建设过程中,必须能够依据普查数据量大小的变化,动态扩充文化资源数据库的存储规模。
实现文化资源数据库的网络化部署。甘肃省文化资源数据库应该建设成为一个开放的、网络化的数据库。授权用户可以在任何时间,借助任何终端设备如PC、笔记本、PAD、智能手机等,在全世界任何地方,通过Internet、移动网络方便快捷地访问数据库中的文化资源数据。
文化传承的“云”构想
数字化的文化资源是一种典型的异构大数据,既包括各类文化资源的描述性结构化数据,也包括大量图片、音频、视频等非结构化文化资源数据。针对这一问题,利用云计算、大数据处理等先进的科技手段显得尤为必要。
在云计算环境中建设文化资源数据库,需要进行多数据源的协作,要将数据结构各异的文化资源数据集成到“云”之上。因此,构建一种云计算环境下的异构数据集成管理平台非常必要。该平台根据云计算虚拟化、分布式、高可靠性及高可扩展性的特点进行构建,可实现对云计算环境中各种关系型、非关系型异构数据进行智能集成,可满足用户对数据库高并发量访问、对海量文化资源数据的高效率存储和访问、对数据库建设的灵活扩展性和高可用性的需求,实现用户高并发、高负载及高速处理海量数据的复杂关联数据查询请求。自上而下来看,该云平台包括3个主要层次:
云端数据获取分析应用接口。该层作为统一的对外调用接口,主要完成用户查询语句的语义分析和最终结果展示。通过这一层统一接收用户的数据获取分析语句请求,将数据获取分析语句具体解析为可对应不同数据源的具体的逻辑操作。
数据构造与任务调度引擎。该层主要负责接收上层下传的与用户查询任务对应的逻辑操作,并根据虚拟数据库结构将逻辑操作自动生成为相应的子任务集合,将子任务集合传输给下一层。本层还要将下层异构数据集成接口层提交的数据获取分析结果集整合好提交给上层的数据获取分析应用接口。
异构数据集成接口。该层是整个系统的核心,主要完成上一层数据构造与任务调度引擎发送的查询子任务集的具体实施和结果上传,并通过异构数据语义集成将云中各种异构数据进行集成。该层负责针对特定数据源的数据访问调用,将上层分布式查询执行引擎生成的具体原子操作( 包括从什么数据源、执行什么操作、获取什么数据),传递给云计算环境下的目标存储服务接口进行执行,并将执行返回的结果传递给上层。
云平台还需物理支撑
只有坚实的物理硬件作为支撑,“云”才能真正落地。甘肃省文化资源数据库云平台物理部署分为核心交换区、计算资源池区、集中存储池、云存储资源池。
通过对服务器、存储、网络的池化和有效管理,为整个云平台提供按需获得、即时可取的计算、存储、网络、操作系统及基础应用软件等资源。可实现云平台对资源的综合监控、管理,提高利用率、运行维护效率和系统可靠性,降低整体建设与整合成本。
主要采用多台高性能X86刀片服务器作为虚拟架构物理计算层,采用高性能统一存储系统构建存储系统层,采用高性能网络系统配合计算和存储建构LAN和SAN。给以上各物理设备配备虚拟化模组,由此构建架构虚拟资源层。应用在资源池中会根据其服务等级需求按需获得资源并均衡化部署,当某一台物理主机出现故障,部署在此物理服务器上的所有虚拟机都将自动恢复或重启到其他同一资源池中的主机上。
根据对甘肃省文化资源数据库云平台建设的需求,存储资源区主要由两部分构成:集中式FC-SAN存储与分布式IP云存储。规划存储容量12TB(其中集中式存储2TB,分布式存储10TB),如在使用过程中发现容量不够,可在线进行扩充。集中式FC-SAN存储主要存储Vmware虚拟机系统VMFS文件、文化资源描述数据Oracle数据库文件,以及数据交换平台备份文件。分布式云存储主要存储图片、视频等多媒体文化资源数据。
(作者单位分别为:甘肃省委党校信息中心;甘肃电信万维信息技术有限公司)