APP下载

高校核心业务系统安全可控迁移范式研究*

2020-11-30于磊磊李永在张家重乔禹

中国教育信息化·高教职教 2020年11期
关键词:迁移

于磊磊 李永在 张家重 乔禹

摘   要:随着高校信息化建设的深入,高校核心业务系统对高性能、可靠性、可用性的要求越来越高。与此同时,在新的国家信息安全形势下,发展自主可控、应用自主可控,已经刻不容缓。文章研究了基于国产自主可控主机高校核心业务的迁移范式,并在山东大学校园卡系统的升级建设过程中进行了验证,取得了良好的效果。

关键词:自主可控;关键业务主机;校园卡系统;迁移

中图分类号:TP309 文献标志码:A 文章编号:1673-8454(2020)21-0093-04

一、引言

国内关键业务基础设施长期依赖国外主机,核心技术和设备受制于人,给国家信息安全带来了系统性的安全风险。尤其是在华为事件、中美贸易战之后,我国国家信息安全面临的形势日益严峻。加速国产自主可控主机对国外主机的替代化进程,是国家信息安全必然选项和基础保障。高校作为“立德树人”的文化阵地,为社会建设事业提供智力支持和人才保障,高校也是国家信息安全的重要阵地。高校的核心业务系统如校园卡系统、财务系统、教务系统等承载着大量的核心数据和重要业务,也一直是严重依赖国外主机的领域。在银行领域,最早尝试和实践了关键业务向自助可控主机的迁移,如2013年,中国邮政储蓄银行的核心系统客户营销系统就实现了从国外主机向国产自助可控主机的迁移。在国产自主可控主机及生态已经成熟的背景下,将高校核心业务系统升级迁移到国产自主可控主机,实现平稳光滑过渡,已经成为一个重要的研究和实践课题。

本文研究了高校核心业务系统架构范式、迁移范式和评估范式,并以山东大学校园一卡通系统作为实践对象进行了评估验证。

二、架构范式

受资源和投入限制,高校核心业务系统架构主要采用单生产中心模式,核心业务的稳定性主要依赖于国外关键业务主机的硬件成熟性,但随着设备运行时间增长,硬件部件的损坏和故障情况仍在所难免。高校需要投入大量资金购买国外关键业务主机维修和维保服务,同时核心业务的连续性也会受到较大影响。在当前数字化、智能化高校建设的背景下,核心业务对连续性的要求愈来愈高,核心业务系统的构建除建设高可靠的生产中心外,应配套建设备份中心和容灾中心,并实现各中心之间的物理隔离和地域隔离。如架构参考样例(见图1),构建生产中心、同城容灾中心和异地备份中心,生产中心采用4个节点的国产自主可控主机系统架设,其中2个应用节点,2个数据库节点,容灾中心采用异构的X86服务器环境,备份中心采用备份一体机承担。生产中心2个应用节点之间通过业务连续性保障软件和链路冗余软件实现故障恢复和节点切换,2个数据库节点通过Oracle的RAC机制实现数据库高可用。生产中心与容灾中心之间通过应用级热容灾平台实现数据实时全同步。备份中心通过在生产中心主机节点内置兼容备份代理实现数据的备份与恢复。

1.數据库服务器集群

在传统架构中,数据库服务器集群通常采用双机热备模式,其中1台服务器作为备用机,只有当主机出现问题的时候业务才会切换到备用机上运行,备用机大部分时候处于空闲状态,这在资源的利用上以及成本方面都形成较大的浪费。在新的架构范式下,基于国产自主可控主机的数据库服务集群是一种多节点并行模式的架构,在集群内的各节点全部处于运行状态,不会出现设备的闲置和资源浪费。节点之间通过内部高速互联芯片连接成一个整体,利用数据库软件的集群(RAC)功能将这些节点融合为一个整体对外提供数据库服务,并通过分布在集群内各节点的全局共享缓存来保障数据一致性。这种数据库集群架构方案优势在于可以将高并发访问均匀分布在集群中不同的节点上进行处理,可显著提高系统资源的使用率和业务运行效率,并能够灵活扩展。当集群内某个节点发生故障停止运行后,系统可以将该节点上的业务分配到其他节点继续运行,当节点故障排除后,可重新加入集群运行,如图2所示。整个系统在确保高效运行的同时提供了极高的可靠性。

2.应用服务器集群

在传统架构中,应用服务器集群同样采用传统双机热备模式。在新的架构范式下,采用多节点并行架构,实现动态节点加入和退出,故障节点的切换时间也大大提高。在传统的双机热备集群构架中,当主节点出现问题时,常常需要数分钟的切换时间才能将业务切换至备用节点;而在多节点并行架构方案出现相同问题时,在故障节点已经存在的访问会话秒级时间就可以切换到另外的节点,而对客户端新会话的创建不会产生影响。这意味着在整个集群中只要有1台节点保持运行就可以确保用户的业务持续运行,如图3所示。

3.多复用容灾中心

在新架构范式下,基于核心业务连续性的高要求,设计了多复用的容灾中心。在生产中心和容灾中心采用国产应用级双活容灾平台实现热容灾,灾备数据库始终处于Open状态,从而为容灾中心复用提供了基础条件,同时,容灾中心配置高速存取的全闪存储系统,从而实现容灾中心的多用途复用:①查询中心。将核心业务中的查询业务分离,将所有查询业务部署在查询中心的服务器集群。其优点有二,一是实现查询业务和生产数据的隔离,从而保护生产数据的安全,降低生产数据库的任务承载;二是能够高效利用容灾中心的全闪存储的高速查询特性,实现大规模查询业务的瞬时响应。②大数据中心。创建大数据中心,通过抽取整合各数据库的关联数据,建立结构化大数据中心,实现数据价值挖掘。③交换数据中心。通过创建交换数据中心,实现与其他校内信息系统的双向数据交换平台,从其他信息系统获取数据并传入生产库,并向其他信息系统提供定向数据。④历史数据库。通过创建历史数据库,对生产数据库、查询数据库的历史数据进行在线写入和专线访问。

三、迁移范式

核心业务系统的迁移是升级项目实施的关键,所设计迁移范式的可行性、落地性是影响核心业务迁移进程和成败的首要因素。新的迁移范式有应用迁移和数据库迁移,并且要求迁移过程中业务无中断。为确保项目迁移的顺利实施,通过周密计划、细致安排,将项目实施分为评估、计划、验证、测试、上线5个阶段,每一个阶段均对基础架构、系统依赖和应用做针对性方案和验证,各阶段的工作任务如表1所示。

以某高校的教务系统为例,其业务迁移包含两个部分——应用迁移和数据库迁移。在应用迁移方面,需要将原有的核心应用从基于Spark体系Solaris 平台迁移到基于Itanium体系的K-Unix平台,校园一卡通厂商深度参与到应用架构评估、迁移方案制定、应用验证、应用测试、应用上线各个阶段,并充分在新的K-Unix系统平台下进行应用的编译、测试、重构、调优,确保了应用的成功迁移。在数据库迁移方面,采用Streams复制实现不同平台Oracle之间数据库的同步,并通过多种机制校验数据的正确性。

四、评估范式

1.国产关键业务主机选型

天梭K1系统由国家服务器领导厂商浪潮公司研制,是一款基于CC-NUMA架构的高性能、高可靠小型机,实现了芯片/模块、系统管理、操作系统、业务应用的多方面的冗余容错设计。山东大学核心业务数据中心在前期建设中主要采用SUN、富士通小型机架构IT基础设施,价格昂贵且对国外厂商依赖性强。在项目新一期升级规划时,基于国产小型机系统设计替代架构方案,进行了全面、深入、严格的性能测试和功能测试。系统2018年12月完成迁移上线以来,已实现超过6000小时的不间断无故障运行,取得了良好的效果。

2.核心业务系统验证选择

为验证架构范式、迁移范式并进而探索研究评估范式,选定了作者所在高校的校园一卡通系统,同时结合升级实施实际进行评估验证。为验证迁移效果和性能提升,进行了两方面的数据收集:①应用运行状况,指校园一卡通生产系统软件在K1主机系统上运行的稳定性和可用性。②Oracle数据库运行状况,指生产状态下的TPS(每秒处理事务数)、RPS(每秒处理数据行数)和高峰运行时负载。结果表明,K1主机系统在关键性能、稳定性方面均有了较大提升。

3.应用运行验证

根据校园一卡通系统的应用评价体系,设计了不间断运行时间、日结占用时间等关键指标,并和旧的系统平台进行了对比,结果如表2所示。

从表2可以得出,从旧的系统平台迁移到K1主机系统后,各项业务均工作正常,稳定性得到了大幅增强,日结时间、业务響应时间等关键指标也有了有效提升。

4.数据库运行验证

数据库运行效果验证采用了3个指标——每秒并发事务量(TPS)、每秒处理数据总行数(Rows)、系统资源占用率,因核心硬件性能不同,未选择与其他系统平台对比,而选择通过压力测试角度对比。取一个数据库节点作为性能监测对象,几项指标的运行数据如图4、5和表3所示。

从图4、5中可以得出,当用户并发量小于50时,TPS值超过600,每秒处理数据行数超过14万。随用户并发量达到50时,两项指标下降明显,但随用户并发量继续递增,各项指标表现为平稳下降,并未因并发量提升产生剧烈抖动,表明K1主机系统应对数据库大并发具有很强的鲁棒性。

从表3中可以得出,在现有数据库业务下,CPU、内存的利用率均在20%左右,CPU最大利用率在70%左右,内存最大利用率在50%左右,能够良好应对后期业务的扩展和数据的增长。

五、结论

发展自主可控、推广自主可控,是国家信息安全的必由之路。本文基于国产自主可控主机实际设计核心业务系统基础架构范式和迁移方式,实现对国外核心业务主机的体系架构替代和业务平滑迁移。山东大学校园一卡通系统项目升级实践验证表明,国产自主可控主机架构能够出色地完成核心业务系统的承载,并在主要关键指标方面得到了有效提升。

参考文献:

[1]吕仲涛.打造“两地三中心”IT架构 提升信息系统连续性运作水平[J].金融电子化,2017(3):62-64.

[2]方雪.基于自主可控计算平台的指挥控制系统架构[J].电子技术与软件工程,2019(21): 132-134.

[3]陈奕飞.省级教育数据中心整合迁移的研究与实践[J].中国教育信息化,2018(11):84-86.

[4]唐明明.基于两地三中心的医院分数据机房[J].中国科技信息,2018(21):42-43.

[5]杨宗凯.教育信息化2.0:颠覆与创新[J].中国教育网络,2018(1):18-19.

[6]马文昊.关键信息系统安全现状与建议[J].中国教育信息化,2013(20):12.

[7]张济建,尹星,刘宏笪等.战略性新兴产业递阶式自主可控路径探析[J].重庆理工大学学报(社会科学):2019(10):81-88.

(编辑:王天鹏)

猜你喜欢

迁移
谈物理模型在物理学习中的应用
浅析迁移规律在足球教学中的影响
创新思维培养之我见
走在文化与生活间的阅读命题