农信社互联网金融业务核心系统基础架构建设若干难点探讨
2024-10-31罗岳衡王淑萍
摘要:在现如今的数字经济时代背景下,以互联网金融为代表的金融服务渠道使得金融机构为终端客户所提供的服务场景以及服务模式得以大力开拓和有效创新。鉴于此,本文紧密围绕农信业务,基于项目建设方视角,重点针对互联网金融云平台建设和同城容灾规划进行深入探讨,从而为农信社互联网金融业务核心系统基础架构建设提供技术指引和实践指导,致力于加速推进我国农村金融机构的互联网金融转型升级。
关键词:农信社;互联网金融云平台;同城容灾规划
中图分类号:F23文献标识码:Adoi:10.19311/j.cnki.16723198.2024.20.051
依据中国人民银行等十部委联合发布的《关于促进互联网金融健康发展的指导意见》,广东农信、四川农信和湖南农信等农村金融机构纷纷与阿里巴巴等互联网科技公司针对互联网金融业务核心系统规划与建设开展深度合作,为传统农信社向互联网金融转型升级树立了标杆与典范。互联网金融业务核心系统属于复杂信息系统项目,其特征主要表现为投资规模大、建设周期长且风险大。云平台规划和同城容灾规划是互联网金融业务核心系统基础架构建设的重难点。
1云平台规划
互联网金融云平台,是指基于云技术与金融业务的全面整合,通过统一的数据存储、数据计算和数据处理,为金融机构和终端客户提供金融服务解决方案。
1.1&LUNqs5e+ESZgdx+btFpAFA==nbsp;基础架构规划
互联网金融云平台基础架构主要包括基础云平台服务、PaaS组件服务、分布式应用管理、移动开发平台、DevOPS平台与云管平台。基础云平台服务分为云底座和IaaS服务,云底座为云平台提供编排管控,是云平台的核心组件模块,基于云底座的基础组件能力,构建IaaS层以提供多项基础IaaS服务;PaaS组件服务包含了各类分布式开发架构的技术服务组件,用于支撑平台设计与开发。运营平台主要围绕云产品能力构建出一套运行管理机制和技术体系,云能力和运营技术为重点关注内容。云管平台为一站式管理中心,可支持多种不同业务类型的自助服务,简化了物理资源和虚拟资源的管理和部署,帮助农信社快速建立简洁高效的互联网金融业务系统,降低运维成本,构建以云计算为基础的全新生态链。
1.2部署架构规划
按照需求独立两朵云划分可用区,涵盖开发测试云、生产环境以及同城数据库3个可用区,为金融业务上云提供完善的云计算基础设施能力。开发测试云为各个研发测试团队提供基础网络资源和服务;生产同城云用于部署和运行农信业务,以A数据中心为主节点规划部署生产可用区,在B数据中心规划部署同城备可用区,同时在B数据中心规划部署分布式数据库与RDS数据库第三可用区,由此形成一同城两中心三可用区的生产云平台。
1.3网络架构规划
基于部署架构规划,将分布式云平台划分为若干个逻辑独立的物理网络集群,每个物理集群对应一个AZ,多个集群间通过物理专线或逻辑专线连接组成多AZ或多region的大型云网络架构。采用CLOS方式构建各个物理集群,依据实际网络接入规模,自由定制网络转发平面数量并逐层迭代。将生产云平台三个可用区进行两两对接,通过波分设备或专线设备实现数据同步与管理互联,组建成统一的一朵云对外提供服务,开发云独立部署,业务在云内互通,两朵云通过边界安全设备对接互联网、外联网和生产内网,为应用业务互联、运维管控、农信社以及外联单位接入提供互联基础条件。
1.4PoD设计规划
通常情况下,数据中心建设以标准自定义的PoD(PointofDelivery)作为建设单元,PoD内部的物理机、网络虚拟化池与存储集群节点无差别部署在不同机柜,以实现PoD内供电—组件—链路—设备节点多级容错。分布式专有云基于标准PoD架构进行进一步强化,服务器可基于云平台的系统规划能力,在所有PoD节点实现无差别接入。
1.5高可用设计
高可用,是指通过保持业务连续性以及服务的高度可用性,以减少停工时间;采用层次化冗余实现高可用的具体内容详见表1。
专有云在同城数据中心可以提供原生的同步复制技术,在异地提供异步复制技术实现容灾。
1.6资源池规划
在云平台建设完成投入生产前,如何以业务发展支撑为核心目标,科学、定量规划,分配和使用云平台,是数据中心资源池规划的关键核心,“解耦化、模块化、定量化、多元化”即为资源池规划的“四化”目标。解耦化,如服务器CPU硬件和传统OS解耦后,即可实现多个物理服务器CPU的统一管理和虚拟分配,网络转发和数据平面解耦后,可构建中央控制节点,并在底层网络创建多个独立的网络转发和数据平面,实现底层网络透明化;通过组网、计算值以及存储池整体模块化,可有效避免后期持续扩展时因容量上限有限导致资源间割裂,引发扩展不连续;通过云资源容量尤其是弹性能力的定量化,可实现云资源全面契合业务负载和相关需求,同时保证了机房PUE的可测量和可管理;多元化架构能够更好适应多种类型的业务需求,有效平衡敏捷性和稳定性,最终实现服务的综合化。
2同城容灾规划
容灾系统需要具备较为完善的数据保护功能与灾难恢复功能,保证生产中心出现意外时数据的完整性与业务的连续性,并在最短时间内由灾备中心接替,恢复业务系统的正常运行,实现损失最小化。RPO和RTO是容灾系统设计的核心指标,数据恢复点目标(RecoveryPointObjective,RPO),是指在灾难发生时系统和数据必须恢复的时间点要求,代表系统能够容忍的最大数据丢失量;恢复时间目标(RecoveryTimeObjective,RTO),是指灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求,代表系统能够容忍的服务停止最长时间。PRO和RTO须在风险分析和业务影响分析之后,根据不同的业务需求进行明确。较好的容灾系统需要尽量满足用户需求,容灾中心建设等级如图2所示。
2.1设计思路
目前,很多金融机构建立了部分数据同城容灾,而未实现应用级容灾体系,暂无异地容灾体系,需要基于农信业务发展需求和应用系统的重要性评估,建立与之相匹配的容灾体系,秉承“同城保发展、异地保生存”原则,构建云平台“同城双中心”以及“异地三中心”的灾备恢复能力。在容灾体系建设中,需要对应用评级进一步细化,制定与之相匹配的PRO和RTO建议,补充云平台可用区,在未来考虑跨多云的容灾结构,同时应满足架构层次解耦,保证技术架构的异构性。在建设策略方面,补充应用双活规范,通过结合云原生复制技术和一键切换等,构建容灾管理流程并进行组织和培训,不断巩固和持续提升数据中心的容灾管理能力。
2.2建设过程
容灾系统建设过程主要包括分析、策略制定、方案实施以及测试/演习/维护4个阶段。在分析阶段,需要收集业务过程信息、技术基础架构支撑环境以及灾难类型等方面内容,之后进行业务影响分析和风险分析,明确因中断或预期灾难造成的影响,分析结果用以确定业务关键级别、业务恢复时间以及可承受的数据损失程度。在策略制定阶段,基于分析结果与容灾投入规划,分别制定短期、长期容灾策略和容灾目标,经评估组评审明确最为适用的容灾方案。在方案实施阶段,基于容灾方案制定容灾体系架构和灾难恢复计划,通过技术手段和服务实现容灾目标。在测试/演习/维护阶段,通过定期修改和计划修改,确保灾难恢复计划的持续有效性。
2.3部署流程
专有云同城容灾集群属于同一个Region下的两个Azone,IDC独立但互为备份,当A(主)集群出现异常状态时,通过ASR-ApsaraStackResilience(切换服务)将B(备)集群切换到线上,部署方式为A→B→A′(将A集群升级为容灾配置)。
2.4IDC规划
机房规划主要包括机房标准参考、机房功能区设计、机房能耗(PUE)优化建议以及机房管理4个方面,GB50174-2017《数据中心基础设施设计规范》提出了机房基础设施建设的核心要求,并将电子信息系统机房划分为A、B、C三级,在机房设计的过程中,根据机房的使用性质、管理要求及其在经济和社会中的重要性确定其所属的相应级别。在异地建立的备份机房,应与主机房具有相同的等级,同一机房内的不同部分可根据实际情况,按照不同的标准进行设计。
2.5技术架构
外部网络采用GSLB或智能dns进行负载和容灾切换;内部网络云产品通过slb进行负载和自动化切换,云应用通过dns进行切换,应用双活部署,由中间件负责切换;分布式数据库为三副本强一致同步;CPFS存储主备同一集群为同步复制,其他存储/数据库为异步复制;云管平台采用同城双活部署;在线应用采用双活部署,应用间调用支持http;批量应用中,计划内场景能够监控批量执行情况并一键调整批量执行计划,灾难场景能够支持手工/自动方式断点重提。
3结论
本文重点针对云平台和同城容灾体系建设规划重难点进行了深入探讨,能够在对农村金融机构发展互联网金融业务的过程中,对互联网金融核心系统项目建设起到一定的指导性作用,避免项目建设的基础架构无法支撑业务快速发展的要求,充分考虑了金融行业自主可控数据库的应用,更加合理地规划核心生产系统的容灾,安全防护和网络,对我国金融行业具有较好的推广价值和借鉴意义,加速推进农信社互联网金融发展。
参考文献
[1]晏祎.基于互联网农村金融发展问题及对策分析[J].农业经济,2022,(09):9092.
[2]李淑萍,徐英杰.互联网金融、系统重要性与商业银行风险承担[J].宏观经济研究,2020,(12):3846+151.
[3]马德辉,何兴建,张志鹏,等.依托云平台在互联网金融时代乘风破浪[J].中国农村金融,2020,(22):1516.
[4]ManelM,JavierC,LuisI,etal.Towardshighavailabilitycyberphysicalsystemsusingamicroservicearchitecture[J].Computing,2023,105(8):17451768.
[5]杜军龙,金俊平,周剑涛,等.具备完整性追溯的系统数据容灾机制[J].计算机工程,2019,45(07):170175.
[6]魏亮,薛牧遥,霍炬,等.基于ICP算法的非合作目标特征点云配准优化[J].系统仿真学报,2020,32(12):23832387.
[7]吕韬,田峰,李征宇,等.分布式关系型数据库恢复点目标测试方法[J].工业技术创新,2020,07(03):3036+41.