云计算技术对统计信息化建设的实践与思考
2016-02-12徐维郎
徐维郎
(宁波市统计局,浙江宁波315040)
云计算技术对统计信息化建设的实践与思考
徐维郎
(宁波市统计局,浙江宁波315040)
摘要:云计算以其广泛的网络访问、按需自助服务、虚拟化、高可靠性、通用性和可拓展性,已被认为是第四次IT产业革命,统计信息化建设可以充分利用这一新兴技术加大对统计工作的支撑。本文通过对统计信息化现状的介绍和对云计算技术的分析,认为云计算应该在统计系统大力推行,并通过宁波的实践加以印证。文章最后对云计算技术应用于统计信息化建设提出了建设和布局方面建议。
关键词:云计算;统计信息化
统计信息化经多年建设,已达一定规模,在统计工作致力于信息资源建设和加强公共信息服务的今天,亟需统计信息化整合资源提供高计算能力,而云计算技术以其资源池化、虚拟化和提供按需服务已成为当前信息化发展的标志性革新技术,必将促进统计信息化建设的变革。
一、统计信息化现状
统计信息化建设起步于上世纪80年代,以“微机起步、人机结合”开始,再是“从小到大、逐步完善”发展,至目前已建成国家、省、市、县和乡五级联网的统计专线网络,拥有设施齐全的统计机房,建立全国统一的基本单位名录库系统,形成全国“1+14”统一数据联网采集体系,国家和省一级的统计综合数据库系统上线运行。
(一)基础设施颇具规模。一是网络。国家、省、市、县和乡五级联网的统计专网建成,国家统计局到31个省(市、区)统计局和新疆生产建设兵团的一级主干网网络带宽达155 + 6兆,采用双设备、双线路冗余架构。统计系统的信息交换、数据传输能力已达到了一定规模。二是机房设备。至2014年底,省级统计局专用机房建筑面积平均为247平方米,平均拥有小型机5台,微机服务器55台。
(二)基本单位名录库系统建立。按照全国一库在线、分级管理维护的模式,建成了全国统一的基本单位名录库系统,并建立了与质监、工商、税务、编办、民政等部门的单位信息共享交换机制和名录比对系统。
(三)联网数据采集系统建成。以国家统计局为中心,14个数据报送单位个数多的省级统计局为分中心,使用统一数据采集平台,建成统计数据集中采集系统,实现数据集中采集、在线审核,保证原始数据的完整性、一致性和可控性,提高了统计数据质量和统计工作效率。
(四)统计综合数据库上线。作为统计系统政务公开的一个重要窗口,国家统计数据库正式对外公开发布,已整理加载全国及分省综合数据150多万笔、3700多个指标。多个省级数据库系统也已上线并对外提供统计数据服务。
(五)信息化新技术推进应用。手持电子智能设备和移动电子采价器在统计数据采集工作中普遍应用,卫星遥感、无人机测量等空间技术,已在农作物种植面积、产量测算、农业普查等统计业务中应用。
二、云计算技术介绍
云计算是分布式处理、并行处理和网格计算的发展,是一种基于网络的超级计算方式,以虚拟化资源提供服务应用的计算、存储模式。用户可使用各种终端方便、快捷、高效的获取网络资源服务,通常把提供资源的网络称为“云”,使用者在这朵“云”资源中,可随时获取,按需使用,随时扩展,按使用付费,就像日常使用水电、煤气一样,取用方便。
云计算被认为是继大型计算机、个人计算机、互联网之后的第四次IT产业革命,是一种商业计算模型,以一种简化的方式提供服务,满足客户和业务的需求。其特点主要体现在广泛的网络访问、按需自助服务、虚拟化、高可靠性、通用性和可拓展性等方面,实现随时随地网络访问。
云计算通过基础设施层、平台层和应用层三个层次的服务提供,共享的软硬件资源和信息可以按需提供给用户。一是基础设施层(Iaas),这层包括了所有的计算资源和存储资源,是云计算向用户提供服务的硬件实体。它可以给用户提供虚拟化的计算资源和存储资源。二是平台服务层(Paas),平台服务层是整个云计算系统的核心层,主要包括软件程序开发环境,海量数据的存储管理和分布式文件系统以及其他实现云计算的管理系统。三是应用服务层(Saas),这是一种软件交付模式,用户通过浏览器就可以访问响应的应用程序,不必要了解其背后支持运作的系统结构,硬件设施或者网络拓扑。
三、云计算技术在统计信息化建设中的实践应用
宁波市统计局积极争取宁波市智慧城市建设领导小组办公室(市智慧办)智力、技术支持,搭乘宁波“智慧城市”建设快车,在云计算技术应用于统计信息化建设中谱写宁波实践篇章,探索建设宁波统计“云中心”,努力推进统计工作的信息化、智能化和高效化。
(一)借机借力,应用整体迁移入“云端”。2015年初,宁波市统计局抓住市委市政府着力推进智慧城市建设以及办公场地整体搬迁的契机,主动与市智慧办对接沟通并取得其同意支持,将宁波市统计局所有信息化应用整体迁移至云中心。根据迁移协议,宁波市统计局将原机房所有应用全部虚拟化,分批将内外网网站、网上直报系统、OA办公系统、经普、人普、农普等大型普查数据处理系统及日常信息支撑系统共约40余台服务器信息系统迁移入驻云中心,并集中技术力量保证迁移期间网络系统的安全稳定和统计业务的运作衔接。迁移完成后,宁波市统计局服务器设置在宁波市电子政务云中心(政务云中心),形成与市智慧办共建的统计私有云,宁波市统计局不再保留物理机房。
(二)分类分责,部门协同聚力抓运维。基于统计系统网络运行的特殊要求以及部门间工作衔接过渡的需要,宁波市统计局将所有信息化系统分为两类,根据实际情况分别确定了宁波市统计局与政务云中心的运行维护职责。一类是主要服务社会和统计报送单位的信息系统,如外网网站和宁波统计网上直报系统等,整体融入政务云中心之中,按照政务云中心的运行管理规范运作,由政务云中心提供防火墙和入侵防御系统(IPS)等安全防护设备,应用系统安全由宁波市统计局技术力量提供支持和保证。另一类是建立在统计专网上的信息系统,如内网网站、OA系统和普查数据处理系统等,由政务云中心划出一部分独立的云资源,单独归宁波市统计局使用,相关网络安全由宁波市统计局自行负责,防火墙、入侵防御系统等安全防护设备也由宁波市统计局自行提供。这种有分有合的运维职责划分,既有效借助政务云中心整体的数据集成处理效能和安全防护设备,实现海量统计数据的安全高效存储处理,又为统计部门根据业务要求独立管理和运作相关系统预留了充足空间。
(三)集约集成,平台全面发力显成效。一年来,统计云中心运行安全顺畅,各项功能逐步发挥,成功实现了包括专业业务信息、行政管理信息等在内的统计信息资源的集中储存、虚拟化管理和动态分配,在助推统计数据资源高效集成、应用系统高效运转、统计效能迅速提升等方面的综合效用全面显现:一是统计信息化系统和数据信息运行及存储空间极大拓展。面对迅速增多的统计信息化系统应用需求和海量数据信息存储处理要求,统计云中心的建成投用极大拓展了系统运行和数据存储空间,使统计部门不再受困于信息化建设和维护成本过高、部署慢、二次改造难等问题,实现了信息资源的低成本海量存储和随需应用,大大提高了信息化管理功效。二是应用系统的稳定性和可靠性得到有效保证。由于云计算技术的特点,确保了系统在某一硬件发生故障时会自动进行漂移,系统运行不受影响。政务云中心是以双活机房方式进行建设的,即使其中某个机房因特大故障全面停止运行,另一机房也可以将所有应用接过去。入驻政务云中心以来,宁波市统计局网络信息系统很少发生因硬件原因而引起的宕机事故。三是系统扩展性大为提高,新系统部署更简单方便。云中心的资源是按需分配的,可以按实际需要进行服务器资源的增加或减少,也只需简单操作就可生成新的服务器资源供使用,因此使统计部门新的应用系统部署更加简单方便。四是系统移植改造更加便捷。入驻政务云中心后,宁波市统计局所有的服务器系统都以虚拟化方式运行,不局限于特定服务器硬件,在政务云中心平台内进行系统移植改造只需复制几个文件就可实现,系统移植改造方便易行。
四、统计信息化建设中应用云计算技术存在的问题
现阶段统计系统使用的云计算中心一般采用商业租用模式,或是参与当地政府统筹集中建设方式,鲜有统计部门自建的云计算中心出现,这在实际运行中存在不少问题。
(一)基础设施问题。云计算中心的运作主要依赖网络基础设施,没有持久的网络连接,云计算将无法发挥作用,网络故障和中断也往往导致数据丢失。统计网络和云计算中心之间如果不是采用专用网络连接方式,无法得到稳定可靠的云计算服务。
(二)数据安全问题。一是数据存储方面。云计算平台尽管有多种数据安全存储保障技术支撑,但平台本身复杂,风险和隐患相比常规增多,控制和监管手段不足,一旦发生数据存储故障,后果将是毁灭性的。二是数据管控方面。信息系统进入云计算中心平台后,用户对数据、系统的控制管理能力减弱,所有的数据实际上都被平台管理者掌控,数据安全不确定性大为增加。三是数据访问方面。尽管有防火墙、密码认证等多种安全保障措施,计算机木马和黑客软件仍时刻威胁着数据安全,特别是集中存储的云计算中心,相比用户自己的存储系统,网上关注度更高,相应威胁度大增。
(三)系统把控问题。云计算平台自成体系,不同厂商之间的产品兼容性差,互操作和移植比较困难。各个云计算平台用户数据和业务迁移到云计算平台后容易形成对云计算服务提供者的过度依赖,平台更换困难。一旦云计算平台出现运行问题,将极大影响本身业务的正常开展。
五、云计算技术应用于统计信息化建设相关建议
现代统计体系建立需要统计信息化发展作为支撑,信息技术的发展也为统计改革提供保障。统计工作将全面采用计算机、互联网和数据挖掘技术,充分应用信息新技术,实现统计信息搜集、处理、传输、共享、存储和统计数据库的现代化。统计数据加工处理过程涉及行业范围广,数据量大,对数据审核、汇总、分析等都要依赖于现代信息技术手段。面对分散的数据分布、海量的数据存储和高效的数据运算需求,云计算技术可以在统计信息化建设中发挥独特的作用。
统计系统应用云计算技术首要一点是云计算中心应由统计系统自己建设,这样可以发挥云计算技术服务于统计工作独特的优势。这首先在于统计的网络基础,已是相当规模的统计专网可以确保统计云发挥作用;其次在于同统计信息系统关联的统计业务有时间性,峰谷明显,月底月初是数据采集高峰,月中出现数据查询、汇总、分析峰值,而且县、市、省、国家各级峰值时间相对错开;再次可以消除部分数据安全问题,数据都在统计专网中,掌控在统计自己手上,被另外使用的可能性大为减小。
统计系统应用云计算技术其次在于云计算中心的布点上。可以按照“物理分散、逻辑统一”原则在统计主干网络上选择若干个机房条件和技术储备相对比较优秀的地方,集中资金进行云计算中心建设,运作上可采取“资源统一调度、管理相对独立”方式,使这些云计算中心相互之间互为备份,即使某些地方因某种原因出现问题,总的计算能力和系统支持也不会出现无法支撑现象,而且所有的服务不依赖于特定的点。
统计系统应用云计算技术关键在于改变观念和发挥技术本身的作用,积极应用云计算技术改变基础资源的配置与管理方式,推动大数据分析应用,积极应用移动服务提高统计服务水平,推进数据共享、数据公开、数据质量提升和数据开发利用,强化信息化对统计工作的技术支撑,实现信息资源的集约化处理和利用,驱动统计工作科技创新。
(责任编辑:施越霞)