多源数据融合技术在后备干部管理系统中的应用
2014-08-07朱付保徐显景霍晓齐朱颢东
朱付保,徐显景,霍晓齐,朱颢东
多源数据融合技术在后备干部管理系统中的应用
朱付保,徐显景,霍晓齐,朱颢东
随着社会信息化进程的逐步深入,各部门中已有业务系统在数据集成和信息共享方面存在不足,已达不到对信息资源整体开发利用的要求,这给后备干部信息管理工作带来了诸多不便。针对后备干部管理的业务特点和信息化的发展趋势,研发一个以数据集成和信息共享为目标的后备干部管理系统显得尤为重要。通过全面分析后备干部管理的业务需求和数据特点,提出了基于.NET平台和SQLite数据库的后备干部管理系统的设计方案,并以河南省为应用实例,验证了该系统设计方案的合理性和有效性。
数据集成;数据融合; 信息孤岛; 信息共享; 数据仓库
0 引言
信息化的深入发展,新的信息系统层出不穷,当今企业组织的运营中基本都包含了许多用以管理业务流程的系统。就大型企业和政府部门的信息化而言,信息系统建设通常具有阶段性和分布性的特点,因而导致了“信息孤岛”现象的存在。“信息孤岛”造成系统中存在大量冗余数据、垃圾数据,无法保证数据的一致性,从而降低信息的利用效率和利用率[1]。大多数企业组织的应用系统存在集成能力差、互操作性不高、缺乏统一标准等缺点。随着企业组织的日益发展,这些现存系统已逐渐无法满足企业组织的业务需要。在日益增多的“信息孤岛”环境下,使得企业组织的工作效率受到严重影响,数据集成问题亟待解决。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享[2]。
作为后备干部管理的组织部门,河南省后备干部管理呈现的是一种多层次的干部管理模式。在后备干部管理复杂的业务流程中涉及到大量信息检索、数据的分析、报表的打印和导出等操作,如何运用计算机相关技术实现后备干部信息的有效集成和共享,加快后备干部管理的信息化建设,是组织部门后备干部信息管理工作中亟待解决的问题。并且后备干部管理系统设计的是否实用、完备、科学、规范、可扩展,会直接影响到系统的研发及推广使用。
本文通过分析后备干部管理领域的业务特点,对多源数据采集、集成和管理进行全面研究,使得项目的层次结构和业务特点得以清晰化。另外,选择水平先进且与系统研发要求相吻合的技术也是一个项目成功的重要因素。随着.NET技术和关系数据库技术的迅速发展,在组织和管理数据方面都取得了重大突破。.NET作为一项主流的且十分成熟的软件开发技术,拥有众多新的设计研发模式。同时能够使用一种统一的、面向组件的编程模型,不管开发人员使用的是何种编程语言,都能很好地支持各个组件的属性、事件和方法[3]。运用其提供的组件技术可以方便的构建企业级应用,并且.NET平台提供了强大的开发部署工具,可以方便的实现系统的调试部署工作。相对于传统数据库,SQLite具有更好的的实时性、系统开销小、底层控制能力强[4]。SQLite作为一款轻量级、跨平台的关系型数据库,除了数据管理高效安全和简单易操作的特点外,还是一款开源的数据库系统,使用该数据库系统可以大大降低系统研发推广成本,具有很高的应用价值和商业价值。因此本文选择.NET和SQLite相结合的技术研发模式。
1 数据融合技术
数据融合技术是指利用计算机对按时序获得的若干观测信息,在一定准则下加以自动分析、综合,以完成所需的决策和评估任务而进行的信息处理技术。信息融合最早用于军事领域,是一个处理探测、互联、评估以及组合多源信息和数据的多层次、多方面的过程[5]。数据融合作为一种数据综合处理技术,集成了许多传统的学科和新的技术,实现了信息融合的应用。数据融合技术主要是针对数据来源的分散性问题,将来自不同源的数据进行融合处理,以实现对数据的集成利用,提高数据信息的利用水平。
数据融合技术按照层次可以分为数据层融合、特征层融合和决策层融合。数据层融合是直接在采集到的原始数据的基础上进行数据融合,是一种最低层次的数据融合。特征层融合会先对原始信息进行特征提取,然后对特征信息进行综合分析和处理,它属于中间层次的融合。决策层融合是三级融合的最终结果,它充分利用特征层融合所获取的各类特征信息,采用适当的融合技术来实现[6]。
2 系统分析
河南省后备干部管理系统是一个多层级的管理模式,系统的设计要考虑到多级信息间的协调管理,能够做到信息的层层上报与接收、数据个性化的计算机屏幕展示、中间文件格式(如Word或Excel)的导出、报表的在线打印等功能。因此,要合理地选择开发环境、开发语言、开发工具包和支撑数据库,搭建多源数据的集成与访问平台,解决信息系统中多源数据集成及数据访问的问题,提高数据的利用率。
整个系统包括上报端和综合端两个子系统,上报端和综合端根据所管理干部职级的不同又分为市厅级、县处级和乡科级3个版本,对应版本的上报端和综合端之间完成信息的上报与接收汇总工作。上报端主要实现数据的采集上报,综合端则主要实现数据的汇总和综合统计分析,系统框架结构如图1所示:
图1 系统总体框架图
本文主要以市厅级后备干部管理系统综合端的分析设计为例进行论述。
2.1 系统架构分析
河南省后备干部管理系统所管理的人员信息涵盖市厅级后备干部、县处级后备干部和乡科级后备干部,是一种多层次的后备干部管理模式。考察组或相关部门的负责人通过系统采集并存储相应级别的后备干部信息,然后通过加密的电子文件或专用网络上报到上级主管部门,上级主管部门能够通过综合端系统接收或将上报的信息导入到综合端系统中进行信息集成共享。因此,系统设计研发采用主流的C/S系统体系结构,使这种多层次的数据上报与接收得以充分实现,同时数据在流通过程中的安全性也得以保证。系统数据信息的存储采用的是轻量级的SQLite数据库,其跨平台及简单易操作的特点更符合系统的设计目标和应用实际。
为了解决系统各功能模块间耦合度过高、开发和后期维护困难等问题,系统采用MVC架构模式。MVC模式分离了程序的表现、控制和数据,具有设计清晰、易于扩展、运用可分布等特点,适用于多用户、可扩展、可维护、高交互的系统[7]。MVC三层架构的设计理念是将一个系统的实现分为模型层(Model)、表示层(View)和控制层(Controller)3个层。表示层指的是系统中的GUI界面,负责接收用户响应;控制层则主要完成把用户响应向模型层转发,并将响应的结果反馈给表示层;模型层则封装了所有逻辑代码片段,完成系统业务处理工作。MVC模式结构如图2所示:
图2 MVC模式结构图
2.2 信息的采集与数据组织方法研究
后备干部人员的信息除了采集其基本信息外,还包括其个人简历、家庭成员及重要社会关系、奖惩情况、近3年考核情况、海外学习工作情况、熟悉外语语种情况、参加培训和实践锻炼情况、考察对象的征求民意及民主测评信息以及考察材料等诸多信息。因此在系统设计研发过程中要充分研究这些信息的组织与联动方法,以便准确、快速、方便地对相关人员进行检索、统计与分析。
2.3 数据存储模式与分析技术研究
对存储在系统中的人员,要实现能够根据其工作单位、姓名等信息进行精确查询和模糊查询,支持汉字或拼音首字母的便捷查询处理。因此在数据采集的时候,除了对单位和姓名等中文信息进行存储外,还要将与之对应的汉语拼音提取后存入数据库中,以供后期查询使用。
从系统的综合端角度来讲,对汇总后的数据进行便捷而有效的分析是一项重大的工作,因此系统的设计要允许系统使用者通过本系统灵活的设置数据统计分析的维度和指标,进而可以对后备干部数据进行全方位的分析,多角度的对比,从而提高后备干部管理的效率和准确率,对于办公信息化、数据利用率最大化具有重要的现实意义。根据具体的业务需求,系统应满足根据人员类别、单位类别进而通过设定年龄结构、性别结构、民族结构、学历结构、职称结构、级别、提拔使用情况等信息进行深度的数据分析,真正实现数据分析的全方位多角度,并能实现分析结果的输出。因此,从系统的设计角度讲,必须对后备干部人员的信息结构、索引方法和汉字的拼音提取技术进行相关研究。
2.4 数据信息的打印和导出方法分析
系统中涉及到大量报表文件的在线打印和导出操作,其中导出主要以Word文档的格式为主,也有少量的Excel文档。对于文档的打印,可以充分运用.NET平台提供的报表打印控件来实现,报表的导出可以借助.NET的基础类库来完成。
3 系统设计与实现
3.1 软件功能模块
为了有效的组织和管理多源数据信息,根据后备干部数据特征,在基于后备干部管理业务特点的基础上将系统综合端划分为单位注册、文件管理、综合管理、数据分析、打印管理、人事变动、用户管理、系统设置和系统帮助9个子功能模块和功能模块结构如图3所示:
图3 系统综合端功能模块图
3.2 数据集成
系统综合端文件管理子模块的导入数据文件功能是用来实现对上报端所上报的数据的集成操作,就后备干部管理的业务背景而言,数据来源较多。以市厅级后备干部管理系统为例,需要上报数据的单位包括四类,分别是省直单位、省辖市、省管高校和省管企业,每一类别下又包括诸多单位组织。面对来源不同的数据,该系统采用数据仓库技术作为系统集成的解决方案。数据仓库是面向主题的、集成的、随时间变化的、非易失性的数据集合,它用于支持管理层的决策过程[8]。系统根据综合端的数据库模式,设计专门的用于从上报端数据文件抽取和转换数据的代码段,并以特定的形式将转换后的数据装载到综合端的数据仓库中,完成数据从上报端到综合端入库的过程。
在综合端进行数据汇总集成之前首先要对数据的完备性和可靠性进行判别,只有数据的可靠性得以验证通过方可继续操作过程。同时考虑到数据的导入并非一次性的,而是可能存在同一单位数据的重复上报,所以在执行数据导入之前还要对将入库数据和已入库数据进行对比。如果将入库数据中有部分后备人员信息在综合端库中已存在,则将这些人员的信息在屏幕上予以显示,并提示操作人员是否更新所列出的与综合数据库中有冲突的人员信息。这样可以充分保障综合端与上报端数据信息的一致性。数据导入的工作流程如图4所示:
图4 数据导入工作流程图
3.3 系统实现效果
用户通过输入正确的系统登录口令进入综合端系统,进入系统主界面后可以进行文件管理、综合信息管理、数据分析、打印管理、人事变动统计、用户管理和系统配置等,综合端系统主界面如图5所示:
图5 系统主界面
综合端系统重点在于实现对后备人员信息的统计与分析,用户进入数据分析模块,该模块包含基本分析、高级分析、年龄分析和后备变化分析。在高级分析中,用户可以通过多条件组合查询,精确分析出符合特定条件的人员集合,并可对新产生的后备人员集合再次进行统计分析和数据信息导出操作,高级分析窗体如图6所示:
图6 高级分析窗体
4 总结
在办公信息化的大背景下,本文针对河南省后备干部管理工作的实际需求,以面向实际业务流和数据特点的方式进行系统整体的分析设计。依据所管理干部的职级和数据特点的不同,将系统分为市厅级、县处级、乡科级3个版本,各版本上报端与综合端相互协调的系统管理模式。系统基于.NET开发平台,采用MVC框架架构,利用集成开发环境的组件技术,采用面向服务的数据集成技术,实现了对多源后备干部数据的集成共享工作。
系统自2012年9月正式运行以来,已逐步在河南省省委组织部青干处,河南省各省辖市、省管高校和省管企业的组织部门中投入使用,各单位的信息已通过采集、存储最终上报到省委组织部的综合端系统中。系统的使用极大的提高了河南省后备干部管理的信息化水平,提高了后备干部管理的效率,消除了信息孤岛问题,提高了信息共享利用水平。经使用表明,系统运行稳定,使用方便,具有广阔的推广应用前景。
[1] 陈跃国,王京春.数据集成综述[J].计算机科学,2004,31(05):48-51.
[2] 肖万贤,刘江宁.企业数据集成模式的研究[J].计算机工程与科学,2004,26(05):49-51.
[3] 王新民..NET技术在管理工作中的应用[J].中国无线电,2005,18(01):17-19.
[4] 唐敏,宋杰.嵌入式数据库SQLite的原理与应用[J].电脑知识与技术,2008,33(04):600-603.
[5] 庞勇,张树兵,樊玮.信息融合在飞机地面作业处理系统中的应用[J].计算机工程,2005,31(S1):10-11.
[6] 刘秀罗,黄柯棣.数据融合技术在CGF建模中的应用[J].国防科技大学学报,2001,23(03):103-106.
[7] 刘亮,霍剑青,郭玉刚,等.基于MVC的通用型模式的设计与实现[J].中国科学技术大学学报,2010,40(06):635-639.
[8] 赵太祥,马玉龙,周雨.数据仓库在异构数据库集成中的应用[J].计算机与网络,2012, 18(07):70-71
Application of Multi-Source Data Fusion in Reserve Cadre Management System
Zhu Fubao,Xu Xianjing,Huo Xiaoqi,Zhu Haodong
(School of Computer and Communication Engineering, Zhengzhou University of Light Industry, Zhengzhou450002, China)
With the gradual process of social information in depth, existing business systems are deficiency in data integration and information sharing and unable to meet the requirements of making full use of data resources. In this case, it is inconvenience in information management of reserved cadres. Developing a management system based on business characteristics of reserved cadres and development trend of information technology is particularly important, and it’s goal is data integration and information sharing. After a comprehensive analysis, a system design based on .NET platform and SQLite is proposed. Henan Province as application examples proves that the system design is reasonable and effective.
Data Integration; Data Fusion; Islands of Information; Information Sharing; Data Warehouse
TP301
A
1007-757X(2014)01-0010-03
2013.12.18)
国家自然科学基金青年科学基金项目(61201447);河南省科技攻关计划项目(122102210492)
朱付保(1974-),男,河南柘城人,郑州轻工业学院,副教授,博士后,研究方向:空间数据库、地理信息系统、数据挖掘,郑州,450002徐显景(1988-),男,河南南阳人,郑州轻工业学院,硕士研究生,研究方向:地理信息系统、数据集成,郑州,450002霍晓齐(1987-),男,河南新乡人,郑州轻工业学院,硕士研究生,主要研究方向为地理信息系统、数据挖掘,郑州,450002朱颢东(1980-),男,河南虞城人,郑州轻工业学院,博士,副教授,研究方向:智能信息处理,郑州,450002