APP下载

数据仓库和数据联邦技术在信用信息资源存储和共享上的比较

2017-03-16公立

科技创新与应用 2017年5期
关键词:存储数据仓库共享

公立

摘 要:信用信息资源是实现社会有序发展的重要内容,文章结合浙江省公共信用信息平台的实际情况,比较了数据仓库和数据联邦两种技术在信用信息资源存储和共享上的优劣势,对推动各地信用信息平台的建设具有重要的借鉴意义。

关键词:数据仓库;数据联邦;信用信息;存储;共享

建设信用信息系统是反映社会信用动态的重要举措,而信用信息资源是信用信息系统的核心组成部分,建立有效的信用信息资源存储和共享机制,对解决各地各部门“信息孤岛”,优化信息资源的配置和利用,提高行政效能和政府监管具有重要意义。本文结合浙江省公共信用信息平台的实际情况,重点分析了信用信息资源存储和共享对技术的要求以及数据仓库和数据联邦两种技术的比较。

1 现阶段信用信息资源发展状况

信用信息主要指的是企业、个人、政府机关、事业单位和社会组织在参与社会活动过程中,形成的信用记录与信用价值有关数据信息,主要分为公共信用信息、金融信用信息和商业信用信息三大类。

在中央政府角度,为了实现社会信用信息资源的整合,国家发改委建立了国家信用信息共享平台和“信用中国”网,以行政管理部门记录、生产的公共信用信息为主;中国人民银行建立了以企业与个人为主体的金融信用信息数据平台。在地方政府角度,我国大部分的省、市、直辖市等已经逐渐落实了公共信用信息数据平台的建设,例如上海、江苏、辽宁、浙江等地。在商业信用角度,一些商业组织以及大型企业也进行了商业信用信息资源平台的建设,为充实社会信用信息资源的存储与共享提供了支持。

2 社会信用信息资源存储与共享

2.1 信用信息资源对存储和共享的技术要求

信用信息资源具有三大特点:数据量庞大、数据类型复杂、跨部门跨区域分布。以浙江省公共信用信息平台(以下简称浙江平台)为例,截至2016年12月底,浙江平台已经拥有161,634,878条信用信息资源,信用主体包括317万法人、6550万自然人,并且数据量以每年20%的速度在增长,庞大的数据量决定了数据存储必须要稳定、高效、可扩展。信用信息资源在归集上由于缺乏统一的标准,归集上来的数据往往类型多种多样,浙江平台目前归集的信用信息资源类型就包括数据库、电子文件、电子表格、图形图像、多媒体文件和纸质文件等,复杂的数据量类型对数据集中、清洗比对和整合应用都提出了非常高的技术要求。信用信息资源在现实中往往是分布在不同的区域不同的部门中,在进行信息共享时,不仅要考虑不同网络之间的数据交换问题,还要考虑数据传输的安全性、便捷性和高效性,特别是要能支持各种不同类型的数据源的数据采集以及格式转换。

2.2 信用信息资源存储和共享的技术比较

2.2.1 建立数据仓库,对信用信息资源进行存储和共享

对社会信用信息资源进行整合及共享,在实施上主要是以需求为主导,建立若干个以服务为核心的信用信息平台。其中,政府可利用其专业的信用管理部门构建横向贯通省级、市级和县级,横向贯穿国家部委的公共信用信息资源共享体系,并实现公共信用信息的集中存储;人民银行可以依托现有的征信系统,进一步充实其他金融领域信用信息,構建完整的金融信用信息数据库;以大型商业征信机构为主体,由政府引导并扶持构建若干个商业信用信息数据库运用安全的信息技术。通过建立数据仓库的方式,可以将已经分散的信用信息、信用数据平台以及相关文件等信用数据资源进行整理,在过滤、归类、抽检等处理方式下,将所需要的信用信息资源整合成为数据仓库,对来自不同渠道的信用信息资源进行储存与管理。这样一来,可以对更加深入的信息资源进行探索,但是因为全国范围内的信用信息资源体现了多样化、更新换代快等特点,数据仓库在一定程度上难以有效适应,也会为本地储存与系统维护等方面带来负担,加大财政投资,延长建设周期。

2.2.2 通过数据联邦,实现全国范围内的信用信息存储和共享

数据联邦即通过信息检索的方式,并非物理集中所有的信息数据,只是利用统一检索平台以及信息源链接,检索并利用信息资源,属于虚拟整合的一种[3]。CALIS便是通过这一方式实现的本地与异地资源联邦式检索整合,在这一平台下,用户仅仅利用检索界面便可搜索自己所需要的信用信息资源。在建立的数据联邦中,可以按照搜索的需求对信息资源进行分类,使其可以为其不同渠道的数据提供服务。在设计检索界面时,要利用中间服务器对涉及到的数据进行转换、整合以及查询优化,为之后的数据检索提供服务。该形式相较于数据仓库的整合方式,前者无需大量的本地信用资源,便可对互联网下的信用信息来源进行严格的管理,并对更新速度快等特征加以良好的适应,除此之外也体现了资金投入少、成效快等优势,是进行信用信息资源存储与共享的有效举措。

由于当下我国在信用机制建设方面依然不够完善,公共、金融和商业信用信息尚未实现融合,数据仓库这种数据集中存储很难真正实现,加上各地区对信用信息资源建设的投入不足,数据联邦这种投入少、成效快的存储共享方式显得更为适合。

3 结束语

综上所述,为了加快我国社会信用信息系统的建设,实现社会的稳定发展,对相关信用信息资源进行存储与共享是十分必要的。从技术路线、投入成本和实现难度几方面考虑,信用信息资源更适合应用数据联邦技术进行存储和共享。

参考文献

[1]龙海明,凤伟俊.我国信用体系建设中的信用信息共享模式研究[J].湖南大学学报(社会科学版),2009,23(5):59-60.

[2]徐元根,黎勇,李捷.数据联邦技术在系统集成中的应用与研究[J].信息安全与技术,2011,(8):66-67.

[3]马刘霞,张小红.信息共享在信用体系建设中的应用[J].中小企业管理与科技(下旬刊),2015,10:269-270.

猜你喜欢

存储数据仓库共享
基于数据仓库的数据倾斜解决方案研究
档案管理中电子文件的存储探究
数据仓库系统设计与实现
云计算与虚拟化
挂羊头卖狗肉的“共享”营销
图书馆与出版企业数字资源共享的环境因素分析
数据复用在存储数据仓库中的运用
数据仓库技术在档案管理领域的应用