APP下载

从数据质量到信息质量的发展

2020-12-19仝方平

电子技术与软件工程 2020年8期
关键词:定义概念内容

仝方平

(云南电网有限责任公司信息中心 云南省昆明市 650000)

由于数据质量本身和信息质量本身的概念存在外延、内涵方面的大部分关联,导致上述二者之间定义和界定过程十分模糊,造成信息质量方面的实际研究者常常发现不知所云的感觉,同时在现实生活中也很难进行区别,常常互相之间进行通用。

1 数据质量和信息质量之间的相关定义

1.1 数据质量的相关定义

在不同阶段,数据质量本身存在不同的概念含义和标准要求。在以前,加强数据质量就是加强数据方面的准确性要求,基本是指在数据实际生产过程中产生的质量情况,包括精度情况、一致性情况、完整性情况等方面,也可以叫做本征质量。

周东教授认为数据质量本身是通过数据的一致性特点、准确性特点到相关性特点等具体参数共同决定。陈远教授等指出,数据质量能够根据正确性特点、准确性特点、不矛盾性特点、一致性特点、完整性特点和集成性特点进行描述。然而随着数据资源信息的不断积累与广泛应用,数据质量本身含义的不断发展,数据质量的相关概念得到扩展,对其定义的认识也开始从狭义层次向广义层次转变,具体要求从各类数据实际提供者、生产者和广大用户等多个研究角度共同确定制定数据质量的使用标准。准确性方面不再作为衡量数据质量本身的唯一可靠标准,而对广大用户要求的使用满意程度正在成为衡量数据实际质量的关键指标。向上教授认为,高使用质量数据主要指那些能够充分满足用户使用要求的各类数据。Strong 教授等指出,数据质量本身就是要求数据能够有效适合使用。数据质量内部概念研究分析主要涵盖两个方面。首先,关注从数据实践方面开展衡量数据质量情况,也就是通过用户角度实施判定,适应广大用户的满意度,同时从数据实际生产者和管理者角度开展考虑;其次,关注从面向数据系统的角度开展具体评价,数据质量本身属于综合性概念,作为一个具有多维度的抽象概念,应该从多方面开展衡量数据的各项基本质量要素。

从大量文献中对数据质量方面的实际定义来看,现在对数据质量本身含义的具体解释和相关理解还是存在不少的分歧。针对数据质量本身应包括哪几个方面内容,现在还没有完全统一的标准规定,常常出现不同的研究分析者、不同的咨询机构提供了完全不同的回答。数据质量本身定义没有统一,造成人们对实际数据质量内容理解方面的多样性区别,不能提出切实有效的处理解决方法。

1.2 信息质量的相关定义

信息质量本身目前仍然没有世界公认的标准要求。现在对信息质量本身的实际定义,基本从下面三方面展开认识。首先,理论方面上抽象的标准定义,从具体用户角度进行相关定义,通常认为信息质量基本就是对各类信息用户使用过程方面的满足程度。信息质量主要是指对各方面信息产品能够有效满足信息消费者各种需要的实际程度的具体衡量。其次,关注信息本身存在的丰富多样性情况,从定义基本要素特征方面出发,实现进一步了解信息质量的具体特征。最后,从信息质量的多维特征开始,深入认识信息质量的定义。信息质量作为一个全方面多维度的抽象概念,对信息质量的深入认识基本采用对信息质量众多衡量维度的实际选择和标准要求进行判断,这是完全有别于以往传统的各类质量管理工作方式。从各方面相关定义能够看到,大部分对信息质量的定义基本是按照研究者本身的主观直觉方面、经验判断方面、行业领域方面和文献资料方面进行汇总研究分析得到的综合性定义,不存在通用的标准定义,也不能有效联系到日常实际工作中。由此可见,信息质量本身并不属于一个简单的绝对的抽象概念,按照不同的研究主体以及相同研究主体中不同的现实需求,经常展示出完全不同的重要意义。信息质量本身常与现实用户的具体需求紧密相连,存在十分强的应用特点。

2 从数据质量定义到信息质量定义的历史发展过程

信息质量的具体研究工作起于以前较早的数据质量方面研究工作,属于数据质量研究的必然延伸内容,是当今随着先进的计算机技术的快速发展而持续加强,是对信息管理内容单纯通过技术的改进发展出来的新认识。传统的数据质量内容研究工作往往按照技术角度的方面关注数据本身的准确性,同时经常依附于具体的产品质量管理过程。自从上个世纪40年代开始,随着各类计算机的大量出现,信息科学技术开始被迅速地应用于各方面的数据管理过程中,导致数据本身的实际准确性大大加强提高,对于生产和处理各类数据的实际能力大大提升。另外,数据方面的实际质量问题也日益开始受到人们的高度关注重视。在上个世纪70年代期间,人们已经正式开始研究如何实现高效存取大批量各类数据的具体问题,导致数据库技术开始出现。数据库技术能够在一定程度方面进一步改进数据质量情况,不断拓展对数据质量内容的全面理解。除了应该考虑数据本身准确性情况之外,还应进一步考虑数据本身的完整性情况、一致性情况和及时性情况等方面。在实践过程中,通常发现数据库技术本身即使存在十分严格的科学理论基础,然而仅仅通过这些科学理论还是难以加强数据质量。因此,人们开始探索根据现有的数据库技术开展实时有效的数据测量、数据分析和完善数据质量等方面。这一时期主要通过技术手段加强数据本身的质量,基本从技术方面和对数据本身外部质量情况等方面开展分析研究工作。随着目前信息社会的不断发展,信息化开始正式成为一项直接影响社会经济未来发展的核心因素。

社会的快速发展与不断进步已经开始和高质量高速度的信息资源内容紧密相连。之所以高度关注信息概念,是由于不仅高度关注数据的实际内容,更十分关注数据本身存在的语义内容。即使像数据库技术等先进的信息科学技术开始逐步正式运用,促使在低成本实际要求下实现获得大量信息,加强数据质量情况,得到各类高附加值信息内容等要求已经成为现在的可能。能够在技术方面提供满足标准要求的高质量信息数据,然而用户还是不能感到有真正价值意义的数据信息。通常所谓达到高质量要求的信息数据不一定就真的属于高质量信息内容。目前纯技术方式的数据内容质量处理解决办法开始出现大量问题和严重缺陷,很难完全符合信息社会发展过程的实际需求,因此人们已经开始实现不断拓展、持续加深了对信息质量内容的全面认识,目前信息质量内容管理工作开始正式形成一个丰富独立的学科研究范畴。

3 数据质量方面和信息质量方面之间的联系与区别

在大量文献资料研究分析中,经常出现难以明确有效区分数据质量概念、信息系统质量概念和信息质量概念,一般把明显应该属于信息系统质量方面的评价指标内容直接归纳在信息质量方面的评价指标内容中,从而导致概念理解的混乱和评价指标体系归属情况存在交叉不清的问题。

3.1 数据质量方面和信息质量方面之间存在的区别

对数据质量方面和信息质量方面之间的概念进行界定,现在主要有着两种基本看法。

(1)通常认为上述二者之间只是属于前后时间延续逻辑关系,在信息系统到具体的信息用户之间属于信息质量范畴的问题,因此能够常用数据质量深入解释系统建设过程中存在的各类质量问题;

(2)通常认为二者属于包含的逻辑关系,数据质量内容是信息质量内容的核心基础。

信息质量内容是一个主要包含数据质量内容、信息系统质量内容的更大范围的定义概念,这其中部分数据能够直接影响信息质量情况,另一部分数据内容的实际质量主要通过信息系统方面实现间接影响信息质量。

3.2 数据质量方面和信息质量方面之间存在的联系

对上述二者之间相互联系,能够可从纵向方面和横向方面的概念关系进行充分认识。从纵向方面之间的概念关系进行分析,数据质量与信息质量在实际层次上存在相对区别的情况,有着逻辑递进关系,能够有效反映了认知发展的不断深化过程,数据质量是信息质量的基础内容和前提体现,信息质量是数据质量的不断抽象与持续升华。从横向方面之间的概念关系进行分析,能够把数据质量看成是信息质量的一个子集,彼此之间存在包含的逻辑关系。因此,信息质量最终还是要通过数据质量内容和信息系统质量内容进行共同保证的。

在过去的一段时间,数据信息生产者在开展数据质量的研究工作时,往往只是按照自己的工作角度不断了解信息系统中各类信息资源内容的客观实际状况,采取专业化、技术性的科学指标和评价方法,实施一系列有效精确的数据质量方面的控制要求和规定标准。正是由于这些规范要求和规定标准,这些数据信息生产者能够有效构建一个完整系统的全方面质量管理工作体系。但是如果上述这些规范要求和规定标准没有满足用户的实际评价和具体需要,那么数据信息生产者实际提供的信息数据就不一定属于实际用户真正需要的信息数据,就难以达到信息价值的目的。因此数据质量方面的规定标准应该与信息质量方面提供的信息结论有机进行结合时,才能达到更好地为广大用户进行服务,进一步提升用户使用过程的满意度。

4 如何认识和理解数据质量和信息质量之间的区别与联系

(1)认识数据质量和信息质量之间的区别和联系,首先关键在于对产生过程的深入认识。数据质量大部分考虑的是从信息数据源到信息数据管理者之间存在的质量问题,属于数据生产过程质量管理控制方式。而信息则按照用户实际需求,实施分析信息出现过程,属于具有适用性特点的质量管理控制方式。从数据质量向信息转变的实际过程也是相应的质量观念从具有符合性特点的质量管理方式向具有适用性特点的质量管理方式转变的具体过程,也就是说从数据质量实现到信息质量的实际转变是一个从按照数据生产开发者为执行主体、根据数据信息系统的研究角度认真审视信息资源的方式,到按照用户为执行主体、根据用户的研究角度认真审视信息数据资源的管理方式的具体转变。

(2)认识数据质量和信息质量之间的区别应该充分界定二者具体的适用范围。根据数据质量的内涵概念进行分析,通常更加关注数据本身的外在特点的规定标准,然而因为数据信息来源范围广泛、类型多变繁杂、形式丰富多样,难以有效从中凝炼具有共同特点的数据质量特征指标,进一步开展分析数据内部的质量问题。如果只是通过数据质量本身概念的不断外延扩展来实现问题的有效解决,则会导致部分分析方法、管理手段的完全失效。采取信息质量概念将按照数据信息内容的内在质量情况,开展信息质量内容维度的细致筛选,从信息质量的表现形式、基本内容和具体效用三个角度具体分析信息质量概念的内在结构,达到揭示信息共享过程中的信息质量问题和掌握质量管理过程规律,同时从关注广大用户信息内在需求开始入手,真正建立具有适用性特点的信息数据质量管理模式。

(3)有效理解是真正区分数据质量和信息质量的关键步骤,信息数据就是那些能够有效引导人们不断思考和深入理解的具体数据。从长远角度进行分析,广大信息用户真正关心的是信息数据本身的价值,而不单单是各类信息数据。因此,各种信息数据系统建设工作的基本目的都是要按照广大用户提供的存在使用价值的信息数据,这种信息数据不单单是基础信息数据,而且还涵盖根据基于一次数据开发实际基础上开展的二次数据开发、三次数据开发过程中加工的具体信息,造成信息质量将是上述过程中十分关键的部分,应该充分关注广大用户的信息数据质量需求情况,按照用户实际需求作为开展信息质量管理工作的标准要求。

5 结束语

因此,对信息质量方面的深入研究,不仅要有效防止将数据质量概念出现盲目扩大化情况,又不能简单将数据质量完全进行排除。对数据质量的部分研究成果和具体实践方法、操作手段将对信息质量的加强存在特别关键的重要意义。

猜你喜欢

定义概念内容
内容回顾温故知新
Birdie Cup Coffee丰盛里概念店
幾樣概念店
主要内容
修辞学的重大定义
山的定义
教你正确用(十七)