APP下载

公共部门信息再利用中的信息质量问题研究*

2016-05-17佩孙建文吴武汉大学信息管理学院武汉43007华中师范大学国家数字化学习工程技术研究中心武汉430079

图书馆 2016年4期
关键词:公共部门参与者利用

王 佩孙建文吴 钢(.武汉大学信息管理学院 武汉 43007;.华中师范大学国家数字化学习工程技术研究中心 武汉 430079)



公共部门信息再利用中的信息质量问题研究*

王佩1孙建文2吴钢1
(1.武汉大学信息管理学院武汉430072;2.华中师范大学国家数字化学习工程技术研究中心武汉430079)

〔摘要〕公共部门信息再利用的成效受到信息质量的直接影响,通过分解公共部门信息再利用的信息增值流程,厘清信息提供方、信息中介和信息用户三类参与者不同的信息质量需求,分析公共部门信息质量的维度,并将公共部门信息再利用过程、再利用参与者与信息质量维度相结合,提出一套逐级递进的信息质量分级体系,达到对信息再利用各个关键环节中信息质量的控制,实现信息的有效再利用。

〔关键词〕公共部门信息信息质量信息再利用

〔分类号〕G203

〔引用本文格式〕王佩,孙建文,吴钢.公共部门信息再利用中的信息质量问题研究[J].图书馆,2016(4):30-37

* 本文系教育部人文社会科学研究青年项目“政府信息资源公益性增值利用对策研究”(项目编号:11YJC870025)的研究成果之一。

1 引言

公共部门信息(Public Sector Information,PSI)蕴藏的经济价值与社会价值已经得到社会的广泛认可与重视,对公共部门信息的再利用在各国也取得了良好的应用成效。国务院于2015年8月31日印发的《促进大数据发展行动纲要》中指出,将于2018年底前建成国家政府数据统一开放平台,率先在信用、交通、医疗、卫生、就业、社保、地理等二十余个重要公共部门实现数据资源合理适度向社会开放[1],为社会公众对公共部门信息开展增值性、公益性开发和创新应用提供数据支持和信息数量上的保障。美国、英国、欧盟等国家和地区也通过《信息自由法》、《公共部门信息再利用条例》、《公共部门信息再利用指令》等法律与政策建立了以公开为原则的公共部门信息开放制度。公共部门信息的数量通过合理开放获取得到了保障,而其质量问题并未获得同等的关注。当人们从公共部门获取信息进行再利用时,虚假、错误、不完善或过时的信息易导致他们做出错误的决定,从而引发重大的社会问题[2],公共部门信息的质量问题亟到重视。

目前我国对于公共部门信息再利用的研究主要集中在三个方面:①公共部门信息再利用中的法律与制度问题研究,包括对公共部门信息再利用的国际立法进展[3]和我国的政策趋势的分析[4],以及公共部门信息再利用中的知识产权制度、市场制度和程序制度的研究[5-7];②公共部门信息再利用的模式研究,包括探讨美国、英国等公共部门信息再利用发展较早国家的再利用模式以及对我国的启示[8-9];③公共部门信息再利用中的信息获取方式与定价方式研究,包括公共部门信息再利用的收费模式[10]和收费制度[11]。公共部门信息的有效再利用不仅需要法律与制度的支持、再利用模式的创新,同时也需要对信息质量进行约束,根据不同的信息再利用场景提供不同质量等级的信息,满足各类型信息用户的需求。公共部门信息再利用的信息增值过程不同于单个组织中的信息增值链,其涉及的信息提供方、信息中介和信息用户的范围和类别众多,不同的信息需求、不同的资金投入、不同的身份、不同的动机决定了参与者对信息质量的不同看法,建立明确而有弹性的信息质量约束机制将有助于培育新的再利用模式,有助于各方参与者达成共识。文章拟从公共部门信息再利用活动中不同增值环节、不同参与者的角度出发,分析用户对信息质量的要求,厘清公共部门信息再利用参与者与信息质量的关系,提出一套逐级递进的信息质量等级体系,并为后续研究提供基础。

2 公共部门信息再利用的过程与参与者

公共部门信息泛指一系列由各领域的公共机构在完成其公共任务时收集、制造、再加工和传播的信息,经济合作与发展组织(OECD)将公共部门信息的再利用定义为商业机构或个人对公共部门信息开展的商业化或非商业化再利用[12]。欧盟在公共部门信息再利用领域开展的一系列调查研究[13-14]对公共部门信息的价值进行了量化和评估,揭示了上游公共部门信息(upstream information)的独占特征,即某些公共部门是一类信息的唯一来源,在提供信息时没有受到显著的竞争,一旦向公众开放,通过市场“看不见的手”驱动将实现其增值。在公共部门信息的再利用活动中,信息质量是制约其实现增值的关键因素之一[15]。在信息再利用的背景下对信息质量问题进行研究,其最终目标是基于对信息质量的理解和控制来实现信息再利用成果的控制和增值,以至于通过对信息质量的校正来达到实现特定信息再利用成果[16]。实现这一目标需要通过三个步骤,首先梳理信息再利用的过程和参与者,揭示信息是以怎样的流程、在怎样的情境中、在哪些参与者之间进行传递和增值;其次明确公共部门信息的特征及其质量维度;最后,通过将信息质量维度与信息再利用流程、参与者进行整合和链接,将对信息质量的约束与信息再利用活动有机结合,将对信息质量的控制转化为对信息再利用各个关键环节的控制并实现信息增值。

2.1公共部门信息的增值链

Taylor在其信息生命周期中的信息增值流程理论中将信息的增值描述为,通过对信息的组织将数据转化为信息,通过整合将信息转化为信息知识,通过评价将信息知识转化为创造性知识,最终通过用户决策利用创造性知识开展增值活动[17]。结合Ferro提出的公共部门信息再利用商业模式[18],可将公共部门信息的增值链概括为图1所示。公共部门信息增值链包括四个步骤:①公共部门收集和制造原始信息,既包括公共部门以专业手段、专门收集的信息,例如气象、地理、人口普查等信息,也包括公共部门履行其公共任务时附带产生的信息,例如医疗、卫生、教育等行业信息,公共部门对原始数据进行初步的分类、格式化和展示,这些原始信息具有不同的载体、格式,以及不同的质量等级和特征;②信息整合机构对原始信息进行整合和优化,信息整合机构既包括公共部门内部的信息整合部门,也包括第三方信息中介机构,如公共部门信息门户、开放数据门户等,信息整合机构通过对原始信息进行筛选、分析、确认、比较和编译来对其进行优化;③公众通过获取经过优化的信息来开展信息再利用活动,例如利用地理信息开发的GPS定位产品,利用气象信息开发的天气预报推送服务等;④公众通过获取具有“目的适应性”的信息来支持自身的决策,通过创造经济价值和社会价值的方式实现公共部门信息的增值,例如农业上利用特定的地理信息、气象信息和市场信息为作物的播种做出决策,旅游业利用特定的交通信息、气象信息设计出游方案。

图1 公共部门信息增值链

2.2集成了信息中介的公共部门信息再利用流程

信息中介是由Hagel和Rayport于1997年提出的一个概念,他们认为信息消费者一般不会直接与信息提供者进行协商和沟通,一类企业抓住这一机会通过成为消费者信息的保管人、代理人和经纪人,代表信息消费者维护其隐私权、与信息提供者进行沟通,即成为信息中介[19]。随后这个概念逐渐扩大,信息中介泛指一类支持与协调信息提供方与信息消费方之间信息传递的组织。通过信息中介来进行信息传递的协调优于信息的直接传递,其重要性可以体现在降低信息检索成本、保护用户的隐私权、提供更完善的信息、降低风险和降低价格这五个方面[20]。在公共部门信息再利用背景下,信息中介可以提供独特而专业的产品和服务,专业化服务将有助于建立起特定类别的信息提供方与信息用户之间的关系,通过构建和管理大型、多功能的公共部门信息系统来创造规模经济效应,通过共享工具和数据集来创造范围经济效应[21]。Bailey和Bakos的研究将信息中介的主要作用概括为聚合信息、成为信息的可信中介、辅助开发市场和将信息提供方与信息用户配对[22],结合德勤公司研究报告[23]中列举的信息产业商业模式原型,可将公共部门信息再利用中的信息中介归纳为如下三类:

(1)整合型信息中介:这类信息中介对公共部门信息进行搜集和聚合,通常针对某个特定主题的信息,厘清信息的相互关系并分析其效率,并以可视化形式呈现信息间的复杂关系[23]。例如美国的data.gov网站、英国的data.gov.uk网站、欧盟的ePSIplatform平台是综合性公共部门信息整合平台,英国的DueDil公司开发的公司信息数据平台、美国的ChemXSeer提供的化学实体、表格索引、数据索引平台是针对特定行业的公共部门信息整合平台。

(2)开发型信息中介:这类信息中介通过设计、开发和发布基于网络的平板电脑或智能手机的应用为信息用户提供信息服务[23],提供基于类型丰富、更新速率较高信息而衍生的服务与产品,这一类型的信息中介高度依赖公共部门信息。例如美国人口普查局开发的dwellr应用结合了人口普查数据、社区统计数据和gps数据为公众提供城市宜居程度的指南,新加坡市区重建局开发的Master Plan 2014应用结合了土地使用许可和城市建设规划,以地图的形式为公众提供城市土地使用指南。

(3)强化型信息中介:这类信息中介通常是已经建立了完善的大型企业或组织,他们将公共部门信息与已有的产品与服务相结合,对其进行丰富和强化[23],这些产品与服务的提供并不完全依赖于公共部门信息。例如法国的Le.TAXI平台将传统出租车行业与GPS导航信息、出租车定位信息、移动搜索引擎相结合,为公众提供通过智能手机预约出租车的服务;美国的Safe Eats应用将传统的餐厅评价与农业部的食品环境地图集、纽约市餐馆登记目录相结合,为公众提供客观有效的餐厅指南。

集成了信息提供方、信息中介与信息用户这三类参与者的公共部门信息再利用流程可概括为图2所示。信息提供方为公共部门,包括各级政府部门、公共企业、其他社会团体等组织机构;信息中介,包括了前文所述的整合型、开发型、强化型这三类;信息用户为公共领域和私有领域的各类参与者,包括个人、企业、科研人员、公益组织等。在进行信息再利用时,不同身份的参与者对信息质量的理解和要求不尽相同,信息在传递过程中其质量指标也发生着变化,同时信息中介与信息用户并不会完全被动接收信息,他们在对信息进行再利用时也会向信息提供方进行信息质量的反馈。

图2 公共部门信息再利用流程

2.3公共部门信息再利用的参与者与信息质量的关系

2.3.1信息提供方与信息质量的关系

根据不同的信息提供方式,信息提供方可分为专门收集和生产信息的机构、附带生产信息的机构、将信息与其他部门信息结合后再进行发布的机构,例如测绘机构是专门收集和生产测绘地理信息的机构;教育机构发布的学生就业统计、教师情况统计等信息是其履行教育职能时附带产生的,其主要职能并非收集这些信息;中国人民银行发布的统计信息是结合了其他公共部门或私营部门的统计报告而产生的。不同的信息提供方式将制约信息提供方的信息质量水平,一般情况下,专门生产信息的机构和发布整合信息的机构在信息收集、生产和发布过程中获得的资金投入、人力投入、基础设施建设会更加丰富和完善,其发布的信息质量水平和质量控制机制将优于附带生产信息的机构。

根据其所处的行业、领域不同,信息提供方所提供的信息内容、形式和获取方式也会有所区别。例如测绘地理信息具有专门的格式,需要特定工具和一定的专业基础才能对其进行处理;实时交通信息,包括道路堵塞、公共交通运行等信息,具有更新速度快的特点,能够以小时、分钟甚至更快的速度进行更新,这类信息通常不以直接下载的方式提供,而是以API的形式对外发布;气象观测数据,以中国气象数据网为例,实时数据可以通过在线浏览的方式获取,而历史数据则需要通过实名注册后登录网站下载。信息格式和获取方式各异,对信息质量的统一管理来说是一种挑战。

各公共部门作为信息提供方为新型跨领域应用与服务提供了原始数据支持,从源头上对信息质量进行控制是提升信息质量的有效手段,但一方面受公共部门自身收集和生产信息的方式与能力的制约,另一方面公共部门所提供信息的内容、形式、时效性和获取方式也不相同,如何识别不同类型、不同来源的信息质量,如何根据原始信息的特征对其进行统一而符合再利用目的的质量管理,是值得进一步思考的问题。

2.3.2信息中介与信息质量的关系

信息中介既可以存在于公共部门内部,也可以是独立存在的第三方机构,其中既包括营利性商业组织,也包括非营利性组织。较公共部门内部信息中介而言,独立的第三方机构具有更高的灵活性和适应能力,可以根据用户不同的需求,采用创新技术对信息进行深度开发,例如transportapi是由企业开发的整合了伦敦地区公共交通时间表、公共交通运行追踪、路程规划、地图信息、历史交通信息、交通资费等信息的交通信息聚合平台。

与其他再利用参与者相比,信息中介对信息质量的整体要求较低。一些公共部门受自身信息处理水平和资金投入的限制,无法在现有条件下提供高质量信息,此时就为信息中介提供了运营空间,通过对原始公共部门信息进行优化,提升信息质量、丰富信息展示形式,成为公共部门信息再利用价值链的重要环节。营利性信息中介会获得更多的资金投入、人力投入,以及更强的信息处理能力,因而这类信息中介对于信息质量的需求较非营利性中介而言会更低,他们在对信息进行再加工时,更关注信息的数量和可获取性,在充分获取信息的基础上投入资源对原始信息进行优化和再利用。

2.3.3信息用户与信息质量的关系

信息用户对信息质量的要求侧重点各有不同,根据营利与否,信息用户可分为营利性用户和非营利性用户,营利性用户较非营利性用户而言更有可能通过付费获取高质量信息;根据动机不同可将信息用户分为临时用户(Casual User)和专业用户(Professional User)。临时用户的信息再利用行为由临时产生的个体需求驱动,具有行为随意、信息处理能力较弱的特点,比如个人用户、传统行业的组织机构等;专业用户的信息再利用行为具有明确的目的性且信息处理能力较强,比如科研人员、高新技术企业等。受信息处理能力的限制,临时用户对于信息形式上的质量要求比专业用户更高,包括信息的易于查找、易于理解等特性;而专业用户对于信息内容上的质量要求比临时用户更高,包括信息的完整性、一致性、时效性等。

2.3.4公共部门信息再利用参与者对信息质量的反馈

在公共部门信息再利用流程的最后,信息用户可以根据自身对信息再利用的过程和效果对信息质量提出反馈意见,根据获取信息的渠道不同,相应的信息质量反馈可以通过信息中介到达信息提供方,也可以由用户直接提交给信息提供方。持续而有目的性的质量反馈是提升信息质量的有效手段,通过收集用户反馈可以对信息再利用的效率进行监测,便于信息提供方对信息质量做出及时调整。用户反馈得到充分重视后还能激励其更积极参与信息再利用活动。

3 公共部门信息质量的维度

信息质量研究横跨多个领域,从信息学、信息系统、计算机科学等领域的理论研究,到质量管理、会计学、科学决策、战略管理、创新管理、公共管理、旅游管理等领域的理论与实践相结合的研究,各学科根据信息所处的不同情境对其质量问题进行了不同角度的分析与阐释。朱兰质量手册第六版将质量的定义由适用性(fitness for use)更新为适目的性(fitness for purpose),结合公共部门信息再利用的背景,信息质量应适合其再利用的目的。为了适合目的,任何形式的信息必须能够真正满足再利用参与者的需求,具备符合再利用参与者需求的正确特征,并通过无损质量的形式加以提供[24]。由于信息对于用户的意义是可以随着时间而变化的,对用户而言,信息的可用性也并非一成不变[25],在公共部门信息再利用中,根据不同的再利用目的,参与者会产生不同的信息需求,同时对信息质量要求也会产生差异,因此建立和维护一套能够被各方参与者认可的信息质量标准显得尤为重要。

信息质量作为一个多维度概念已经被广泛认可[26],常见的信息质量维度包括准确度、时效性、完整度、相关度和一致性等[27],尽管多年来研究者从信息本身、信息的获取、信息的语境和信息的表示等角度提出了大量的信息质量维度指标[28],但这些维度和指标中也存在诸多重复和不一致。出于探析公共部门信息再利用中信息质量问题的目的,结合Miller提出的多维信息质量观点[29],仅选取以下十个具有代表性的信息质量维度作为后续论述的基础。

(1)相关度(relevance):代表用户可以获得的、与其需求相关的信息的数量,数量越大相关度越高。如果信息在其他质量维度得分较高,而相关度得分较低,则该项信息对于用户来说是不符合其需求的。但低相关度信息并不一定意味着信息的质量低,仅代表该项信息所处的类别不符合信息用户的需求。在公共部门信息再利用的实践中,可以通过协助用户理解和获取相关度高的信息,提升用户可感知的信息可用度;通过改进信息检索算法提高用户对相关信息的获取数量。

(2)准确度(accuracy):是信息最为明显的特征,实际应用中信息准确度并非越高越好,当信息的准确度超出了用户个人的信息处理能力时,例如个人用户在只需获得天气预报时却收到一份精确的卫星云图,过高的准确度将增加用户处理信息的成本和信息误用的风险。在公共部门信息再利用中,需从信息传递和信息获取这两个层面确保信息准确度,当信息在信息提供方、信息中介、信息用户之间传递时确保其不失真,当信息被获取时确保其准确度符合用户期望。

(3)时效性(timeliness):也可称为即时性(currency),反映了信息传递和获取的速率。不同用户对信息时效性有不同的要求,当个人用户利用交通信息对实时出行进行规划时,对信息的时效性要求较高,而承包商对道路建设进行长期规划时对交通信息的时效性要求则相对较低。在公共部门信息再利用中,同样需要从信息传递和信息获取这两个层面确保信息的时效性,确保信息提供方收集和传播信息的即时性、用户能够获取到符合其时效性需求的信息。

(4)完整度(completeness):又可称为综合性(comprehensiveness),完整度低的信息将导致用户陷入盲人摸象式的困境。用户对信息完整度的需求取决于再利用目的,个人用户基于个人使用目的对一项药品的信息完整度需求,与科研人员基于研究目的对该信息完整度需求迥然不同,同时个人用户在面对超出其信息处理能力的高完整度信息时也将带来困惑和信息误用的风险。在公共部门信息再利用中,信息提供方和信息中介需要对用户再利用目的进行研究和分析,将对用户需求的理解贯彻信息生产、整合和再利用的全过程。

(5)一贯性(consistency):又可称为一致性(coherence),包括不同信息之间的一致性和信息本身的连贯性,采取不同计量单位、不同格式将产生不一致的信息,信息的不一致通常意味着其准确度或时效性方面的缺陷。

(6)格式(format):代表信息以何种形式呈现给用户,当信息不能以有序、通用格式的形式呈现时,将给信息传递和使用带来负担。将纸质文献转化为机读文档从而满足用户直接使用的需求,是提高这一信息质量维度的有效手段。

(7)可获取度(accessibility):代表信息在用户需要时可被获取的程度。公共部门信息的可获取度由政策和技术两方面因素决定,从政策上出于对公共安全、个人隐私、知识产权等方面的考量,部分公共部门信息的获取将有一定的限制和滞后;从技术上公共部门信息的提供方和信息中介可以通过拓展信息获取途径和获取效率提升这一质量维度。信息的可获取度还将直接影响信息用户对再利用活动的积极性。

(8)互操作性(interoperability):也可称为兼容性(compatibility),用以表示信息之间关联程度。信息并不能孤立存在,信息之间交互、链接的关系也能影响其对用户的适用性。在公共部门信息再利用中,各类创新应用尤其需要具有高度互操作性信息的支持,如何提高信息的互操作性也需要各类信息提供方和信息中介协作解决。

(9)安全性(security):包括了在公共部门信息再利用流程中传递的所有信息的安全性,包括公共信息安全和个人信息安全,也包括虚拟信息安全和存储信息实体的安全。

(10)效度(validity):也可称为权威度(authority)或信誉度(reputation),信息的效度可以通过满足特定标准的方式进行验证,包括对信息本身的验证和对信息来源的验证,对信息和信息再利用活动进行审计是确认其效度的有效手段[29]。效度相较其他单个信息质量维度而言更类似于一种对整体信息质量的认可,但高效度信息并不意味着整体信息质量的高度,例如由权威机构提供的、却在相关度、完整度上不足的信息,对于特定用户来说其质量也许并不符合预期。

4 公共部门信息再利用参与者对信息质量的需求

通过对公共部门信息再利用过程进行解析,可以发现信息的质量是由信息提供方、信息中介和信息用户三方参与者协作达成。公共部门信息再利用作为一项实践活动,三方参与者在其过程中对信息质量的需求也是以自身实践为导向,因此不仅应从理论上对参与者的信息质量需求进行分析,更应从实践角度出发,将参与者的再利用活动与信息质量联系起来,将参与者的需求、责任与信息质量维度进行匹配,以期获得涵盖整个再利用过程的信息质量管理的完整图景。

表1 公共部门信息再利用环节与再利用参与者、信息质量维度的关系

公共部门信息再利用参与者的需求不尽相同,各方参与者对于在再利用过程中出现的问题和如何利用信息去解决问题有着不同看法,通过对各方参与者在再利用不同环节中可能遇到的问题进行分析,并将这些问题与信息质量相结合,将有助于理解再利用活动与信息质量的关系。表1列举了一系列参与者面临的不同再利用环节的问题和信息质量维度的关系,归纳了英国[15, 30]、澳大利亚[31]、德国[32]、西班牙[32-34]、丹麦[35]、罗马尼亚[36]、南非[37]这七个国家的公共部门信息再利用案例。这些文献中展示的公共部门信息再利用活动的范围和规模各不相同,通过对具体参与者的归类,对再利用活动的程序和阶段进行识别和比较,可以发现各国都经历了或部分经历了表1中所列举的再利用各个步骤,其中程序层面和技术层面的步骤占据了绝大部分,信息质量并未以一个明确的面貌出现在这些再利用过程中,信息质量维度与再利用的关系潜藏在再利用的每一个环节中。在这些再利用活动中,目前还缺乏一个涵盖面广、具有理论基础、能提升再利用效率的信息质量解决方案。

5 公共部门信息质量分级体系

公共部门信息再利用各方参与者的信息需求源于其不同的身份和任务,因此理解各参与者对信息的不同态度和需求,通过沟通,在各方的需求差异间寻找一种平衡,是提高信息质量和促进再利用的必要方式。公共部门信息再利用是一项由数量众多、类型各异、需求多样的参与者开展的跨部门、跨机构、跨层级和跨领域的信息活动,其复杂性超越了一般的信息检索、信息共享等活动,如果期望通过提升再利用活动各环节的信息质量,达到放大信息再利用成效的目的,则需建立起一套覆盖技术层面和组织层面的信息质量管理程序和标准。根据信息质量的逐级递进,可以将公共部门信息质量管理标准分为以下三个级别。

(1)初始级信息。作为信息提供方的各公共部门及机构提供的原始信息需具备初始等级的信息质量。公共部门信息由各个部门及机构从各自的系统中收集或提取,其质量参差不齐,因此提供信息的具体单位需对其信息质量负责。受具体部门职能、资金和人力投入的限制,并非所有公共部门都具备处理原始信息满足不同层次需求的能力,因此在初始等级上对信息质量仅作基本的可获取度、时效性、格式和安全上的要求,具体包括对发布信息的URL格式、可机读格式、发布时间、发布频率、存储方式作出要求。初始等级信息虽然仅具有基本的质量水平,但以其规范的格式、规律的发布频率和可靠的获取度,仍能为各类专业用户所利用;同时考虑到各部门信息处理能力不均衡的问题,信息处理能力不足的公共部门也能提供符合该等级条件的信息,无需因顾虑信息质量稍差而推迟发布信息;此外初始级信息也为信息中介提供了发挥空间,将信息优化的工作交给专业人士处理,实现公共部门信息的充分、有效再利用。

(2)优化级信息。公共部门内部和外部的整合型信息中介将对初始级信息进行优化,为用户提供具备优化级质量的信息。目前各国公共部门信息门户、开放数据门户是优化级信息的主要来源。对信息的优化主要表现在对信息可获取度的优化,包括对资源定位的细化要求,将相似信息以集合的形式集中发布,对信息检索的优化;对信息准确度的优化,包括确保发布的信息及时反映当前真实情况,确保对原始信息的更新及时反映在发布信息中,提供对错误信息进行修改的渠道;对信息的效度进行声明,以文档形式声明所提供的信息质量,以便用户据此对信息做出信任度判断;对信息安全的优化,采用异地备份的方式确保信息的物理安全,提供信息服务运行时间、停运时间、频次限制方面的可用性声明;对信息格式进行优化,以标准开放格式发布信息,根据信息内容类型选择发布格式,例如语义数据格式、标准表格格式、数据内容标示符、元数据标准等。

(3)适用级信息。公共部门内部和外部的开发型、强化型信息中介将对优化级信息进一步处理使其符合用户的再利用目的,这类信息具有最高等级的信息质量。信息中介将公共部门信息与用户需求进行匹配,在对信息深度理解的基础上对其进行进一步优化。在相关度上,深度挖掘信息之间的潜在关联,从语义角度创建、揭示信息之间关系并以易于感知的形式展示;在准确度和时效性上,做到所发布的信息与信息更新之间的滞后达到最小化,使得信息能准确、实时反映当前的真实情况;在完整度上,将信息收集、发布的全过程以可追溯的形式呈现,如使用PROV数据溯源模型对信息的创建、处理、演化进行记录;在一贯性、互操作性和格式上,采用符合行业特征、基于开放标准的工具、格式对信息进行处理和展示,例如标准统计数据格式(SDMX/Data Cube等)、标准地理数据格式(KML/ GeoJSON等);在可获取度和安全度上,对信息进行转储和备份,并提供不同时间点、不同类型的文件下载列表和链接;在效度上,建立信息持续发布的长期保证机制,提供数据验证机制,确保用户从信息中介处获取的信息与原始信息相一致。

这三个等级为递进关系,优化级信息首先需符合初始级信息所要求的质量标准,适用级信息需同时具备初始级信息和优化级信息所要求的质量标准。信息用户可以根据其再利用目的、信息处理能力和财政预算,自由选择符合需求的信息等级开展再利用活动。

6 总结与展望

文章通过对公共部门信息再利用的信息增值过程和参与者的阐述,分析了信息质量对再利用过程和其参与者的重要性,再结合各国再利用的实践案例,将再利用过程、再利用参与者与信息质量维度联系起来,并提出了公共部门信息质量分级设想,笔者认为应从以下三个方面对公共部门信息再利用中的信息质量问题进行深入探讨。

第一,需要对再利用的各方参与者的能力和需求进行综合考虑,对所建立的信息质量管理设想进行验证性研究;第二,信息质量管理是一项持续进行的过程,需要获得相应参与组织内部和外部的政策支持,应从宏观层面进行信息质量管理策略的研究,包括探讨信息质量立法、信息质量监察机制、信息质量激励机制的建设和实施;第三,信息质量的保障和提高将通过具体的信息质量评估和控制来实现,因此如何将信息质量维度与技术指标和手段相结合值得进行进一步研究,包括探讨所采取的信息质量评估、信息质量控制标准和工具。

(来稿时间:2015年12月)

参考文献:

1.促进大数据发展行动纲要[EB/OL].[2015-09-19].http:// www.gov.cn/zhengce/content/2015-09/05/content_10137.htm

2. 冉从敬,陈传夫,贺德方.公共部门信息增值利用的社会责任研究[J].中国软科学,2014(12):48-59

3. 陈传夫,肖志锋.公共部门信息资源再利用国际立法的进展与对我国的建议[J].信息资源管理学报,2011(1):16-25

4. 陈传夫,鲜冉,王迪.我国公共部门信息资源增值利用的政策趋势分析[J].信息资源管理学报, 2015(2):4-10

5.冉从敬.公共部门信息再利用制度研究[J].中国图书馆报,2008(6):103-108

6. 冉从敬.美国公共部门信息再利用的制度体系研究[J].图书与情报,2010(4):69-74

7. 陈传夫,刘莎.公共部门信息增值利用中面临的知识产权问题及对策[J]. 图书馆论坛,2010(6):19-22

8. 秦丽红.美国公共部门信息再利用模式及其对我国的借鉴意义[J].图书馆学研究,2009(1):77-79

9. 赵芳,樊江宏.英国公共部门信息再利用模式分析[J].图书馆学研究,2011(6):86-90

10. 陈传夫,马浩琴,黄璇.我国公共部门信息资源增值利用的定价问题及对策[J].情报资料工作,2011(1):11-15

11. 冉从敬,柳杨.英国公共部门信息再利用收费制度对我国的启示[J].图书馆论坛,2015(2):88-94

12. Recommendation of the Council for Enhanced Access and More Effective Use of Public Sector Information[EB/OL]. [2015-10-13].http://webnet.oecd.org/oecdacts/Instruments/ ShowInstrumentView.aspx?InstrumentID=122

13. Commercial exploitation of Europe’s public sector information [EB/OL].[2015-10-13].http://ec.europa.eu/information_ society/newsroom/cf/dae/document.cfm?doc_id=1196

14. Graham Vickery.A review of recent PSI re-use studies and related market developments[EB/OL].[2015-10-13].http:// ec.europa.eu/newsroom/dae/document.cfm?doc_id=1093

15. Market Assessment of Public Sector Information[R/OL]. [2015-08-28].http://www.gov.uk/government/uploads/system/ uploads/attachment_data/file/198905/bis-13-743-marketassessment-of-public-sector-information.pdf

16. Jacob Marschak.Economics of information systems[J].Journal of the American Statistical Association,1971(3):192-219

17. Robert S. Taylor.Value-added processes in the information life cycle[J].Journal of the American society for information science,1982(9):341-346

18. Enrico Ferro, Michele Osella.Eight business model archetypes for PSI re-use[EB/OL].[2015-10-03].http://www. w3.org/2013/04/odw/odw13_submission_27.pdf

19. John Hagel,Jeffrey F. Rayport.The coming battle for customer Information[J].Harvard Business Review,1997(1):53-60

20. Paul Resnick,Richard Zeckhauser,Chris Avery.Roles for electronic brokers[EB/OL].[2015-10-15].http://ccs.mit.edu/papers/ CCSWP179.html

21. Marijn Janssen,Anneke Zuiderwijk.Infomediary business models for connecting open data providers and users[J].Social Science Computer Review,2014(5): 694-711

22. Bailey J. P.,Bakos, J. Y. An exploratory study of the emerging role of electronic intermediaries[J].International Journal of Electronic Commerce,1997(3):1, 7

23. Deloitte.Open growth Stimulation demand for open data in the UK[EB/OL].[2015-09-06]. http://www2.deloitte.com/content/ dam/Deloitte/uk/Documents/deloitte-analytics/open-growth.pdf

24. 约瑟夫·M·朱兰.朱兰质量手册[M].北京:中国人民大学出版社,2014:6

25. Ballou, D.,Madnick, S.,Wang, R. Special section: assuring information quality[J].Journal of Management Information Systems,2003(20):9-11

26. Markus Helfert,Foley Owen. A context aware information quality framework[C].Fourth International Conference on Cooperation and Promotion of Information Resources in Science and Technology,2009:187-193

27. Delone William H., McLean Ephraim R..The DeLone and McLean model of information systems success: a ten-year update[J].Journal of management information systems,2003(4): 9-30

28. Wang, R. Y.,Strong, D. M..Beyond accuracy: What data quality means to data consumers[J].Journal of management information systems,1996(4):5-33

29. Miller, Holmes.The multiple dimensions of information quality[J].Information Systems Management,1996(2):79-82

30. Guidance on the implementation of the Re-use of Public Sector Information Regulations 2015[EB/OL].[2015-09-14].http:// www.nationalarchives.gov.uk/documents/information-management/ psi-implementation-guidance-public-sector-bodies.pdf

31. Houghton, J.Costs and Benefits of Data Provision. Report to the Australian National Data Service[R/OL].[2015-10-26].http:// ands.org.au/resource/houghton-cost-benefit-study.pdf

32. Sirko Hunnius, Krieger Bernhard, Schuppan,Tino. Providing, Guarding, Shielding: Open Government Data in Spain and Germany[C].2014 EGPA Annual Conference,2014

33. Emilio Garcia Garcia,Maldonado S. L. Soriano.Reuse of Public Sector Information in Spain: A solid foundation for a promising future[EB/OL].[2015-09-30].http://bid.ub.edu/29/ soriano3.htm

34. Cerrillo-i-Martínez Agustí.The Reuse of Public Sector Information in Europe and Its Impact on Transparency[J].European Law Journal,2012(6): 770-792

35. Thorhildur Jetzek. Sustainable Value of Open Government Data: Uncovering the Generative Mechanisms of Open Data through a Mixed Methods Approach[D].Copenhagen:Copenhagen Business School, 2015

36. Dragos Dacian C.,Bogdana Neamtu.Reusing Public Sector Information-Policy Choices and Experiences in some of the Member States with an emphasis on the Case of Romania[J/OL].[2015-10-01].http://eiop.or.at/eiop/pdf/2009-004.pdf

37. Sharif Raed M.Utilization and Value of Public Sector Information for Knowledge Development: the Case of South Africa[D]. New York: Syracuse University,2013

Information Quality Study in the Context of Public Sector Information Re-use

Wang Pei1Sun Jianwen2Wu Gang1
( 1. School of Information Management, Wuhan University; 2. National Engineering Research Center for e-Learning, Central China Normal University )

〔Abstract〕The result of public sector information re-use is highly affected by the quality of raw PSI information. By investigating the PSI-based value-added chain, defining user need for PSI quality from different stakeholders’ perspectives, and analyzing PSI quality dimensions, a 3-level PSI quality grading system is presented. By implementing the quality grading system, the quality of PSI can be controlled and the re-use result can be improved.

〔Keywords〕Public sector informationInformation qualityInformation re-use

〔作者简介〕王佩(1984-),女,武汉大学信息管理学院博士研究生;孙建文(1982-),男,华中师范大学国家数字化学习工程技术研究中心副教授;吴钢(1983-),男,武汉大学信息管理学院讲师。

猜你喜欢

公共部门参与者利用
利用min{a,b}的积分表示解决一类绝对值不等式
休闲跑步参与者心理和行为相关性的研究进展
门限秘密分享中高效添加新参与者方案
公共部门人力资源管理激励机制研究
利用一半进行移多补少
第七届中国公共部门人力资源管理论坛在北京召开
利用数的分解来思考
Roommate is necessary when far away from home
基于代理的多方公平交换签名方案
《国际公共部门会计准则前言》发布