我国省级政府数据开放平台可用性评估
2021-07-01DeborahRichards
王 迪,Deborah Richards
0 导言
近年,鼓励向公众开放政府数据的运动在各国开展[1],很多政府部门建立政府数据开放平台[2-3],如美国政府建立的data.gov,英国政府建立的data.gov.uk,新加坡政府建立的data.gov.sg。政府数据开放平台是发布与利用开放政府数据常用途径[1],这类数据平台逐渐成为开放政府数据项目的标志[4]。政府数据开放平台的发展仍处于起步阶段[5]。为了解目前政府数据开放平台发展状况,很多学者与机构提出了多种评估体系[1]。然而,现有评估体系将关注点更多地放在平台的数据上,忽视了平台自身的功能与服务。另一方面,虽然平台上开放的数据越来越多[6-7],但对已开放数据利用的缺乏逐渐成为制约开放政府数据发展的一个主要问题[8-10]。社会公众对开放政府数据与平台认知的缺乏[11]导致开放政府数据无法实现推动数据创新[12]并创造经济价值[13]的主要目标[1,14]。因此,目前开放政府数据带来的社会效益十分有限[15]。然而,社会公众对政府数据开放平台缺乏利用的原因尚不明朗[9]。
在探讨技术接受度时,可用性通常作为一项技术被接受与利用的前提条件[16]。可用性主要关注用户可以在何种程度上使用一个信息系统的功能[17]。虽然相比信息系统接受度中的其他概念,可用性是一个相对狭义的概念,但可用性却适用于交互性信息系统的各个方面[18]。由于可用性对于一个信息系统的成功具有决定性的影响,因此在本研究中,笔者从政府数据开放平台可用性角度来探讨其未来的发展方向,并提出以下两个研究问题:(1)如何评估当前政府数据开放平台的可用性?(2)目前我国政府数据开放平台在界面设计上存在哪些问题?为回答上述问题,笔者首先基于文献调查,对政府数据开放平台可用性原则进行了扩展,并构建了具体的评估标准。之后,笔者选取了我国部分省级政府数据开放平台进行启发性评估,来了解目前平台在可用性方面存在的问题。
本文的目标和主要贡献体现在3个方面:一是本研究提出了系统和客观地对政府数据开放平台进行可用性评估的框架;二是本研究对我国省级政府数据开放平台的可用性进行了系统评估,并分析了目前存在的问题;三是本研究所构建的可用性评估框架,包括框架中的原则与评估标准,能够为设计者在未来提升开放数据平台界面的可用性提供指导。
1 政府数据开放平台与可用性评估
1.1 政府数据开放平台评估
政府数据开放平台是由政府部门建设的用于向社会公众公开发布其拥有的数据的官方平台[3-4,19]。数据平台如同一个“一站式商场”,供社会公众获取他们所需的来自不同政府部门的数据。社会公众作为开放政府数据利用的最主要获益者,因此他们也被视为开放政府数据工程一个最主要的相关方[20]。
不同的研究机构与学者针对政府数据开放平台提出了很多评估体系[1]。其中只有少部分被实际运用于对政府数据开放平台的评估,如万维网基金会提出的开放数据晴雨表[15],开放知识基金会提出的开放数据指标[21],欧盟提出的开放数据监控[22],经济合作与发展组织提出的OUR数据指数[23],数据开放指标[24],开放数据平台指数[5],以及开放数据平台需求[4]等。在我国对政府数据开放平台进行的评估方面,郑磊等学者构建了有关平台功能与体验的研究框架[25],评估过程主要采用观察法。李志基于用户体验的政府开放数据平台评价则缺乏一个系统的评估框架[26]。周文泓等学者对我国地方政府开放数据平台建设的评估与国际上的评估指标类似,主要关注开放政府数据的属性以及对数据利用的促进[27]。沈晶等学者从开放程度提升度、更新频率兑现提升度和用户利用提升度这3方面分析评估了我国省级政府数据开放平台的发展速度[28]。范佳佳从深度、广度和影响力3个维度对全球53个国家政府开放数据利用效率进行了评估[29]。
通过对国内外相关文献的比较能够发现,政府数据开放平台现有评估体系存在一定的局限性。这些指标体系中,一部分是基于与相关法律政策的匹配度[1];另一部分则主要关注平台的数据数量[22]和数据质量[5,21,24,30-31]。虽然一些学者在其评估体系中试图探究平台与用户之间的交互,包括帮助功能[5]、可视化[5,32]、排行榜[32]以及评分[23]功能。然而,这些指标体系并不是专门为开放政府数据可用性评估设计的。因此,目前的研究中缺少针对政府数据开放平台界面可用性的系统全面评估。
1.2 政府数据开放平台的可用性
在人机交互领域,可用性是一个被广泛接受的概念,指用户与计算机如何通过界面进行更好、更愉悦的交互[33]。对于网站而言,可用性通常指对于用户友好性和网站易用性的一种定性评估[34]。由于政府建立的政府数据开放平台属于网站的一种,在本研究中,笔者也将可用性理解为一种评估,并重点关注通过良好的界面设计来保证用户与政府数据开放平台之间和谐而高效的交互[18]。
之前的研究证实了具有较高可用性的政府数据开放平台所能带来的益处:一方面,由于政府数据开放平台是连接用户与政府的桥梁[4],可以为政府及其在线服务塑造更为可靠的公众印象[35]。因此,开放政府工程[1]与现代民主的价值观[36]都强调政府数据开放平台需要具备用户友好性。如果政府数据开放平台不具备优良的可用性,不仅会阻碍用户使用平台以及平台的服务,更会影响社会公众对政府部门的积极评价[37]。另一方面,平台良好的可用性有利于提升用户对平台的满意度[35]。相关研究表明用户对政府网站的接受度和使用度与网站的可用性之间存在正相关关系[38]。网站的低可用性,如政府网站无法访问或使用,将会导致用户对政府网站不满,进而阻碍用户再次使用该网站或将该网站推荐给他人使用[39]。为了提高社会公众对平台数据的开发利用,通过良好的平台可用性来为社会公众留下良好的印象就显得尤为重要了。然而,在现有的国内外研究中,并没有足够关注政府数据开放平台的可用性。虽然有学者针对美国政府数据开放平台的数据处理能力进行了启发性评估,但是该研究仅仅将网站普适的可用性原则纳入了评估[40],而没有考虑开放政府数据所具有的独特属性。此外,类似的启发性评估目前尚未在除美国以外的地区开展。
1.3 启发性评估
根据可用性的定义,对网站的评估可以作为研究网站可用性的一种主要方式。这种评估主要通过可用性观察[41-42]方式开展。可用性观察的方法包括启发性评估[41]、认知浏览[43]、用户测试[44]等。启发性评估由于具有高效性、易操作性和有效性[37]等优势,成为广泛应用于各研究领域的可用性观察方法[41]。启发性评估是对用户界面可用性设计的一种系统观察[18],其主要目标是发现用户界面设计中存在的可用性问题,从而指导未来界面设计的改良[45]。启发性评估通常需要由一定数量的专家对一个界面进行检测,并通过比较界面与可用性原则之间的差距,来发现存在的问题[18,45],这一过程被称作“启发性评估”。启发性评估主要依靠专家对操作界面进行检测,而非普通用户。启发性评估的依据是事先确定的可用性原则体系,而非实际的操作任务。启发性评估更适用于系统界面开发的前期阶段。启发性评估能够发现和识别绝大多数可用性问题[46]。此外,由于启发性评估的高效性,这一方法能够发现很多严重而具体的问题,从而进一步促进信息系统用户界面设计的改善[47]。基于上述启发性评估所具有的优势,在本研究中,笔者采用了这一方法来对我国政府数据开放平台的可用性进行评估。
2 研究方法
2.1 政府数据开放平台的选择
为了选取本研究的评估对象,在2018年6月,笔者使用了两大搜索引擎(百度与谷歌)并结合相关研究文献,查找了我国已经建立的省级政府数据开放平台。这些平台必须由省级政府建立,因此目标平台的域名中必须有“.gov”字段,同时平台必须汇集来自不同政府部门与机构的数据。最终,笔者查找到9个省级政府数据开放平台。由于本研究在进行启发性评估时,新疆的数据平台无法顺利访问,因此该平台被剔除,并确定其他8个省级政府数据开放平台作为本次可用性评估的对象。表1列举了作为本次评估对象的8个省级政府数据开放平台的网址以及所在地的背景数据。
表1 政府数据开放平台评估对象
2.2 可用性原则的拓展
学者们提出为数众多的可用性原则,引导信息系统开发者[18]。Molich等提出的10项可用性原则能够解释界面设计中可以观察到的绝大多数问题,学者们普遍认为所有用户界面设计者都应遵守这十项可用性原则[48]。基于这一最初版本并通过与其他可用性原则评估的比较,Nielsen进一步提出增强版十项可用性原则[16],即目前广泛应用于各类网站可用性评估中的原则[35,49],包括电子商务网站[42]、电子政务网站[50-51]、美国政府数据开放平台[40]。这些研究不仅证明Nielsen提出的可用性原则在识别网站设计可用性问题上的有效性,也证明这些原则能够应用于政府数据开放平台研究。因此,将Nielsen提出的可用性原则纳入本文的评估体系中是十分必要的。另一方面,这些原则是20年前提出的,最初针对的是软件的可用性评估,后来被拓展至网站的可用性评估领域。虽然政府数据开放平台属于网站的一种,但具有自身独特的属性。政府数据开放平台产生的动力决定了其主要目标是为用户提供数据和数据集[2-4,19],需要在平台界面中提供数据服务。此外,平台所提供的数据需要符合开放政府数据的定义。因此,只有对Nielsen的十项可用性原则进行扩展,才能覆盖政府数据开放平台的独特需求。为此,Fajar Marta提出一系列设计原则来反映开放数据的3个核心特征:公开、隐私与信息质量[52],其所提出的设计原则的有效性通过对5个政府数据开放平台的深度观察得到进一步证实。由于本研究启发性评估的对象就是政府数据开放平台,因此,将这些经过论证的设计原则纳入评估体系之中具有一定的意义。
然而,Fajar Marta提出的设计原则与Neilsen的可用性原则之间存在一定的重合。如Fajar Marta提出的第4条设计原则要求网站提供帮助功能,这与Nielsen的第10项原则,帮助功能与记录功能,是有所重复的。此外,一些原则并不适合非网站运营者进行观察,如Fajar Marta提出的第13条设计原则要求平台在上传数据集之前删除隐私信息。因此,笔者对上述可用性原则进行了进一步的筛选,在去除了存在重合的原则以及不适用于非网站运营者进行观察的原则之后,最终确定了面向政府数据开放平台设计的21条可用性原则。具体剔除原因及筛选结果如表2所示。
2.3 评估标准构建
在传统的启发性评估中,可用性问题的发现依赖评估者的观察和经验[40]。然而,缺乏具体内容的可用性原则会导致启发性评估无法实现发现可用性问题的目的[35]。为避免启发性评估在发现需要测试的可用性问题上的不足,同时也为了确保本研究评估的客观性与可操作性,笔者针对表2中每一条筛选出的可用性原则构建了具体的评估标准,以便降低评估者在判断目标平台是否满足可用性原则时的难度,减少对评估者经验的依赖程度。本文主要通过3种途径构建评估标准:一是每一条原则的描述与解释[18,52];二是每一条原则在网页界面设计中的范例[49,53-54];三是关于政府数据开放平台可用性的相关研究[5,21-22,24,55-56]。在整合三方面内容的基础上,笔者确定了54条具体的评估标准。表3汇集了表2筛选之后的可用性原则以及各自对应的评估标准。
表2 可用性原则筛选
表3 可用性原则的评估标准
2.4 评估者的选择
启发性评估需要由各个评估者独立观察选定的评估对象。因此,在进行可用性评估前,需要对评估者进行选择。Nielsen通过权衡评估成本与可用性问题的发现概率,推荐选取3~5名评估者来进行启发性评估[18]。Nielsen的研究同时显示,专家与非专家在进行启发性评估的效果上具有显著差异[57]。因此,本研究在计算机科学领域招募了4名具有网站开发经验且未曾使用过8个评估对象平台的专家担任本次启发性评估的评估者。
(续表3)
2.5 评估流程与数据分析
在评估开始前,每一名评估者都得到了关于本次评估背景与目标的说明文件,以及一个包含8个评估对象平台和所有可用性原则与评估标准的表格。本次评估没有对评估者进行任何关于可用性原则与评估标准的培训,避免评估者受培训影响而无法客观观察和测试。每一个评估者都遵循同样的顺序和流程来完成对8个评估对象平台的启发性评估。首先,评估者粗略浏览各个政府数据开放平台5分钟,了解平台的大致情况。之后,评估者使用平台,观察各项功能设计,同时与表3中的54条评估标准进行比较。如果平台的功能符合评估标准的描述,评估者就为该评估标准标注值为1,否则标注值为0。在完成对8个评估对象的可用性评估之前,评估者之间不允许进行交流[18]。各评估者的评估结果分别记录在单独的电子表格中,并在评估结束后,由笔者对评估结果进行汇总。本次可用性评估从2018年6月12日持续至7月20日。在收集了4名评估者对8个评估对象的评估数据后,笔者计算了每个评估标准和可用性原则的平均值,并通过对比分析得出了相应结论。选择使用平均值,因为它是启发性评估中使用最广泛同时也是最重要的一个数值[18]。
3 我国政府数据开放平台可用性现状
3.1 可用性原则与评估标准比较
表4展示了本次评估中可用性原则与评估标准的平均值。由评估结果可知,目前我国省级政府数据开放平台可用性设计能够较好实现系统与现实的匹配性(可用性原则2),而在针对不同类型的用户提供相应服务(可用性原则21)上的表现较差。相比专门针对政府数据开放平台的可用性原则(可用性原则11~21,均值得分1.739),我国省级政府数据开放平台在通用型的可用性原则方面的表现更好(可用性原则1~10,均值为2.594)。
表4 可用性原则与评估标准的均值计算结果
在评估标准方面,目前我国省级政府数据开放平台在评估标准17(平台的菜单和按钮需要有描述其功能的关键词)和28(平台采用左端对齐)的得分最高,为满分4分,这意味着所有数据平台的设计都满足这两项标准。评估标准14(为书写失误自动推荐关联词汇)和15(将焦点自动设置在输入框上)的得分最低,为0分,意味着暂时没有数据平台满足这两项标准。
3.2 我国政府数据开放平台可用性比较
首先,通过Kruskal-Wallis H检验(KW检验)对本次评估的我国8个政府数据开放平台进行了排序比较[58]。KW检验结果如表5所示。显著性p=0.051,意味着虽然不同数据平台的平均秩存在差异,但该差异并不具有统计学意义上的显著性。上海政府数据开放平台排序最高,意味着该平台在本次评估中的可用性表现最好,而四川的政府数据开放平台的排序最低。
表5 Kruskal-Wallis H检验结果
笔者通过单因素方差分析对各个平台在可用性原则上的表现是否存在显著差异进行了检测。分析结果如表6所示,“*”表示存在显著差异。我国政府数据开放平台在10个可用性原则上的表现存在显著差异,其中的4个属于普适性的可用性原则,6个属于政府数据开放平台独有的可用性原则。该结果表明,目前我国的政府数据开放平台在可用性设计上的表现并不一致,尤其在政府数据开放平台独有的可用性原则上的表现,存在较大差异。
表6 数据平台可用性原则均值与单因素方差分析
在单因素方差分析基础上进行的Post-hoc检测表明,对于可用性原则3(用户控制与自由)、6(识别而非记忆)和7(操作的灵活性与高效性),四川政府数据开放平台相比其他平台来说显著较差。对于可用性原则4(一致性与标准),贵州政府数据开放平台相比北京、广东、香港、上海和浙江的数据平台显著较差。对于可用性原则12(提供用户反馈数据集质量的功能),四川和浙江的数据平台表现显著较差。对于可用性原则13(提供用户与其他用户进行交流的功能),广东和台湾的数据平台表现显著较好。对于可用性原则14(用关键词对数据集进行标引以便快速检索),上海与台湾的数据平台表现显著较好。对于可用性原则15(允许用户无需先注册就可以下载数据或申请数据),北京数据平台表现显著较差。对于可用性原则17(提供应用程序接口)和19(通过元数据功能来提供数据背景信息),四川数据平台表现显著较差。
笔者进一步计算了各个平台在评估标准上的均值得分,并对均值得分进行了单因素方差分析,结果如表7所示。在54个评估标准中,我国政府数据开放平台在其中的11个评估标准上的均值得分存在显著差异。其中6个评估标准属于政府数据开放平台所独有,而其余5个为普适性的可用性评估标准。对于评估标准8(在每个菜单栏中都明确标注用户目前所在位置以及可以前往的位置的相关选项)、评估标准9(平台的设计和结构符合大多数在线数据库/平台的范式)、评估标准16(用户可以轻松获取使用说明)和评估标准19(提供面包屑导航),四川数据平台得分相比其他地方的数据平台显著较低。这是因为四川政府数据开放平台没有设置导航栏,来告知用户目前所在的位置以及他们可以前往哪些页面。对于评估标准11(将各个构成元素放置在相对固定的位置),四川和贵州的数据平台的得分显著较低。但是,评估者们对于两个数据平台在该评估标准上的表现存在不同的意见。对于评估标准43(提供用户反馈数据集质量的功能),北京和台湾的数据平台得分较高,而四川的数据平台得分较低。对于评估标准44(提供用户与其他用户进行交流的功能),广东和台湾的数据平台因为提供用户留言与评分功能,而得到了较高的分数。对于评估标准45(用关键词对数据集进行标引以便快速检索),上海和台湾的政府数据开放平台由于对每个数据集都使用了标签和关键词进行标引,因而得分显著较高。对于评估标准49和52,四川数据平台因为没有提供API功能和元数据,因此得分较低。
表7 数据平台可用性评估标准与单因素方差分析
4 我国政府数据开放平台设计改进方向
通过上一节的数据分析,可以看出目前我国政府数据开放平台在可用性设计上存在一定的问题,其中最主要的问题是目前数据平台并没有区分用户类型并提供相应功能。同时,我国政府数据开放平台在差错预防、用户交互、数据标签、筛选推荐、数据格式和数据可视化等方面存在较大的改进空间。就政府数据开放平台的帮助功能而言,目前我国政府数据开放平台在与帮助功能相关的可用性原则(可用性原则9与10)方面表现较差。这意味着目前我国的政府数据开放平台缺乏较好的帮助功能来支持用户对平台的使用。这一结论从侧面证实了相关研究中表明的目前政府数据开放平台缺乏提供诸如常见问题、使用教学等帮助功能[5]。然而,一些学者的研究表明,实际上,开放政府数据用户对帮助功能具有较高的需求度[59]。这意味着目前数据平台帮助功能的不足或许是导致利用率较低的一个因素。
结合本研究所建立的可用性评估框架以及本次评估中识别的可用性设计问题,笔者认为,未来我国政府数据开放平台能够通过以下措施改进平台的可用性:检索词的自动推荐功能、将焦点自动定位在输入框、提供新手教学功能、提供数据申请跟踪功能以及基于用户类型提供不同的功能服务等。通过改善数据平台的可用性,来提升社会公众对我国政府数据开放平台的接受度和利用度。
5 结语
具有优良可用性设计的政府数据开放平台,能够提供平台与用户之间高效而舒适的交互体验[18]。由于政府数据开放平台是用户获取开放政府数据的直接接口,因此对数据平台进行可用性评估能够有效发现目前平台设计中除数据数量和质量之外的问题。基于这一因素,本文重点关注政府数据开放平台的可用性设计并对我国省级政府数据开放平台进行了系统评估。本文首先建立了适用于政府数据开放平台的可用性评估框架,进而通过启发性评估对选取的我国省级政府数据开放平台的可用性进行了分析。
基于启发性评估结果,得出如下主要结论:一是我国政府数据开放平台在普遍适用的可用性原则上的表现要优于政府数据开放平台独有的可用性原则上的表现;二是目前政府数据开放平台在系统与现实的匹配性上的表现最好,而在针对不同类型的用户提供相应服务上的表现最差;三是目前我国政府数据开放平台在差错预防、用户交互、数据标签、筛选推荐、数据格式和数据可视化方面需要改进;四是广东、台湾和上海的政府数据开放平台可用性优势明显,而四川政府数据开放平台与其他地区的数据平台相比存在一定的差距。上述研究结论从侧面论证了目前缺乏指导政府数据开放平台可用性设计的体系框架,同时说明,运用本研究构建的可用性评估框架对政府数据开放平台进行可用性评估,有利于我国政府数据开放平台的进一步发展。