APP下载

中国省级政府网站电子政务建设成效评价研究*
——基于网站链接分析和内容分析的比较

2019-11-23杨金龙刘千里

图书情报研究 2019年4期
关键词:官方网站电子政务网页

杨金龙 刘千里 吴 震

(南京大学信息管理学院 南京 210023)

政府网站作为电子政务的基础和电子政务发展程度的主要标志,不仅是宣传政府形象的窗口,也是政府发布信息、服务于社会的主要渠道,更是实现社会公众与政府沟通互动的载体[1]。2016年2月17日,中办、国办印发《关于全面推进政务公开工作的意见》(中办发〔2016〕8 号)提出,加快推进“互联网+政务”,构建基于互联网的一体化政务服务体系。强化政府门户网站信息公开第一平台作用,整合信息资源,加强协调联动,将政府网站打造成更加全面的信息公开平台、更加权威的政策发布解读和舆论引导平台、更加及时的回应关切和便民服务平台[2]。2016年9月25日,国务院发布《国务院关于加快推进“互联网+政务服务”工作的指导意见》(国发〔2016〕55 号)进一步提出,2017年底前,各省(区、市)人民政府、国务院有关部门建成一体化网上政务服务平台,全面公开政务服务事项,政务服务标准化、网络化水平显著提升[3]。政策文件对如何利用政府网站规范服务内容、创新服务模式、拓展服务渠道、开放服务资源、深化服务功能,进一步推进政务公开和互联网+政务服务工作做出了明确要求[4]。

在政府网站的评价方面,有的学者从政府网站信息量出发提出了政府网站信息资源计量的指标体系,有的学者从整个网站的综合水平出发提出了综合评价政府网站的指标体系圈[5]。而目前很有用、且应用广泛的评价方法则是从网络信息计量学出发的链接分析[6]和与之相关的网络影响因子(WIP,Web Impact Factor)测度[7]。链接分析通过网站被链接的次数(尤其是外部链接数)反映该网站的质量。其评价依据是一个网站被另一个网站所链接是对该网站的赞许和利用,而且两者的内容是相关的;一个网站的外部链接数越多,其影响力越大[8]。网络影响因子测度以链接分析为基础,以网络影响因子的大小来反映网站的影响力大小[9]。有学者提出了网络影响因子的计算方法:假设某一时刻链接到网络上某一特定网站或区域的网页数为a,而这一网站或区域本身所包含的网页数为b,那么其网络影响因子的数值可以表示为WIF=a/b。显然,网站的网络影响因子越高,其影响力和知名度越大[10]。

除了网站链接分析以外,也有学者从政府网站的内容入手,对其发布的政策文献进行评价分析。如有学者追踪了印度尼西亚的巴厘岛政府在2014年5月到6月间所发布的内容,并且参照印度尼西亚共和国交通和信息部所发布的指南对巴厘岛政府下辖的各二级行政单位官方网站发布的内容进行了评价分析,研究指出登巴萨市的网站建设得最好,居于第一位,同时指出其他行政单位应该提升其政府网站内容管理水平[11]。

本文在对中国省级政府官方网站电子政务建设成效进行评价时,分别从网站链接分析和网站内容分析入手,对各省级政府官方网站进行了评价排序,分析了各省级政府官方网站电子政务建设的可取之处和不足之处,并给出改进意见和建议。

1 研究方法与数据来源

本文选取中国大陆31 个省级行政区(省、自治区、直辖市)的官方网站作为研究对象, 分别对各省级行政单位的官方网站进行了访问,确保其能正常提供服务,并记录各省级政府的官方网址(包含域名在内),以便后续进行自动化收集相关链接数据和网站内容。

1.1 研究方法

结合已有研究成果,确定本研究采用的研究指标为网页总数、链接指数、站外链接数、站内链接数、主页链接数、网络影响因子、外部网络影响因子、内部网络影响因子、搜索引擎网页排名值等指标,以确保评价指标较为全面客观,如表1所示。

表1 研究指标及含义解释

续表1

Google 是目前全球最大的搜索引擎,所收藏的网页数量在同类搜索引擎中是最多的,支持130 多种语言,且搜索准确率极高,因此考虑运用Google 来统计各省级政府官方网站被收录的网页数量;同时由于研究对象是中国境内的政府网站,考虑到百度是全球最大的中文搜索引擎,是中国境内使用人数最多的搜索引擎,对中文的支持毋庸置疑是最好的,因此本研究同时选用百度和Google 所收录的网页数量进行计量,并取二者的均值作为网页总数,以便全面和准确的衡量各省级政府网站的网页数量。但是不论是百度还是Google,都无法对政府网站的站内链接和站外链接进行测度,因此本研究选用国内研究者使用较多的“站长之家“(www.chinaz.com)进行站内链接、站外链接等相关数据的收集。除Google 公司外,百度公司也有自己的一套独立的排名系统,因此本研究同时采用Google 和百度的PageRank值进行计量运算。

1.2 数据收集

政府官方网站内容(以下简称政策文献)包括各省级政府官方网站2016年度发布的所有与电子政务相关的政策文件(如通知、指南、意见、发展规划、暂行办法、规定、细则、方案、纲要、通则、制度、文件、招投标等)、法律法规(条例、法)、标准规范(国家、地方和行业)、工作报告(年报、报告、总结等)、新闻报道(通讯、政策文件解读、新闻等)等。本研究在收集政策文献时依托南京大学政务数据资源研究所全球电子政务数据库平台工作,以各省级政府官方网站为数据来源,采取机器自动抓取和人工筛选过滤的模式进行数据采集。

首先需要确定待收集的政策文献范围及来源。本文通过对电子政务相关的政策文献进行试检索和分析已有研究中与电子政务相关的关键词,构造电子政务政策文献主题关键词表(如表2所示),在收集政策文献时主要选取标题中含有这些关键词的政策文献。选取后缀为通知、指南、意见、规划、(暂行)办法、规定、细则、方案、纲要、通则、法律法规等政策文献,确保涵盖的文件范围尽可能多。

表2 电子政务主题关键词表

其次确定待收集的政策文献来源。本研究的评价对象是2016年中国各省级政府网站的电子政务建设成效,故而主要选取中国大陆31个省级行政单位的官方网站进行电子政务文献收集,收集各网站2016年全年发布的所有与电子政务相关的政策文献,由于政府网站改版或升级导致部分文献无法从官网上找到时,则借助北大法宝、威科先行等权威法律信息库进行文献检索,确保所收集的电子政务政策文献全面而准确。

之后通过编写爬虫工具实现机器自动下载政策文献并记录相关信息。自2008年5月1日起施行《中国人民共和国政府信息公开条例》以来,国务院各部委及地方各级政府的官方网站都推出了信息公开目录,将政府文件、政府会议、规划计划等均予以公开,这为本文利用机器自动收集政策文献提供了极大便利。因此只需要从政府文件公开目录中下载文件并记录信息即可。

最后对文献进行人工筛选过滤。为避免机器下载的文件中出现无关电子政务的文件,对文献进行人工筛选和过滤,以确保文献类型的针对性,防止一些跟电子政务主题无关的文献被保留下来。

2 政府网站链接分析

2.1 数据处理

利用上述研究工具并结合计算机程序对各省级政府官方网站的相关数据进行收集,截止时间为2018年2月22日,并对收集到的数据进行二次处理,如网页总数=(百度收录的网页+Google 收录的网页总数)/2;网络影响因子(WIF)=链接总数/网页总数;内部网络影响因子=站内链接数/网页总数;外部网络影响因子=站外连接数/网页总数。最终得到的各省级政府官方网站链接相关数据如表3、表4所示。

表3 省级政府官方网站基本信息

表4 省级政府官方网站影响因子及排名

2.2 灰色关联度排序

为了对这10 个指标进行综合处理并得到整体排序,本文引入基于灰色关联度的排序方法[15]。灰色关联度寻求各因数之间的数值关系,是一种系统的分析技术,综合系统内各个因素的数值,其排序结果显得更为科学和可靠[16]。灰色关联度分析主要包括以下步骤:第一,对各个指标的数值中的数值进行比较,并选择最大值作为参考行,标记为Χ0;第二,分别计算其他行Χ1,Χ2,……,Χn与参考行Χ0之间的差的绝对值,并从这些绝对值中找出最大值和最小值,分别标记为max|Χ0(K)-Χi(K)|和min |Χ0(K)-Χi(K)|;第三,再从max|Χ0(K)-Χi(K)|和min |Χ0(K)-Χi(K)|中选出最大值和最小值,分别记为max|max|Χ0(K)-Χi(K)|= △i(max) 和minmin |Χ0(K)-Χi(K)|=△i(min),计算结果如表5所示。

表5 灰色关联度指标

运用计算机程序实现上述计算公式,最终计算得到中国31 个省级政府官方网站电子政务建设成效灰色关联排序结果如表6所示。

表6 2016年省级政府官网网站电子政务建设成效灰色关联排序

3 政府网站内容分析

由于政府网站的内容是非结构化数据,无法进行直接比较,故本文采用目前学者广泛使用的关键词分析方法对政策文献进行内容分析,并构造了政策文献关键词指数对各省级政府网站内容进行比较分析。

3.1 政策文献文本分词

由于本文所处的学科领域是电子政务领域,在进行文本分词时没有现成的词库可以利用,利用一般的分词软件进行分词时并不能取得很好的分词效果,可能原因就是在切词没有很好的语料库可以借鉴,因此不能对电子政务相关的一些领域关键词、专有名词等进行准确得识别,如“电子政务”的分词结果为“电子”和“政务”两个词。这样的例子还有很多,因此人工进行归并的工作量很大,且又会带来主观因素的偏差。故而本文选择已在期刊上正式发表的电子政务相关文章中的关键词作为词库,进而利用结巴分词软件进行分词。在选择期刊时,本研究在结合已有电子政务相关研究的基础上,充分考虑了电子政务的交叉学科性质,如情报学、管理学、政治学等学科都有涉及,故而最终从各个学科中选取了有代表性的几个期刊(如表7所示)。

表7 电子政务相关期刊

本文选取上述期刊创刊以来的所有已出版文章进行关键词统计,作为分词时的语料库。政策文献有了分词结果后就能进行关键词统计了,在统计时本研究只选取高频关键词进行统计,这是为了避免计算量过大且只有高频关键词才能体现出政策文献的主题,高低词频划分采用了Donohue 于1973年提出的高频低频词界分公式,即:

其中I1是指数据中只出现过一次的关键词数量[17]。即假设某份文献的分词结果中频数为1 的关键词数量为55 个词,那么,即统计时频次超过10 次的词语即可认为是高频词。

3.2 政策文献关键词指数分析

最终的电子政务政策文献关键词指数计量公式为:

其中,Fi是第个省级行政单位2016年的电子政务政策文献关键词指数,Fij是该省份全年电子政务政策文献中出现的第j 个关键词的频数,ni是该省份全年电子政务政策文献高频关键词的总数,表示某一关键词的权重,代表着该关键词的重要程度,权重高的关键词就代表高频关键词中的高频词,因而在决定电子政务政策文献关键词指数时起的作用要相应更大一些,最终计算结果如表8所示。

表8 2016年省级政府电子政务文献关键词指数排名

4 结果分析与对策建议

将网站链接分析灰度关联排序的结果与网站内容政策文献关键词指数排序的结果进行对比分析,结果发现灰色关联排序结果中,前10 名省级政府网站中除四川和天津外其余均位于网站内容政策文献关键词指数排序的前10 名内,这也从侧面说面了基于链接分析的中国省级政府网站电子政务建设成效评价结果与基于网站内容分析的评价结果是一致的。

针对灰色关联排序中较为靠后的山西省、广西壮族自治区及西藏自治区进行分析,结果如表9、表10 所示。

表9 排名靠后的省级政府网站链接关联排序结果

表10 排名靠后的省级政府网站内容政策文献关键词指数排序结果

由此可以看出,灰色关联度排序靠后的省级政府官方网站普遍存在一些共性问题,如网页总数、链接总数、站外链接数、主页链接数等指标均低于省级政府网站的平均值,网页总数、链接总数较低说明其网站内容建设上存在问题,网站内容更新频率不够快、内容发布不够多,另外从政策文献关键词指数上看这几个省份普遍靠后,说明其发布的内容主题没能跟上政策主题普遍的发展趋势,之后应该紧跟政策趋势、努力做好网站内容建设的工作。站外链接数、主页链接数较低说明网站发布的内容影响力不够,一方面可能是其宣传不够到位,另一方面可能是网站内容的质量不高,因此这些省级政府官方网站在保证内容发布数量的前提下,还要确保网页内容的质量。

针对以上分析结果,对比反映出的问题,本文针对省级政府网站建设提出以下对策建议:

(1)及时更新内容,提高网站内容更新速度

政府网站是一个地区的窗口,不仅是该地区市民获取政府相关信息的大本营,同时也是其他地区了解该地区的第一扇窗。因而,及时更新内容不仅能给市民提供更多的有效信息, 同时也能体现出一个城市不断前行、创新、发展的精神内核。省级政府网站应紧跟政务不同发展阶段的需求,及时进行布局调整,组建专业高效的电子政务运营团队,专门更新网站内容,使得网站内容更新与时代同进步。

(2)关注内容质量,提升网站内容建设水平

政府网站提供服务的丰富性很大程度上体现了其政府网站的建设水平。省级政府网站在进行内容编辑的时候,要注意信息的可读性,有效利用精练的文字、精美的图片甚至视频等来吸引读者的注意力。网站应优化整合,设计适用的页面结构,使得条目清晰、分类明确,减少由于技术性失误导致的效率低下问题。网站的生命在于内容,能否提供高质量的信息服务成为公众是否认可的关键所在。省级政府网站应制订切实可行的信息采集、编审、更新机制,切实保障网站内容的质量建设。

(3)关注对外宣传,扩大网站正向社会影响

当前,移动互联网已经成为公众获取信息与服务的第一渠道,公众访问网站的第一终端已经从PC 转变为智能手机。省级政府网站也需要与时俱进,不断拓宽服务形式和服务渠道,加强移动终端自适应和社交媒体推送等新技术的应用,扩展移动门户、微博、微信等发布服务渠道,形成立体化、多渠道传播格局,拓展网站政务信息覆盖面和影响力。各种政务新媒体不应成为政府网站的“摆设”,而应成为政府网站的有效补充和延伸,为政府网站提升政府形象创造更多的机会和渠道。

随着计算机技术的发展和人工智能浪潮速度的加快,传统事务向网络化、智能化转变已经成为发展的必然趋势。政府网站的建设,不仅可以使政府内部工作人员共享信息、提高效率,同时还可以更好地为市民提供各项公共服务。相信省级政府网站的建设会随着时代的发展和技术的进步,逐步成为公众办事和获取信息的最佳渠道。

猜你喜欢

官方网站电子政务网页
基于HTML5与CSS3的网页设计技术研究
论基于云的电子政务服务平台构建
歌谱十四首
国内外高校官网语种概况分析
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于URL和网页类型的网页信息采集研究
如何获得域名的准确解析地址
智慧城市时代的电子政务研究
中国电子政务的“短板”