从湖北省高校网站评价看链接分析指标的应用
2016-04-07李芳玲华薇娜
李芳玲,华薇娜
(南京大学信息管理学院,210093)
从湖北省高校网站评价看链接分析指标的应用
李芳玲,华薇娜
(南京大学信息管理学院,210093)
摘要:文章以2013年湖北省综合实力排名前32位的高校网站为研究对象,搜集流量指标中的Alexa全球流量综合排名以及网络链接指标中的网页总数、链接总数、外链数、PR值,计算网络影响因子WIF和WIFe,通过分析相关链接数据间的相关性及链接数据与高校综合实力排名间的关系,探索相关链接数据与网站质量、受欢迎程度之间的联系,一方面在实际应用中探讨链接分析评价指标的可靠性,另一方面为高校网站评价时的指标选取提供参考。
关键词:链接分析;高校网站;指标
1引言
链接分析是网络计量学中的重要方法之一,国外已有很多学者对链接分析指标做了相关研究,研究结果表明网站链接指标能从侧面反映网站质量、网站受欢迎程度[1-2],这也使得近年来,国内不少学者将链接分析方法应用到网站评价上来,网站评价逐渐成为链接分析领域的重要内容。
国内应用链接分析方法进行网站评价的文章很多,其中不乏优秀的研究成果。这些文章主要分为两大类:一类是借助链接分析指标,搜集数据,对某类型网站作影响力、规模、质量、内部结构完备程度等方面的排名。如张倩、腾红等《基于链接分析法的我国主要商业银行网站影响力评价研究》(2011)[3];另一类是研究链接分析在某类型网站评价中的有效性,探讨评价指标的优缺点、可靠性。如张琳、徐莉莉《基于链接分析的企业网站评价指标的有效性分析》(2010)[4]。当然,还有一些关于链接分析的其他类型的文章,如结合链接分析方法,提出某类型网站的评价指标体系[5]等。从这些链接分析应用方面的文献可知,链接分析评价指标很多,如张琳等选择网站网页数、网域网页数、链接总数、外部链接网站数、链接效率、网络影响因子等7项指标,来验证链接分析指标在企业网站评价中的有效性;黄贺芳、孙建军运用网页总数、链接总数、外部链接数、网络影响因子、链接效率5项指标对腾讯新闻、新浪新闻、网易新闻、搜狐新闻四大门户网站进行了评价[6]等。因为评价指标太多,检索指令也不尽相同,导致在对某类型的网站进行评价时,不知选用哪些评价指标,亦不知何种检索指令得到的数据可靠,这虽与所使用的搜索引擎有关,但本质上还是对指令及指标间联系的理解不够准确。
本文以高校网站为例,将链接分析中的常用指标集中起来进行分析,主要探索相关链接数据与网站质量、受欢迎程度之间的关系,一方面在实际应用中探讨链接分析评价指标的可靠性,另一方面为高校网站评价时指标选取提供参考。
2资料和方法
2.1 研究对象及指标选取
链接数据具有不稳定、实时性强的特点,考虑到本文是要探索链接分析各指标间的联系及其实际指导意义,要求研究对象具有稳定性、可靠性,且本次数据选取于2014年年初,故选取湖北省2013年综合实力排名前32位的高校网站作为研究对象[7]。
虽说不同学者选取的评价指标不尽相同,但基本离不开网页总数、链接总数、外链数及网络影响因子这四个指标,也有学者对多个链接分析指标进行因子分析,发现这四个指标能解释原始因变量总方差的80%以上[8]。可见,在进行链接分析时,这四个指标具有重要参考价值。除此之外,增选网站流量数据中的Alexa全球流量综合排名、网络链接中的外部网络影响因子、表示网页等级的PR值和这32所高校2013年的综合实力排名为评价指标,对这8个指标做相关分析,了解各指标数据间的联系和实际意义。
2.2 研究工具及检索指令
为保证数据的可靠性和有效性,这里选定ChinaRank作为流量统计工具,Google作为链接数据搜集工具。
以武汉大学为例,Google检索指令[9-11]如下:
网页总数:site:www.whu.edu.cn
链接总数:www.whu.edu.cn
外链数:link: www.whu.edu.cn
2.3 测度指标[12]
(1)流量指标——Alexa全球流量综合排名,其排名依据是三个月来用户访问数和页面浏览量累积的几何平均值,用来评价某一网站访问量的高低。
(2)网络链接指标:
①网页总数,指该网站收录网页的数量,体现该网站规模大小。
②链接总数,指链接到该网站的网络链接总数,理论上包括自链和外链。总链接数高说明该网站的网络信息组织体系比较完备,信息揭示程度相对较高。
③外链数,指除该网站自身以外,链接到该网站的链接总数。外链数高说明该网站外部影响力大、受关注程度高,是受大众欢迎的网站。
④网络影响因子(WIF)[13-14],网络影响因子反映了网页被外部链接的总平均水平,WIF越高,说明该网站越有价值、质量越高。其计算公式是:
但是,网络的不稳定性强,导致难以保证WIF计算结果的准确性,众多学者的实证研究表明以外部影响因子(WIFe)作为评价指标更为准确,其计算公式是:
⑤PR值,Google用于测评网页“重要性”的一种方法,共0-10级,一般PR值达到4就是一个不错的网站了,7-10级表示该网站非常受欢迎。
2.4 统计学处理
采用SPSS20.0对搜集数据进行相关性分析、比较,认为P≤0.05为差异有统计学意义。
3数据搜集结果
各指标数据搜集结果如表1所示,数据搜集时间:2014-2-16。
4数据分析
在进行网站评价时,我们最关心的是网站的影响力及质量评价。本文从网站受欢迎程度、网站质量以及其它分析三方面进行数据分析,从而反映这8个评价指标中,哪些指标对于高校网站受欢迎程度评价具有重要参考意义,哪些指标对于质量评价具有重要参考意义。
4.1 关于网站受欢迎程度的分析
PR值能反映一个网站受欢迎的程度,一般PR值达到4就是一个不错的网站了,7-10则表示该网站非常受欢迎[15],但PR值相同的网站如何比较影响力?链接总数、外链数、Alexa综合排名以及网页总数能否反映某网站的受欢迎程度呢?现对PR值与链接总数、外链数、Alexa综合排名、网页总数作相关性分析,结果如表2。
表2 PR与链接总数、外链数、Alexa、网页总数的相关分析
**.在置信度(双测)为 0.01 时,相关性是显著的*.在置信度(双测)为 0.05 时,相关性是显著的
由于PR值为定序变量,故计算Spearman相关系数。由表2可知:(1)PR与外链数间双侧显著性值P<0.01,相关系数为0.887,即高校网站受欢迎程度与该网站的外链数呈显著高度正相关。外链数是影响PR值的重要因素之一,这种高度相关说明尽管外链数并不是决定PR值的惟一因素,但这并不影响我们从外链数来看一个网站的受欢迎程度。在实际情况中,这也证明了“link:网址”方式得到的外链数是非常可靠的,尽管其中包含部分自链情况。(2)PR与Alexa全球流量排名间双侧显著性值P=0.011,相关系数为-0.443,呈显著的中度负相关。说明某高校网站PR值越高,Alexa值越小,PR值由外部链接数及链接站点的PR等级决定,Alexa值由用户访问数和页面浏览量决定,可见两者均与网站的“知名度”有关,而本例实际结果也证明了这点,可认为在高校网站受欢迎程度的排名上,可以以Alexa值排名作参考,或者说以Alexa值为高校受欢迎程度的排名依据都是可靠的。(3)PR值与网页总数间及链接总数间无显著相关关系,表明网页总数和链接总数的多少不能说明该网站的流行程度。
由以上分析可知:由“link:网址”指令得到的外链数与PR值间存在显著高度相关,由此可见,“link:网址”指令得到的数据不一定能准确反映网站的外链数量(会包含少量自链),但对于网站间外链数排名以及反映网站受欢迎程度排名来讲是可靠的。另外,Alexa全球流量排名与PR值之间的显著负相关关系表明,两者均能反映网站的流行程度;而网页总数和链接总数的多少与网站受欢迎程度无必然联系。
4.2 关于网站质量的分析
在某种程度上,WIF测度了网站吸引链接的能力,是计量网站影响力的重要指标。通常,WIF越高,说明网站的影响力越大,也就反证出网站的质量越高[16]。WIF和WIFe均能作为评价网站质量的指标,但众多学者的实证研究表明,WIFe对于评价网站质量可靠性更高[17]。现对WIFe与各链接数据、高校综合实力排名作相关分析,看看WIFe与网站流行程度及综合实力排名间具备怎样的联系,对高校网站评价具有哪些实际指导意义。结果见表3。
表3 WIFe与各评价标准间的相关关系(包括表3—1和表3—2)
**.在置信度(双测)为 0.01 时,相关性是显著的
外部网络影响因子反映了网页被外部链接的平均水平,能有效评价网站质量高低。由表3—1可知:(1)WIFe与2013综合实力排名间存在显著的中度相关,说明高校网站WIFe排名在一定程度上能反映该网站的综合实力、学术水平,也说明某高校网站综合实力排名越靠前,其网站质量一般越好,这与国外学者Tang和Thelwall的研究发现一致,Tang和Thelwall通过WIF研究中国大陆大学网站,发现外部WIF与大学(网站)排名存在相关性[18],这进一步证明本研究结果的可靠性。(2)PR值与综合实力排名间双侧显著性值P<0.01,相关系数为-0.812,表明高校网站越受欢迎,其综合实力往往越强,反之亦然,或者说网站受欢迎程度与网站质量间是互相影响的关系。
综合(1)(2)可知,高校网站PR值、WIFe和综合实力排名这三者之间是显著相关的,即我们可以认为:高校网站受欢迎程度、质量和综合实力排名三者之间互相影响,一般高校网站越受欢迎,该校网站质量越高,综合实力也越强。
表3—2
**.在 .01 水平(双侧)上显著相关
由表3—2可知:(1)网站质量与网页总数、链接总数间均无相关关系,故不能从高校网站的网页数量或是链接总数来判断该网站质量高低。(2)网络影响因子(WIF)和外部网络影响因子(WIFe)间双侧显著性值P<0.01,相关系数为0.830,说明对于高校网站质量排名来说,用WIF或WIFe作为排名依据都是可靠的。(3)表3—1中,外部网络影响因子(WIFe)与PR值间P值<0.01,相关系数为0.523,两者之间呈显著的中度相关,另表3—2中WIFe与外链数间P值<0.01,相关系数为0.574,两者之间亦呈显著中度相关,说明网站质量与网站受欢迎程度之间存在正相关关系,高校网站越受欢迎,其网站质量往往越高,反之亦然,这也符合常理认定,本例结果具有一定可靠性。(4)表3—1中,网络影响因子(WIF)与PR值间P值为0.270,相关系数为0.201,两者之间无相关关系。表3—2中,WIF与外链数间相关分析也显示无相关关系。这与常理不符,一般情况下,一个网站越受欢迎,其网站质量一般越高,第(3)点也体现了这点,但此处WIF与网站受欢迎程度之间并无实际联系,可见是受网站自链数的影响。综合得出结论,由于网站自链情况的影响,传统网络影响因子(WIF)并不能体现出该网站的受欢迎程度,但外部网络影响因子(WIFe)由于剔除了自链数的影响,能在一定程度上反映网站的受欢迎程度。
总结表3—2:从网站质量来说,WIF和WIFe都可作为排名依据。从网站受欢迎程度来说,WIFe能在一定程度上反映网站受欢迎程度,可从WIFe排名看网站流行程度排名;但受网站自链数的影响,传统网络影响因子WIF不能反映网站的受欢迎程度。另外,网页数量和链接总数不能反映网站质量的高低。
4.3 其它分析
这里从网页总数、链接总数以及外链数间的相关性看网站评价与链接数据间的联系,结果见表4。
表4 链接数据间相关分析
**.在 .01 水平(双侧)上显著相关
从对表4的相关性分析可以看出:(1)网页总数与链接总数的Pearson相关系数为0.514,显著性值P<0.01,但网页总数与外链数之间并无显著相关关系,表明高校网站网页总数越多,其总链接数往往越多,但并不能反映其外部链接数越多。(2)链接总数与外链数间P值为0.809,可见两者之间不存在相关关系。
总结表4:学者朱自强对国内重点大学的研究显示,重点大学的总链接数与外部链接数存在着高度相关性[19],而本例中表4不能体现这点,这说明湖北省内绝大部分高校网站与全国重点大学网站间存在较大的差异,绝大多数省内大学的受关注度较低,这就影响其他网站对省内高校网站作出引用链接,因此外部链接数就相对较少。但是,对于知名度高的网站来说,一般网页总数越多,链接总数也越多。
5讨论
基于对上文的分析总结,得出以下6点结论:
(1)网页数不代表知名度。表2结果表明对于高校网站来讲,网页数量的多少与网站受欢迎程度间无必然联系,即不能认为网页数量越多,网站的知名度越高,而这也恰恰是人们对网站认识的一个误区。可见,对于提升高校网站的外链数,提升高校网站的关注度来讲,增加网页数量并不是重点,重点还是应放在提升学校的综合实力、提升学校在大众心中的影响力上。
(2)外链数在极大程度上代表了网站受欢迎程度,应着力提高网站外链数。由表1可知,湖北省32所高校的外链数普遍较少,综合排名前3位的武汉大学、华中科技大学、华中师范大学的外链数在1000以上,除此之外在综合排名前7位的武汉理工大学、华中农业大学、中国地质大学(武汉)、中南财经政法大学的外链数在700以上,其余25所高校的外链数均在350以下,很多学校的外链数不足100,表面上是因为网站受关注度低,根本上还是由于网站内容不够丰富、网站资源利用率不高等。
外链数代表了网站的受欢迎程度。因此,为了提升网站关注度,高校一方面要从提高办学能力着手,注重培育人才、积极参加学术交流活动、创办精品课程等,以丰富网站内容,让网站内容有看头,让大家愿意在本网站上查阅所需信息;另一方面还要从网站构建角度着手,注重网站资源质量、网站资源的整合、提高资源利用率等,使高校网站的重要信息能快速被检索者找到,并且对于这些重要信息能一目了然,不用为了查找某一具体信息,在网站上花费太多时间。
(3)对于使用Google搜索引擎来说,“link:网址”得到的外链数是可靠的。网络链接分析中,对于外链数的获取,不同的研究人员会使用不同的指令,如在Google搜索引擎中,有的学者用“网址 -site:网址”命令得到外链数[20],有的学者用“link:网址”命令得到外链数;且不同的搜索引擎,指令也会有所不同,如在Yahoo!搜索引擎中有的学者会使用“host:网址”指令得到网页数[21]等。不论这些指令准确与否,本例表明,“link:网址”指令得到的外链数与PR值间具有很高的相关性,即对于Google搜索引擎来讲,使用“link:网址”指令得到的外链数是可靠的,特别是当以该指令得到的外链数作为网站受欢迎程度的排名依据时,其搜索到的数据是非常可靠的,这也为后来的网络链接分析学习者提供了一个参考——高校网站间的外链数排名可以以Google搜索引擎的“link:网址”指令为排名依据,以免在众多不同检索指令中迷失方向,不知如何是好。
(4) 对于提升高校网站受欢迎程度、综合实力来说,提高网站质量是关键之一。对于高校网站链接数据与综合实力排名来讲,网站PR值、WIFe和综合实力排名这三者两两之间是显著相关的,特别是PR值与综合实力排名间,呈高度相关,这说明一般高校网站的受欢迎程度、网站质量、高校综合实力排名间是具有显著联系的,高校综合实力排名越靠前,网站越受欢迎,网站质量一般也越高。
对于高校网站建设来讲,提升高校综合实力排名和网站关注度均是目标,是加强网站建设的根本目的,不是我们能直接干预的,这两者是因变量,而不是变量,我们要做的是从提高网站质量入手,使得高校网站能在如今这个移动网络时代,为相关师生、科研人员、家长带来更多有用的信息。
(5) WIF和WIFe均可作为网站质量排名指标,WIFe可作为网站受欢迎程度排名指标。对于高校网站排名来讲,若是选取网站质量排名指标,WIF和WIFe间的高度相关说明这两者都可用;但若是选取网站受欢迎程度排名指标,WIFe与PR值间的显著相关说明WIFe能在一定程度上反映网站受欢迎程度,可从WIFe排名看网站流行度排名,但受网站自链数的影响,传统网络影响因子WIF不能反映网站的受欢迎程度。
(6)对于评价网站质量来说,以外链数为参考指标比以网页总数或链接总数为参考指标要可靠得多。网页数量和链接总数不能反映网站质量的高低,不能认为一个网站网页总数越多或是链接总数越多,该网站办得越好。但是,可以认为一个网站外链数越多,该网站办得越好。这是因为自链数在很大程度上影响了链接总数的大小,实践也表明大部分网站的自链数比外链数要多得多。
参考文献:
[1] Hetlng Chu,Shaoyi He,Mike Thelwall.Library and infomIntion science schools in Canada and USA: A webometric perspectitre[J].Journal of Education for Library and Information Science,2002,43(2):110-125.
[2] Thelwall,M.AComparison of Sources of links for Academic Web Impact Factor Calculations[J].Journal of Documentation,2002,58(1):60-72.
[3] 张倩,滕红,袁小姗.基于链接分析法的我国主要商业银行网站影响力评价研究[J].情报科学,2011,29(6):833-837.
[4] 张琳,徐莉莉. 基于链接分析的企业网站评价指标的有效性分析[J]. 图书情报工作,2010,54(16):86-89.
[5] 王尊新.高校图书馆网站评价指标体系研究[J].现代图书情报技术,2005,(3):60-62.
[6] 黄贺芳,孙建军.基于链接分析的网站评价实证研究——以四大门户网站为例[J].情报杂志,2011,1(30):74-77.
[7] 武书连.挑大学选专业:2013高考志愿填报指南[M].北京:中国统计出版社,2012.28-34.
[8] 程慧平.链接分析指标在大学网站排名评价中的有效性分析[J].信息资源管理报,2012,(3):46-51.
[9] 王轶,孙焱.山西省高校网站链接分析[J].晋图学刊,2011,(1):30-33.
[10] 李蹊.基于链接分析的我国主要团购网站影响力评价研究[J].情报探索,2012,(12):46-48.
[11] 王宏鑫.我国省级以上公共图书馆网站的链接分析[J].中国图书馆学报,2005,(31):86-90.
[12] 段宇锋.网络链接分析与网站评价研究[D].武汉:武汉大学,2004.
[13] 张洋.网络影响因子研究综述[J].中国图书馆学报,2010,(1):66-75.
[14] 朱雷.网站影响力的定量评价指标——网络影响因子述评[J].情报科学,2006,24(8):1270-1274.
[15] 王德广,周志刚,梁旭.PageRank算法的分析及其改进[J].计算机工程,2010,36(22):291-293.
[16] 邓中华,孙建军,李江.国外链接指标研究综述[J].情报科学,2008,26(7):1116-1120.
[17] 吴茵茵.外部网络影响因子在大学网站评估的应用[J].现代情报,2008,(4):66-71.
[18] Tang,R.,Thelwall,M.Exploring the pattern of links for between Chinese university Web sites[J].Journal of the American Society for information Science and Technology,2002,(39):417 -424.
[19] 朱自强.网络信息计量学理论与方法—大学网站网络流量及页面链接分析研究[D].南京:江苏南京理工大学,2005.
[20] 许剑颖.基于链接分析法的中国农业网站网络影响力分析[J].图书情报工作网刊,2012,(10):42-46.
[21] 赵发珍,基于链接分析法的网络社区影响力研究——以国内30个网络社区网站为例[J].现代情报,2013,33(6):91-95.
(责任编辑:曹高峰)
Application of link analysis index in the evaluation of university websites in Hubei province
LI Fang-ling, HUA Wei-na
(Department of Information Management, Nanjing University, Nanjing210093, China)
Abstract:In this paper, the research object is the top 32 university websites of university ranking of Hubei Province, China in 2013. By collecting the alexa comprehensive ranking, number of web pages, number of links, number of external links and Page Rank of these 32 websites, calculating web impact factor(WIF) and external WIF(WIFe) of them, the author analyzes the correlation between each link data. Then on this basis, the author mainly discusses the contact between related link data and website quality, website popularity. This paper has two research purposes, one is to discuss the reliability of web link analysis evaluation indicators in practice, the other one is to provide a reference for the selection of university website evaluation indicators.
Key words:Web link analysis; university website; indicators
收稿日期:2015-01-21
作者简介:李芳玲,女,硕士研究生。
中图分类号:G353.1
文献标识码:A
文章编号:1006-1525(2016)01-0107-07