国内教育技术学核心网站测定实证研究*——基于网络信息计量学指标
2016-10-18丁永刚金梦甜桑秋侠
丁永刚,金梦甜,桑秋侠 ,张 馨
(湖北大学教育学院,湖北武汉430062)
国内教育技术学核心网站测定实证研究*——基于网络信息计量学指标
丁永刚,金梦甜,桑秋侠 ,张馨
(湖北大学教育学院,湖北武汉430062)
为了从数量众多的教育技术网站中挖掘出核心网站,文章以国内7大类共307个教育技术学网站为研究样本,依据“页面总数”、“总入链数”、“网络影响因子”等网络信息计量学指标,利用布拉德福定律和网络影响因子法对国内教育技术核心网站进行测定,并对不同方法测定所得结果进行分析、讨论,研究结果表明这种评价方法是科学、有效和可靠的。
核心网站评价;计量学指标;教育技术学;布拉德福定律
一、研究背景
网络信息计量学(Webometrics)是采用数学、统计学等各种定量方法,对网上信息的组织、存贮、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示网络信息数量特征和内在规律的一门新兴学科[8]。随着网络信息计量学研究的不断深入,网络信息计量学方法已经广泛运用于国内图书情报学网站[1]、中国大学网站[2]-[4]、中国社会科学院网站[5]、中外企业网站[6]、团购网站[7]等学术性网站和电子商务网站的评价与信息有效性分析中。
随着教育技术学科的兴起和不断发展,与教育技术学科相关的网站不断涌现。其中一些网站发布的教育技术专业信息不仅量大,而且稳定,专业人士访问率高,这些网站在一定程度上反映了教育技术学方向的研究水平和发展动态,具有较高的学术及应用价值,是教育技术核心网站。同时我们也意识到,由于各级(省、市、区)教育技术网站建设水平参差不齐,一些内容缺乏针对性,管理及维护不够完善的教育技术相关网站也大量存在。对此,我们提出这样一个问题,即如何才能从数量巨大、类型众多、结构各异的教育技术网站中挖掘出教育技术的核心网站。目前,对教育技术网站的评价大多采用定性分析的方法,除陈向东将链接分析法和流量分析法用于教育网站评价外[8][9],应用网络信息计量学对教育技术学网站进行定量评价的相关研究尚不多见[10]。然而,以往的定性研究方法易受评价专家个人知识、经验和好恶的影响而使得评价结果具有较大主观随意性。而定量评价方法的指标数据是由软件或者其他非人工直接干预的方式产生,排除了人为主观因素的影响,因而评价的指标数据较为客观[11]。
文章依据上述思想,提出了一种基于网络信息计量学指标的教育技术学(Educatioal Technology,ET)核心网站评价方法。本研究的主要目的在于利用布拉德福定律和网络影响因子法,从众多教育技术网站中甄别出核心网站,并对这两种方法测得的结果进行综合分析及评价。同时,通过此实证研究,验证网络信息资源定量评价指标的有效性,为定量评价教育技术核心网站提供新的思路和方法。
二、数据收集与预处理
1.选择研究样本
从理论上讲,所有包含与教育技术学专业相关信息的网站均可视为教育技术学网站。但对于研究的可行性与可靠性来说,这样的定义过于宽泛。因此,我们首先借鉴文献[12]的研究方法,利用中国知识基础设施(National knowledge infrastructure,CNKI)学术期刊全文数据库,对我国教育类核心期刊 《中国电化教育》2009~2013年五年全年刊载的1897篇论文进行检索,并对这1897篇论文的关键词进行频度分析,发现出现频度较高的主题词有:“信息技术”、“教学资源”、“教育信息化”、“网络教育”、“远程教育”、“网络课程”、“教育技术”、“电化教育”等。这些主题词在一定程度上体现了我国目前教育技术专业研究的重点问题和发展方向,综合比较后,笔者们确定以上8个关键词为教育技术学专业的特征词。在本研究中只要包含上述主题词中任意一个的网页均被认定为教育技术学“相关网页”,但这些相关网页所属的网站不一定是教育技术网站,因为存在着这样一些网站,它的某个网页可能只是对含有教育技术学专业相关特征词的新闻进行报道、或只是对特征词进行解释(如百度百科,维基百科等网站)。因此需要对这些网站进行过滤,并删除只包含少部分教育技术信息的网站。最终,我们得到的研究样本共307个,分类后如表1所示。
进一步验证,我们发现样本中有的网站只包含部分信息技术内容;有的网站没有明显的特征将其归属到相应的类型中。将诸如此类的样本删除后,将其划分为国家级教育资源网(库)、省级教育资源网(库)、教育技术期刊网、信息技术网站、专题学习网站、远程教育网站和高等院校的网络教育学院七大类,得到最终研究样本共307个教育技术网站,如表1所示。
表1 最终研究样本
2.获取样本数据
本研究要用到样本网站的计量指标包括:网站总入链数、网站网页总数和网站出链数。本研究依据参考文献[13],在对几大著名的搜索引擎进行覆盖范围、检索准确度和检索速度等性能综合比较后,发现百度(https:// www.baidu.com/)的各项性能均优于其它搜索引擎。因此笔者们采用百度搜索引擎的相关指标检索式来获取数据。为了把搜索引擎稳定性的影响降到最低,笔者们集中在2015年6月10日完成研究数据的收集工作。
三、研究方法
1.布拉德福定律方法
布拉德福定律是传统计量科学的基本定律之一,主要用来描述科技论文在期刊中的分布规律,后来逐步发展成为传统计量科学的基本规律之一[14]。近年来许多研究成果表明,网络信息在许多情况下也具有与传统信息类似的变化特点和分布规律,张洋[1]等在对我国图书情报学核心网站测定的实证研究中也证实布拉德福定律在网络环境下同样具有适用性。因此我们依据布拉德福定律的基本原理,借鉴相关研究成果,采用 “总入链数”为评价指标,利用布拉德福定律方法来测定教育技术样本网站中的核心网站。
(1)排序
首先,将307个样本网站的“总入链数”按照递减顺序进行等级排序,如表2所示。
表2 教育技术网站“总入链数”排序表
(2)检验
利用布拉德福定律方法的图像分析法检验样本网站的“总入链数”是否符合布拉德福分布。仿照布拉德福的做法,以“样本网站累计数n的自然对数lnn”为横轴,以“总入链数的累计数R(n)”为纵轴,以表2中的数据(Lnni,R(ni))为坐标值作散点图,得到布拉德福曲线如图1所示。将图1中的曲线与标准的布拉德福分散曲线作比较,可以发现两者十分相似,曲线的下弯部分 (核心区)、直线部分以及弯曲下垂部分(格鲁斯下垂)都清晰可见。因此,可以初步认为该数据确实符合布拉德福分布。
图1 “总入链数累计数”的布拉德福曲线图
(3)分区
由表2中的数据可知,网站总数量N=307,这307个网站的总入链数A=R(307)=9154780,分别取分区数m为3和6来计算布拉德福常数am(m=3,6)。
当m=3时,按照区域分析法,令每个区的网站总入链数的累积量相等,其平均值为A/m=3051593,按照这一平均值计算各区域中的网站累计数Nj(j=1,2,3),得到区域划分的结果如表3所示。
表3 区域划分的结果(m=3)
当m=6时,同理,得到区域划分的结果如表4所示。
表4 区域划分的结果(m=6)
结果表明,当m=6时,分区效果要好一些。根据表4的分析结果,选取m=6时的前5个区为核心区,即网站总入链数排名靠前的19个网站为核心网站,结果如表5所示。
表5 依据“总入链数”利用布拉德福定律方法测定的我国教育技术核心网站
此外,以网站的“网页总数”为评价指标,采用与上述(1)~(3)相同的研究方法,同样可以得到相应的核心区。为了便于比较,同样取排名前19名的网站为核心网站,结果如表6所示。
表6 依据“网页总数”利用布拉德福定律方法测定的我国教育技术核心网站
2.网络影响因子法
网络影响因子(Web Impact Factor,WIF)是从传统计量科学中“期刊影响因子”的概念延伸而来,经过这些年的探索和积累,WIF研究取得了令人瞩目的研究成果,逐步发展成为网络信息资源定量评价的重要指标[15]。使用网络影响因子来评价网站,可以消除历史悠久、规模较大的网站在“吸引”网络链接上所占据的优势,从而更客观地反映网站被利用的情况。
在本研究中,依据我们所收集的网络数据,以网站的“总入链数”为分子、“网页总数”为分母来计算各样本网站的WIF。为便于比较,取WIF值排名前19的网站为核心网站,结果如表7所示。
表7 依据“网络影响因子”测定的我国教育技术学核心网站
四、测定结果的比较分析
在本研究中,我们分别以“总入链数”、“网页总数”和“网络影响因子”为评价指标来测定我国教育技术核心网站,得到三组不同的核心网站(见表5、表6和表7,并在以下将这三种方法分别简称为A、B、C)。
总体上看,这三种方法的测定结果有一定差异,只有一个网站同时出现在三种测定结果中,即“中国教育和科研计算机网”。中国教育和科研计算机网是国内最权威的教育门户网站,该网站提供中国教育、科研发展、教育信息化等与教育技术学密切相关的内容。因此,该网站被测定为教育技术核心网站是合理的,同时也从一定程度上反映了本文测定方法的有效性;另一方面,说明我国教育技术网站仍处于改进阶段,不同的网站各有长处,但也存在各自的不足之处,因此特别权威的、公认的核心网站几乎没有。
通过对三种不同测量结果的比较分析,我们可以进一步发现以下特点:
(1)A和B方法均采用的是绝对值指标,其中有11个网站重复出现,重复率高达57.9%。采用绝对值指标的特点是网站规模越庞大则越有优势。简单地说,网站的总入链数或者网页总数越大,则该网站越容易被测定为核心网站。例如,“21世纪教育网”作为一个国家级的教育资源网,教学资源容量巨大,网站规模可见一斑,因而在A、B方法中被测定为核心网站。
(2)在A和C的测定结果中,也有4个重复的网站,这是我们非常乐意看到的一种结果。A方法采用绝对值指标,C方法采用相对值指标,采用这两种方法得到的共同的核心网站无论是在建设规模、资源容量,还是利用率上都相当可观,可以确定为教育技术核心网站,这也在一定程度上说明了测量结果的可靠性。
(3)在A、B和C的测定结果中,绝大部分核心网站是国家级网站。特别是在A和B方法中,19个样本都包含十个以上国家教育资源网。这说明国家在建设教育技术网站方面投入了较大的精力,而各省各地区在教育技术学科网站上的建设水平参差不齐,网站管理和应用等方面还有待改进。
(4)在C方法测定结果中,核心网站包含的网站类型较全面,且一些省市教育资源网和高等学校的网络教育学院占有较大比例。这说明这些网站在利用率上要高于其它网站,因而被测定为核心网站。值得思考的是,其它一些网站,例如资源更为丰富的“国家基础教育资源网”,专业底蕴深厚的各教育技术期刊网等,没有被测定为核心网站,可能是因为这些网站存在利用率不高的问题。因此应该在这方面采取更多的措施和投入更多的管理,以免造成教育资源的浪费。
采用绝对值标准和相对值标准评测网站的重要程度,各有优劣。用绝对值指标评定时,可以以一种客观的、直接的方式将结果展示出来,但是会受到网站规模大小、网站知名度等因素的影响,因而可能对结果产生一定的影响;采用相对值指标来测评时,结果可能更接近真实情况,但是由于各种搜索引擎对于各个变量的抓取方式或者定义不尽相同,则也会使网页链接统计出现一定的偏差。但是,从本文的研究结果来看,这些方法都比较客观地反映出我国教育技术网站的实际情况,且能够相互印证、借鉴和补充。
五、结论与讨论
通过以上实证研究,我们可以得出如下结论:
1.测量结果具有一定实用价值
本研究首先在样本选择上,科学界定教育技术网站;同时在研究方法上,运用了三种不同的方法,保证了测定结果的有效性和可靠性。此外,我们通过对测定结果的比较分析发现了目前教育技术网站存在的一些问题,从而引起网站建设者和使用者的广泛关注,这对于教育技术核心网站的建设和改善起到很好的导向作用。
2.网络信息计量学指标的运用,为教育技术网站的评价提供了新的方法和思路
目前的一些评价指标大多以定性为主,即使有定量指标,也只是较简单的量化指标,不能满足深层次的评价要求。本研究的开展在教育网站定量评价方面提供了一种有效的手段,在一定程度上能够弥补教育技术核心网站在定量研究方面存在的不足。研究结果表明这种评价方法是科学、有效和可靠的。在以后的研究中我们将不断探索、寻求更合理的方法,使评价结果更有效、更权威。
[1]张洋,弋云.应用网络信息计量指标测定我国图书情报学核心网站的实证研究[J].图书情报知识,2011(1):82-87.
[2]邱均平,陈敬全,段宇锋.中国大学网站链接分析及网络影响因子探讨[J].中国软科学,2003(6):151-155.
[3]谢奇,张晗.中国大学网站的网络计量学研究[J].现代图书情报技术,2005(7):74-77.
[4]刘媞媞.基于链接分析的山东高校网站评价研究[J].泰山医学院学报,2011(11):920-924.
[5]殷之明,冷熠.网络信息计量实证研究——中国社会科学院研究所网站评价[J].科技情报开发与经济,2009,19 (19):100-102.
[6]陈太洋,任全娥.中外企业网站的链接分析与网络影响力评价[J].信息系统,2008,31(4):614-619.
[7]李蹊.基于链接分析的我国主要团购网站影响力评价研究[J].情报探索,2012(12):46-48.
[8]陈向东.一种新的教育网站评价方法——链接分析[J].中国电化教育,2007(7):64-67.
[9]陈向东.基于流量分析的教育网站评价[J].现代远距离教育,2007(1):15-17.
[10]曹梅.教育网站评价的网络计量模式初探[J].开放教育研究,2011(10):103-107.
[11]白银,曹梅.国内教育网站评价研究概述[J].现代教育技术,2011(1):107-111.
[12]纪宏璠,江倩,雷体南等.教育技术学研究动态透视—《电化教育研究》2007-2010年载文分析[J].软件导刊,2011(8):43-46.
[13]信息检索系统的相关词提示技术与评测[J].情报理论与实践,2007,30(1):100-104.
[14]张洋.网络信息计量学理论与实证研究[M].北京:科学出版社,2009.
[15]孙建军,李江.网络信息计量理论、工具与应用[M].北京:科学出版社,2009.
(编辑:杨馥红)
G40-057
A
1673-8454(2016)09-0019-05
本文受湖北省教育厅人文社会科学研究项目“基于网络信息计量学指标的国内教育技术核心网站实证研究”(项目编号:2012G031)资助。