APP下载

关于搜索引擎的评测

2015-07-24曾伟琪

电脑知识与技术 2015年14期
关键词:搜索引擎权重模型

曾伟琪

摘要:该文结合目前互联网搜索引擎的应用情况,首先确定了搜索引擎主要的评价指标。并对如何确定各指标权重进行了研究,建立了权重分配子模型,为评分标准制定依据。利用多目标决策理论建立搜索引擎性能的综合评价数学模型,然后使用建立的模型举例计算百度、搜狗、搜搜、爱问、谷歌五个常用搜索引擎的的得分。该文的模型主要是基于多目标决策理论以及多元回归和层次分析。

关键词:搜索引擎;权重;模型

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2013)14-0014-02

随着互联网的快速发展,人们已经离不开从互联网上获取信息。但是这些信息浩如烟海,同事又夹杂着大量的有害信息。搜索引擎技术就是完美利用这些资源的有效手段。搜索引擎可以说是一个网站,这些网站通过网络搜索软件( 也称网络搜索机器人) 或网站登录等方式,将互联网上大量网站收集到本地,经过一定的处理后放入自己的资料库。用户对其进行各种查询,搜索引擎给出响应,提供用户所需的信息。有调查显示,搜索是继电子邮件之后的第二大互联网应用。 因此,建立搜索引擎综合评价体系,完整、客观地对搜索引擎进行综合评价,具有较大的社会意义和研究前景。而针对这个问题目前已经有很多学者做出一些卓有成效的研究,统计了大量数据,运用了大量分析研究方法,信息技术的逐渐发展,客观有效地评价搜索引擎,得出有意义排名,并且设计个性化搜索引擎,对于提高工作效率,实现时间价值最大化,具有重要意义。

为了确定搜索引擎的性能,我们要根据搜索引擎和用户之间的相互关系,以第三方身份确定评价搜索引擎性能优劣的关键因素,通过建立权重子模型,确定每个环节的权重大小。再进一步实际试验,统计数据,采用多目标决策法,统计搜索引擎的最终得分,进行排名。

1 模型假设

1)假设所参与评价的搜索引擎性能稳定,服务器无故障,且短时间内不会升级,状态保持。

2)假设模型衡量的因素就是参与评价的关键因素, 其他变量设为无关变量,它们的变化不影响评价最后评价结果的准确度。

3)假设网络速度的状况的变化与不影响结果。

4)假设参与评价的因素之间相互独立。

2 符号说明

2 模型建立与求解

2.1 对现有的搜索引擎进行分析

在对互联网搜索引擎的优劣进行评价时,所建立的数学模型中涉及许多决策变量。这些变量有繁多、结构复杂、不确定性等特点。为了解决这一问题,我们有必要对描述目标的相对重要度做出正确的估价。而各因素的重要程度是不一样的,为了反映因素的重要程度,需要对各因素相对重要性进行估测(即权数),由各因素权数组成的集合就是权重集。权重是指标本身的物理属性的客观反映,是主客观综合量度的结果。

系统工程理论中的层次分析法(Analytic Hierarchy Process,简称AHP)是一种较好的权重确定方法。它是把复杂问题中的各因素划分成相关联的有序层次,使之条理化的多目标、多准则的决策方法,是一种定量分析与定性分析相结合的有效方法。而本模型将使用层次分析法对问题的决策变量确定其权重。给出问题的层次结构模型:

搜索引擎b;准确性b1、安全性b2、完整性b3;非歧义b11、去重复b12、优先度b13、无毒b21、社会影响b22、内容原创b31、更新频率b32。

下面阐述AHP确定权重的基本过程。

根据以上分数可求出前五名的搜索引擎排序为:谷歌、搜狗、搜搜、爱问、百度。

4 结束语

本文使用层次分析法比较全面的研究了关于搜索引擎的评价问题,利用多目标决策理论建立搜索引擎性能的综合评价数学模型,得出最终评分。但各大搜索引擎都在迅速发展,各自的搜索引擎的性能也在进一步提升,这些都会影响到本文所确定的评价指标的适用性。并且层次分析法存在其天然的缺点,比如其定量数据较少,定性成分多。所以,如何建立一个合理的评价模型仍需进一步研究。

参考文献:

[1] 刘正春. 搜索引擎综合评价模型研究[J]. 数学的实践与认识, 2004,34(9).

[2] 徐俊, 刘娜. 层次分析法的基本思想与实际应用[J]. 情报探索, 2008(12).

[3] 郭金玉, 张忠彬, 孙庆云. 层次分析法在安全科学研究中的应用[J]. 中国安全生产科学技术, 2008(2).

猜你喜欢

搜索引擎权重模型
一半模型
重要模型『一线三等角』
权重常思“浮名轻”
重尾非线性自回归模型自加权M-估计的渐近分布
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
3D打印中的模型分割与打包
网络搜索引擎亟待规范
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析