基于聚类分析的搜索引擎自动性能评价

2010-06-05吴世勇王明文

中文信息学报 2010年5期

吴世勇，王明文

(江西师范大学计算机信息工程学院，江西南昌 330022)

1 引言

搜索引擎的评价是信息检索研究中的核心课题之一，客观可靠的检索性能评价方式是任何一项信息检索研究中均需要考虑和设计的内容。Saracevic指出[1]：“评价问题在信息检索研发过程中处于如此重要的地位，以至于任何一种新方法与他们的评价方式是融为一体的”。

目前采用较多的评价是基于Cleverdon提出文献[1]的Cranfield 评价框架。Cranfield 框架涉及到的组成部分包括标准评测语料库、查询样例集合、标准答案集合和相应的评价指标等[2]。Cranfield方法指出[1-2]，信息检索系统的评价由如下几个步骤组成：首先，确定查询样例集合，抽取最能表示用户信息需求的一部分查询样例构建一个规模恰当的集合；其次，针对查询样例集合，在检索系统需要检索的语料库中寻找对应的答案，即进行标准答案集合的标注；最后，将查询样例集合和语料库输入检索系统，系统反馈检索结果，再利用检索评价指标对检索结果和标准答案的接近程度进行评价，给出最终的用数值表示的评价结果。

随着万维网的不断发展与互联网信息量的增加，进行网络信息检索系统的性能评价时，Cranfield方法遇到了巨大的障碍。困难主要反映在针对查询样例集合的标准答案标注上，利用手工标注答案的方式进行网络信息检索系统的评价是一个既耗费人力、又耗费时间的过程。考虑到当前搜索引擎涉及到的索引页面都在成百上千亿页面以上(2008年Google在官方网站中透露，他们索引的页面数量在一万亿左右)，再利用手工标注答案的方式进行网络信息检索系统的评价是十分不现实的事情，因此提高搜索引擎性能评价的自动化水平是当前检索系统评价研究中的热点。本文应用聚类方法分析搜索引擎检索返回文档的质量，用类内距和类间距等聚类指标来定义检索性能指标，实现检索系统的自动性能评价。

2 相关研究工作

为了解决Cranfield方法在网络信息检索系统评价中所面临的困境，近年来提出了一些自动进行搜索引擎性能评估的方案，一种是基于Cranfield框架，只是使用自动化方法进行答案自动标注，另一种是在Cranfield框架之外采用一些新的评价方法进行自动化评价。

第一种方案中，研究者尝试使用检索系统反馈的结果信息进行自动标注。Soboroff[3]提出可以在检索系统结果池中，随机挑选一定数量的结果作为答案集合进行评价。Nuray[4]提出对Soboroff方法的修正方案。但这种方案对检索系统性能排序的影响较难以投入使用。部分研究人员基于已有的网页目录资源进行结果的自动标注，如Chowdhury[5]和Beitzel[6]提出的利用开放目录计划所整理的网页目录和对应的网页摘要资源进行性能评测的工作，但使用摘要信息作为用户查询是不合理的假设，也未能得到普及应用。

第二种方案中，有IBM Haifa研究院研发的“相关词集合评价方法”[7]，减少了评价反馈时间，但手工标注与查询相关联的词项也需要大量的人力。Joachims、刘奕群等提出的基于用户点击行为的评价方法[2，8]，更适合导航类查询的评价。在查询性能预测研究中，Kwok和Vinay等人提出的对检索结果同质性进行分析的方法[9-10]，Cronen-Townsend等人提出的对检索结果突显性分析的clarity score方法[11-12]，为利用检索结果质量的好坏程度来实现检索系统的性能自动评价提供了思路。但他们的方法没有考虑查询词的覆盖范围，只是利用返回文档之间的相似度来评价检索结果，而检索结果的好坏与查询本身的质量也有很大关系[13]，多义性、歧义性的查询一般覆盖范围大难以检索到相关文档，Charles Clarke等人[14]针对查询歧义性和结果多样性提出的评价指标能够更好地反映用户查询需求。本文将针对信息类查询结果多样性的特点，根据查询的覆盖度对检索结果进行聚类分析，从这一角度开展评价工作。

3 信息类查询评价与查询覆盖度

3.1 信息类查询

在网络信息检索中，用户的信息查询需求存在很大差异，有的用户希望寻找指定名称的站点或主页，而有的用户希望寻找与查询主题相关的文档页面。这些查询类型的不同对于检索系统是十分重要的，因为不同的查询需求可以设计不同的检索算法从而获得更佳的检索结果，对检索系统的评价也同样如此，不同的查询需求应采用不同的评价方法。

对用户查询有不同的分类方法。Broder把用户的查询信息需求分为三类：导航类，信息类和事务类[15]。导航类查询是寻找知道名称的站点或主页，比如“江西高招网”、“某某市政府网站”等查询，对应于TREC评估的homepage/named page任务；信息类查询是寻找与查询主题相关的文档页面，目标可能位于多个网页，比如“电影”、“知识产权保护”等查询，对应于TREC评估的ad-hoc任务；而事务类查询是指用户希望找到一个服务入口，需要进一步进行服务访问，如火车路线查询、歌曲下载等。

对于大量的用户查询，如何识别其类型呢？在刘奕群的工作[2]中，利用Sogou实验室提供的用户查询日志中的点击信息实现了用户查询信息需求的分类，并且针对导航类查询，提出了基于用户行为分析的搜索引擎自动性能评价方法。因为对于导航类查询而言，其正确答案唯一，而不需考虑答案全面性的问题；其对应的搜索引擎检索性能也较高，因此用户点击行为的可靠性也比较容易保证。即：用户在进行导航类查询时，较容易发现并点击结果列表中对应的答案，只要将用户点击行为中反映出的答案挑选出来就能实现答案的自动标注，从而达到不需要人工标注实现自动性能评价的目的。

对于信息类或事务类查询而言，情况则要复杂的多，其正确答案不唯一，用户期望的正确答案可能有多个，必须考虑答案全面性的问题；而其对应的搜索引擎检索性能相对较低，用户能否点击到正确的答案也较难保证。因此，使用某个搜索引擎的用户行为信息去评价其他搜索引擎信息类、事务类查询的性能是不合理的。

3.2 信息类查询的评价思路

如何实现针对信息类查询的搜索引擎自动性能评价呢？网络搜索引擎处理的数据是整个Web，同时Web数据还在不断动态变化，不同的搜索引擎索引的数据也不尽相同，为了对不同数据集上检索系统的质量进行评估，我们考虑从搜索引擎检索返回文档的整体质量来考查检索系统的性能。根据聚团性假设[10]，与一个查询相关的文档，彼此之间会具有一定的潜在关系，与那些不相关的文档相比，与查询相关的文档会具有一定的相似性或者称为同质性，相关文档会形成一个团，并与那些不相关文档区分开来。考虑到信息类查询的目的是为了查找与查询主题相关的多个文档页面，如果检索返回的文档间比较相似，即具有比较高的同质性，我们就认为返回的文档集合与查询主题比较相关；反之，如果检索返回的文档间相似度很小，我们就认为返回文档集合中可能存在很多不相关的文档，返回文档的整体质量较差。

因此，我们通过对检索返回文档进行聚类分析来考查检索返回的文档质量，达到评估搜索引擎性能的目的。考虑到信息类查询的主题一般可以划分为几个子主题，我们可以根据查询子主题的个数确定返回文档聚类的数目，也就是说查询子主题的个数越多，相应的聚类数目也就越多。确定聚类数目后对检索返回文档进行聚类，如果一个类当中的文档间比较相似、紧密程度较高，我们就认为这个类中的文档与查询中相应的一个查询子主题比较相关；如果几个类中心的距离比较大，侧面反映查询子主题的内聚性比较好，不相关文档(噪声因子)较少。即固定聚类数量后，通过比较类内距和类间距等聚类指标对检索性能进行评价，如果类内距越小、类间距越大则检索返回文档的质量越好。

在对检索返回结果进行聚类分析之前，我们首先要计算查询的覆盖度，即得到对该查询的检索结果进行聚类的数目，下一小节我们将具体介绍查询覆盖度的计算方法。

3.3 查询覆盖度

根据信息检索研究中的独立性假设原则，出现在文档和查询中的词都被看作是相互独立的，所以某个查询的覆盖度可以通过计算查询中所有查询词的覆盖度来得到。

要计算查询词的覆盖范围，我们需要考查查询词本身的性质，查询词具有一般性和特指性之分，一般性查询往往是比较抽象的概念，其覆盖范围比较广泛；而特指性查询往往是比较具体的概念，其覆盖范围较小。比如：“体育”——>“篮球”——>“NBA”——>“火箭队”，其中“体育”这个查询词属于一般性查询，覆盖范围很广，包括了篮球、足球、乒乓球等子主题；而“NBA”属于体育当中的一项篮球赛事，查询的覆盖范围就要小很多。

现在，我们把每个查询词看作是一个查询子主题，那么该查询的覆盖度(CS)可以通过公式(1)计算得到：

(1)

其中q是查询Q中的一个查询词。

文献[16]提出的预测查询性能的CTS方法中，给出了两种计算查询主题重要度的方法，我们发现查询主题越重要的查询，其查询的范围应该更小，即查询覆盖度更小，因而可以将其方法应用到查询覆盖度的计算。在本文中，我们同样可以用两种方法来计算查询词的覆盖度CS(q)，其中一种方法称为CS1，使用查询词的逆文档频率(IDF)来计算查询词的覆盖度，计算方法比较简单。IDF是信息检索中常用到的一个因子，它是词项所出现的文档数目的倒数，常用于反映该词项的区分能力，查询词的IDF越小，其区分能力越低，但覆盖范围就越大。所以，CS1方法定义如下：

(2)

(3)

另外一种方法称为CS2，是基于下面两条准则而设计的[16]。第一，覆盖范围小的词项在文档集中的出现概率(词频)要比其他的词小；第二，覆盖范围小的词项在不同文档中的词频往往存在很大变化。也就是说覆盖范围大的词项在文档集中的分布是比较稳定的，覆盖范围小的词项在文档集中的分布变化比较大。故定义两个变量MP(q)和VP(q)来计算覆盖度CS2(q)。

(4)

上述两种方法都是使用查询词在文档集中的词频信息和文档频率等静态信息，因此我们可以在检索前计算得到查询的查询覆盖度。由于我们无法得到商业搜索引擎的整个文档集，本文计算查询覆盖度使用的文档集是北京大学网络实验室提供的CWT200G数据集与本实验中搜索引擎检索返回的近10G检索结果的合集，共37 662 913篇文档。我们首先对网页预处理，包括对200G网页的解压，采用htmlparser分析html标签，提取网页中的标题和正文，即标签和<body>中的内容。分词处理之后，对title和body分别进行词频统计并建立索引，索引文件大小有50G左右。然后通过索引取得查询词的词频信息和文档频率来计算查询覆盖度，例如查询“知识产权保护”，通过公式(4)计算三个查询词的覆盖度分别为2.82、2.13、2.41，由公式(1)可得整个查询的覆盖度为7.36，取整后我们设该查询的聚类数目为7。</p><h2>4 信息类查询的自动性能评价</h2><h3>4.1 自动性能评价框架</h3><p>上节的论述中，我们明确了本文搜索引擎性能自动评价的对象是信息类查询，本节我们来讨论针对信息类查询的自动性能评价的系统框架。搜索引擎自动性能评价框架如图1所示。</p><p><img src="https://img.fx361.cc/images/2023/0215/d34b738a39cfb8c4d268f16e742859c6bed0d3b8.webp"/></p><p>图1 搜索引擎自动性能评价框架</p><p>首先我们对搜狗实验室提供的用户查询日志(SogouQ)进行查询类别分析，使用文献[17]中的方法提取出查询日志中的信息类查询，随后运用上节提出的查询覆盖度计算方法计算出查询的覆盖度，同时使用不同的搜索引擎对提取出来的查询进行检索，将检索返回的结果网页抓取回来并进行预处理，最后结合查询的覆盖度对检索结果进行聚类分析，通过比较类内距和类间距等聚类指标对检索性能进行评价。</p><h3>4.2 聚类分析</h3><p>聚类分析是数据挖掘的研究内容之一，是根据数据集中数据的不同特征，将其划分为不同的簇(Cluster)，使得属于同一簇的个体之间的距离尽可能小，不同簇的个体间的距离尽可能大。本文聚类分析采用向量空间模型(VSM, Vector Space Model)来处理，它的主要思想是：每一个词都作为特征空间坐标系的一维，将文档空间看作是一组正交特征向量组成的特征空间，每个文档表示为其中的一个规范化特征向量V(d)=(t1,w1(d),…,ti,wi(d)…)，其中ti为特征项，wi(d)为ti在文档d中的权值。为了解决高维特征空间问题，我们选择χ2统计法(CHI)进行特征选择，减少聚类算法的处理时间。</p><p>本文采用的聚类技术是基于原型的、划分的K-mean算法，K-mean算法比较简单，其基本思想是用一个聚类的平均值或中值来表示这个聚类。首先，选择K个初始质心，其中K是用户指定的参数，即上一小节计算得到的查询覆盖度。每个点指派到最近的质心，而指派到一个质心的点集为一个簇。然后，根据指派到簇的点，更新每个簇的质心。重复指派和更新步骤，直到簇中心不发生变化。</p><p>为了将点指派到最近的质心，我们需要相似性度量来量化所考查的数据的“最近”概念。本文使用最常用的余弦相似性方法来计算两个文档之间的相似度，公式如下：</p><p>(5)</p><h3>4.3 评价函数</h3><p>对检索结果进行聚类后，我们利用类内距和类间距等聚类指标来评价检索性能。</p><p>类间距是所有聚类簇中心之间距离的平均值。定义如下：</p><p><img src="https://img.fx361.cc/images/2023/0215/2e752dbd1d828255ede4757d11fff91b66c7de2f.webp"/></p><p>(6)</p><p>其中k是聚类数目，ci，cj分别表示聚类Ci和Cj的类中心，|ci,cj|表示两个类中心之间的距离。类间距表示类之间的区分程度，类间距越大，检索结果中的不相关文档(噪声因子)越少，侧面说明搜索引擎的检索性能越好。</p><p>类内距是所有聚类簇中的元素之间距离的平均值。定义如下：</p><p><img src="https://img.fx361.cc/images/2023/0215/26b7dd8ac4d1f7d0180f3e8bbd17ee57deab0973.webp"/></p><p>(7)</p><p>其中k是聚类数目，mi表示聚类Ci中元素的个数，ci表示聚类Ci的类中心，χij表示聚类Ci中的第j个元素，|χij,ci|为聚类Ci中元素与类中心的距离。类内距表示类内的凝聚程度，类内距越小，检索结果中的相关文档就越多，反映了搜索引擎的检索性能越好。</p><p>因此，我们可以用类间距和类内距这两个指标来估计搜索引擎的检索性能，用Quality表示检索结果的质量，则Quality可以定义为：</p><p>(8)</p><p>Quality越大，即类间距与类内距之比越大，反应了检索结果中的相关文档越多，不相关文档越少，说明检索性能越好。</p><h2>5 实验结果及分析</h2><p>我们选取了三个搜索引擎作为性能评价的对象，分别是Google，Baidu和Bing。实验数据全部采集自2009年7月的互联网。首先我们从搜狗实验室提供的用户查询日志(SogouQ)中提取出100个查询频率较高的信息类查询并计算其查询覆盖度，再分别到三个搜索引擎上进行检索，利用一些网页抓取工具分别将搜索引擎返回的前600个检索结果抓取下来。经数据预处理后，对三组检索结果分别进行聚类。我们提取的100个查询在Sogou日志中的检索频率都在5次以上，基中查询长度小于等于3的查询约占80%(查询长度主要是指用户提交的查询中包含几个词语或者字，经统计Sogou日志中平均每个查询长度为3.32)，查询词条内容的分布可以大致分为：娱乐、健康、商业、学术、计算机、社会等。</p><h3>5.1 自动评价结果</h3><p>下面列出了100个查询的聚类结果，如图2所示。</p><p><img src="https://img.fx361.cc/images/2023/0215/c186244e0e6496171c2c52d628343fb593b818c6.webp"/></p><p>图2 三个搜索引擎检索结果质量比较</p><p>从图中可以看出，Google的检索结果质量总体上要比Baidu和Bing的检索结果质量好。Baidu和Bing的检索结果质量相对来说相差不大，有的查询Baidu的检索结果质量稍好一些，有的查询Bing的检索结果质量稍好一些。计算100个查询的检索结果质量平均值，Google的平均值为0.199 428，Baidu的平均值为0.146 191，Bing的平均值为0.156 826，我们可以得到三个搜索引擎检索性能的排序从高到低为依次Google、Bing、Baidu。图中不同查询的检索结果聚类质量存在比较大的差异，这是由于不同查询的查询覆盖度不同导致聚类数目不同而造成的，并不会影响检索性能排序的比较。</p><h3>5.2 评价结果比较</h3><p>为了说明我们提出的基于聚类分析的评价方法是可行的，我们将与人工标注的评价结果进行比较。我们选择了每个搜索引擎对每个查询的前20个结果，以及第21至100的5%，来进行人工标注答案，采用Pooling的方法[18]构造结果池。答案标注分为三个等级，分别为非常相关、一般相关、不相关，评估指标使用了p@3、p@10、p@20、NDCG@3、NDCG@10和NDCG@20。由于人为因素，不同评价人员人工标注相关等级的程度有所差别，导致不同查询的精确率相差较大，但不影响评价结果的排序。人工评价的结论是Google的检索结果准确度总体上要比Baidu和Bing的检索结果准确度高。Baidu和Bing的检索结果准确度总体来说相差不大，其中Bing的检索结果准确度比Baidu的检索结果准确度高的查询多八个。将基于聚类分析的搜索引擎自动性能评价的排序结果与人工评价的排序结果进行对比，具体的评价实验结果如图3所示。</p><p><img src="https://img.fx361.cc/images/2023/0215/c12613c1bb408cf64a73ef76bfbaa30ecd708acd.webp"/></p><p>图3 基于聚类分析的自动性能评价结果与人工标注评价结果的比较</p><p>为了进一步分析这两种方法评价结果的一致性，我们进行一致性检验。设xg(i)、xbd(i)、xb(i)分别为Google、Baidu、bing第i个查询的自动评分，yg(i)、ybd(i)、yb(i)分别为Google、Baidu、Bing第i个查询的人工标注评分，然后分别对三组变量{xg(i)-xbd(i),yg(i)-ybd(i)}, {xg(i)-xb(i),yg(i)-yb(i)}，{xbd(i)-xb(i),ybd(i)-yb(i)}进行相关分析，计算得到三组变量的Pearson相关系数。自动性能评价结果与人工评价结果(不同评价指标)的相关系数如表1所示。实验结果表明两种评价方法的评价结果是一致的且有统计学意义。(**表示双边检验中两个变量相关性在a=0.01的水平是显著的)。由此,可得出自动评价的搜索引擎性能排序结果与人工评价的结果相同。</p><p><img src="https://img.fx361.cc/images/2023/0215/a0296b7f98862d14db30534627810b9aaf7b02ab.webp"/></p><p>表1 基于聚类分析的自动性能评价结果与人工评价结果(不同评价指标)的相关系数</p><h3>5.3 查询覆盖度计算方法的比较</h3><p>为了考查查询覆盖度对自动性能评价的影响以及两种查询覆盖度计算方法的优劣，我们分别对不使用查询覆盖度方法(CS0)、两种查询覆盖度计算方法(CS1和CS2)进行比较。通过聚类分析得到不同的自动评价结果，然后再分别与人工评价结果进行相关分析，表2中列出了三种不同覆盖度计算方法的评价结果与人工评价结果的Pearson相关系数，可以看到根据查询覆盖度进行聚类分析的自动评价方法能提高评价的准确率，其中第二种方法比第一种方法更好。</p><p><img src="https://img.fx361.cc/images/2023/0215/bdb4801c31c329eb703e6b6b21bca1a50ccf11d4.webp"/></p><p>表2 不同查询覆盖度计算方法的评价结果与人工评价结果的相关系数</p><h3>5.4 参数λ的影响</h3><p>为了得到较好的参数λ取值，我们对查询覆盖度计算方法1中的λ分别取4、6、8、10、12、14，对方法2中的λ分别取1、2、3、4、5、6，计算出不同的查询覆盖度，再得到相应的自动评价结果，然后分别与人工评价结果进行一致性检验，对上述三组变量对{xg(i)-xbd(i),yg(i)-ybd(i)}, {xg(i)-xb(i),yg(i)-yb(i)}，{xbd(i)-xb(i),ybd(i)-yb(i)}进行相关分析，得到三组变量对的Pearson相关系数如表3和表4所示。可以看出，本文两种覆盖度计算方法中的参数分别取10和4较合适。</p><p><img src="https://img.fx361.cc/images/2023/0215/84f0582191a18ec00c2e404a50ab95140b8a10ff.webp"/></p><p>表3 查询覆盖度计算方法1(λ取不同的值)的评价结果与人工评价结果的相关系数</p><p><img src="https://img.fx361.cc/images/2023/0215/288699aef6560eb8381703e838236d0b6c1163e8.webp"/></p><p>表4 查询覆盖度计算方法2(λ取不同的值)的评价结果与人工评价结果的相关系数</p><h2>6 结论与未来的工作</h2><p>为了提高搜索引擎性能评价的自动化水平，本文提出了一种搜索引擎性能评价指标和自动进行搜索引擎性能评价的方法。首先我们对搜狗实验室提供的用户查询日志(SogouQ)进行了查询类别判断，提取出了查询日志中的信息类查询，然后使用三大搜索引擎对提取出来的查询进行检索，将检索返回的结果网页抓取回来后进行内容提取、分词等处理，再应用我们提出的方法使用北京大学网络实验室提供的CWT200G数据集进行查询覆盖度的计算，并根据其覆盖范围对检索结果进行聚类，通过本文提出的搜索引擎性能评价指标实现了检索性能的自动评价。实验结果表明，基于聚类分析的评价结果与人工标注的评价结果具有很高的一致性。</p><p>由于本文使用了简单的K-mean算法对检索结果进行聚类分析，初始聚类中心的选择对聚类结果的影响较大，在未来的工作中，我们将考虑使用其他聚类的方法如层次聚类来提高自动性能评价的可靠性。同时，在改进查询覆盖度的计算方面，我们考虑利用开放目录计划(ODP)进行查询覆盖范围的估计，从而不需要通过搜索引擎索引的整个文档集来估算查询覆盖度。</p><p>[1] Saracevic, T. Evaluation of evaluation in information retrieval[C]//Fox E.A., Ingwersen P, Fidel R,eds. Proc. of the 18th Annual international ACM SIGIR Conf. on Research and Development in information Retrieval (SIGIR ’95). New York: ACM Press,1995: 138-146.</p><p>[2] 刘奕群,岑荣伟,张敏,等. 基于用户行为分析的搜索引擎自动性能评价[J]. 软件学报,2008,19 (11):3023-3032.</p><p>[3] Soboroff I., Nicholas C., Cahan P. Ranking retrieval systems without relevance judgments[C]//Kraft DH, Croft WB, Harper DJ, Zobel J, eds. Proc. of the 24th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (SIGIR 2001). New York :ACM Press, 2001: 66-73.</p><p>[4] Nuray R. Can F. Automatic ranking of retrieval systems in imperfect environments[C]//Clarke C, Cormack G, Callan J, Hawking D, Smeaton A, eds. Proc. of the 26th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (SIGIR 2003). New York :ACM Press, 2003: 379-380.</p><p>[5] Chowdhury A., Soboroff I. Automatic Evaluation of World Wide Web Search Services[C]//Jarverlin K, Beaulieu M, Baeza-Yates R, Myaeng SH, eds. Proc. of the 25th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (SIGIR 2002). New York: ACM Press, 2002:421-422.</p><p>[6] Beitzel S. M., Jensen E. C., Chowdhury A., Grossman D. Using titles and category names from editor-driven taxonomies for automatic evaluation[C]//Kraft D, Frieder O, Hammeer J, Qureshi S, Seligman L, eds.Proc. of the twelfth international conference on Information and knowledge management, 2003:17-23.</p><p>[7] Amitay E., Carmel D., Lempel R., Soffer A. Scaling IR-system evaluation using term relevance sets[C]//Jarvelin K, Allan J, Bruza P, Sanderson M, eds. Proc. of the 27th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (SIGIR 2004). New York :ACM Press,2004: 10-17.</p><p>[8] Joachims T. Evaluating Retrieval Performance Using Clickthrough Data[C]//Franke J, Nakhaeizadeh G, Renz I. Text Mining. Springer-Verlag, 2003:79-96.</p><p>[9] 郎皓，王斌，李锦涛，等. 文本检索的查询性能预测[J]. 软件学报,2008,19(2):291-300.</p><p>[10] Vinay V, Cox IJ, Milic-Frayling N, Wood K. On ranking the effectiveness of searches[C]//Proc. of the 29th Annual International ACM SIGIR Conf. on Research and Development in Information Retrieval. New York: ACM Press, 2006. 398-404.</p><p>[11] Zhou Y, Croft WB. Ranking robustness: A novel framework to predict query performance[C]//Proc. of the 15th ACM International Conf. on Information and Knowledge Management.Arlington:ACM Press, 2006:567-574.</p><p>[12] Cronen-Townsend S, Zhou Y, Croft WB. Predicting query performance[C]//Proc. of the 25th Annual International ACM SIGIR Conf. on Research and Development in Information Retrieval. Tampere: ACM Press, 2002: 299-306.</p><p>[13] Carmel D, Yom-Tov E, Darlow A, Pelleg D. What makes a query difficult?[C]//Proc. of the 29th Annual International ACM SIGIR Conf. on Research and Development in Information Retrieval. New York: ACM Press, 2006:390-397.</p><p>[14] Charles Clarke, Maheedhar Kolla, Gordon Cormack. Novelty and Diversity in Information Retrieval Evaluation[C]//Proc. of the 31th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (SIGIR 2008). Singapore: ACM Press, 2008:659-666.</p><p>[15] Andrei Z. Broder.,A taxonomy of web search[C]//SIGIR Forum,2002,36(2):3-10.</p><p>[16] Lang H, Wang B, Jones G et al. Query performance prediction for information retrieval based on covering topic score[J]. Journal of Computer Science and Technology, 2008, 23 (4): 590-601.</p><p>[17] Liu YQ, Zhang M, Ru LY, Ma SP. Automatic Query Type Identification Based on Click through Information[C]//Ng HT, Leong MK, Kan MY, Ji DH, eds. Proc. of the 3rdAsia Information Retrieval Symp.,AIRS 2006,LNCS 4182, Berlin, Heidelberg: Springer-Verlag, 2006:593-600.</p><p>[18] 李晓明，闫宏飞，王继明. 搜索引擎——原理、技术与系统[M]. 北京：科学出版社, 2005 ：179-181.</p></div></div> <div class="article_love_part"> <h3>猜你喜欢</h3> <div class="article_love_keyword"><span><a href="/tags/1/7/322c1a5432a9b99e/3491573.html" target="_blank">覆盖度</a></span><span><a href="/tags/a/0/ffe4f7fc9624c45f/1.html" target="_blank">搜索引擎</a></span><span><a href="/tags/3/5/c0eb5cb77d8024b6/1.html" target="_blank">文档</a></span></div> <div class="article_love_news"><dd><a href="/news/2022/1021/11862724.html" target="_blank" title="呼和浩特市和林格尔县植被覆盖度变化遥感监测">呼和浩特市和林格尔县植被覆盖度变化遥感监测</a></dd><dd><a href="/news/2021/1214/12501999.html" target="_blank" title="基于NDVI的晋州市植被覆盖信息提取">基于NDVI的晋州市植被覆盖信息提取</a></dd><dd><a href="/news/2021/0727/8621423.html" target="_blank" title="有人一声不吭向你扔了个文档">有人一声不吭向你扔了个文档</a></dd><dd><a href="/news/2020/0317/17584398.html" target="_blank" title="低覆盖度CO分子在Ni(110)面的吸附研究">低覆盖度CO分子在Ni(110)面的吸附研究</a></dd><dd><a href="/news/2016/1201/17689457.html" target="_blank" title="基于RI码计算的Word复制文档鉴别">基于RI码计算的Word复制文档鉴别</a></dd><dd><a href="/news/2015/1222/13022959.html" target="_blank" title="Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat">Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat</a></dd><dd><a href="/news/2015/1110/15425948.html" target="_blank" title="网络搜索引擎亟待规范">网络搜索引擎亟待规范</a></dd><dd><a href="/news/2014/1106/18193448.html" target="_blank" title="基于Nutch的医疗搜索引擎的研究与开发">基于Nutch的医疗搜索引擎的研究与开发</a></dd><dd><a href="/news/2014/0311/21623768.html" target="_blank" title="广告主与搜索引擎的双向博弈分析">广告主与搜索引擎的双向博弈分析</a></dd><dd><a href="/news/2012/0429/24157378.html" target="_blank" title="不让他人随意下载Google文档">不让他人随意下载Google文档</a></dd></div> </div><div class="phbk_part"><h3>杂志排行</h3> <ul><li><a href="/bk/sdjy/202410.html" class="title">《师道·教研》</a><a href="/bk/sdjy/202410.html" class="date">2024年10期</a></li><li><a href="/bk/swyzhsby/202411.html" class="title">《思维与智慧·上半月》</a><a href="/bk/swyzhsby/202411.html" class="date">2024年11期</a></li><li><a href="/bk/xdgyjjhxxh/20242.html" class="title">《现代工业经济和信息化》</a><a href="/bk/xdgyjjhxxh/20242.html" class="date">2024年2期</a></li><li><a href="/bk/wxxsyb/202410.html" class="title">《微型小说月报》</a><a href="/bk/wxxsyb/202410.html" class="date">2024年10期</a></li><li><a href="/bk/gywsw/20241.html" class="title">《工业微生物》</a><a href="/bk/gywsw/20241.html" class="date">2024年1期</a></li><li><a href="/bk/xl/20249.html" class="title">《雪莲》</a><a href="/bk/xl/20249.html" class="date">2024年9期</a></li><li><a href="/bk/sjbl/202421.html" class="title">《世界博览》</a><a href="/bk/sjbl/202421.html" class="date">2024年21期</a></li><li><a href="/bk/zxqyglykj/20246.html" class="title">《中小企业管理与科技》</a><a href="/bk/zxqyglykj/20246.html" class="date">2024年6期</a></li><li><a href="/bk/xdsp/20244.html" class="title">《现代食品》</a><a href="/bk/xdsp/20244.html" class="date">2024年4期</a></li><li><a href="/bk/wszyjy/202410.html" class="title">《卫生职业教育》</a><a href="/bk/wszyjy/202410.html" class="date">2024年10期</a></li></ul> </div><div class="bk_part"> <div class="bk_im_b"><a href="/bk/zwxxxb/20105.html"><img src="https://cimg.fx361.com/images/2023/0215/a69900a788690f8c12e7d8884e5ac4778efea69b.webp" alt=""></a></div> <div class="dbk_title"><a href="/bk/zwxxxb/" target="_blank">中文信息学报</a></div> <div class="dbk_date"><a href="/bk/zwxxxb/20105.html" target="_blank">2010年5期</a></div> </div><div class="others"> <h3><a href="/bk/zwxxxb/" target="_blank">中文信息学报</a>的其它文章</h3> <ul><li><a href="/news/2010/0619/17284590.html" title="基于树核函数的“it”待消解项识别研究">基于树核函数的“it”待消解项识别研究</a></li><li><a href="/news/2010/0619/17284520.html" title="基于合一句法和实体语义树的中文语义关系抽取">基于合一句法和实体语义树的中文语义关系抽取</a></li><li><a href="/news/2010/0619/17284466.html" title="副词“就”的用法及其自动识别研究">副词“就”的用法及其自动识别研究</a></li><li><a href="/news/2010/0619/17284401.html" title="基于语义角色标注的新闻领域复述句识别方法">基于语义角色标注的新闻领域复述句识别方法</a></li><li><a href="/news/2010/0605/17302862.html" title="ACL 2010 评述">ACL 2010 评述</a></li><li><a href="/news/2010/0605/17302853.html" title="女书计算机键盘布局与输入法的研究">女书计算机键盘布局与输入法的研究</a></li></ul></div></div> <div class="m_footer"></div> <script> if ('serviceWorker' in navigator) { window.onload = function () { navigator.serviceWorker.register('/sw.js'); }; } </script> <script type="text/javascript" src="https://s1.pstatp.com/cdn/expire-1-M/jquery/3.4.0/jquery.min.js"></script> <script type="text/javascript" src="https://s2.pstatp.com/cdn/expire-1-M/Swiper/4.5.0/js/swiper.min.js"></script> <script type="text/javascript" src="https://s1.pstatp.com/cdn/expire-1-M/jquery.lazyload/1.9.1/jquery.lazyload.js"></script> <script type="text/javascript"> document.write('<script src="https://img.fx361.cc/js/m.index_cc.js"><\/script>'); </script> </section> </body> </html>