一种基于微分流型的Web检索算法
2005-04-29霍华冯博琴
西安交通大学学报 2005年2期
霍 华 冯博琴
摘要:为进一步提高Web的检索性能,提出了一种基于微分流型的Web检索算法.该算法的核心思想为:用微分流型描述Web空间,用流型的切平面模拟Web的切空间,将流型上2点之间的测地线距离转化为二维平面上点与点之间的欧氏距离,基于距离的匹配过程由原来的在整个文档集合中进行,转换为仅在查询的邻域内进行,以减少匹配过程的计算量.实验结果表明,该算法的查准率比Google和IIT分别提高35.24%和40.93%,它更适合于大型异构Web文档集合的检索.
关键词:Web空间;微分流型;查准率;查全率
中图分类号:TP391文献标识码:A文章编号:0253—987X(2005)02—0130—04