分布式搜索时代
2011-01-16董守斌
中国教育网络 2011年10期
董守斌
华南理工大学信息网络工程研究中心副主任
分布式搜索时代
董守斌
华南理工大学信息网络工程研究中心副主任
华南理工大学信息网络工程研究中心副主任董守斌很早就主持华南理工大学木棉搜索引擎的开发工作。该引擎基于开源项目进行,以建立一个具有可扩展性和开放性的搜索引擎。他们立足于教育网,力图解决新一代搜索引擎应用中所带来的新问题和技术挑战,并与北京大学、清华大学合作形成中文分词的标准数据集等工作。
“信息检索是现代互联网应用体系结构的重要支柱。 WWW上的搜索引擎技术随着IPv4网络信息资源的爆炸增长取得了巨大的成就,特别是中文搜索引擎的技术,为互联网的应用普及作出巨大的贡献。”董守斌说。目前在下一代互联网CNGI项目的支持下,华南理工大学等研究单位联合华中科技大学等共同研究和开发面向新一代网络的大规模分布式搜索引擎:从搜索引擎体系结构面临的可扩展性问题出发,结合IPv6网络信息分布的构造特点和潜在的发展趋势,在下一代互联网上建设具有一定规模的分布式搜索引擎系统,通过资源词典、索引数据以及检索结果等多层面的资源共享和融合,实现搜索单元的有机协作和互为增强,支持对IPv4/IPv6网络中的大规模的多媒体信息检索服务,并以统一门户界面满足多种终端的访问需要。
董守斌表示,目前工作的重点在于推广分布式搜索引擎的应用以及单元搜索引擎的部署,致力于将教育网不同层次、不同专题及各具特色的搜索引擎系统组织起来,形成大规模、分布式的搜索引擎服务联合体,提高教育网搜索引擎的服务特色和竞争力。不同耦合度的搜索引擎组织模型的对比试验和示范研究,可以为我国发展下一代搜索引擎技术奠定扎实的基础,并进一步推动我国网上信息资源的良性发展。