中外老年搜索引擎比较研究
2010-05-04郑钊权
郑钊权
(1.广州美术学院图书馆;2.中山大学资讯管理系,广东 广州 510006)
根据CNNIC数据显示,截止到2009年12月底,中国网民达到3.84亿人,相比2008年新增网民8600万人。比较2009年和2008年中国网民的年龄属性分布情况,可以发现新增网民主要集中在30~40岁的年轻群体。其中2009年50~59岁网民占比由2008年的4.2%提升到4.5%,而60岁以上年长网民占比则由1.5%提升到1.9%。所以我们有必要研究年长用户网络搜索的实际需求和使用习惯,同时评价面向年长用户的搜索产品,使老年搜索提供的个性化服务更能满足年长用户的信息需求。
1 老年搜索引擎的特点
随着网络的深度社会化,老年人上网的认知和行为逐渐引起国外相关学者的研究兴趣,老年搜索引擎也应运而生。所谓老年搜索引擎,就是针对年长者的认知结构、上网行为特别加以设计的一种专用搜索引擎,是他们查找网络信息的捷径。与一般的搜索引擎相比,它具有如下特点:①可靠性,有专门的工作人员对网站进行评价,注重过滤虚假重复信息,可为年长者提供安全干净的信息环境;②针对性,提供与年长用户密切相关的健康信息、休闲娱乐网站;③易用性,检索方式使用方便,网站界面设计朴素。
2 中外老年搜索引擎的比较分析
百度老年搜索于2009年4月14日在中国推出,是全球最大的中文搜索引擎公司百度的新产品。Cranky于2007年1月9日在美国正式发布,是美国热门求职网站Monster的创始人创建的。二者皆开发较早,是市场上仅有的老年搜索引擎,在界面设计、信息检索方式等方面都颇具代表性。笔者以二者为研究对象,加以对比分析。
表1 两种老年搜索引擎的基本情况
百度老年搜索的最大特点是提供适合年长者视力的大字号文字,并且与汉王公司合作,提供网页手写输入功能,用户可以直接通过鼠标移动来输入汉字。
Cranky最大的特点是网站的高质量,Cranky和美国互联网市场调查公司Compete合作,找出了50万个老年人最喜欢浏览的网站,随后,该网站又派出评估人员逐一阅读,并找出5000个最有价值的网站,定期选择其中最具代表性的10个搜索关键词放在首页。
2.1 界面设计
年长者在使用搜索引擎的时候,首先接触到的就是搜索引擎的界面。因此,首页设计的友好与否,将决定首次使用者是否继续使用。老年搜索的主要使用者是年长者,其界面应当比一般的网站朴素简洁一些。
表2 两种老年搜索引擎的界面设计
百度老年搜索风格与一般的网站导航相似,可降低年长用户的使用门槛,使不会打字的年长用户也能通过点击链接轻易使用。但设计与色彩颇为单调,以百度的蓝色为主色调,整个网页没有flash做成的动态界面,也没有滚动的热门新闻、本地天气预报等。而Cranky的风格更为简洁,色彩搭配较为丰富,还有网站创建者的视频、网站的简单介绍、老人最常用的十大搜索关键词,只是右下角出现大片空白,布局不协调。
2.2 检索功能
搜索引擎的最主要目的就是检索信息,老年搜索引擎也是如此。而检索功能是否强大,是评价老年搜索引擎性能的重要指标,表3反映了这两种老年搜索引擎所具备的检索功能。
表3 两种老年搜索引擎的检索功能
这两种老年搜索引擎的特点都是简单易用,尽量减少年长用户输入文字的工作量。在以宠物主题为搜索目标的搜索中,百度老年搜索提供了“宠物之家”、“宠物中国”等网站的链接,而Cranky则提供了interesting pets等关键词检索链接。
在检索功能上,百度老年搜索可能更胜一筹,只需点击1次即可进入相关网站。它的首页上部分为实用工具栏目,包括天气预报、电视节目、黄历等链接。从提供的频道内容上看,一共分13个一级类目,分别为名站、新闻、电脑网路、音乐、游戏、听书、视频、曲艺、书画、花鸟、养生、社区、理财、软件,基本上囊括了年长用户要使用到的所有功能。缺点是老人使用频率较高的网站并没有放在最醒目的位置,网页的聚焦点比较分散。为了方便老人使用,百度老年搜索还提供了“帮助手册”按键,里面提供了年长用户经常遇到的问题和解决方法。而Cranky则不具备可立刻获取的网站信息,需要先搜索或者点击相关关键词才能出现相关网站,这就需要使用者具有较高的网络使用技能。
2.3 检索结果
将检索结果友好地显示给年长用户,并符合他们的使用习惯,是评价老年搜索引擎的重要方面,表4是两种搜索引擎检索结果的对比。
在检索结果方面,两种搜索引擎的表现也是不一样的:百度老年搜索提供的搜索结果虽然更详细,但是每页搜索结果多达10个,面对那么多搜索结果,年长用户容易眼花缭乱,在厌烦心理作用下,使用该搜索引擎的倾向大大降低。而Cranky提供的搜索结果每页只有4个,而且都是经过精心挑选的网站,更容易受到年长用户的欢迎。
表4 两种老年搜索引擎的检索结果
2.4 检索效果
检索效果是评价搜索引擎的核心指标。一个优秀的老年搜索引擎在检全率和检准率方面应该达到一定的标准。为此,笔者采取实验的方式,从命题结果数和检索结果相关性等角度对两种老年搜索引擎的检索效果进行简单测评分析。以年长用户感兴趣的含义明确的单一概念词汇作为检索词,分别在两个搜索引擎中检索,然后选择前10个结果作为测评相关率的依据。这里采用定量分析的方法,将结果与主题的相关性按3个等级评分,“2”表示相关性最高,“1”表示部分内容相关,“0”表示没有相关性。实验的检索词如下:
N1:高血压/hypertension;N2:糖尿病/diabetes;N3:便秘/constipation
通过实验,得出结果如表5所示。
表5 两种老年搜索引擎的搜索效果
从表5可以看出,Cranky在搜索信息的准确率上比百度老年搜索更为出色,相关率在80%以上。在百度老年搜索中,搜索高血压时,搜出的结果有些网站只有域名,没有内容;搜索“便秘”时,有的内容是孕妇便秘或者是小孩便秘,不符合老人搜索的范围;搜索糖尿病时,有的网站是纯粹的商业广告,这都大大影响了搜索引擎的准确率。相比之下,Cranky提供的网站更为权威,信息更值得信赖,首页第一条的检索结果是美国国家图书馆的医学分馆和国家卫生研究所提供的权威信息服务,其他的检索结果也是医学杂志、政府部门或者非盈利组织提供的信息,内容可靠性高。
3 对我国发展中文老年搜索引擎的启示
3.1 建立主题专家知识库
老年搜索引擎是为有针对性地向某一特定领域、某一特定人群或某一特定需求提供有价值信息的工具,提供的信息具有较强的专业性,是面向主题的。因此,必须建立一个专家系统来实现精确导航,这也是与传统搜索引擎最大的区别之一。知识库从专家那里获取某专业领域的知识,通过系统Agent的推理功能,从知识推出相应的结论。主题概念数据库是专家知识库的重要组成部分,初始的主题概念数据库主要是通过专家建立及对专业领域网站信息的搜集来实现。专家首先给出某领域一定的主题词以及他们之间的相关性,然后建立3层主题概念分类表,并通过对专业网页收集来补充主题概念数据库。
3.2 抽取用户个性化兴趣
年长用户首次使用系统的时候,通过用户身份选择主动设置一些个人信息、喜好分类或者通过反馈搜索结果评价等方式来进行用户个人信息和偏好的获取。根据网络技能的熟练程度,或者根据使用搜索引擎的目的等进行身份设置,提供最新的个性化资讯和相关热门搜索。采用了用户个性化信息的搜索算法可以在一定程度上提高系统的查准率和查全率。
3.3 提供针对年长用户的视频教程
通过视频教育,运用计算机网络所特有的信息数据库管理技术和双向交互功能,一方面,系统对每个年长用户的个性资料、学习过程和阶段情况等可以实现完整的系统跟踪记录;另一方面,教学和学习服务系统可根据系统记录的个人资料,针对各阶段的年长用户提出个性化学习建议。
3.4 建立完善的帮助系统
由于年长用户的信息检索能力普遍薄弱,因此建立完善的帮助系统对于老年搜索来说是非常重要的。在检索过程中,以图片和文字相结合的方式详细介绍了各种检索方式,并提供检索技巧,如怎样缩小检索范围、怎样利用逻辑检索得到更为直接准确的答案等。甚至提供在线帮助,允许年长用户通过实时交谈的方式解决使用过程中遇到的各种问题。
4 结束语
我们必须懂得如何把信息技术应用在老龄化的不同阶段,如初步老龄化、中度老龄化和深度老龄化。另外,还要知道老年搜索是否存在着明显的性别差异,网络搜索能力与生活质量是否存在关系等等。在未来的工作中,寻找更能表示用户个性化信息的特征向量以及对用户个性化特征信息进行保护和建立可扩展的算法将是个性化老年搜索引擎的发展方向。
[1] Ontology Based Personalized Search[EB/OL].[2009-12-06].http://www.inf.ethz.ch/personal/pretscha/papers/kuthesis99.pdf.
[2] Personalized Search Based on User Search Histories[EB/OL].[2009-12-06].http://www.ittc.ku.edu/research/thesis/documents/mirco_speretta.pdf.
[3] LearningOntology-Based UserProfiles:ASemantic Approach to Personalized Web Se[EB/OL].[2009-12-06].http//www.comp.hkbu.edu.hk/~cib/2007/Nov/iib_vol8no1_article1.pdf.
[4] Sabine Koch.Health informatics and the delivery of care to older people.Sabine Koch?Maria H.glund.Health informatics and the delivery of care to older people.Maturitas 2009(63):195-199.
[5] Flynn KE,Smith MA,Freese J.When do older adults turn to the internet for health information?Findings from the Wisconsin Longitudinal Study.J Gen Intern Med,2006(21):295-301.
[6] Terryl Aslaa,Kirsty Williamsonb,c,4,John Millsc.The role of information in successful aging:The case for a research focus on the oldest old.Library&Information Science Research,2006(28):49-63.
[7] 马晓普,梁晶晶,赖国勇.基于用户兴趣的个性化搜索引擎系统[J].攀枝花学院学报,2009(3):37-40.
[8] 左美云,刘勃勃,刘方.老年人信息需求模型的构建与应用[J].管理评论,2009(10):70-77.
[9] 文振威,秦晓.个性化搜索引擎的研究与设计[J].计算机工程与设计,2009(10):342-344,394.
[10] 朱前东,庞弘粲.搜索引擎个性化检索研究综述[J].图书馆学刊,2008(6):14-17.
[11] 曹红兵.搜索引擎的个性化检索研究[J].图书情报工作,2007(3):129-132.
[12] 王娜.博客搜索引擎与传统搜索引擎的比较研究[J].图书情报工作,2006(7):54-57.
[13] 钟辉新.基于垂直搜索引擎的个性化信息服务探[J].情报杂志,2008(1):118-120.
[14] 李玉玲.社区居家养老:文献综述[J].江海纵横,2008(1):27-29.