基于网络互动问答平台的信息检索模式构建
2011-04-03王知津王春燕范淑杰
王知津,王春燕,范淑杰
(南开大学商学院信息资源管理系,天津 300071)
近年来,国内外很多门户网站纷纷推出了一种基于检索的互动式知识问答分享平台[1](以下简称互动问答平台)。互动问答平台自身有什么特点?用户如何通过互动问答平台获得准确、及时的答案?目前对这些问题的研究较少,笔者在对网络互动问答平台的特点进行总结的基础上,构建了基于网络互动问答平台的信息检索模式,以完善互动问答方式,促进个人知识共享和隐性知识显性化。
1 互动问答平台
1.1 互动问答平台的概念
互动问答平台通过有效的服务策略,把需要某个主题信息的用户以及能解答相关问题的专家集中起来,通过悬赏机制,发动其他用户给出答案。提问者可以借此分享他人智慧来获得所需要的结果,回答者也可在分享过程中获得自己的满足。如图1所示,互动问答平台是一个用户问答和知识库整理的平台。在用户问答中,互动问答平台能够引导用户B来间接回答用户A的提问,并且在用户D直接回答用户C时,能够记录问题和答案;在其他用户出现类似问答时,系统进行相似性匹配,如果问题相似,系统可以直接为发问的用户提供一组答案;如果在知识库中没有找到相似的问题,系统就引导其他用户或专家来回答发问者。发问者、专家、回答者三者的角色可以互换,如C回答A的问题时,C的角色是专家,A是发问者。但是,“闻道有先后,术业有专攻”。当C提出问题,由用户B回答,C就成为了发问者,B则是专家或者回答者。这正体现了网络互动问答平台的互动性。
图1 互动问答平台在用户问答中的作用
图2 互动问答平台工作流程概况
图2展示了互动问答平台工作流程概况。互动问答平台主要采用单问多答的问答模式,即用户以示例或一般性描述提交问题后,由其他用户或网站聘任的答疑专家回复,并对已有的答案进行补充和评价。这种方式不但便于用户对回复的问题进行甄别,选出最优的答案,而且还有利于用户对问题有一个更加全面的了解[2]。由图2可见,互动问答平台知识库对所有用户开放,用户在发布自己的问题之前,系统会自动将这一问题提交到知识库中,检索是否已经有用户发问类似问题的记录、是否已经确认了正确答案,从而避免同一个问题得到多次重复回答的现象出现,节省了用户的时间,提高了检索效率。
1.2 互动问答平台的特点
互动问答平台具有以下特点:(1)参与对象广泛,使用不受限。互动问答平台是一个开放性的知识分享平台,为知识需求者(即发问用户和浏览用户)和知识提供者(即回答用户)之间架起了沟通桥梁。互动问答平台以激励措施鼓励用户参与问题的提交、回复以及对其他用户的问题给出补充和评价,对所有参与的用户均无使用权限。由此可见,互动问答平台的使用对象包括提问者、回复者,甚至浏览用户,其参与的用户对象极其广泛;(2)答疑手段多样化,实时效果明显。多样化的答疑手段应用于互动问答平台,在原有的网页问答平台中添加了邮件、视频、短信等即时的或非即时的问答手段。如腾讯公司将其互动问答平台“SOSO问问”与其QQ实时聊天工具有机地结合起来,为广大网络用户带来实时、多样的问答体验;(3)咨询内容全面,完全开放自由。互动问答平台对于用户的提问和回复内容通常不加多少约束,很多问答平台(如Yahoo!Answers等)提供百科全书式的问答服务,咨询内容从生活常识到天文地理,无所不包。这种完全开放自由的服务策略为用户提供了最大限度的咨询空间,有效解决了检索中存在的盲点,但同时也显现出一些问题,如非法内容(如不文明话题等);(4)赏罚分明,鼓励用户共同推动平台完善。互动问答平台的知识专家大都来自在各个领域中有卓越表现并乐意与其他用户分享知识的网民。这些知识专家在网站激励措施的吸引下,竭力维护自己的知识专家身份,有力推动着网站的发展。另外,互动问答平台引入了悬赏机制,对于表现好的用户给予加分,分数越高,级别越高,享受的权限越大。有的网站还对高分用户实行物质奖励。同时,网站对知识专家团实行淘汰机制,适时更换“懒散”成员。一系列有效机制的实施,使知识专家团始终保持一种强劲的聚合力,围绕网站服务。
从上述论述可以看到,互动问答平台具有开放性、易获取性、共享性、内容广泛性等特点。但是,互动问答平台还存在一些传统网络信息行为共有的问题,主要包括一些提问表达的不明确、回答的不准确、知识产权保护、隐私权、诚信等问题[3]。
1.3 互动问答平台的进展
国外的Google Answers、Yahoo Answers和国内的新浪的“爱问”、百度的“知道”、腾讯的“问问”等是目前比较有代表性的互动问答平台。
目前国内对互动问答平台的研究主要从参考咨询角度、知识组织角度以及信息检索角度进行。国内关于互动问答平台的研究文献大多集中于研究互动问答平台对图书馆数字参考咨询服务的启示或影响方面。从知识组织角度看,淡金华、赵捧未对“百度知道”进行研究和分析,从自组织的角度探讨了隐性知识的自组织过程及其影响,并针对高校环境下学生知识管理的有效进行提出了对策。从信息检索角度看,魏海霞介绍了互动问答的运行方式和管理模式及一些相关网站的建设,分析了它在信息检索中的具体作用,认为它是传统信息检索方式的有益补充和现代信息检索技术的深入与拓展,以期人们能恰当地运用它。在互动问答平台技术的研究方面,笔者比对多篇论文之后,仅发现3篇比较符合这一主题,徐刚、邓胜利、黄玉、陈军、顾申化的硕士毕业论文论述了相关问题。孙晓峰在其论文中试图建立基于轻量级框架的互动问答平台(iSee),iSee在传统MVC模式的基础上,采用了四层架构设计。
在互动问答平台的实践作用方面,笔者认为主要有:(1)互动问答提高了对普通人、普通事物信息检索的成功率。就凭一段录像或一段描述,成百上千的热心人从不同途径对同一个事物进行检索和挖掘,用户很快就能获取关于这个事物的相关信息。特别是一些带有地方色彩、民间特色、生活气息浓烈、实践经验的信息往往能有效得到解决[4];(2)互动问答平台是现代网络信息检索的一种新形式。互动问答平台能使信息检索的功能进一步完善。因此,许多网络搜索引擎和网站相继增加这种功能,一些大型数据库如重庆维普的“中文科技期刊数据库”等也在接收用户提问时添加这种功能,以便检索系统准确理解用户检索原意。
2 基于互动问答平台的信息检索模式
2.1 构成要素及其相互关系
影响检索活动过程的关键构成要素包括:检索目标、用户检索能力、用户判断。它们从不同侧面决定着检索活动的结果与方向。首先,客观明确的检索目标是决定信息检索活动成功的关键。最后得到的答案是用户对大量回答进行分析的结果,而不一定是检索活动的直接结果。具体目标是进一步开展信息检索活动的重要线索,有助于明确信息需求和最终答案。其次,用户在互动问答平台中的角色定位决定了其在信息检索中的视角,进而影响检索策略和方法的选择与使用。在具体开展检索活动之前,用户如果对互动问答平台的特点有了充分的了解,并能通过其他用户的发言,判断其提供的答案的可信度或准确度,就可依据信息需求,明确自身信息需求,判断出最终答案。
2.2 基于互动问答平台的信息检索流程设计
基于互动问答平台的信息检索流程设计如图3所示。需要说明的是,本文只阐述信息检索这一环节,不涉及知识库的建立与应用。
图3 基于互动问答平台的信息检索流程
如图3所示,用户受到个人背景、激发因素(如任务、急需解决的困惑)的影响,产生了信息需求。同时,用户对互动问答平台有了一定的了解,建立了互动问答平台知识基础(必要时,还可注册互动问答平台)。用户在全面综合认识预期目标的基础上,根据目标制定调查大纲,调查大纲中需划定检索的范围,进而选择有效的检索类目,使用恰当的技巧(浏览、直接提问等)进行检索。对检索结果进行阶段评估,如果发现结果不符合预期目标或不完整,则对问题重组,再次进行检索。以上步骤循环往复,直至所获信息能够满足预期目标,再运用信息分析与预测方法对所检索出来的信息进行整理分析,形成答案,并对答案进行满意度评价。
2.3 基于互动问答平台的信息检索模式
图4 基于互动问答平台的信息检索模式
如图4所示,基于互动问答平台的信息检索模式是构成要素及其相互关系、流程设计的整合。用户在正确认识构成要素之间的关系后,根据检索目标,凭借对互动问答平台的了解,判断所需搜寻的互动问答平台类型和时间范围,确定检索方式和预期目标。按照检索流程对选定的互动问答平台进行信息检索,总结检索结果之后,依然要凭借用户自己的判断能力,进行下一步活动。在整个信息检索阶段,用户的个人背景、激发因素影响着用户的判断,同时,也会存在一些干扰因素,如前面提到的一些提问表达的不明确、回答的不准确等。
3 互动问答平台信息检索模式的有关说明
3.1 激发因素和干扰因素
激发因素用以解释某些信息需求没有引发信息查询行为的可能性和人们为了达到预期的查询效果会采用哪种查询策略。干扰因素则贯穿于整个查询行为的始终,并对用户检索行为产生障碍,不同的人在不同的时间进行查询,遇到的障碍是不同的。如果用户的信息需求可以清晰地表达出来,但是不知道在哪里得到最新、最正确的信息,他可能会选择相应的检索系统,然后对结果进行选择性的浏览。如果用户明确信息需求,又知道在哪个网站可以获得最准确、最需要的信息,则可能会通过反复关注特定的信息源,保持获取最新的信息。如果用户不能明确信息需求,也不能清晰地表达或者信息的易获取性很弱,用户可能会采用在熟悉的网站上进行缺乏明确目标的浏览。而在这些不同的浏览过程中,用户又可能会有新的信息需求,修正先前的需求表达或者需求本身,从而回到开始查询的阶段,如此循环直到用户觉得得到了需要的信息或者放弃查询为止。
3.2 满意度评价
在收集到信息后,用户需要对信息进行提炼、核实、处理和利用。对利用结果的评价反映出用户的满意度。在满意的情况下,用户可能会产生新的或者更深入的信息需求,返回到初始阶段。在不满意的情况下,用户要么放弃查询,要么修正自己的查询策略,同样回到初始阶段。可见,对检索结果的价值和使用价值进行阶段性评估非常必要[5]。这是因为:(1)通过结果评价,有利于寻找和及时发现搜集的各个环节存在的疏漏、缺陷和问题;(2)可以使提供答案的其他用户的劳动成果得到网络平台的承认,有利于稳定、发展和壮大用户队伍;(3)可以使结果本身潜在的使用价值在某种程度上得到揭示。
3.3 互动问答平台自身的不足
用户在互动问答平台中只需输入一段文字便可得到需要的信息。因此,互动问答平台又被称为“懒人检索”,得到了越来越多的认可,成为人们学习、工作和生活的重要工具[6]。互动问答平台在信息检索中也存在如反馈速度慢、答案不确定、有些平台需要付费等不足。互动问答平台的发展所面临的主要问题是知识产权保护、隐私权保护、答案的准确性以及诚信等。
3.4 互动问答平台信息检索模式的局限性
该模式的局限性在于:(1)互动问答平台在对现实社会的复制过程中,会删除或夸大(有意或无意)一些细节,造成网络社区发展的失真和迷乱。特别是目前互动问答平台的管理缺少有效的法制手段,导致互动问答平台的失范问题相当突出[7]。因此,从互动问答平台中获取的信息零散、系统性差,同时,还需要反复考证其可靠性;(2)在互动问答平台中,所有用户都用账号登录平台,而账号可以隐匿用户的信息。因此,可以说互动问答平台存在大量的、参差不齐、良莠难辨的答案。所以,从互动问答平台中获取信息时,用户只能依赖于个人辨别能力和经验;(3)基于互动问答平台的信息检索模式是依据用户过去的经验、判断和感觉而开展的人类社会活动,这并不是非常科学、非常可靠。正是由于基于互动问答平台的信息检索模式具有自身的局限性,所以用户不仅应当将自己的直觉和判断融入信息搜寻过程中,更要注意分析式思维与直觉式思维的相互补充,以及运用其他科学分析等弥补其不足。本文构建了一个描述性的模式,该模式阐释了网络用户信息查寻行为的一般过程,对互动问答平台上用户的信息查寻行为进行了序化和梳理。该模式也存在一些缺陷,即模式只是描述性的,还缺乏定量数据的支持。
[1] 刘冰.互动问答平台与网上答疑系统服务策略比较[J].通化师范学院学报,2008(10);71-73.
[2] 淡金华,赵捧未.基于百度知道的知识自组织现象及启示[J].科技情报开发与经济,2009(2):114-116.
[3] 邓小昭.因特网用户信息检索与浏览行为研究[J].情报学报,2003(12):654–657.
[4] 万琳.网络用户信息查询行为模式的建立[J].科技情报开发与经济,2007(34):83-85.
[5] 胡昌平.信息服务与用户研究[M].武汉:武汉大学出版社,1993:167-169.
[6] 魏海霞.互动问答在信息检索中的作用和地位[J].兰台世界,2009(10):70-71.
[7] 何立芳.知识搜索引擎对联合数字参考咨询的借鉴意义[J].图书馆学研究,2009(11):74-76.