移动问答服务信息内容评价及质量优化研究
2018-03-30蒋雅竹
凌 菲,蒋雅竹
(广西科技大学图书馆,广西 柳州 545006)
1 移动问答服务信息内容评价理论基础
移动问答服务是以手机为媒介的一种问答服务,在情境和参与动机的影响下,吸引大量用户参与其中回答和提出问题。所谓移动问答服务,主要是用户以手机短信形式向问答平台提出问题或登录移动问答APP、手机网页进行移动问答。Lee(2013)等人研究了付费型移动问答平台用户的参与动机以及信息搜寻行为,用户使用移动问答服务的关键影响因素就是它的易获取性、便捷性和快速性特征,与传统PC问答相比,移动问答用户倾向于对日常生活的情况进行广泛的提问。实际上,用户使用移动问答服务就是为了解决生活或工作学习中遇到的问题的信息搜寻行为,即用户使用移动问答服务与日常生活相关。同时,用户使用移动问答服务可以节省信息搜寻过程中对答案的不断查询与选择所花费的时间,得到专门的答案有效满足了用户需求。
日常信息搜寻研究中,质量和易获取是选择信息源的一个主要标准。网络环境下,人们在搜寻和获取日常生活信息的时候,主要关注的是搜寻和获取到的信息是否符合自己的需求,信息内容是否正确有效。Lee的调查发现,59.8%的用户评价答案最主要的标准是准确性,47.8%的用户选择信息来源的可靠性,36.8%用户选择深度和专业性。
因此,本文试图从用户需求与信息内容相关性来构建提问者关于答案质量的评价标准。关于用户需求与信息内容相关性评价,研究者往往从客观相关性和主观相关性两个方面来考察信息是否满足用户的需求,客观相关性通常指一条信息是否符合它所在的主题,而主观相关性则是指信息是否能够符合用户检索过程中的认知、交互以及情境等层面的需求。
除此以外,国内外研究者也提出了大量的相关性评价指标,如信息是否有实际效用以及是否带有情感响应等等,这些都与情境和情感相关。关于从用户主观相关性指标来对信息内容进行评价,从Barry和Schamber(1998)提供了10个标准:1)深度、范围和专业性,即答案具有一定深度,涉及特定主题,凸显具体领域内的专业知识;2)准确性;3)完整性;4)可理解性;5)最新时效性,即最近、最新的答案;6)可验证性,即有实际数据事实证明;7)可信性,答案来源可靠,具备可信性(引用可靠,来自专家等);8)清晰度;9)答案具备细节性,提供专门案例;10)具有实用性,能够帮助解决问题。Saracevic(2007)在2007年的研究中对此前的研究进行了总结,将用户主观相关性评价指标归纳为七个方面:内容、对象、信度、情境匹配、认知匹配、信仰匹配、情感因素。
2 移动问答服务信息内容评价
2.1 数据收集
利用Java网络爬虫获取网页源代码原理实现数据的采集,随机采集“百度知道”APP的 1 000 条问题及其答案。本文选择分析“百度知道”数据是因为它是目前通用类移动问答使用人数最多的平台,每天生成大量的数据,涵盖各类主题,与人们日常生活的方方面面息息相关,几乎涵盖了用户的全部信息需求。“百度知道”APP每一个问题都有它的标签,用户提出问题时,平台就会推荐出问题的相关标签,用户再根据问题内容选择标签。本次数据采集不能包含全部标签,但是挑选的范围也与人们日常生活各方面相关。有些问题没有标签的原因有可能是用户通过短信向问答平台提出问题时无法选择标签。对于问题及其答案的数据集的采集是本文对移动问答服务探析的一个支撑。
本文对 1 000 个问题进行了收集和分析,因为移动问答的问题没有像社交问答平台那样对问题进行分类,但是以标签的形式确定问题相关的内容,依据电脑端“百度知道”对问题的类型和主题划分,消除重复的类别。把收集到的问题根据内容分析,发现提问的主要主题类型是生活、教育、游戏、娱乐、健康、运动和计算机通信等,与生活相关的问题有购物、人际关系、本地信息等,经过内容的审核,删除掉一些表达和内容不清楚的问题,样本总共有977条问题和 2 011 条答案。通过实验和观察发现,“百度知道”APP的响应时间比较快,大多数的问题都会在10分钟甚至1分钟内得到回答。基于此,本文通过APP答案的响应和用户的采纳行为进一步了解用户信息搜寻的满足程度。经过对样本问题的初步分析发现“百度知道”APP问题的回答率在63%左右,其中有确切标签的问题更容易得到回答。进一步分析已得到回答问题的答案采纳情况,发现用户的采纳率仅在27%左右,说明答案并不能很好地满足用户的需求。教育学习方面的采纳率(39%)高于其他方面。教育学习方面大多数是学生提出学习中遇到的问题,提问通常以图片上传方式,更能明确需求,所以得到的回答也比较满意。这里需要说明的是,用户对答案的采纳说明答案质量已经满足了他的需求,用户采纳后结束搜寻过程,不需要寻求其他答案。通过对数据集的初步分析发现,“百度知道”APP对用户提问的响应速度很快,但是答案的质量不高,不能很好满足用户的需求。
因此,本文以“百度知道”APP作为数据来源,分析被采纳过的答案,将用户对信息内容的主观相关性评价建立在一个假设条件之下,即用户对答案的采纳行为代表用户对答案满意,能够满足用户的信息需求。
2.2 用户信息需求与答案选择相关性指标模型
前文提到研究者往往从客观相关性和主观相关性两个方面来考察信息是否满足用户的需求,这与其情境、情感相关。文章参考Barry和Saracevic关于信息相关性的评价指标,构建用户需求和答案选择相关性指标模型,以Saracevic指标划分评价类别,以Barry的指标作为评价指标,数据来源是收集的数据集中已经被用户采纳为满意答案的问题和答案。本文研究对象是移动问答服务,根据移动问答服务特性,对指标做了调整,参考了Saracevic提出的相关性评价指标,确定从内容、效用、外部条件、信息源、情感因素指标类别进行考察。首先,用户对于答案的选择以及采纳肯定是基于自身可理解性和清晰明了的基础上,因此这两项指标不再考察;其次,用户对于满意答案的判定标准是主观且自由的,因此对信度这一指标不做分析;同时移动问答服务鲜有关于“信仰”的问答,因此取消“信仰”匹配考察。本文将情境匹配具体化为信息内容是否能解决用户实际处境下遇到的问题,即效用指标,因此相关性评价指标分为内容、效用、信息源、外部性和社会情感5大类13个指标。在内容类中,从内容的准确性、完整性、专业性来考察。可用性和实用性主要是从解决用户实际问题的效用来考察,对于移动问答服务,用户提出问题就是希望可以通过他人的经验和知识来解决自己的问题,因此效用非常重要。移动问答平台上用户对于特定资源和服务的寻求也是提问的重要部分,因此信息源是考察信息的真实程度,来源是否可靠,是否是领域内从业者或者专家,以及链接的有效性。对于外部性,提问者选择的满意答案不是从答案本身的角度出发,而是受外界因素影响对答案做出的选择。结合移动问答服务相关问答内容,用户倾向于及时、快速的信息,或者当只有一个答案选择时,选择该唯一答案作为满意答案的标准。移动问答服务与用户日常生活关系密切,因此社会化情感指标的体现尤为明显,提问者倾向于选择为其提供情感支持的答案,或欣赏或认同回答者的回答,回答者的实际经验和态度也是选择满意答案的重要标准。如表1所示。
表1 用户信息需求与答案选择相关性指标
2.3 用户答案选择相关性评价重要指标
上一节分析了移动问答用户信息需求与答案选择相关性指标,得出用户选择指标分为内容、效用、信息源、外部性和社会情感5大类别13项指标,同时作者根据移动问答服务的特性以及用户对于答案的需求,分析了13项指标所属的类别,并逐一对每一指标进行了相关说明,这13项指标同时也是用户采纳答案的偏好,如表1所示。为了进一步分析用户答案选择相关性重要评价指标,笔者从用户提问的角度和采纳答案的情况来考察移动问答用户选择满意答案的依据,相关性评价指标的分布反映用户对答案质量的偏好。基于此,笔者从问题的提问类型以及用户所采纳答案的内容进行分析,依据13项指标,并通过多名志愿者的反复讨论和确认,得出用户对于答案的需求或者偏好,如问题“今天晚上有什么足球比赛?”表达的是用户对于答案的时效性需求(表1),图1是最终分析出的指标分布结果。内容因素、效用因素和情感因素占了全部影响因素的83%,是影响用户采纳满意答案的重要因素。内容的准确性、专业性、完整性占了41%,因此信息内容的质量是用户使用移动问答服务最主要的需求。信息的准确性是判断信息是否正确有效的标准,用户使用移动问答服务主要来自于日常生活的需要,回答者主要依靠个人生活经验做出回答,一般来说,答案的来源没有明确的信息来源,因此答案的准确性更显得重要。平台上很大一部分答案只提供了片面或不完全的信息,用户在选择答案时完整性也成了重要标准。专业性指用户在移动问答平台上提问有关某一领域的专业性比较强的问题,特别是计算机通信和医疗保健等相关问题。
图1 用户答案选择相关性重要评价指标分布
情感类因素也是主要影响因素,而其中的认同感占了主要作用,说明当提问者提出讨论性问题或寻求意见类问题时,他更愿意选择与自己内心感受相同、相似或相关的答案,图1中情感支持因素占的比例较小可能是因为样本量较小,而且局限于已经被采纳答案的问题导致的,因为在数据集的标签里有大量关于感情、烦恼类的咨询,因此可以推断,用户在移动问题平台上也是想得到其他用户精神上的支持和情感上的鼓励。
效用类别下只有实用性和可用性两个指标,占了全部指标的15%,仅次于正确性、完整性、认同感指标,说明这两个评价指标均体现出很重要的地位。在移动问答服务平台中,提问者所提出的问题内容涉及生活的方方面面,多数结合了自己的实际处境,想要获得最有实际效用、最可行的帮助,移动问答用户有针对性地提出需求,也是更希望获得能解决自己特定问题的答案。
受到情境的影响,用户在日常行为活动中对信息的需求具有及时性和时效性的特点。移动问答平台服务处理的问题是最新的、当前的问题。用户有关体育运动、娱乐休闲的提问中都体现了问题的时效性特征。这类问题的答案一般属于事实信息,移动问答平台上,用户对这类简单的事实信息的答案一般都会满意。
同时,从内容的主题和范围看,提问的范围涉及了人们生活的很多方面,有关用户日常行为活动的问题能很快得到回答者的响应,说明用户对信息的需求比较具体、简单。在调查中发现,“百度知道”APP对用户提问的内容没有字数的限制,用户提问的字数从几个字到几百个字不等,但是80%以上的提问少于100字,这说明移动问答平台内容比较简单。而答案平均字数为31个字也说明移动问答能满足用户简单的信息需求,采纳答案的平均字数是45个字,说明用户需要的是比较详细完整的解答。
通过分析用户需求与信息内容相关性评价,发现移动问答平台用户想要得到的回复不单只是正确完整的答案,同时也更加注重情感的交互和实际问题的解决能力。影响用户对移动问答服务信息内容评价的重要指标是信息内容的正确性、完整性、专业性、及时性、时效性、可用性、实用性以及来自回答者的情感支持和认同感,如图1所示。
3 移动问答服务信息内容质量的优化
调查中发现用户对答案的采纳率比较低,也说明了用户对于答案的质量满意程度较低。但是信息的准确性、实用性、时效性、及时性、易获取性对移动平台用户确实非常重要。答案的及时和易获取是移动问答服务的一个特点,因此,答案质量的提升关键在于它的准确性、实用性和时效性。社会情感类因素也是主要影响因素,说明用户更愿意选择与自己内心感受相同的答案,需要其他用户精神上的支持和情感上的鼓励。从前文分析的结果来看,信息的效用价值也是用户的重要需求,但是信息来源的可靠和专业程度较低,因此结合移动问答平台的服务功能,可以从以下方面探寻优化答案的质量。
3.1 基于移动问答用户需求情境的信息内容提供
3.1.1 移动问答服务更关注的是用户的需求。与传统问答平台服务不同,移动问答平台用户更关注的是需求的满足和问题的解决,因此知识贡献者需要将自己拥有的知识或外部信息分析提取,结合提问者实际需求,融入自己的观点、看法或感情因素。
3.1.2 增强用户的归属感。用户需要在平台上寻找一些情感支持和鼓励,但是目前移动问答服务并没有像社交问答服务那样形成很多的交流圈,用户之间的交流一般只有问答交互,问题解决后用户的交流基本结束,用户之间的黏性较差。而移动问答APP用户是通过感兴趣的标签来实现交流,平台会通过感兴趣的标签来推荐问题,没有形成一种圈子的交流。因此可以设置圈子交流的功能,用户就自己感兴趣的话题加入圈子,这样就促进了用户间的交流,增加用户间的归属感。另一方面,平台可以通过一些热门话题的讨论来实现与用户的交互。
3.1.3 注重效用功能。移动问答用户提出的问题与日常生活相关,用户注重的是解决实际的问题,传统自动化问答系统使用简单问题进行提问,得到大量重复的信息,移动问答服务应该提供给用户的是能够解决用户在特定情境下解决特殊问题的信息,可以直接使用并且有效的信息,因此对问题的主题和标签的划分更要倾向于贴近用户的日常生活。
3.2 移动问答的个性化推荐
3.2.1 提供更精准的自动推荐系统。通过分析用户的浏览、提问和回答情况推测移动问答用户的信息需求和使用习惯,用标签和相似提问等功能向用户推荐其感兴趣和擅长的主题,同时用户提问的问题也会推荐给可能对此问题感兴趣的用户,这样就把问题推荐给了相关的回答者,而且也可以找到回答者感兴趣的领域。大多数平台的活跃用户对于使用平台的期望是以最小努力快速获得有效信息,因此为了促进这类用户从信息的搜寻者变为持续知识贡献者,可以向这类用户推荐其感兴趣或者擅长的问题,这样就能得到与之相匹配的答案,提高答案的质量。
3.2.2 电脑端“百度知道”上面把高知识贡献者评为“知道之星”“知道达人”“知道名人”“知道行家”等。移动端也可以根据用户回答问题的类型和采纳情况评出在某些专业或领域比较擅长的高贡献者。这样就可以根据用户的提问类型推荐给擅长此领域的知识贡献者,这种方法可以叫做专家推荐法,也有利于答案专业性程度的提高。
3.3 提高答案专业性的策略
移动问答平台答案的专业程度较低,而且答案是否是该领域的专家或从业者提供并不明确,一些专业性强的问题用户没有相关的能力和知识进行回答。因此,平台可以对用户的专业和职业进行划定,在基本用户信息注册当中就可以根据用户的专业和职业进行角色分配,用户的专业、职业、学历可以作为用户的标签,设定他回答问题的权限,同时采取一些激励措施鼓励这些专业用户持续地知识贡献。例如,医疗健康、计算机等需要专业回答的问题,就可以限定回答者的专业和学历或者职业,这样就避免了非专业用户对问题理解的偏差导致信息质量的下降。
另一方面,学者认为提供专业数字信息咨询服务的图书馆员能够提供高质量的答案,国外就有许多图书馆员参与到Yahoo!Answers平台提供高质量的信息咨询,并得到用户的认可。因而对于移动问答服务平台信息内容质量优化的方向,笔者认为可以考虑移动问答平台与图书馆合作的可行性,使得具有专业知识和咨询服务技能的图书馆员参与回答,以弥补移动问答平台答案专业性、完整性、可信度等方面的缺陷,提高信息内容的质量。
3.4 完善问题和答案的审核机制
调查中发现,问题得不到回答的原因主要是问题描述不清晰,导致回答者对提问者的需求不明确,回答率和回答质量就会降低。移动问答还会出现一些频繁重复提问的没有意义的问题和广告性质的问题。平台对于答案审核权限可以赋予广大用户,根据积分、等级的排名适当放宽用户对答案的审核权利,这将有利于平台中的信息管理,促进平台的优化发展。因此,完善审核机制,为用户提供比较良好的内容交互也尤其重要。
4 结 语
移动问答服务每天都在解决大量的问题,在一定程度上满足了用户日常生活各方面信息的需求。通过分析用户需求与信息内容相关性评价,发现移动问答平台用户想要得到的回复不单只是正确完整的答案,同时也更加注重情感的交互和实际问题的解决。影响用户对移动问答服务
信息内容评价的重要指标是信息内容的正确性、完整性、专业性、及时性、时效性、可用性、实用性以及来自回答者的情感支持和认同。移动问答平台用户倾向于在平台上学习、获取信息、解决问题、获得认同,因此提供及时、有用、高质量的信息内容可以促进用户持续使用问答服务。
总之,提高问答服务平台的内容质量和及时性,提升用户的体验,增强用户归属感以及平台使用的便捷性是有效促进移动问答平台用户持续使用的关键。而这些服务功能的实现需要靠技术集成,内容满足用户的需求是基本,技术层面的实施是质量提升和服务优化的可行性保证。
[1]Lee U,Kim J,Yi E,et al.Analyzing crowd workers in mobile pay-for-answer q&a[C]∥Proceedings of the SIGCHI Conference on Human Factors in Computing Systems.ACM,2013:533—542.
[2]Lee U,Yi E,Ko M.Mobile Q&A:Beyond Text-Only Q&A and Privacy Concerns[EB /OL].[2015-04-01].http:∥mslab.kaist.ac.kr/wikipages/files/mobile_qa_cscw_workshop.Pdf.
[3]马 芳.信息检索中的相关性研究[J].科技情报开发与经济,2009(19):89—90,97.
[4]Cosijn E,Ingwersen P.Dimension of relevance[J].2000,36(4):533—550.
[5]Barry C L,Schamber L.Users’ Criteria for Relevance Evaluation:A Cross-Situational Comparison[J].Information Processing & Management,1998(34):219—236.
[6]SaracevicT.Relevance:A review of the literature and a framework for thinking on the notion in information science[J].Journal of the American Society for Information Science and Technology,2007,58(13):2126—2144.
[7]吴瑞红.互动问答社区中回答可信性分析[D].北京:北京信息科技大学,2013.
[8]张豪锋,边会艳.研究生网络问答社区使用现状调查与分析[J].现代教育技术,2012,22(6):84—87.
[9]刘乙蓉,刘 芸.问答平台中的答案聚合及其优化:以Quora为例[J].图书馆学研究,2017(6):48—56,13.