影响高质量网络问答系统建设的因素
2017-04-01任梦婷王娟阮佩姗刘振盼
任梦婷++王娟++阮佩姗++刘振盼
摘 要:网络问答系统在我们日常生活知识的分享和传播中扮演着至关重要的角色,提高用户满意度是创建一个高质量问答系统的先决条件。为此,文章根据“关于网络问答系统的认知调查问卷”的结果进行分析研究,同时融合国内外相关方面的研究成果,得出以下结论:用户满意的程度是评价问答系统质量的标杆,即构建高质量网络问答系统的最终因素。
关键词:网络问答系统;问卷调查;用户满意度
中图分类号:F253.9 文獻标识码:A
Abstract: The Q & A system plays a vital role in the sharing and dissemination of our daily life knowledge. Improving user satisfaction is a prerequisite for creating a quality Q & A system. Therefore, according to the results of the questionnaire on the question and answer system of network question-answering system, this paper combines the results of domestic and foreign related research, and draws the following conclusions: The degree of user satisfaction is the benchmark of evaluating QA system quality, The final factor of constructing high quality network question answering system.
Key words: Q & A system; questionnaire; customer satisfaction
1 问答系统
1.1 定义
问答系统(Question Answering System, QA)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。
1.2 问答系统的一般处理流程
给定一个问题,问答系统的处理流程一般如下:首先分析问题,得到问题的句子成分信息、所属类别和潜在答案类型等信息;然后根据问题分析得到的信息,进行数据集中得到可能含有答案的数据,这缩小了进一步精确分析的范围;在得到的小范围数据中采用各种技术提取答案或者答案集合;最后将答案返回给用户[1]。问答系统的一般处理流程如图1所示:
1.3 问答平台特点综述
问答平台的服务界面是用户获取积极体验的首要因素,为了确保用户能够方便、快速和有效地提出和解答问题,大多网络问答平台的界面都追求简洁、清晰。在问答模式上,除Google Answers因为采取收费模式需要将问题定价并邀请专家解答外,其他平台均采取提问—回答式。Google Answers的答题专家必须通过严格选择程序,而其他平台会聘请特邀专家或者由具备某些领域专业知识、见解和经验的网络用户回答问题。奖励机制各有特点,但均以提升用户满意度为宗旨。问答平台允许用户自由提问和回答问题,因此,对提问以及答案的质量控制成为确保问答平台稳健发展的关键因素。由于各类问答平台还处于发展初期,虽有审核人员,但更多还是依赖于用户对自身行为的控制。表1为国内外一些具有代表性问答平台的特点[2]。
2 文献综述
国内外学者主要围绕网络问答平台的概念与类型、功能特点、互动机制、用户分享行为及采纳因素等展开研究。关于问答系统的定义,很多的研究者都给出了各自的说法,但大都可将其理解为一个高级的信息探索平台。刘梦黎(2014)提出从便利研究的角度出发,网络问答平台被分成四类:搜索引擎型、文献整合型、社交网络型和实名社区型[3]。而毛先领(2011)则提出根据处理数据的不同,将问答系统分为三类:基于结构化数据的问答系统、基于自由文本的问答系统和基于问题答案对的问答系统,同时他在《问答系统研究综述》文章中给出了问答系统的一般处理流程。吴丹、刘媛、王少成对一些典型的中英文网络问答社区的基本信息、交互性、个性化服务等方面进行了比较研究与评价实验[4]。陈晓宇、邓胜利、孙雅梦(2014)以知乎为例,对网络问答社区用户信息行为进行了研究,认为网络问答社区用户信息行为可以具体理解为三种知识行为模式,分别是:知识搜寻行为、知识贡献行为和知识采纳行为[5]。Nikhil Vithlani等人(2015)设计了一个小规模的Social Q & A系统,并且对其进行全面的大规模仿真评估,由此严密而完整地分析了在线社交网络答疑系统[6]。一般认为,Joseph Weizenbaum在1966年左右实现的“Eliza”是第一个问答系统,而国内第一个中文互动型问答产品是新浪爱问知识人。
3 问卷调查结果与分析
3.1 问卷设计
依据本文的研究内容,设计了一套问卷。针对现有及潜在用户进行调研,了解当前网民对网络问答系统的认知及期望。本调查问卷涉及17个问题,题目包括客观题与主观题,由此尽最大可能吸收全面、合理且新鲜的观点。
问卷分为两种形式:自填问卷和访问问卷,问题答案的类型包括三种:结构式、开放式和半结构式。问卷结构包括三类变量,即客观因素、认知因素以及行为因素。客观因素主要包含问题如下:受访者的年龄、性别、身份等;认知因素包含的问题主要有:目前对网络问答系统的使用程度、常用的问答平台有哪些、描述对网络问答平台的观点和看法等;行为因素包含的问题主要有:在网络问答系统中的行为是什么、选择网络问答平台的考虑因素、对网络问答平台的建议及意见等。
问卷回收之后进行筛选,删除不合格的问卷,利用对比分析等方法来得出结论。
3.2 受访对象
本问卷的受访对象为全国范围内不同年龄层次的网民,主要受访对象为:在校大学生、高校老师及社会各界人士。不同用户群体对网络问答系统的认识和期望可能会受到其群体特征的影响。大学生作为拥有较多空闲时间和一定知识素养的特殊群体,其思想很大程度上受到学校或老师的影响,但他们中不乏在某一方面具有独到见解的。除此之外,社會广大网民对网络问答平台的看法更具有多样性和针对性,并且已工作的社会人士较多具有不同于在校学生的成熟而全面的观点。因此,本问卷调查对象覆盖面较广,代表性较强,具有一定的参考价值。
3.3 正式调查
在完成原始问卷之后,又征求相关人员和专家意见对原始问卷中个别题目进行了修改,同时抽取30人为试测样本,以检查问卷表述的方式、项目、内容能否被受试者所理解,然后将问卷发放给了高校不同年级学生和社会群众进行填写。
问卷形式包括纸质问卷和网络问卷两种,问卷总数为380份,回收数目366份,有效问卷359份,占94.5%。
3.4 数据分析方法
使用Excel 2010和问卷网自带功能对调查问卷结果进行分析处理。本调查问卷将问题归类并分为若干维度,同时运用样本对比分析法,将不同类别的受访群众的观点进行对比分析,得出最终结论。
3.5 调查结果分析
3.5.1 受访者的客观基本情况
本问卷受访者大学生居多数,性别基本各半,年龄层次不一,但以18~25岁为主。具体如表2:
3.5.2 熟悉程度及使用频率
在参加调查的网民中,65.67%的人对网络问答社区的熟悉程度尚可,同时有18.45%的人表示非常熟悉,这证明网络问答社区的确很大程度上进入了广大网民的视野。对事物的认可很大程度上表现在其使用的频率大小,在众被访者中通过网络问答平台获取过知识或信息的占绝大多数。
3.5.3 互动频率
使用并不代表参与,对问答平台的发展起到推动性作用的最终还是网民的参与互动程度。从搜索引擎到问答社区的转变就是用户的参与互动性,知识库的构建更多地依赖于普通用户的贡献而非占极少部分的专家。大多数被访者不参与问答互动的原因是由于互动方式不够便利或者互动界面过于复杂。由图2、图3用户提问和回答的情况得知用户在社区中的参与程度不是很积极,这就表现出现存网络问答平台对用户的激励制度有待提升。
3.5.4 关注内容
问答社区应当以满足用户的需求为宗旨,是否存在用户需要的内容决定着用户使用量。服务用户第一步就是得知用户的关注点从而进行改正或添加。超过一半的人通过问答社区寻找技能技巧知识类信息,可见常识知识库的建设对于问答系统的质量有很大的影响[7]。而近四分之一的人为了阅览社会热点或话题评论,只有少数人通过问答社区搜寻生活情感中存在的问题,说明人们更关心社会问题而非自身问题。了解用户的关注内容可有效提升网民们对于问答社区的绩效期望。根据问卷中“最渴望在网络问答社区中获得什么”一题的答案可知,知识是网民们最想得到的,但是他们想得到的不仅仅只是知识,具体如图4所示:
3.5.5 信任度
对问答平台的信任度是支持度的重要保证,提升用户信任度的方法主要有:(1)保护用户隐私。(2)保证答案质量。(3)透明的参与规则。(4)人性化的客服。就调查结果来看,绝大多数网民对于网络问答社区有不同程度上的信任,然而,仍有少数人明确表示不信任,并且近70%的调查者在网络问答平台获取信息后会通过其他渠道进行考证。网民们认为有些答案过于表面,不够深刻,大多是经验之谈,没有经过考证,实用性一般。这就需要问答社区对知识源进行过滤与筛选,从而保证答案质量以提高用户的信任度。问卷中的开放性问题涉及关于网络问答社区的建议时有被访者答道:“安排专业人员识别不可靠信息,杜绝虚假荒诞”。由此可见提高网民的信任度对于满意度的提升是至关重要的。
3.5.6 关于时间
提问者将问题发布后很有可能无法立即得出答案或者说满意的答案,此时就需要等待一段时间来得到理想的回复[6]。问卷显示,67.38%的被访者不愿意等待较长时间以得到相关的回答,他们更期待问答社区存在完全贴合自身需要的答案来等待自己提出问题,这就需要建设具有强大内容的常识知识库。从另一方面来说,涉及某些时效性很强的问题,等待时间越长意味着答案的实用性大打折扣。
3.5.7 社区知名度
问答社区的知名度自然会成为潜在用户选择的重要因素,根据调查,具有代表性的网络问答社区中,百度知道的吸引力高居榜首,其次分别为知乎,Google answers,新浪爱问。然而网站知名度高也暴露出更多的缺点,比如有被访者提出百度知道广告过多,而知乎“大V效应严重,往往抖个机灵能获得高赞,踏实答题的反而无人问津”。除此之外,交互平台的建设对于用户满意度有很大的影响,历经长时间的考验后网民们所感受到问答社区在相关技术、设备方面对系统使用的支持程度应当只增不减。同时问答社区必须有自己的特色,以此来吸引更多的忠实用户。
3.5.8 理想社区状态
根据被访者的回答,问答社区最应具备的特点依次是内容可靠、回答易于理解、用户知识素养好、原创性好、互动方式吸引人、页面设计美观、娱乐性强。这充分证明了问题和答案质量的重要性。同时有被访者提出问答社区的问题“应该偏向于归类化,能让人操作更简单,更容易找到适合不同人群的答案”。而内容可靠是受访者公认的网络问答社区必备条件,这包括答案的可靠性以及答案发布后评论区的言语真实性。相比之下娱乐性却显得没那么重要,可见广大用户更注重问答社区的知识性而非娱乐性,专业性是网民们追求的首要条件。除此之外内容的真实性、实用性以及原创性也显得尤为重要。值得一提的是,网络安全性始终是用户不会忽略的内容,马斯洛需求金字塔中安全需要是排在第二位的,仅次于生理需要。可见一个高质量的网络问答社区必须足够重视用户在问答社区中的安全。
3.5.9 参与方式
通过调查用户对网络问答社区的参与方式可以更好地建设问答系统。调查显示,大多数网民喜欢充当提问者和信息被动接受者的角色,可见广大网民分享自己所见的意愿并不强烈。由此可以得知现存网络问答社区的激励机制并不十分吸引用户,同时有被访者表示用户界面内容不够完美和独特,使得用户的切实体验并不十分美好。
4 结果讨论
4.1 结论及建议
分析以上数据可得影响用户满意度即高质量网络问答系统构建的因素,由此针对各类问答系统的建设提出以下几个方面的建议:(1)提高用户熟悉程度,使用及互动频率。对于问答社区的熟悉程度越高,表明用户对其了解越深刻,从而满意度较强,因而会增加对平台的使用及互动频率。(2)随时调查用户关注内容。作为信息交流平台,用户关注的才是焦点,才是值得挖掘与提供的。(3)提高用户对问答社区的信任度。对于某种事物,信任才会接受乃至对其满意这是毋庸置疑的。从答案的真实性到用户的安全性,问答系统要做到坚决维护用户的自身利益。(4)重视问题与答案的时效性。根据研究表明,一般情况下问题与答案相隔时间越长用户的满意度越差,问题自身具有的时效性使得用户不愿意花较长时间去等待。(5)提高社区知名度。长时间的经历与蜕变会打造一个群众基础很强的网络问答社区,而对于新进入市场的社区则需要更大的努力与之抗衡,如何探寻自身独有的特色是问答系统应当考虑的重要问题。(6)遵循用户意愿建设问答系统。社区建设是否真正符合用户的心意,这其中包括用户界面、个人中心、互动机制等各方面的建设。(7)健全激励制度。问答系统要及时测试现存激励制度是否能够满足用户需要,并非激励机制越完备问答系统质量越高,真正符合用户需要的才是最应当提倡的方式。
4.2 研究局限性
首先,由于问題数量及样本量有限,本文基于某些网络问答社区的研究结果是否可以应用于整个网络问答系统仍然是值得怀疑的。其次,本文的问卷调查主要调查了用户对问答社区的整体认知,但没有从实践方面验证所得结论。
由于本次的受访者绝大多数是在校大学生以及研究生,而社会不同层面的网民相对较少,学生对于事物的看法不是非常成熟或深刻,所以认知上或许同网民们有较大偏差。此外,分析问卷的方法较为单一,问卷设计具有某些缺陷等都会对研究结果产生一定的影响。
参考文献:
[1] 毛先领,李晓明. 问答系统研究综述[J]. 计算机科学与探索,2012(3):193-207.
[2] 邓胜利. 国内外交互问答平台的比较及其对策研究[J]. 情报理论与实践,2009(3):50-55.
[3] 刘梦黎. 网络问答平台的四种科学传播模式研究[D]. 南宁:广西大学(硕士学位论文),2014:10-24.
[4] 吴丹,刘媛,王少成. 中英文网络问答社区比较研究与评价实验[J]. 现代图书情报技术,2011(1):74-82.
[5] Xiaoyu CHEN, Shengli DENG. Influencing factors of answer adoption in social Q & A communities from users' perspective: Taking Zhihu as an example[J]. Chinese Journal of Library and Information Science, 2014(3):81-95.
[6] H. Shen, G. Liu, N. Vithlani. Social Q & A: An Online Social Network Based Question and Answer System[C] // 2015 24th International Conference on Computer Communication and Networks (ICCCN), 2015.
[7] 汤赛丽. 常识知识问答系统中知识库构建的研究与设计[D]. 开封:河南大学(硕士学位论文),2005.