OPAC用户生成内容优化
2014-02-12黎邦群
黎邦群
OPAC用户生成内容优化
黎邦群
文章针对当前图书馆OPAC网站的用户生成内容缺少优化而影响检索体验的现状,进行用户生成内容优化的影响因素及具体策略的研究。通过探讨用户生成内容优化的用户、质量及价值等影响因素,研究用户培养、质量控制及价值挖掘等策略,并在此基础上,从影响用户的积极性、产生纠纷风险及加重工作人员负担等方面对优化的负面效果及改进措施进行了详细的分析,从而就用户生成内容的优化给出了合适的建议,呼吁图书馆重视优化工作,以期提高OPAC用户生成内容的质量,提升用户的检索体验,维护图书馆的良好形象。
OPAC 用户生成内容 内容优化 质量控制 用户培养 用户体验
0 引言
近年随着Web 2.0的概念及用户参与的理念深入人心,OPAC网站的用户生成内容(User Generated Content,UGC)与日俱增。用户输入的检索词、检索行为及其特征等隐性内容和书评、标签及留言等显性内容,逐渐成为书目元数据必要的有益的补充,但与书目数据相比,用户生成内容明显存在着信息准确度不高与格式不规范、侵犯隐私与版权、不良信息与行为等弊端,严重影响了图书馆的形象与用户的检索体验,亟需优化。
然而,目前针对OPAC内容的优化,多集中于书目元数据,如数据规范[1]、质量控制[2]及编目建设[3]等,很少关注用户生成内容。文献检索结果显示,相关的理论研究明显滞后于实践,尤其缺少以影响因素为视角来系统地论述具体的优化策略方面的研究。
1 影响因素
1.1 用户因素
用户生成内容属于一种劳动密集型的信息生产模式,生成的过程离不开用户,内容优化的影响因素与用户密切相关,包括用户特征、用户动因与生成模式等用户因素。
(1)用户特征。OPAC用户为图书馆的读者,包括高校图书馆的教师与学生、公共图书馆的普通市民、科研工作者与学术研究者等,分布广泛。OPAC从以编目元数据的聚合、发布及浏览为主的Web 1.0发展到了以用户的参与、互动及传播为主的Web 2.0,其用户已从早期的被动接受与有限参与,发展为主动参与和自我创造内容,用户性格特征由含蓄内敛到个性张扬,完成了角色转换,从而奠定了用户驱动的数字信息资源建设与服务的基础。
(2)用户动因。OPAC用户在生成内容的过程中往往受到兴趣、利他主义、易用性、乐趣、社会身份认知、机会主义和个人声誉等不同因素的影响,具有不同的强度和指向。用户动因在宏观上受OPAC功能及图书馆服务观念等外部因素的影响,在微观上受使用心理、检索行为等内部因素的影响,具有动机复杂、自主性强、难以控制等特点。用户生成内容的详细动因包括5个方面:①价值表达。用户利用OPAC的相关开放平台表达自己的价值观。比如发表特定图书的阅读见解和主观感受,表达自己的价值观;或对其他用户的书评内容与观点进行响应、探讨及争鸣。这些价值观带有鲜明的情感倾向;②功能反馈。用户对OPAC的功能、属性与性能进行评价、判断,提出需求与建议。比如用户分享图书检索的经验与技巧,披露相关功能的细节等;③知识诉求。用户为了获取新的知识,就某一疑难问题向同行询问、请教或求助,其他用户答疑解惑,提供帮助;④检索需求。用户利用OPAC的书目检索程序查询所需图书,由此生成检索词、检索习惯与行为等隐性知识内容;⑤交友从众。用户利用OPAC的读者交流平台来寻找志同道合的朋友或受其他用户言论的感染而直抒胸臆。这类用户为了结交关系、提升品位或消磨时间而生成内容。
(3)生成模式。用户动因所表现出的心理活动和行为特征不尽相同,并对生成模式产生影响。独立自主式、协作关联式以及两者结合式是OPAC用户生成内容的主要模式。独立自主式是指用户生成内容的过程完全独立,不需要其他用户的参与和帮助,如用户单独添加个性化的虚拟书架的过程。协作关联式是指多名用户共同参与,围绕某一具有关联性的主题展开创作与分享,不断完善与丰富生成的内容,如多名用户针对某条书评而展开的讨论。两者结合式是指用户生成内容既存在单一用户的独立贡献,又存在多名用户的共同协作,如热门图书标签云图的形成。
1.2 质量因素
传统OPAC的基本内容即书目元数据主要由图书馆编目员生成,具有规范化、权威性、客观性及可信性等专业特征。用户生成内容则具有很大的随意性,加上监管困难,相关法律和政策缺位,造成了种种的质量隐患,主要表现形式如下:
(1)劣质数据。用户生成内容的质量低劣,对其他用户的参考价值不大,或者毫无价值,甚至存在负面价值。包括无关、重复、片面、偏颇、偏激或错误的观点。
(2)不良信息。随着用户生成内容的蓬勃发展与用户普及而激增的垃圾与虚假信息、违规内容与版权信息、隐私信息与谣言等垃圾2.0[4],几乎伴随着Web 2.0的流行应运而生,成为危害网络与社会的毒瘤,典型特征包括内容与作者相似,目标、时间与IP地址集中等。
(3)不良行为。即用户恶意的检索、点击、访问、推荐、投票等行为。比如连续不间断地刷新某页、检索重复的关键词等行为,多集中于用户生成的隐性内容方面。
这些劣质或不良的数据、信息及行为不请自来,对用户造成困扰与误导,广遭诟病,浪费了有限的网络带宽与OPAC系统资源,并造成图书馆相关统计结果的不公正。
1.3 价值因素
OPAC用户的性别、专业、阅读兴趣和爱好不同,价值观与偏好、需求与行为千差万别,导致用户生成内容复杂多样,具有多元化与差异化、分散性和无序性等特征,可靠性、权威性和价值得不到保证。实际上,互联网中大部分用户生成内容贡献的价值都不高。虽然用户生成的隐性内容蕴含了丰富的主观观点资讯,但并不会实时地共享给其他用户,价值尚有待发掘。显性内容受表达方式、语言提炼能力的影响,传递的价值可能与用户生成的初衷存在一定的出入,导致其他用户的阅读与理解出现偏差,价值也受到影响。
2 优化策略
用户生成内容对图书馆而言,既是“馅饼”也是“陷井”。为了降低劣质数据、不良信息与行为的存活率,提高内容的质量,必须对其予以优化,以去伪存真,去粗存精。根据其影响因素,相关的优化策略如下:
2.1 用户培养
OPAC用户生成内容的参与者可分为以下几类:一是潜水者或围观者即普通看客,看完即走,什么都不留下;二是核心贡献者即忠诚粉丝,与OPAC充分互动,并真正参与建设;处在两者之间的是一般的参与者和协作者、传播者。图书馆需要把握贡献来源,查看用户信息,并对贡献用户进行收藏、评级、分组、建群及备注等。
(1)用户自律。包括用户约束自己与监督他人。从自我约束的角度看,用户需要提高自身的道德素养;从监督他人的角度看,用户需要抵制各种不健康、不文明的信息。互联网的自由性和开放性,导致部分生成内容的匿名性。一般的用户缺乏明显的自律意识,应加强教育与培养,促进用户生成内容的健康发展,使OPAC成为安全、可靠、清洁的网络空间。
(2)用户基数培养。用户基数是指网站形成的相对固定的活跃用户数量。过少的用户基数,不利于内容的聚合,无法吸引新用户加入。优质内容的生成离不开增长强劲的用户基数支持。图书馆可以通过宣传推广OPAC网站、提升用户检索体验等举措,培养一定的用户基数与相对固定的核心用户群。
(3)意见领袖发现。意见领袖是指少数贡献频率和贡献数量极高的用户,经常提供信息,同时对他人施加影响的活跃分子[5]。其他用户经常对意见领袖贡献的内容表示认同、呼应、追随或反对。OPAC不乏意见领袖,具有对内容进行加工与解释、扩散与传播、支配与引导、协调或干扰等作用,并对追随者产生影响力,左右舆论走向。可通过社会学技术、关键信息提取及问卷调查等途径来识别意见领袖,从影响力、支持力等方面刻画意见领袖。
2.2 质量控制
用户生成内容质量控制工程师已成一门新职业,优秀人才备受争夺,体现了用户生成内容质量控制的重要性与紧迫性。OPAC用户生成内容的质量控制策略对用户的使用权利、义务与行为责任进行界定,并明确图书馆的防范与发现、作为与不作为等义务和责任。
(1)制度监管。为了控制用户生成内容的质量,必须制定相应的管理制度对用户行为的随意性加以规范,并认真贯彻执行。管理制度中包括奖励与惩罚条例,督促用户发表或编辑合适的内容,提醒用户遵守法律法规,注意网络道德。奖励措施包括激励用户多贡献高价值内容的机制,惩罚措施包括删除用户内容、禁言与注销账户等。图书馆可以订立类似《新浪微博社区公约》[6]的管理制度及行为准则,约束用户行为,作为《信息网络传播权保护条例》等具有强制性约束力的正式的网络监管法律的补充。
(2)技术治理。为了规避风险和防范不良信息与行为,需要积极采用内容识别和过滤技术,对用户生成内容进行技术治理与数据清洗,以净化OPAC的内容,给予用户更好的体验。如改进用户提示系统,随时提醒用户注意网络言行;在允许用户生成内容的所有OPAC网页上,添加一个“报告违规行为”或“违法和不良信息举报中心”的链接,以便用户举报发送不良信息的嫌疑者;根据需要过滤大量转载和非法链接等不规范的内容,比如过滤字符数在20个以上的书签或10个以下的书评;建立违规关键词数据表,对不良信息及检索词进行关键词过滤;运用SQL语句检索内容数据库,禁止发表重复内容等。
(3)人工审核。OPAC虽为非营利性网站,图书馆仍需对用户生成内容的保存和发表负责。由于用户群体的多元化和多样性,生成内容的质量参差不齐,制度监管与技术治理存在一定的局限性。图书馆应制定内容审核机制,并配备专门人员成立检查小组,主动检查OPAC热门网页,每周至少检查一次。对内容进行长期的人工评估、甄别、筛选和分析,推荐优质内容,发现并及时屏蔽不良信息与行为。针对访问统计结果显示比较热门的信息,予以高度关注,作出清醒而冷静的判断。人工审核的好处不言而喻:根据《信息网络传播权保护条例》规定,只要图书馆及时删除侵权信息,就可以免于承担赔偿责任。
(4)与其他网站交换数据。图书馆可以通过与其他网站交换高质量用户生成内容的方式来丰富自身的OPAC内容,交换的内容包括但不限于图书封面、责任者简介、文摘或摘要、全文目录、标签或书评等数据,以弥补OPAC网站用户生成内容价值低、图书信息揭示简单的缺陷,更好地满足用户深入了解图书相关信息的需求。与其他网站进行相关信息的交换与整合,是Web 3.0概念中最重要的特征与理念。
2.3 价值挖掘
(1)检索词与检索行为挖掘。在质量控制的基础上,利用偏好信息处理与个性化检索技术,通过分析用户的行为特征,帮助用户寻找高质量内容。检索词与检索行为属于隐性内容,需要进行数据挖掘才能体现价值。OPAC检索框是用户向图书馆提交信息需求最直接最便捷的入口,检索词是反映用户信息需求最紧要的数据,检索行为表达了用户最明确最迫切的想法。检索词及用户的检索行为隐含了用户对书目的评价和需求,蕴藏了丰富、未知、有用的知识,对图书馆的个性化主动服务、关联性内容推荐、学科文献资源建设决策、业务管理优化等非常有价值。笔者曾对检索词和检索行为进行收集、利用、挖掘和整理,设计和实现了OPAC拼写检查[7]、检索建议[8]及书目纠错[9]等功能,以挖掘用户生成内容的价值。
(2)用户主观观点分析。用户生成内容由用户直接贡献,蕴含了用户所表达的主观观点,例如需求、疑问、建议及评价等,应对其予以深入分析,以了解用户需求,把握用户行为。主要工作包括主观观点表达的发现与主观观点的抽取等。如运用相关的机器学习算法与计算机技术,通过对内容进行词法、语法分析,利用词语、语法、位置等特征,识别内容中体现主观观点句子,判断观点属于哗众取宠还是真知灼见,抽取出评价对象和用户喜好等。这对分析与判断用户的检索需求与意图,开展个性化的图书推荐等特色服务不无裨益。
2.4 负面效果与改进措施
用户生成内容优化的效果评价应以提升OPAC用户使用体验为目的和标准,因此,相关的优化策略不可避免地将会产生如下的弊端:
(1)影响用户的积极性。质量控制策略中的制度监督、技术治理、人工审核等举措,如对用户造成了过多的干涉与管制,容易剥夺其自主性,导致其参与积极性降低,打击了其热情与意愿,不利于内容的即时发布分享,对生成的氛围与环境造成负面影响。因此质量控制措施应做到“润物细无声”,尽量让用户感觉不到束缚。图书馆在制订相关的制度条款时,要注意措辞友好、语句温馨,争取获得OPAC用户的广泛认同。
(2)产生纠纷风险。用户可能会对图书馆处理违规内容的行为产生抵触情绪,对违规的判别标准及执行力度产生怀疑,对惩罚措施产生反感,并由此带来各种争执与纠纷风险。制度条款应尽量清晰明了,处理过程透明,以免产生歧义与错觉,力争减少争议。处理违规用户既不能纵容与姑息,又要避免过度刺激用户,力戒粗暴的网络“执法”行为,耐心细致地做好受罚用户的解释与安抚工作。例如,可以用隐藏灰色地带的内容并进行提醒、警示与教育等组合行为来替代强硬删除等单纯的处罚手段。
(3)加重工作人员负担。OPAC用户生成内容优化是一项长期工作,需要图书馆持续地投入大量的人力,这无疑会加重工作人员的劳动强度,给本来就在人员编制与人力资源上捉襟见肘的图书馆带来额外负担。但是相比优化的需求与价值,这种投入无疑是值得的。仅凭图书馆一己之力难以面面俱到,可以招募内容优化的志愿者,组织热心用户成立自律小组,给予核心用户更大的网络自治权,以减轻工作人员的负担。
3 结语
采用Web 2.0技术生成内容来弥补传统OPAC书目信息量不足的缺陷,对馆藏进行全面、准确、实时的揭示,增加图书馆网站的用户粘性,是OPAC革新的要求。优化用户生成内容,去其糟粕,取其精华,是用户的强烈需求与图书馆义不容辞的责任,对于提高OPAC口碑和促进品牌建设,具有现实意义和直接影响,图书馆应予以足够重视并实施积极有效的策略。用户生成内容的发展趋势是融合化、大众化与移动化。随着移动互联网的高速发展,移动用户生成内容势不可挡,成为互联网的新热点。手机等移动终端能与用户产生更好的互动性,更贴近用户,移动用户生成内容将随着移动终端功能的增强而越来越丰富,相关优化的研究近在咫尺。
[1]胡良.新印古籍书目数据建设探讨——以中国人民大学图书馆为例[J].图书馆工作与研究,2013(2):78-80,93.
[2]易向军.联机编目环境下书目数据规范控制研究[J].中国图书馆学报,2011(6):120-124.
[3]周小敏.全国图书馆联合编目中心书目数据质量控制[J].图书馆建设,2011(2):56-59.
[4]HAYATI P,POTDAR V,TALEVSKI A,et al. Definition of spam2.0:new spamming boom[C].Digital Ecosystems and Technologies,2010:580-584.
[5]王培.我国大众虚拟社区意见领袖舆论影响力研究[D].长春:东北师范大学,2009:4-2.
[6]新浪微博社区公约[EB/OL].[2013-03-07].http://weibo.com/z/guize/zhengqiu.html.
[7]黎邦群.OPAC拼写检查功能的设计与实现[J].图书馆学研究,2012(4):73-79.
[8]黎邦群.基于数据特征的OPAC简单检索及检索建议[J].图书馆论坛,2012(1):65-68.
[9]黎邦群.OPAC书目纠错功能的设计与实现[J].大学图书馆学报,2012(1):59-63.
UGC Optimization for OPAC
LI Bang-qun
On account of the poor search experience caused by the lack of UGC optimization for library OPAC,the paper studies the influence factors like users,quality and value of UGC;as well as the strategy of UGC optimization,such as user training,quality control and value mining.The author does detailed analysis of the negative effects and the improvement measures of UGC optimization from user's enthusiasm,potential disputes,increasing librarian workload,etc.;then,makes suggestions to optimize the UGC for OPAC;and calls for library's attention to the optimization,so as to improve the quality of UGC,enhance the search experience,and promote the image of library.
OPAC;UGC;content optimization;quality control;user training;user experience
格式 黎邦群.OPAC用户生成内容优化[J].图书馆论坛,2014(1):80-84.
黎邦群,男,惠州学院图书馆副研究馆员。
2013-03-07