APP下载

用户协同标注行为特征研究

2021-08-06冯翠翠易明莫富传

现代情报 2021年8期

冯翠翠 易明 莫富传

摘 要:[目的/意義]在社会化标注系统中,用户通过自建或引用标签对资源进行标注,最终形成反映大众分类标准的社会化高频标签集。分析用户协同标注行为的特征,有助于促进对协同标注过程和大众分类标准涌现的认识和理解。[方法/过程]本文采集豆瓣网的电影标签数据进行实证分析,揭示社会化标签系统中用户协同标注行为的特性和规律。[结果/结论]研究发现,用户协同标注行为呈现以下特征:用户倾向于使用多种类型的标签进行标注,但大众标签构成了高频标签群的主体;高频标签的首创者并非为系统的资深用户,但得到大量用户的追随;用户标注行为由自建标签到引用标签并形成高频标签表明大众分类标准最终涌现。

关键词:协同标注;社会化标签;个性化标签;大众分类

DOI:10.3969/j.issn.1008-0821.2021.08.003

〔中图分类号〕G254.1 〔文献标识码〕A 〔文章编号〕1008-0821(2021)08-0027-09

Research on the Characteristics of Collaborative Tagging Behavior

——Based on the Empirical Analysis of Douban Movie Label Data

Feng Cuicui1 Yi Ming1 Mo Fuchuan2

(1.School of Information Management,Central China Normal University,Wuhan  430079,China;

2.School of Information Management,Wuhan University,Wuhan 430072,China)

Abstract:[Purpose/Significance]In the social tagging system,users tag resources through creating or citing tags,and finally the High-frequency social tags set that reflecting the folksonomy have emerged.Analyzing the characteristics of collaborative tagging behavior is helpful to understand the process of collaborative tagging and the emergence of folksonomy.[Method/Process]Taking Douban movies tags data as an example,this paper analyzes the characteristics and rules of users collaborative tagging behavior in the social tagging system.[Result/Conclusion]It is found that the characteristics of collaborative tagging behavior are follows:Users tend to use multiple types of tags for tagging,but public tagging constitutes the main body of high frequency tags.Most of the creators of high-frequency tags arent the senior users of the system,but are followed by a large number of other ordinary users.The formation of high-frequency labeling shows that the folksonomy finally emerged.

Key words:collaborative tagging;social tags;personalized tags;folksonomy

社会化标签系统为用户的协同信息行为提供了良好的平台,也为协同信息行为方面的研究提供了极大便利。在社会化标签系统中,用户通过自建或反复参考、借鉴和引用已有标签对资源进行标注,最终形成“用户—资源—标签”三元交互的动态网络关系和反映大众分类标准的社会化高频标签群。社会化标签既是用户对网络信息资源所定义的一个或多个描述,是对网络信息资源的内容的凝练;也是一种准确、开放的分类方式,帮助用户通过社会化标签查找优质的信息资源。

目前,协同标注行为得到了国内外研究人员的广泛关注,使之逐渐成为信息管理领域的研究热点之一。但现有研究主要关注协同标注行为的内涵、动机和影响因素等内容,部分学者从标签角度对协同标注行为中的标签功能类型[1]、标签词汇频率及词汇共现频率[2]、中文博客平台标签标注特征[3]等进行分析,尚缺少用户在参与协同标注过程中的个体及群体行为特征研究。本文采集豆瓣网的电影标签数据进行实证分析,分析社会化标签系统中协同标注行为的参与用户、用户标注行为和用户认知演化过程等方面的特征,以揭示社会化标签系统中用户行为和标签使用的特性和规律。

1 协同标注行为概述

目前,学界从行为学和信息组织学等角度界定协同标注行为的内涵。从行为学的角度出发,研究人员认为协同标注行为是指众多用户协作参与的标注行为。例如Voss J认为,协同标注指的是众多用户协作完成的标注行为,用户通过添加标签以达到个人的或者社群的目的,这种零散的且是个人的行为在大量草根用户的协同参与下具有了社会性价值[4-5]。李京生认为,用户可以对自己发布的信息进行标注,也可以对其他用户发布的信息进行标注,当多个用户对多个对象添加标签时,标签就具有了社会性,也就成为了社会化标签[6]。从信息组织学的角度出发的研究者将协同标注行为视为一种对目标资源进行分析并赋予标签的过程。杨青云等认为,协同标注是众多信息用户根据自己的需求,选择合适的网络信息资源,并根据自己的认知水平,确定与之相匹配的社会化标签进行标注的过程[7]。Zauder K等认为,协作标注是用户在在线社区中浏览或者收集网上资源时,以非受控的词语为资源标注标签,用以表明该资源的主题、性质和主要内容等[8],反映了标注对象与标注结果之间的相关关系[9]。

本文认为,协同标注行为是指众多信息用户在社会化标签系统中根据自己对网络信息资源的认知,通过独立自主自建标签或借鉴他人标注行为、接受社会化标签系统推荐的标签,以标签的形式对网络信息资源进行标注和分类,并逐渐形成被大部分标注用户所认同的社会化标签和大众分类标准的行为。具体来看,协同标注行为包含以下内容:

1)协同标注行为是一种协同信息行为。协同标注行为强调的是众多用户在社会化标签系统上使用社会化标签对信息资源进行标注,社会化标签系统具备协同标注功能,允许用户在标注过程中相互借鉴和引用,最终形成大众分类标准,实现对所标注的网络信息资源充分地分类、组织、管理及利用。

2)协同标注行为主要包含两个子行为:自建行为与引用行为。自建行为是指用户根据自己对目标资源的认知独立地对其以标签的形式进行标注的行为,自建行为的发生会产生新的标签。由于用户的非独立性和系统的开放性,用户既可以观察、参考甚至直接采纳其他用户的标注结果,也会直接选用系统提供的标签进行标注,即借鉴他人标注结果或系统推荐标签对目标资源进行标注的行为就是引用行为。引用行为的发生只会增加已有标签的标注次数,而不会产生新的标签。

3)在协同标注行为过程中形成了“用户—资源—标签”三元交互的动态网络关系。用户对目标资源赋予标签、用户可以引用他人标签、以及同一标签能将不同资源汇聚起来,这就使得用户之间、资源之间以及用户与资源之间通过标签产生了联系。而后续更多用户通过自建或引用标签的形式对相同或不同的目标资源赋予标签,将导致“用户—资源—标签”三元交互的网络关系呈现动态变化。

4)协同标注行为能够最终形成大众分类标准。在协同标注行为中,虽然每个用户标注资源的信息动机不同,但是他们的标注行为通过社会化标签系统的集成便能产生整体效应,“涌现”出对应某个资源的、被大多数群体用户所认同的大众分类标准。

可见,协同标注行为作为一种典型的协同信息组织行为,包含了杂乱无章的初始阶段、局部共识的中级阶段和全局共识的终极阶段的3个子过程以及群体用户意见发散、收敛和凝聚的3个子环节,描述了协同标注行为由量变到质变、群体智慧最终涌现的过程[10]。

2 实证研究

2.1 研究设计

从协同标注行为的过程看,首先,目标资源在社会化标签系统中出现时用户行为主要以自建标签为主。社会化标签系统建立在“无知观”的假设基础上,即任何用户都不可能对日渐复杂的对象系统及问题全域有一个全面的把握,只能按照自己的知识背景对某一领域的某一问题有着一定了解[11]。因此,用户只需要基于不同的信息动机和主观认知,就能通過自建标签的方式对目标资源进行标注。由于用户对目标资源认知的差异性,不同用户针对同一目标资源的标注结果也会不尽相同,从而产生不同种类标签。虽然随着其他用户的参与,目标资源相关的标签种类、数量会逐渐增加,少数标签数量可能会相对占优,但总体上规模相对较少。

其次,随着标注用户的不断增加,协同标注行为进入到引用行为占优的阶段。随着目标资源的标注用户迅速增加,标签的种类、数量也在激增,从而形成了较好的基础数据集,为协同功能的发挥提供了重要支持。用户可以看到目标资源的已有标签以及系统推荐标签,导致引用标签的概率上升,并在系统协同功能的支撑下不断产生重复标签,针对该目标资源可能会出现高频标签。但由于标注用户还在持续增加,所以此时的高频标签只能代表一种阶段性的局部共识。也就是说,少数标签一直缓慢增加,吸引了其他用户的跟随,成为最终的高频标签;但是不排除在这个阶段会出现新的标签,成为最终的高频标签。

最后,在后续标注用户的推动下,协同标注行为最终会形成大众分类体系。一方面,标注用户持续增加,达到了群体用户规模;另一方面,群体用户针对目标资源的分类标准出现重叠的情形越来越多,使得原有的部分高频标签会得到更多用户的认同和引用。即引用标签行为已经占据绝对主导地位,并形成了稳定的代表群体用户意见的高频标签群。

在协同标注行为过程中,个体用户在对某一资源进行标注时,既采取自建行为,也往往会引用他人标注或系统推荐的标签。自建行为产生新的标签,引用标签则不断产生重复标签而形成高频标签。即协同标注行为经历由自建标签策略为主到以引用标注策略为主的过程,同时形成稳定的代表群体用户意见的高频标签群,群体用户对目标资源的主观认知由发散趋于一致,最终形成大众分类标准。这一过程反映了用户在参与协同标注行为过程中,用户的角色、用户具体的标签标注行为以及用户对社会化标签与目标资源的认知均呈现了一定动态变化。

基于以上分析,本研究采集豆瓣网的电影标签数据进行实证分析,重点以电影高频标签数据为样本,关注协同标注行为的用户,从标注用户、用户标注行为、用户认知演化过程3个层面分析协同标注行为的特征,解决协同标注行为中的3个问题:用户角色“是普通用户还是领袖用户”、用户进行标签标注时“倾向使用个性化标签还是大众标签”、用户认知“发散和收敛之间如何演化”,以揭示社会化标签系统中用户行为和标签使用的特性和规律。本研究的思路如图1所示。

2.2 数据采集与筛选

2.2.1 数据样本的选择

豆瓣网是一个提供关于书籍、电影、音乐等作品信息的社区网站,无论是对作品进行描述还是评论都由用户提供。豆瓣电影是中国最大的电影分享与评论社区,用户可以对电影标记想看、在看或者看过后进行评分,并发表长评或者短评。在这个过程中,用户产生了大量的、动态的电影标签,形成了丰富的用户、标签、资源数据集,一定意义上形成了评论共同体,有利于开展协同标注行为方面的研究。

首先,在豆瓣电影中,电影标签是部分可见的,即参与标注的用户可以看见前面用户已给出的部分标签,标签按照用户提供标签的时间进行排列,最

图1 协同标注行为特征的分析框架

新的标签排在最上面;其次,系统将高频标签以标注次数进行排列和展示,帮助用户快速了解该电影的受欢迎标签;最后,在用户提供标签的界面,系统还会给出10个标签供用户参考。由于这种特殊性,豆瓣电影标签的标注会产生一定数量的高频标签群。基于以上考虑,本文选择豆瓣网站作为数据来源,重点采集豆瓣网电影标签数据作为实验数据集。

2.2.2 数据采集与预处理

由于豆瓣网对电影标签数据每天最多保留10个页面,新的标签数据将覆盖旧的数据。因此,本文使用R语言自编程序于2018年11月—2019年9月实时爬取了豆瓣电影的标签数据,共获取了528部电影的数据。根据研究的需要,对标签数据进行了逐层筛选:

1)网络信息生命周期理论认为,网络信息从产生到消亡整个过程分为成长期、成熟期和衰退期3个阶段[12]:网络信息产生之后很快进入成长期,其访问量迅速上升;接着进入成熟期,网络信息的访问量达到最大值;然后就进入到衰退期,此时网络信息的访问量将逐渐降低并趋近于零;但处于衰退期甚至已经消亡的网络信息的效用价值也有可能被重新激活,开始新的生命周期。考虑到在開始采集后的一段时间内,部分先前已开放的电影受关注度已经极低,进入衰退期,虽然有可能开始新的生命周期,但已不是完整的成长过程;或者部分电影正处于成熟期而无法获知成长期的情况;同样地,在结束采集前一段时间内,部分刚上线的电影资源受关注度还不高,处于成长期,无法获知成熟期、衰退期、甚至新一轮生命周期的情况;或者部分电影正处于成熟期而无法获知衰退期和新一轮生命周期的情况。因此,需要剔除在采集时间段内生命周期不完整的部分电影。对528部电影在数据采集周期内参与标注的用户数进行分析后发现,大多数电影需要1个月左右的时间才能形成第一轮完整的生命周期。对此,本文以开始采集后的1个月和截至采集前1个月为时间节点对数据进行初步筛选,选取了于2018年12月—2019年6月上映且于2019年8月31日前开放观看的158部电影的标签数据。

2)对于单部电影而言,当标注数量在连续1周及以上时间内为个位数或零时,认为其生命周期尚未开始或已经结束,应停止数据采集工作。也就是说,上述158部电影中,部分电影仍有可能持续不受用户关注,导致其迟迟没有进入成长期,或在短时间内受到用户的高度关注、由于特殊原因又快速进入衰退期,即生命周期不完整,本文对这部分电影数据也进行剔除。通过分析,共有78部电影标签数据在其生命周期内不完整,剔除此部分电影后得到80部电影标签数据。

3)为使样本数据更有代表性,本研究仅筛选全部标签标注次数不低于500的电影,最终得到58部电影标签数据作为本文的研究数据。

2.3 实证研究结果

2.3.1 协同标注行为的用户角色特征及其讨论

1)协同标注行为的用户角色特征

高频标签显然是由后续用户反复参考、借鉴和引用已有标签而形成,追溯高频标签的首创者(指高频标签首次出现时的使用者),对于探究高频标签的用户特征更有意义。选取58部电影中首创高频标签数≥5的用户作为分析对象,并进一步获取该用户群体加入豆瓣网时间、电影数量、标签个数、标注次数以及当前电影下首创的高频标签中属于已标注高频标签群比值等信息,如表1所示。

由表1可知,从加入豆瓣网的时间角度看,高频标签的首创用户加入豆瓣网的时间相对于豆瓣电影板块上线时间(2005年5月2日)和电影标签功能上线时间(2005年6月6日)来说较晚,高频标签的首创用户并非为豆瓣电影板块及其标签功能的早期用户。从关注电影数量角度看(包括“在看”电影、“想看电影”和“看过”电影3种类型),大多数用户对电影资源保持着较高的关注度,持续关注电影资源从宣传、热映到开放的发展情况,更有着较为丰富的观影经历,为保证其全面认识电影资源奠定基础。从标签标注角度看,大多数用户并非对所关注的电影资源都进行标注,但倾向于反复使用自己使用过的标签。这与Golder S A、Sen S等的研究结论相符:Golder S A的研究发现对于目标资源的标签来说,各个标签的相对比例随着时间的推移呈现一个相对稳定的趋势,即用户受到前期用户标注行为的影响[13];Sen S的研究也证明用户未来倾向使用的标签与他们过去使用过的标签相似[14]。进一步地,从首创高频标签归属比例(即在某用户的首创高频标签集中属于该用户所有高频标签集的首创高频标签数所占的比值)情况看,用户在面对新的电影资源时,会从自有高频标签集中选取部分标签进行标注。表明用户在进行标签标注时容易受到标注习惯的影响;或者由于用户所关注的电影资源之间存在较大的相似性,导致用户在面对新的电影资源时,选择同一类型的电影资源的标签进行新的标注。

2)协同标注行为用户角色特征的讨论分析

高频标签首创者一方面具有较为丰富的标注经验和成熟的标注习惯,能够引领群体用户的协同标注行为,可视为协同标注行为的领袖用户;而其他大多用户通过引用他人或接受系统推荐的标签进行标注,属于“追随”他人的普通用户。因此,参与协同标注行为的用户在角色上的特征显著地表现为领袖用户的引领作用和普通用户的数量占优。

首先,协同标注行为具有显著的群体性特征,大多用户属于“追随”他人的普通用户。协同标注行为强调的是大量信息用户的参与,是一个群体协同行为。相对于初期用户来说,后续加入的用户既有可能自建标签进行标注,但更有很大的概率直接引用已有标签进行标注。在自建标签情形下,由于用户无法完整、正确地获取网络资源的信息,或者用户需要花费大量的时间和精力才能完整、正确地获取网络资源的信息而选择采取引用标签策略,或者用户出于标新立异的心态使用个性化标签,以及尽管是在全面了解目标资源的基础上进行标注,也有可能只是已有标签的重复使用,导致用户不会得到其他用户的广泛认可而沦为“普通用户”。在引用标签情形下,用户引用已有标签只是对他人标注成果的又一次复用,进而成为领袖用户的“追随者”。

其次,高频标签的首创者引领了协同标注行为整个过程,是协同标注行为的领袖用户。高频标签首创者能够在目标资源上线的初期快速做出反应,基于自己较为全面的认知和成熟的标注习惯对资源进行标注。高频标签首创者所标注的标签能够反应目标资源的信息、标注行为较为规范,后续用户将以参考、借鉴、直接引用标签等形式去“追随”高频首创标签者,使其成为整个协同标注行为的“意见领袖”。在意见领袖的作用下,群体意见能够快速汇聚,最终“涌现”出对应某个资源的、被大多数群体用户所认同的大众分类标准。

最后,普通用户不断“追随”使得领袖用户的引领作用进一步强化。虽然领袖用户在整个协同标注行为过程中发挥引领作用,但也正是普通用户的不断“追随”才能使得领袖用户具有引领作用,并使其引领作用进一步强化。领袖用户并非都是社会化标签系统的资深用户,仅在某个或若干资源的标注过程中发挥引领作用,意味着当这一资源下的领袖用户在面对新的资源时未能准确做出标注,则有可能沦为其他用户的追随者。而先前属于“追随者”的普通用户也将有可能成为领袖用户,引领新一轮的协同标注行为。

2.3.2 协同标注行为的标签使用类别特征及其讨论

1)协同标注行为的标签使用类别特征

为探究用户参与协同标注行为过程中的标签使用情况,本研究首先以天为单位,依次计算电影标签个数的累积值和高频标签与全部标签个数之比,并根据计算结果绘制双坐标图,如图2所示。图2显示,在整个协同标注行为过程中,标签个数逐步增加。表明随着用户活跃度的提高,用户使用个性化标签的可能性在增加,导致标签类型不断丰富。

从用户標注时标签数量规律上看,用户也倾向于使用多个标签进行标注。如表2所示,接近20%的用户仅对目标资源标注1个标签,37.70%的用户在标注时使用2~3个标签,30.58%的用户使用4~6个标签对资源进行标注,9.32%的用户对资源标注7~10个标签,仅有少部分用户对目标资源标注10个以上的标签。即68.28%的用户倾向于使用2~6个标签进行标注,标签类型具有多样性。

进一步地,以单部电影为对象,逐一计算26部电影中用户所使用的标签中属于高频标签的比例并绘制箱线图,如图3所示。由图3可知,大部分用户所使用的标签中仅有20%左右的标签属于高频标签,且当用户所使用标签中有一半及以上为高频标签已经属于异常值。这表明,虽然用户不可避免参考甚至直接引用他人标签,或者接受系统推荐的高频标签,但大量用户仍倾向于同时使用个性化标签对资源进行标注。

2)协同标注行为标签使用特征的讨论分析

高频标签的过程特征表明,虽然在整个协同标注行为过程中,标签个数逐步增加,标签类型不断丰富,个性化标签数量占优,但先前受群体用户关注和引用的大众标签不断得到更多新的关注和引用,大众标签始终构成了高频标签群的主体。即协同标注行为存在“个性化标签数量占优、而大众标签构成高频标签主体”的一对张力点。个性化标签数量占优表明用户在进行标注时倾向于使用个性化标签,大众标签构成高频标签主体用表明用户在进行标签标注时参考、引用了其他用户使用过或系统推荐的大众化标签。

首先,由于用户对目标资源认知的差异性,不同用户针对同一目标资源的标注结果也会不尽相同,从而产生不同种类标签。虽然随着其他用户的参与,目标资源相关的标签种类、数量会逐渐增加,少数标签数量可能会相对占优,但总体上规模相对较少。

其次,引用行为在系统协同功能的支撑下不断产生重复标签,针对该目标资源可能会出现高频标签。但由于标注用户还在持续增加,所以此时的高频标签只能代表一种阶段性的局部共识。也就是说,少数标签一直缓慢增加,吸引了其他用户的跟随,成为最终的高频标签;但是不排除在这个阶段会出现新的标签,成为最终的高频标签。

最后,在后续标注用户的推动下,一方面,标注用户持续增加,达到了群体用户规模;另一方面,群体用户针对目标资源的标注结果出现重叠的情形越来越多,使得原有的部分高频标签会得到更多用户的认同和引用,并形成了稳定的代表群体用户意见的高频标签群。

2.3.3 协同标注行为的用户认知变化过程特征及其讨论

1)协同标注行为的用户认知变化过程特征

在统计高频标签的时间分布基础上,本研究集中绘制了高频标签与全部标签个数比、高频标签与全部标签次数比、当前高频标签与累积高频标签一致性等高频标签相关比值的时间分布图,如图4所示。由图4可知,在整个协同标注行为过程中,虽然高频标签个数与全部标签个数之比逐渐降低,但高频标签被标注次数与全部标签被标注次数之比始终维持较高水平,且当前高频标签与累积高频标签一致性逐渐稳定于较高水平。

图4 部分电影高频标签相关比值的时间分布图

高频标签个数与全部标签个数之比在协同标注行为初期处于高峰,以及如图5所示的大部分电影的高频标签集中出现在协同标注行为发生后的两个月内,反映了高频标签早在协同标注行为的初期已经出现,只是由于能够占据全部标签被标注次数的80%的高频标签数量有限,其他低频标签数量不断增多,导致高频标签个数与全部标签个数之比随时间下降。高频标签被标注次数与全部标签被标注次数之比始终维持较高水平则表明随着时间推进,群体用户对初期已经出现的高频标签高度认可和反复引用,先前受群体用户关注和引用的大众标签不断得到更多新的关注和引用,大众标签始终构成了高频标签群的主体。当前高频标签与累积高频标签一致性逐渐稳定于较高水平,则说明高频标签群的构成逐步趋于稳定状态,群体用户对目标资源的认知趋于一致,大众分类标准最终涌现。

图5 58部电影高频标签首次出现的时间分布

2)协同标注行为用户认知变化过程特征的讨论分析

基于社会认同理论和信息搜寻理论的研究认为,用户遵循最省力原则使用系统推荐的标签而不是通过自我思考自建标签,大量的此类标注行为将提升信息率[15]。Cosley D等的研究也表明,系统推荐功能会导致行为的一致性[16]。在协同标注行为过程中,用户标注策略由自建标签为主到以引用标注为主,逐渐导致少数标签被绝大部分用户用于标注,且随着协同标注行为的推进,这些少数标签将形成稳定的高频标签群。如果将标注某标签的行为视为用户对该标注所反映的意见的认可,则少量标签组成的稳定的高频标签群所反映的意见即是参与协同标注行为的群体用户的意见。虽然在协同标注初期自建标签使得用户意见较为发散,但群体用户意见终将由发散向收敛转移,并最终形成目标资源的大众分类标准。即协同标注行为存在群体用户意见经历由发散向收敛转移的过程。

一方面,用户标注策略由自建标签为主到以引用标签为主。从协同标注行为过程分析来看,在协同标注行为初期,协同标注参与者的标注策略以自建标签为主;但随着协同标注行为的推进,后续参与者出于节约成本或者忽视个人独特认知的原因,在对目标资源进行标注时直接引用其他用户使用的标签或者接收社会化标签系统推荐的标签。自建标签策略的使用表明标注用户对目标资源的认知存在差异,对目标资源的分类标准的意见也不统一。引用标签策略逐渐占优并成为主要标注策略,表明后续标注用户对前期已被使用的标签及标签所代表的群体意见认可度逐渐提高,对目标资源的分类标准的意见趋于一致;另一方面,协同标注行为能够最终形成大众分类标准。在协同标注行为中,虽然每个用户标注资源的信息动机不同,但是他们的标注行为通过社会化标签系统的集成便能产生整体效应,“涌现”出对应某个资源的、被大多数群体用户所认同的分类标准,即大众分类标准的形成。

总之,协同标注行为的整个过程强调从个体信息行为向群体合作行为的转变,强调信息行为的协同性、合作性等特征[17],同时在标注过程中,存在用户部分或者完全放弃理性分析而盲目跟从他人的非理性行为,标注演化过程中出现了观点收敛的情况,即所有人关于大众分类的观点最终达到了统一。

3 结 语

本文采集豆瓣网的电影标签数据,从标注用户、用户标注行为、用户认知演化过程3个层面分析协同标注行为的特征。研究发现,个性化标签数量占优而大众标签构成高频标签主体、领袖用户的引领作用和普通用户的数量占优、以及群体用户意见经历由发散向收敛转移等现象,构成了协同标注行为的3个显著特征。本文的研究有助于促进对协同标注过程和大众分类标准涌现的认识和理解,有助于社会化标签系统的深度开发和整体优化,提高协同标注平台上用户协同标注效果。当然,本文的研究还存在一定的局限性,后續研究应扩展数据类型,基于“用户—资源—标签”的三元交互的动态网络关系,从标签和目标资源角度分析协同标注行为的特征与规律。

参考文献

[1]Golder S A,Huberman B A.Usage Patterns of Collaborative Tagging Systems[J].Journal of Information Science,2006,32(2):198-208.

[2]Kipp M,Campbell D G.Patterns and Inconsistencies in Collaborative Tagging Systems:An Examination Oftagging Practices[EB/OL].http://dlist.sir.arizona.edu/1704/01/KippCampbellASIST.pdf,2021-01-15.

[3]王永芳,王亚栋.中文博客中标签特征分析[J].农业网络信息,2016,(11):100-103.

[4]Voss J.Tagging,Folksonomy & Co-Renaissance of Manual Indexing?[EB/OL].http://arxiv.org/abs/cs/0701072,2021-01-20.

[5]樊晓琦.基于信息熵的社会化标注动机差异化研究[D].杭州:浙江理工大学,2016.

[6]李京生.基于用户标记的社会化搜索引擎的设计与研究[D].北京:北京工业大学,2012.

[7]杨青云,裴雷,吴克文.国外社会化标注系统中标注行为研究现状[J].情报杂志,2009,28(11):185-188,184.

[8]Zauder K,Lazic J L,Zorica M B.Collaborative Tagging Supported Knowledge Discovery[C]//Proceedings of the ITI 2007 29th International Conference on Information Technology Interfaces.New York:IEEE Press,2007:437-442.

[9]李枫林,张景.基于用户标注行为的相关性分析及重排序[J].情报理论与实践,2010,33(10):57-61.

[10]易明,冯翠翠,莫富传,等.基于群体智慧理论的协同标注信息行为机理研究——以豆瓣电影标签数据为例[J].情报学报,2021,40(1):101-114.

[11]Nishimoto K,Sumi Y,Mase K.Enhancement of Creative Aspects of a Daily Conversation with a Topic Development Agent[C]//In Proceedings of Coordination Technology for Collaborative Applications-Organizations,Processes,and Agents,1998:63-76.

[12]馬费成,夏永红.网络信息的生命周期实证研究[J].情报理论与实践,2009,32(6):1-7.

[13]Golder S A,Huberman B A.Usage Patterns of Collaborative Tagging Systems[J].Journal of Information Science,2006,32(2):198-208.

[14]Sen S,Lam S K,Rashid A M,et al.Tagging,Communities,Vocabulary,Evolution[EB/OL].http://portal.acm.org/citation.cfm?doid=1180875.1180904.

[15]Gattis L F.Planning and Information Foraging Theories and Their Value to the Novice Technical Communicator[A].Proceedings of the 20th Annual International Conference on Computer Documentation[C]//New York:ACM Press,2002:39-43.

[16]Cosley D,Lam S K,Albert I,et al.Is Seeing Believing?How Recommender System Interfaces Affect Users Opinions[J].Proc.sigchi Conf.on Human Factors in Computing Systems,2003,(5):585-592.

[17]金燕,李昱瑶.科研团队成员的协同信息行为模型[J].情报理论与实践,2015,38(9):86-90.

(责任编辑:陈 媛)