APP下载

用户生成内容研究进展综述

2018-01-07徐勇武雅利李东勤赵涛焦梦蕾

现代情报 2018年11期
关键词:情感内容用户

徐勇 武雅利 李东勤 赵涛 焦梦蕾

〔摘要〕用戶生成内容是Web20下由网络用户创作的互联网信息,分析其相关理论研究进展从而为UGC的进一步研究及商业利用提供思路具有重要的参考意义。本文在界定了UGC产生的背景基础上,从UGC基本范畴、生成动机、质量问题和法律问题4方面,分析了UGC研究动态;探究UGC情感分析中情感词语和情感量化问题,归纳现有情感分析涉及的算法应用。在研究现状分析基础上,指出下一步应重点研究促进网络用户生产出高质量UGC的激励和约束政策,建立更加完善、准确的推荐模型,设计符合不同应用领域的情感词量化方法,构建保护用户隐私的UGC生产、利用机制。

〔关键词〕Web 20;用户生成内容;研究动态;情感分析

DOI:10.3969/j.issn.1008-0821.2018.11.022

〔中图分类号〕G202〔文献标识码〕A〔文章编号〕1008-0821(2018)11-0130-06

Survey on Research Trend of User Generated ContentXu Yong1,2Wu Yali1Li Dongqin1Zhao Tao1Jiao Menglei1

(1.School of Management Science and Engineering,Anhui Finance and Economics University,

Bengbu 233000,China;

2.School of Statistics and Applied Mathematics,Anhui Finance and Economics University,

Bengbu 233000,China)

〔Abstract〕User Generation Content is an active topic in recent years under the condition of Web 20.Literatures on User Generation Content were reviewed.The paper introduced the background of UGC,then analyzed its research trends from four views,basic concept,generation motivation,quality and legal problem of UGC.Sentimental words and sentimental quantification in UGCs sentimental analysis were studied,and the application of algorithms used in the existing sentimental analysis was introduced.Finally,interesting works in the future,such as policies which could improve UGCs quality,recommendation models that could get high accuracy of UGC mining,quantitative method how to construct a sufficient sentimental dictionary for different area,privacy preserving of UGC,were proposed.

〔Key words〕Web 20;user generated content;research trends;sentiment analysis

Web 10时代是以网站编辑为主,用户往往作为信息接受者而存在,信息的传递是单向的。在此基础上的Web 20时代,强调发挥用户的能动性,赋予用户更多主动权,信息在网站与用户之间是双向传递的关系,用户不再仅仅是信息的消费者,还是信息制造者,“以人为本”是其区别于Web 10的主要特点。2004年,Web 20的概念产生于OReilly和Media Live International的一场头脑风暴中,次年9月,Tim OReilly[1]在“What is Web 20”一文中概括了Web 20的概念,认为Web 20是网络中利用集体智慧的平台,数据库管理是Web 20时代的核心竞争力,并给出Web 20的架构图。

用户生成内容(User Generated Content)正是在Web 20环境下应运而生的产物,早期的研究中,用户生成内容还被称作User Created Content(UCC)、Consumer Generated Media(CGM)等。2005年,有“互联网女皇”之称的摩根斯坦利首席分析师Mary Meeker首次提出用户生成内图1Web 20架构图

2018年11月第38卷第11期现代情报Journal of Modern InformationNov.,2018Vol38No112018年11月第38卷第11期用户生成内容研究进展综述Nov.,2018Vol38No11容(UGC,User-Generated Content)这一术语,并逐渐得到广泛认可。同年4月,BBC率先试水建立一个UGC小组,在当年7月的伦敦地铁爆炸案中,BBC在新闻播报中就使用了人们在逃离现场时抓拍的照片进行剪辑。次年,时代周刊(TIME)创新性地将“You”评选为其年度人物。2007年,世界经济合作与发展组织(OECD)在“Participative Web and User-Created Content:Web 20 Wikis and Social Networking”报告中将UGC的3大特点总结出来:互联网上公开的内容;内容具有一定程度的创新性;由非权威人士及非专业手段创作发布。这3大特点也成为后续UGC研究的基础。门亮等[2]认为对于用户来说,用户生成内容可视为其在互联网中的DIY(Do It Yourself),利用手机、电脑等设备,加入自身思考,制造出属于自己的UGC,发布到互联网中实现信息交流。

《紙牌屋》(House of Cards)作为利用大数据技术分析UGC应用于影视作品中的一个里程碑,其制作理念是以用户需求为主,根据用户点击量、用户在某网页停留时间等用户信息,去制作用户喜爱的作品。《纸牌屋》的制作公司是美国最大的在线影片租赁提供商网飞(Netflix)公司,作为美国三大流媒体公司,Netflix拥有全球最好的个性化推荐系统,以及大量用户的收视习惯数据。《纸牌屋》的开拍不同于传统影视剧的制作方法,Netflix公司在决定投拍前,充分收集用户数据,发现许多用户爱看1990年BBC同名迷你剧《纸牌屋》,与此同时,导演大卫·芬奇(David Fincher)和演员凯文·史派西(Kevin Spacey)也深得这些用户喜爱。在这些知识的支持下,Netflix于2013年初推出其首部自制剧集《纸牌屋》。Netflix的用户数量在《纸牌屋》正式上线后增加了300万,足以说明了解用户的需求对于影视制作的重要性[3-4]。近些年来,UGC在国内影视作品中的应用也愈加明显,2009年,酷6在创业初期就提出了UGC模式[5]。作为国内第一家视频网站,优酷所理解的UGC的重点在于“U”,也就是用户的创意是最珍贵的,优酷于2013年推出的“分享计划”,目的就在于发掘并收集草根用户的创意想法,为有想法的拍客创造舞台。随后国内短视频分享网站如雨后春笋般出现,无疑也是充分体现UGC价值的有力佐证。除了在网络视频制作中发挥作用,越来越多的企业也意识到UGC的重要性,并顺势提出各种策略以利用UGC为企业带来效益,如戴尔的Idea Storm、星巴克的My Starbucks Idea、网易云每日推荐、淘宝猜你喜欢等等。以星巴克为例,李奕莹等[6-7]构建了企业开放式创新社区(OIC)中UGC对其创新的贡献价值研究模型,分析OIC中UGC信息质量、UGC互动质量、用户创新行为和用户互动行为这4个自变量对UGC贡献价值的影响。并在OIC的条件下,建立创新价值链模型,分析星巴克的My Starbucks Idea策略。

用户生成内容颇有全民参与的含义,并且已经影响到生活的很多领域。UGC充分利用Web 20环境为其提供的技术便利、更开放的社交氛围,激发用户创造UGC的积极性,UGC的作用也渐渐渗入到商业、新闻舆论、日常社交等层面。

1UGC相关概念

基于OECD在2007年给出的UGC 3大特点,用户生成内容可理解为普通的非权威人士在网络上发布的带有一定创意的内容,其形式包括音频、视频、文本、图片等等。若发布的主体是有一定影响力的权威人士或团队,用户生成内容就会转化为专业生产内容(Professionally-generated Content,PGC),相比之下,PGC的影响力、质量都远远高于普通用户生成的UGC,这也是优酷等几大视频网站希望发掘更多PGC的原因。PGC本质上仍然是用户自发的行为,而职业生产内容(Occupationally-generated Content,OGC)是将内容生产行为作为一种职业活动,是为获取报酬而进行内容编辑、整理,三者的关系如图2所示。

相较于国外,国内UGC的研究起步较晚,早期人们大多通过报纸、新闻等载体意识到UGC会对我们生活产生较大影响,之后就有学者针对UGC的概念、特点、内容形式等方面进行深入研究。蓝勤华[8]认为UGC特点主要是个人化、个性化、强调创意和弱利益驱动,并将UGC的类型划分为SNS类的社交网站、视频分享网络、照片分享网络等。胡华[9]认为UGC的存在形式可以分为视频、音频、图片、应用程序、文本5种,闫婧[10]将UGC分为文字类、图片类、音频/视频类和社交聚合4大类。虽然大家对UGC的特点、形式总结得不完全相同,但都基于OECD所给出的UGC基本概念与特点。由于UGC可在不同用户、不同对象之间形成一种联系,张振宇等[11]将UGC视为一种新颖的媒体形态,并从商业价值的角度出发,结合用户之间、用户与媒体的强弱关系,发现“强关系”下产生的UGC通常具有较高的商业价值,“弱关系”条件下,商业价值不高。

2UGC动机研究

动机是指人在做出某种行为、从事某种活动时的心理状态。用户在创作UGC时必定是出于某种动机,现有研究中对UGC动机的分类已较为完善。2007年,在OECD的报告中,已对UGC产生动因的相关因素进行了分析,将UGC产生动机分为技术驱动力、社会驱动力、经济驱动力以及制度和法律驱动力4方面。在此后的研究中,学者们也大多基于这些因素。比如,赵宇翔等[12]将动因分成社会驱动、技术驱动、个体驱动3个维度和人口统计学特征1个调节集。柳瑶等[13]将动机分为内在需求、社会诱因和技术诱因3个层面。其中,内在需求主要源于用户个体的自我认知与自身需求,比如意见表达、休闲娱乐、追求利益等等,是为了满足自身行为而出现的动机;社会诱因是由于用户处在社会的大环境中,为了得到他人认同或换取更高的社会地位与重视程度,在社会刺激下产生的动机;技术诱因是指基于技术接受理论、社会认知理论等理论基础,用户可预知到其付出成本,如感知易用性、安全性。除了用户的主观动机外,范哲等[14]加入外部环境的机会感知和用户自身的能力认知。通过实证分析,他们认为影响用户生成UGC的主要因素是利他与互惠,并且感知易用性与感知有用性是外部环境机会感知中最显著的变量。此外,用户也必须具备将其自身知识储备转化为UGC的能力。

明确UGC的产生动机,了解不同用户在生产UGC时的心理活动,可根据不同的动机对用户进行分类,从而实施不同的激励措施,引导用户产生数量更多、质量更高的UGC。在现有研究中,已有学者针对UGC的激励措施展开研究。

激励理论主要有内容型激励理论、过程型激励理论、行为改造型激励理论和综合激励理论,其中包括马斯诺的需求层次论、赫兹伯格的双因素理论、期望理论、归因理论、公平理论、强化理论、内外综合激励理论等。赵宇翔[15]在《社会化媒体中用户生成内容的动因与激励设计研究》一文中,将目前对UGC的研究提炼出用户、内容、技术、组织和社会五大要素,进而从不同的维度分析影响UGC的动因,从用户分类、双因素和时间3个维度构建了用户激励策略研究的概念框架。研究发现不同用户群体对影响在线用户生成内容行为的激励因素和保健因素的感知存在一定的差异。普通参与者将网站的易用性、信息构建、个人隐私和信息安全保障、人—机交互性等因素作为保健因素,而将外部奖励、人—人交互性、归属感、网站的可用性等因素作为激励因素。

除了将UGC动机与激励措施结合的研究之外,张世颖[16]认为通过对UGC动机的确定,还可以对UGC质量做出判断,UGC的产生动机与其质量之间存在着一定的因果逻辑关系,针对大量的网络用户,可以针对不同层次的用户实施提高UGC质量的激励措施,实现质量由“劣”转“优”的目的,并且使UGC达到一种“量”与“质”的平衡与统一,促使网络用户创造更多的高质量UGC。图3即表示UGC动机研究与UGC激励措施、UGC质量评价之间的关联。

3UGC质量研究

随着物联网、云计算等技术的发展,大数据时代已经到来。UGC作为数据的一种,也满足大数据的5V特点[17]:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值密度)、Veracity(真实性)。其中Value和Veracity都可理解为UGC质量参差不齐,以淘宝评论为例,针对某商品的评论甚至会多至数千条,但其中高质量的评论并不多,例如大量“好评”、文本极短、答非所问等等,这体现了UGC也有价值密度低的特点,这主要是因为互联网中不会因用户类别而限制其生产UGC。此外,有图3UGC动机研究与激励措施、UGC质量的关联图

些商家雇佣水军刷好评、恶意诋毁竞争对手、利用返现诱惑买家给好评等虚假行为,导致评论中存在不实信息,也被称作垃圾信息。因此,对UGC质量分析具有现实意义。

针对UGC中存在的质量评价、质量指标、质量控制等现实问题,金燕[18]总结后认为目前UGC质量问题主要存在于内容错误、垃圾内容、内容价值密度低3方面。在UGC质量评价方面,目前存在人工检测法和自动测量方法两种方法,但都存在缺陷,如主观性太强或评价指标多样性等因素都会导致评价结果不统一,故现在急需一套适用性强的UGC质量评价指标体系。从UGC创建过程角度出发,金燕等[19]构建了一个通用的UGC质量实时监控框架,该框架由数据采集层、数据存储层和质量监控层3个主要模块构成,SPC技术的利用可以对UGC创建过程的每一个阶段进行实时监控。针对用户评论产生的文本UGC,林煜明等[20]围绕着评论质量评估、评论总结和垃圾评论检测3方面总结了国际上评论质量检测与控制的研究内容、技术和方法的研究进展。从UGC主体生产评论,到其他用户在网络上接收该评论,这一过程中可以通过用户输入约束、UGC评估、垃圾检测、UGC总结和排序系统进行控制。从评论内容的角度看,影響评论质量的因素主要包括评论的语法特征、语义特征、元特征、文本的统计特征、可读性和相似性特征。从UGC主体角度,在考虑UGC质量时应考虑到主体的基本属性,如该用户是否有不良记录、注册时间长短、基本资料完成度、活跃时间分布情况等。垃圾评论检测也是UGC质量控制的一种重要方式,检测的主要判断标准为评论是否为垃圾内容、评论主体或团队的质量高低。此外,评论排序对用户高效利用UGC也十分重要,现有应用中,淘宝的评论排序根据用户等级、评分和推荐,当当网的评论排序根据评论的回复数,eBay的评论排序根据相关度。为了更准确地检测虚假评论,汪建成等[21]依据评论UGC的特性建立了基于主题——对立情感依赖的模型,该模型会提取正反两类情感词语,在潜在狄利克雷模型(LDA)中加入情感层,即将LDA扩展成文档—主题—情感—词语结构。在此基础上提出TOSDM模型,结合评论UGC的主题与情感,提取出6位特征对虚假评论展开检测。

如图4所示,对UGC质量的研究可以划分为基于内容和基于用户两方面,其中基于用户可以通过UGC质量寻找领袖意见,以及进行虚假主体判别,通常情况下,若UGC质量非常低,那么产生该UGC的主体很可能是虚假主体。

由于网络中UGC的量之大,普通用户很难寻找到自身需要的UGC,因此可根据内容创建某领域的推荐系统,还可以基于内容进行垃圾识别与谣言检测等。

4UGC法律问题

由于目前用户在网络上发表言论具有随机性、匿名性、数据海量性等特点,导致用户对其发表UGC的版权问题不够重视,在不经意间会侵犯他人权益或者无法保障自身权益。在网络出现初期,为解决著作权产生的利益问题,美国政府于1998年通过了美国数字千年版权法,目前仍应用于网络法治。此外,UGC规则虽然已被提出,但许多网络龙头企业并未签字认同,目前来说并不是理想的网络自治规则。当前,我国的网络治理主要根据2006年国务院发布的《信息网络传播权条例》。张慧霞[22]指出网络治理的发展将是未来研究的重点与难点。

目前在UGC版权问题上,李妙玲等[23]认为存在着过滤识别技术不到位、网络自治不规范、全民版权意识薄弱、产权意识教育滞后于技术的发展等问题。除此之外,用户的隐私保护也是学术界研究的热点,一方面,实行实名制有助于保证UGC的质量,在此条件下用户若发表言论会考虑到其言论的影响,以及会不会对自己带来麻烦。但实名制也会限制用户创作UGC,有些用户需要用匿名来保护自己,将UGC作为秘密分享出来,比如树洞类UGC。蒋晓丽等[24]将树洞类UGC平台分为社会类和群体类两种。社会化树洞UGC面向范围更广,如微博树洞。与之相对,群体化树洞UGC是以职业、兴趣等属性促成的。这两类UGC平台都为用户提供了隐私保护、言论自由的空间,满足信息化时代网民抒发情绪的需求。树洞可以让用户更自由地袒露心声,故引起许多忧郁症领域专家学者的注意,如何利用树洞UGC对忧郁症患者改善病情等问题不断被深入探究[25-26]。

目前学者们普遍认为若要解决UGC相关法律问题,作为UGC主体,用户应自觉地进行版权教育;从社会角度出发,学校和社会也应该加强版权知识的普及;在UGC网站角度,应提高用户版权意识,建立适当的奖惩措施。

5情感分析

51UGC情感描述

情感识别问题的提出源于美国MIT大学的Minsky教授,其在《The Society of Mind》中第一次提出智能机器的情感识别问题,引起学术界的关注。“情感计算”的概念源于1997年Picard所著的《Affective Computing》一书中,Picard认为情感计算是源于人类情感产生、情感识别、情感表示以及影响情感因素度量等方面的计算科学,是利用计算机完成信息载体、情感极性倾向和强度度量的过程。情感是用户内心思想的主观反映,可以直接反映用户的喜恶。早期的UGC的研究主要围绕UGC概念及其商业应用、UGC动机与激励措施等方面进行。尤其是UGC在视频类软件中的应用,这主要是因为UGC刚提出时,youTube率先发挥其商业价值,导致国内的关注点聚焦于其商业价值。随着研究的深入,越来越多的学者开始针对UGC意见挖掘、情感分析等其他领域进行研究。比如,针对微博中的文本进行分析,挖掘出群众的舆论导向与情感变化,可以推测出微博用户的关注信息,从而为用户提供针对性服务。

若要对文本UGC进行情感类别划分,需要一个较为完善的情感词典为基础。现有的情感词典尤其是中文情感词典规模不足是影响情感分析效果的一个重要因素。除了词典规模小这一缺点外,赵妍妍等[27]认为现有的情感词典在情感分析任务的使用中存在词典中的词太过正式、词典中仅包括词语而没有词组等不足。英文词典方面具有代表性的有General Inquirer和Opinion Lexicon,这两大词典都有数千个褒义词和贬义词,其中依据词语的强度、词性等基本属性,General Inquirer给每个词语贴上标签,以方便人们在使用词典时能够更简便地完成任务。中文情感词典领域,HowNet在UGC情感倾向分析中的利用较为普遍,近些年,中国科学院计算技术研究所研制出的汉语词法分析系统ICTCLAS也逐渐得到认可,并逐渐被推广使用。对于文本类型UGC的信息提取工作,Egger M[28]将其分为信息收集、分析和可视化3阶段,并在此基础上,将步骤细分为数据的收集与清洗、文档级信息抽取、句子与短语和词级的信息抽取、选择的挑战等。基于Ekman的6种基本情绪理论,赖凯声等[29]通过人工对《现代汉语词典》、《实用汉语形容词词典》和《现代汉语实词搭配词典》进行词语扩展,最终收集448个情绪词,在此基础上结合POMS量表和罗跃嘉词表等词库,通过新浪微博的搜索功能对国内网络流行词汇情感词进行验证,以筛除使用频率较低的生僻词,最终得到2242个情绪词。

情感分析过程中,除了需要情感词外,还需对每个情感词进行量化,即确定其分值。目前大多研究中,都将情感词分为积极与消极两种,潘宇等[30]在研究餐厅评论极性时,选择以食品味道、餐厅环境、服务态度和消费价格作为衡量用户评论的标准,对UGC进行特征标注从而对UGC进行极性分析,对评论中出现的正向情感词语量化为+1,负面情绪的词语赋值为-1。此外文献[31]中也提到文本UGC的情感量化问题,只是对于情感倾向的判断仍限于语义范围,针对目前情感词语量化的深度与广度都还有待提高。

52情感分析方法

传统应用于情感分类的文本分类方法有朴素贝叶斯(Naive Bayesian,NB)、k近邻(k-Nearest Neighbor,kNN)、支持向量機(Support Vector Machine,SVM)、决策树等。对于目前国内情感分析的研究,饶元等[32]认为主要是情绪的极性化分析计算与观点倾向性分析计算2个方面。为了分析观点倾向问题,徐琳宏等[33]通过计算词汇与知网中褒贬性之间的相似度,从而对词汇的倾向做出判断,将倾向性明显的词语视为特征词,接着采用SVM对这些特征词进行分类操作,根据情感词的倾向就可判断UGC的整体倾向。同样是利用SVM分类方法,针对服装电商评论情感值问题,李宏媛等[34]采用线性回归模型,通过对比平均绝对误差、均方差误差、均方根误差等发现商品评论对产品销售量的具体影响。

除了分类算法外,还有学者利用关联算法进行UGC情感分析,以豆瓣为例,Yang J等[35]提出了一种改进的基于MapReduce的内容挖掘Apriori算法,作者认为对UGC进行情感分析,可以对观众喜爱以及用户接下来的动作进行预测,以豆瓣为例,可发掘用户喜爱的电影以及其他相关信息,那么行业利益相关者,如制片人即可有效地宣传其内容,据此改善用户体验,更好地帮助观众找到与其兴趣有关的电影。通过UGC深入了解消费者可以缩短出版方与观众的差距。潜在狄利克雷分布模型(LDA)是一种概率生成模型,考虑到朋友间交互所表现出的情感比非朋友间交互表现出的情感相似度更高,基于此,黄发良等[36]针对微博用户提出微博主题情感倾向分析的SRTSM模型,该模型是在传统LDA的基础上加入情感层与微博用户关系参数,接着采取吉布斯采样方法,利用SRTSM模型进行微博主题和情感分析。为了对产品评论提供一个全面的评价,Raghupathi D等[37]提出了一个较为准确的整体情感评级算法,从单个文本分析出发,用一个影响语言字典来评价单词树的叶子。该算法虽然对评论UGC的情感倾向足够重视,却因为重视整体而忽视了个体的作用。根据情感分析的过程,文本类型UGC的情感分析可细化成情感信息的抽取、情感信息的分类以及情感信息的检索与归纳[38]。其中分类任务又可分为主、客观信息的二元分类和主观信息的情感分类。对UGC进行的情感分析可以应用于用户评论分析与决策、舆情监控和信息预测,但由于一些国外的研究技术和情感资源无法直接移植到中文处理中,因此结合中文的特点,寻找适用于中文处理的技术与手段,仍是接下来应继续探索的问题。

6下一步的研究趋势

通过对已有文献的梳理,文中对UGC的概念、动机、质量和法律方面进行概述,接着对UGC情感分析的情感描述、分析方法展开研究。对于接下来的研究,可以针对以下几方面展开:

61追求高质量

随着大数据时代的到来,每天都会产生大量的UGC,数量爆炸式增长的同时,并未能保证UGC的高质量。UGC的创造越来越多地依靠手机、Pad等移动电子产品,用户倾向于利用零碎时间生产UGC,因此大多数UGC的质量是不高的。此外,由于被利益驱使的网络灌水、刷屏等非正常现象的大量出现,容易对UGC研究样本造成污染,所以若能有效地改善UGC的质量,有助于提高数据分析的准确率和高效性。比如,UGC网站对于稳定产出高质量的UGC主体给予一定的激励政策,虚拟的积分或游戏币等。

62提高推荐准确度

UGC感知易用性的高低因人而异,用户创作UGC时带有强烈的个性特点,如何结合用户个体,理解UGC表达的真实含义、判断UGC质量高低是值得研究的问题。这其中会涉及到中文语义复杂度较高、容易产生歧义等问题。还可以结合UGC特点对用户信誉或用户活跃度进行预测与分类,对不同层次的用户进行针对性的广告投放或推荐方案,进一步挖掘UGC的商业价值。为了提高商家的服务质量,林煜明等[20]提出综合考虑用户的地理信息和用户对商品的评论,两者的结合将在很大程度上为商家和用户带来便利。但用户与UGC的属性如何准确分类,如何建立更加完善、准确的推荐模型是接下来值得研究的热点。

63完善情感词库

英文词库已经较为完善,在分词阶段只需将单个的单词拆开即可。中文因其特殊性与复杂性,中文分词比英文分词困难,针对UGC情感分析问题,可尝试构建更加完善的情感词库,更加充分地考虑停用词、歧义词等问题。由于目前研究中,在情感量化方面没有统一标准,大多研究在权值的分配问题上研究仍然不够深入,在实际应用时不能准确地表达用户的情感倾向,如何将情感词量化得更符合现实意义,也是值得探究的方向。此外,不同性格的用户生产UGC时,在情感表达方面都有差异。比如,性格外向的用户可能会更加善于表达自己的情感,所用的情感词会较为强烈;性格内向的用户产生的UGC可能会较为平稳,情感方面波动不明显。因此,在情感分析阶段,也可尝试结合用户的个性特点采取针对性分析。

64加强用户隐私保护

用户生成内容因其网上发布的特点,存在着UGC主体组成复杂、形式掺杂、质量不齐等问题,此外,目前国内网络自治规则也并不完善。随着网络直播等第三方视频网站的兴起,网站仅充当用户的UGC展示平台,因此作为网站营运者,如何加强监管、对每天产生的海量UGC进行审核是个问题。除此之外,今后还应注重解决因UGC引发的相关法律道德问题,充分利用UGC使其发挥积极作用,加强对“人肉”等侵犯个人隐私的治理力度。

参考文献

[1]http://www.oreilly.com/pub/a/web2/archive/what-is-web-20.html?page=1[EB].

[2]门亮,杨雄勇.UGC平台的特征及其信息流的分析[J].设计,2015,(5):52-54.

[3]李冰,郄婧琳.大数据、流媒体与视频内容生产新策略——美剧《纸牌屋》的启示[J].出版广角,2015,(3):89-91.

[4]黎孔静.由Netflix自制剧《纸牌屋》的热播引发的思考[J].电视研究,2013,(9):76-77.

[5]刘倩琦.中国视频UGC的掘金路[J].投资北京,2014,(1):50-53.

[6]李奕瑩,戚桂杰.企业开放式创新社区中用户生成内容的创新贡献[J].中国科技论坛,2017,(4):95-102.

[7]李奕莹,戚桂杰.创新价值链视角下企业开放式创新社区管理的系统动力学研究[J].商业经济与管理,2017,(6):60-70.

[8]蓝勤华.UGC(用户创造内容)概念之辨析[J].中国网络传播研究,2010,(00):279-286.

[9]胡华.基于中文UGC信息源的半自动应用本体构建研究[D].武汉:武汉大学,2014.

[10]闫婧.基于用户信誉评级的UGC质量预判方法[D].郑州:郑州大学,2017.

[11]张振宇,喻发胜.公共性与商业性:UGC媒体发展的两难境地——以媒介形态研究的视角[J].湖北社会科学,2015,(8):192-198.

[12]赵宇翔,朱庆华.Web20环境下影响用户生成内容的主要动因研究[J].中国图书馆学报,2009,(5):107-116.

[13]柳瑶,郎宇洁,李凌.微博用户生成内容的动机研究[J].图书情报工作,2013,57(10):51-57.

[14]范哲,张乾.MOA视角下的问答网站用户贡献行为研究[J].图书与情报,2015,(5):123-132.

[15]赵宇翔.社会化媒体中用户生成内容的动因与激励设计研究[D].南京:南京大学,2011.

[16]张世颖.移动互联网用户生成内容动机分析与质量评价研究[D].长春:吉林大学,2014.

[17]https://baike.so.com/doc/5374131-5610149.html[EB].

[18]金燕.国内外UGC质量研究现状与展望[J].情报理论与实践,2016,39(3):15-19.

[19]金燕,李丹.基于SPC的用户生成内容质量监控研究[J].情报科学,2016,34(5):86-90,141.

[20]林煜明,王晓玲,朱涛,等.用户评论的质量检测与控制研究综述[J].软件学报,2014,25(3):506-527.

[21]汪建成,严馨,余正涛,等.基于主题-对立情感依赖模型的虚假评论检测方法[J].山西大学学报:自然科学版,2015,(1):31-38.

[22]张慧霞.美国UGC规则探讨——兼论网络自治与法治的关系[J].电子知识产权,2008,(5):37-39.

[23]李妙玲,岳庆荣.我国用户生成内容的版权侵权问题治理模式研究[J].新世纪图书馆,2015,(5):54-59.

[24]蒋晓丽,杨珊.虚拟社会安全阀:树洞类UGC平台的宣泄功能研究[J].新闻界,2017,(6):54-59.

[25]王赛.树洞文化在互联网中的应用与发展[J].青年记者,2014,(32):69-70.

[26]耿绍宁.试析网络“树洞”应用对高校和谐稳定的影响——以“树洞”微博为例[J].思想理论教育,2013,(15):76-78,82.

[27]赵妍妍,秦兵,石秋慧,等.大规模情感词典的构建及其在情感分类中的应用[J].中文信息学报,2017,31(2):187-193.

[28]Egger M.A Brief Tutorial on How to Extract Information from User-Generated Content(UGC)[J].KI - Künstliche Intelligenz,2013,27(1):53-60.

[29]赖凯声,陈浩,钱卫宁,等.微博情绪与中国股市:基于协整分析[J].系统科学与数学,2014,34(5):565-575.

[30]潘宇,林鸿飞.基于语义极性分析的餐馆评论挖掘[J].计算机工程,2008,17(17):208-210.

[31]王海雷,章彦星,赵海玉,等.基于用户生成内容的产品搜索模型[J].中文信息学报,2013,27(4):89-95.

[32]饶元,吴连伟,王一鸣,等.基于语义分析的情感计算技术研究进展[J].软件学报,2018,29(8):1-25.

[33]徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100.

[34]李宏媛,陶然.服装电商评论情感分析研究[J].智能计算机与应用.2017,7(1):27-34.

[35]Yang J,Yecies B.Mining Chinese Social Media UGC:A Big Data Framework for Analyzing Douban Movie Reviews[J].Journal of Big Data,2016,3(1):1-23.

[36]黄发良,于戈,张继连,等.基于社交关系的微博主题情感挖掘[J].软件学报,2017,28(3):694-707.

[37]Raghupathi D,Yannou B,Farel R,Emilie Poirson.Customer Sentiment Appraisal from User-generated Product Reviews:A Domain Independent Heuristic Algorithm[J].International Journal on Interactive Design and Manufacturing(IJIDeM),2015,9(3):201-211.

[38]趙妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848.

(责任编辑:陈媛)2018年11月第38卷第11期现代情报Journal of Modern InformationNov.,2018Vol38No112018年11月第38卷第11期理性行为理论及其在信息系统研究中的应用与展望Nov.,2018Vol38No11

收稿日期:2018-08-15

猜你喜欢

情感内容用户
内容回顾温故知新
如何在情感中自我成长,保持独立
情感
如何在情感中自我成长,保持独立
关注用户
主要内容
情感移植
关注用户
关注用户
如何获取一亿海外用户