大数据语境下动画电影评论典型意见挖掘分析
2022-04-16伍婷
伍婷
21世纪以来,“移动互联网的应用普及,令中国电影产业链体系完善并朝向数字化方向发展”[1]。电影评论主阵地也由纸质媒介转移至网络媒介,自出机杼的专业化影评不再独领风骚,众声喧哗的大众化点评风起云涌,“电影评论功能与观众的联系更加紧密,具备参与性、互动性和大众性特征,不再局限于艺术层面的分析”[2]。面对成千上万条没有形成整合意见的评论,动画成功与失败的因素到底有哪些无从知晓,更无法短时间内对大数据进行分析整合,因而对动画电影用户评论数据的典型意见挖掘(Opinion Mining)就显得十分必要。
本文基于电影網站平台,对用户评论数据进行典型意见提取。用数据做支撑,结合用户评论数据与专业影评,进行科学与艺术层面的综合分析。从动画电影内容共创的视角,对大数据时代动画电影用户评论进行典型意见挖掘分析。
一、动画电影评论典型意见挖掘
(一)典型意见挖掘的必要性
如果从1941年中国第一部动画电影长片《铁扇公主》算起,“20世纪后60年间中国仅生产了13部长片”[3]。以往形成的创作模式和经验在面临市场检验时弊端显露,虽开始了艰难的技术探索,却忽视了广大受众的需要和诉求,由此导致众多商业大片折戟沉沙,票房惨败。
长期以来,纸媒上的专业影评几乎成为观众观影与否的依据,同时也反作用于动画电影的创作,对中国动画的发展和繁荣居功至伟。但毋庸讳言,专业影评也有其局限性。专业影评属个案分析,具有个人倾向性和主观臆断性,对意欲了解影片质量的普通观众而言,有可能存在误导。而互联网的普及和大数据的发展,使越来越多的用户习惯于将自己的观影意见发表在网上,形成海量的用户评论数据,对意欲观影者具有一定的参考价值和导向作用。
《西游记之大圣归来》(以下简称《大圣归来》,2015)和《哪吒之魔童降世》(以下简称《哪吒》,2019)代表了中国动画电影的发展趋势,也是传统题材现代演绎的代表作品。两部作品无论在形式还是内容上都有相似之处,具有样本分析的价值。因而很多学者从专业角度对两部影片给出了评价:认为《大圣归来》的成功得益于“题材创新、故事去低幼化、表现普世化”[4];“故事打动人心,角色塑造鲜明、具有人性情怀,但尚未能全面解决影片的统一性和风格化问题”[5]等;认为《哪吒》的成功在于“内容制作精良、人物形象及作品精神内涵符合受众审美心理需求”[6]等。虽然专业影评具有一定的影响力,但因其传播范围有限,普通观众更倾向于参考豆瓣、猫眼电影等平台的用户的综合评分及评论。另外,专业评论多呈现出评论者的主观判断,是针对个案的分析,难以代表普通观众的观感,且缺少科学依据。
数量庞大的受众意见对于投资人和创作者而言举足轻重,这是动画电影的商业属性所决定的。而互联网电影评论网站中用户的评论数据,是大数据时代赋予动画电影研究者的重要信息。科学地运用大数据,对数以万计的用户评论进行典型意见挖掘,是研究受众的重要方法之一。
典型意见挖掘可在短时间内使用户快速了解产品或服务的优劣,从而做出消费决策。还可为生产者反馈用户意见信息,进一步优化产品。在内容为王的“互联网+”时代,对比相关性推荐和精准营销,“用户更在乎同类用户的亲身体验及反馈,例如看过同一部电影用户的评价、评分”[7]。因此,无论是点评网站、电商平台还是各大论坛都出现了针对产品或服务的性能、功能及质量等客户评论[8],并且随着大数据研究的兴起,有关评论数据挖掘的研究逐渐成为热点。“产品特征词提取、用户情感倾向分析、数据挖掘算法、评论挖掘应用等研究层出不穷,主要集中在产品评论文本挖掘技术、方法及应用”[9]等方面。在动画电影评论中,用户除了会对影片总体评价外,通常也会针对其构成因素发表观点,如人物设计、场景设计等细粒度信息。而这些信息同样受到重点关注,值得研究者挖掘分析。因每个观众对动画电影的喜好度会有偏差,需要对海量的评论数据进行全方面的挖掘,分析评论中的意见内容,才能使用户更快速、直观、准确的发现评论中有价值的信息,而不是背本趋末。
(二)典型意见挖掘的方法
动画电影评论数据的典型意见挖掘是通过计算机技术对互联网上众多用户的评论数据进行清洗、分词、归类、聚合典型意见的过程。典型意见挖掘早在1997年由学者哈齐瓦斯洛(Hatzivassiloglou)等人提出,随着互联网发展及对文本分析需求的不断增加,典型意见挖掘逐渐成为数据挖掘中的重要研究领域,成为UGC(User Generated Content:用户原创内容)应用中的重要组成内容。典型意见挖掘是在分词的基础上,将词汇通过预训练的词向量模型转化为能被神经网络理解的向量。在此基础上,通过K-means聚类算法和依存文法分析,呈现出聚类后的典型意见。这些典型意见以标签短句的形式出现,包含了多个语义相近但表述不同的评论语句,直观地展现出评论者的具体意见。
通常,对典型意见挖掘的第一步是提取评论标签,即从评论中提取核心关键词,也是对评论数据分层拆解的核心环节。这种关键词语的提取,可以通过有监督学习和无监督学习两大机器学习类别去实现。基于监督学习的方法需要大量的人工标注,一般商品类的评论都倾向于对商品的某种特征做出评价。而动画电影属于文化艺术产品,不同的人感受不一,对不同类型的电影考量因素也不同,很难利用标注好的语料,对各种模型进行预测。而对于无监督学习而言,大部分基于统计学原理,采用TF-IDF方法,对大量文本中出现的重要词汇进行重要度打分,从而得到批量文本中的关键词语。动画电影评论的典型意见挖掘,主要包括数据获取及清洗、中文文本分词、提取关键词等技术。利用结巴(jieba)分词进行中文文本分词、TF-IDF提取关键词、word2vec浅层神经网络获得词向量;通过文法分析和一定的抽取规则,获取备选的典型意见的集合;再通过K-means聚类算法,将语义相同但表达不同的典型评论意见归集并计算其聚类中心,返回与聚类中心最近的一条评论,从而形成最终的典型意见。
(三)动画电影评论维度的独特性
与其他领域评论数据相比,动画电影评论在典型意见挖掘的方法上没有显著差异。它在评论维度中区别于其他产品,不但具有分析的样本价值,且具有自身的独特属性。随着数字技术发展,动画制作介质产生了巨变。纸质制作工艺被计算机技术代替,动画与电影的界限也逐渐模糊,但依然有本质区别。“动画”是以造型手段为载体逐个拍摄而成的影像作品[10],是重构素材与异质化物质的过程;而“电影”在现实基础上,按照摄影机每秒钟运行24格的速度准确记录发生的全部动作,由活动照相术和幻灯放映术结合发展起来的一种连续的影像画面。另外,从观众视觉和心理接受角度來看,动画夸张、变形的本体特征区别于电影的逼真、写实性特征。[11]因此,动画电影与一般电影的区别也使动画电影和一般电影的评论维度产生区别。动画电影角色设计的夸张和趣味,场景设计的幻想性和吸引力,动作设计的夸张、变形,画面的唯美与梦幻等与一般电影呈现有显著差异。因此,单独对动画电影评论进行典型意见挖掘的分析,具有一定的实践应用价值和必要性。
目前,对用户评论典型意见的挖掘技术在电影评论网站中还未得到广泛应用。只有个别学者针对影评数据,进行电影舆情与风险监控研究[12]及电影推荐“算法”分析研究[13]等。大众点评和美团根据用户不同的评价维度,提取的典型意见标签值得电影评论网站借鉴参考。动画电影与一般产品、服务行业不同,其评论不仅包括作品创作过程,还包括相关创作人员身份要素。因此,借鉴大众点评及美团网用户评论典型意见挖掘内容,综合观众对动画电影的普遍关注点,以及个别观众的个性化需求,结合动画自身属性,可将用户评论分为创作者维度、作品维度和主观维度等三个宏观维度。在此基础上,每个宏观维度可细分出多个具体维度。
如图1所示,创作者维度包括导演、编剧等;作品维度包括形式和内容两个层面,形式包括画面风格、角色设计、场景设计、视觉效果、特效设计等,内容包括角色性格、角色行为、故事情节、音乐、台词等;主观维度是用户评论中最具个性化的维度,包括是否推荐、满意程度等标签。动画电影评论作为一种特殊的内容文本,从自然语言处理的角度来看,它是专业影评和短评的综合体。由于专业影评相对复杂,且目前技术存在局限,本文主要针对短评文本进行典型意见挖掘分析。
二、影评网站电影评论典型意见挖掘
(一)影评网站用户评论分析
随着互联网的迅速发展促使电影评论网站在国内外盛行,比较有影响力的电影评论网站有Rotten tomatoes、IMDb、豆瓣电影、猫眼电影、时光网等。虽然国外的电影评论网站早于中国,且评分机制相对成熟,但因语言、政治、经济等差异,导致用户使用呈现显著区别。由于《大圣归来》和《哪吒》在Rotten tomatoes和IMDb上的评论人数过少,无法代表海外观众的整体意见,因而不在本次研究范围之内。
豆瓣网、时光网和猫眼电影是国内较有代表性的电影网站。猫眼电影对《大圣归来》的用户评论约111.3万人,评分高达9.3分;《哪吒》的用户评论约340万人,评分高达9.6分。时光网中《大圣归来》的用户评论数约2.7万人,评分为8.1分;《哪吒》的用户评论数共约7193人,评分为8.3分。豆瓣电影中《大圣归来》的用户评论数约53万人,评分为8.3分;《哪吒》的用户评论数约124万人,评分为8.5分。①
通过上述可知,两部影片在国内影评网站中的总体评分较高,在音乐、画面、导演、故事等各方面表现优异。但很难在短时间内从庞大的评论数据中获取用户评论意见倾向和需求,需通过典型意见挖掘动画电影存在的具体优缺点和用户需求点。猫眼电影和时光网主要以打造网络购票系统和在线播放来获取盈利为目的,电影评分与评论的真实性相对较弱。特别是时光网评论数据样本量明显不足。因此,本文以豆瓣电影的用户评论数据进行典型意见挖掘分析。
(二)豆瓣电影用户评论典型意见挖掘方法
豆瓣电影用户评论具有典型代表性,但对数据公开展示数量有一定限制,无法抓取全部评论数据。获取《大圣归来》和《哪吒》两部影片的用户评论数据源,主要通过以下步骤实现(如图2所示)。
如图2所示,本文首先采用了爬虫工具爬取豆瓣影评数据。用数据爬虫工具抓取评论数据主要有两个指标:一是用户的电影评论数据;二是每条评论的星级评分。数据爬取后用ROSTCM6对数据进行一般性处理工作,将爬虫后的数据进行清洗,清除数字、英文字符和一些空值文。数据清洗后利用结巴分词模块将获取到的文本进行中文分词(Chinese Word Segmentation)。对评论数据分词后,需要进行评论关键词提取。关键词提取往往可以通过几个关键词窥探整个文本的主题思想。本文主要运用结巴分词中基于TF-IDF算法的关键词抽取;接着采用word2vec给定的语料库,通过优化后的训练模型快速有效地将一个词语表达成向量形式。得到词向量后,通过依存文法分析一定的抽取规则,获取备选的典型意见集合;最后利用k-means算法进行聚类,将备选的典型意见集合成不同的类。尽可能使语义相同但表达不同的典型意见归集在一起,并计算其聚类中心,返回与聚类中心最近的一条评论,从而形成数条典型意见。
(三)典型意见挖掘结果
通过对《大圣归来》和《哪吒》的用户评论数据进行典型意见挖掘运行结果可知,《大圣归来》共挖掘221组典型意见,《哪吒》共挖掘305组典型意见。①两部影片由于叙事题材、影片类型、叙事模式等具有高度相似性,用户评论的典型意见也存在相似之处。对比两部影片数据挖掘结果可知,观众相较于《大圣归来》更喜爱《哪吒》,通过《哪吒》对国产动画信心倍增。
如表1所示,动画电影评论相比一般电影,对创作者评论维度关注度较低,没有形成典型意见。主要典型意见集中在作品维度和主观维度。在作品维度分析中,两部影片的镜头语言、画面风格、场景设计、视觉特效等制作精致,受到观众一致好评;在人物设定方面,“大圣”“江流儿”“哪吒”“敖丙”“太乙真人”等人物创意超出了大众预期;作品内容上两部影片呈现出微妙差异。从主观维度分析,受众对两部影片整体满意,会推荐其他观众观看。一方面说明受众对经典IP改编动画电影的支持和期待;另一方面表现了受众对经典故事和形象的深厚情怀,说明中国商业动画电影制作技术已基本满足大众审美预期。
其一,两部影片都根植于中国经典IP进行创意改编。无论是角色塑造还是剧情的颠覆性改编,都得到观众的认可。被认为是用好莱坞故事模式讲述中国版超级英雄故事,融合了中西方叙事语言和文化,讲述了英雄自我救赎和成长的故事。两部影片都从现代人的视角映射了普通人的生活现状、内心需求和行为方式。通过江流儿的执着、大圣的自我救赎,使观众跳出了原型故事的束缚,表现了现代人与命运积极抗争的奋斗精神,引发观众的共鸣。
其二,打破了以往传统式英雄主义“高大全”式的人物形象。英雄不再是刚直不阿、不畏权贵、一心为民、没有私欲的脸谱化形象,而是能够真正深入大众内心的“有血有肉”、充满人性的“接地气”英雄形象。将神话传说人物“普通化”“大众化”“世俗化”,用现代人的说话方式、口音、行为习惯、表演动作、思维方式去表现动画角色,无疑与现代观众的生活紧密贴合,使观众实现移情并沉浸于故事中。
其三,国产动画电影重新进入观众视野,被受众认同并予以期待。传统经典IP故事改编的动画被称为“国产良心之作”。因而,对经典IP的创意改编深受观众的认可和推荐。同时,“制作精良”“国漫崛起”已然表现了中国观众对国产动画良性发展趋势的渴望与信任。《哪吒》在主题表现上形成了“我命由我不由天”的精神内核,相比单纯的英雄救赎主题更有叙事侧重点。
其四,两部影片赞誉多过诋毁,但现实问题仍然多而显著。《大圣归来》和《哪吒》均存在剧情薄弱的问题,特别在故事情节上略显生硬,无法摆脱影片“笑点低俗”“刻意”等现实问题。这也是中国动画电影叙事重整体而忽视理性分析的表现之一;另外,“虚高的口碑”也是受众从众心理的表现之一。人云亦云地评价不在少数,需要观众冷静地对影片做客观评价。过高的评分、评价不利于国产动画电影的长远发展,应该引起重视。
(四)动画电影评论典型意见挖掘的局限
传统的专业影评强调评论者个人的主观判断,而典型意见挖掘技术对动画电影评论大数据进行挖掘,可辨伪去妄、客观地了解受众审美心理需求、观影习惯和偏好,也可弥补专业影评个案分析和主观判断的缺陷。因此,用数据说话,从受众的视角分析影片实际问题,对动画产业创作具有重要应用价值和指导意义。本文对豆瓣电影中具有代表性的动画电影《大圣归来》和《哪吒》进行典型意见挖掘,得出了与专业影评不同的分析结果。但典型意见挖掘结果不是万能的,也存在一定的局限和误差,不能替代专业影评的重要位置。
第一,互联网用户群体庞大,评论信息纷繁复杂,具有一定的随意性和模糊性。典型意见挖掘通过互联网用户评论的文本数据分析受众的审美心理需求,具有一定的客观依据和数据支撑。但也存在用户评论业余,受群体心理趋势影响盲目跟风等现实问题。而专业影评是从专业角度对影片进行分析,虽然有主观臆断的成分,但分析具有一定的专业说服力和权威性,从侧面补充了受众典型意见专业性不足和从众心理的问题。
第二,用户评论数据典型意见的准确性有待进一步提高。首先,由于典型意见挖掘技术的局限性,目前中文分词的准确性以及词向量的效果对典型意见挖掘结果存在一定的影响。网络流行词库的更新迟缓,也会导致典型意见挖掘准确性降低;其次,电影评论网站对用户数据获取有一定的限制,普通研究者难以将网站上所有的用户评论数据全部获取。因而存在样本数不足,分析结果不具有普适性等现实问题;再次,长篇评论相较于短片评论更丰富且专业性更强,但目前的计算机技术难以对长篇文本进行快速有效的提取,典型意见挖掘难以应用于大批量长篇用户评论数据中。
结语
综上所述,动画电影典型意见挖掘确实可以弥补专业影评的缺陷,这种技术从受众的视角来看充分展现动画电影的优劣并作出了相对客观、真实的评价。但目前对动画电影评论的典型意见挖掘技术,包括评论本身都存在一定的局限,无法挖掘出完美的结果。只有在充分利用计算机技术、掌握大数据的基础上,不断对动画电影用户评论数据进行典型意见挖掘技术的探索、改进,才能更好地体现典型意见挖掘在动画产业中的重要应用价值。而用户评论的典型意见挖掘是从受众的视角对影片进行分析,难以取代专业影评的重要地位。因此,在充分掌握科学依据的基础上,综合主观层面分析动画电影的艺术要素,才能相对准确的分析影片的优劣。就此而言,更需要将东方思维的感性顿悟与西方思维的理性分析相融合,才能得出相对全面的评价结论,为中国动画电影的创作和发展助力。
参考文献:
[1]艾媒报告.2019全球及中国电影市场运行大数据与产业布局策略研究报告[EB/OL].(2019-08-16)[2020-01-19] https://www.iimedia.cn/c400/65754.html.
[2]王宜文,李璠玎.电影评论的多维度变革与重构[ J ].浙江传媒学院学报,2010(04):66-71.
[3]杨晓林,张语洋.新中国动画70年的叙事策略嬗变论略[ J ].民族艺术研究,2019(06):28-37.
[4]蒲剑.用普世的手法讲好中国故事——《西游记之大圣归来》的启示[ J ].当代电影,2015(09):44-45.
[5]陈可红.《西游记之大圣归来》:叙事回归与人性情怀[ J ].电影艺术,2015(06):59-61.
[6]王子鉴.从《哪吒·魔童降世》看国产动画电影的发展[ J ].传媒,2019(21):41-43.
[7]美团算法团队.美团机器学习实践[M].北京:人民邮电出版社,2018:104.
[8]宋君,战洪飞,余军合.基于网络评论数据的产品设计综合评价模型的构建[ J ].计算机应用与软件,2019(01):88-93,110.
[9]韩忠明,李梦琪,刘雯,张梦玫,段大高,于重重.网络评论方面级观点挖掘方法研究综述[ J ].软件学报,2018(02):417-441.
[10]聶欣如.“动画”的概念[ J ].文艺研究,2017(08):109-116.
[11]张乃迪,钟远波.数字技术背景下动画与电影界限的探索[ J ].当代电影,2018(07):161-164.
[12]倪万.基于大数据的电影舆情数据挖掘与风险监控研究[ J ].当代电影,2016(02):71-76.
[13]王晓通.大数据背景下电影智能推送的“算法”实现及其潜在问题[ J ].当代电影,2019(05):64-70.