人工智能算法时代的电影实践
2024-10-03谢悦邱章红
【摘 要】 近年来,中国电影产业快速增长,电影宣发推广方式因互联网技术发展而变革。电影首周票房对总票房和口碑至关重要,但国内尚缺乏系统化对票房危机预警的研究。本文探讨了人工智能在电影舆情分析中的应用,强调数据、算法和算力的核心作用,并提出实时监控和分析评论数据的方法;分析了评论数据的不同形式,讨论了情感和情绪分析的重要性,提出了主题挖掘和算法应用的挑战;并指出当前技术在电影舆情分析中的不足,展望未来的发展方向,强调构建实时票房危机预警系统的重要性。
【关键词】 舆情分析; 情感分析; 主题抽取; 人工智能
电影投资是一个高风险行业,大制作的电影在发行宣传期伴随着高风险,电影发行期的主要票房收入都是出现在上映开始的前两三周,而首周的票房大概率与电影的总票房呈正相关系。首周亦是电影口碑能否立住的关键,互联网的电影口碑往往是决定整体口碑的关键,而口碑的形成往往是自下而上的,从普通观众开始,逐渐通过口耳相传、社交媒体分享和在线评论平台扩散,最终形成广泛的公众意见。无论是帮助投资方和影院及时调整排座比率减少损失,还是帮助宣发团队调整宣发策略打好电影口碑,便于制作团队和投资方下一次的合作,收集分析观众反映的各项数据和信息并做出调整都是一项项关键的任务。
国内目前尚未建立起针对电影票房危机的预警系统,主要存在的问题是对舆情分析不够、对舆情的分析方法不足以及对舆情的处理不够及时。常见的电影监测平台,如灯塔等,主要提供票房等数据,而对于舆情内容的分析研究还不充分。现有的关于舆情内容分析的研究大多是个案研究,一次研究往往耗费大量时间,无法对舆情实时分析,互联网的舆情发酵速度普遍较快,宣发团队如果采取这类方式,等到发现具体危机时,舆论会变得无法管控。同时,这些个案研究均没有以提取舆情潜在危机为导向,有的分析观众评论典型意见[1],缺少分析评论意见对舆论的影响程度;有的分析得到的舆情内容含义较宽泛[2],得出的结果对宣发团队分析舆情并没有多少帮助。总之,这些方式都很难在电影发行期间辅助宣发并使宣发策略及时调整优化。
在人工智能领域,数据、算法和算力是三大核心要素。本文通过探讨人工智能的电影舆情分析方法论,从分析电影舆情数据入手,剖析解决问题的算法,并探讨算力带来的研究方法的变化和进步。数据是基础,通过对社交平台、影评网站等渠道获取的海量评论和讨论数据进行清洗和预处理,可以提取出有价值的信息。算法是关键,通过应用自然语言处理、机器学习和深度学习等先进算法,可以有效地识别和分析观众的情感倾向和意见。算力是保障,现代计算设备和分布式计算技术的进步,使得处理和分析大规模数据成为可能,在一定程度上提高了分析的效率和精度。
一、数据·语言·在线
“大数据是当前电影舆情数据挖掘的基础。”大数据“这一趋势对我们的思维方式有了颠覆性的变革”。大数据的分析不仅仅是数据量的增加,更是对数据的深度挖掘和理解,以发现潜在的模式和关联。[3]“从大样本的描述性统计与中样本的推断性统计相结合,转向超大规模样本数据对总体的直接描述分析”[4]。也就是说,以一部电影的舆论分析为例,过去通过抽样采访电影观众的评论,来推断整体的舆论情况。而在“大数据时代”,通过分析大部分观众的评论,直接得出整体舆论的真实情况。
随着新媒体的多元化发展,数据信息有语言文字、图像和视频及带有含义的数字信息等,在电影的舆情分析问题中,分别有评论讨论数据、观看照片、采访视频或自媒体评价视频以及点击率、实时观看热度、票房等数字信息。考虑到对照片和视频数据的处理技术还不完善;且带有含义的数字信息处理起来较为方便,数据量相比于海量评论数据而言较少,蕴含明显的概括信息(如电影的热度,围绕电影的某个话题的热度等等),难以从中获取潜在舆论危机信息。这类数据已经是对电影舆情的某些宏观分析,当这些数据发生明显变化以至于反映出舆情问题的时候,舆情一般早已经有明显的发酵趋势。故舆情监测的主要研究对象为围绕电影的评论讨论数据。
电影的舆论“通常以显舆论、潜舆论和行为舆论等形式体现,显舆论即以语言、文字形式传递的信息、表达的意见,潜舆论以情绪形式表达,行为舆论则是以购买、点击等形式体现的”[5]。这样的分类可以帮助人们进一步理解电影舆论,对计算机而言,没办法直接理解互联网电影评论平台上的舆论,故而人们必须将舆论转化为数据。然而,如果仅仅是把舆论简单转化为数据,则无法对庞大的数据量进行分类测算。所以人们类似地引入“显数据”“行为数据”与“隐数据”的概念。显数据即关于电影的语言文字信息或观点,常常表现为观影评论和讨论;行为数据即反映观众有关电影观看行为的数据,如实时观看热度、票房、评论点击率、话题搜索度等;隐数据是情绪数据,潜藏在显数据和行为数据中,需要计算机从中进行理解和提取,具体表现为评论数据反映出的受众情感和行为数据中反映出的观众喜爱度等。
显数据中包含大量语言文字信息,从中能找到电影舆论潜在危机的主题,是舆情危机预警中主要使用的数据。显数据中,主要有短评论、长评论以及讨论数据,豆瓣和时光网是国内主要的电影评论平台。对于单部电影,豆瓣的评论数据包含短评、长评及评论数据下的讨论和讨论帖,时光网只有短评和长评,但是每条评论数据下都可以进行讨论。
短评论数据中的情感表达更加简洁明确,由于字数有限,观众在进行短评论的时候情感表达往往较为强烈,可以直接反映观众的直观感受。同时,短评中会出现高频关键词,这些关键词可以反映观众关注的主要问题和亮点。
长评论数据通常包含更详细的分析和评价。观众会在长评中对观影进行多维度的反馈,描述具体的情节、角色表演、拍摄技巧等,观众会详细描述对于电影的多维情绪,甚至是引起情绪的原因。
讨论数据可以反映观众之间的互动共鸣和观点多样性,引起观众共鸣的话题往往比个人的评论数据拥有更大的舆论影响力。引起观众争论的话题是舆论分析的重要分析对象,争论一方面会提升话题关注度,增加曝光,另一方面如果争论中包含大量负面情绪和批评,会对电影口碑造成不利影响;不同观点的激烈争论可能使电影的市场定位模糊,目标受众难以形成统一认知。
互联网平台网页设计分为前端和后端,前端向大众展现数据,从互联网平台上获取数据可以使用网络爬虫,爬虫可以收集所有前端能展示的数据。但是后端可以接收大众行为数据和显数据,并进行处理,也可以筛选展现给大众的数据,换言之,平台公司可以不向观众展现所有的电影数据。例如豆瓣展现短评数据最多只能展现200条,平台用这种方式维护网络数据安全。这对于电影舆情分析是有阻碍的,但由于评论数据可以按时间排列,可以实时记录随时间变化的所有评论数据是需要的。
这样实时的数据收集处理方法是一种在线方法,电影舆情的数据是实时变化的,故而对发行期间电影舆情的分析也是需要实时的,从电影宣发启动的那一刻开始,有关于这部电影的数据就在不断地积累变化,舆情监测一般都是在线的。因此,院线电影票房危机预警系统的逻辑是:
1.实时监控爬取百度、豆瓣、猫眼、微博等社交媒体对一部影片的实时评论,并对评论数据进行情绪分析;
2.迅速对这些文本信息挖掘、分析,提取主要话题和热点;
3.对其中可能危及影片票房的负面因素进行提取、按破坏严重性强弱提出警告;
4.随着时间叠加对信息及时更新;
5.为发行方调整方案提供依据支持。
合理且普适的舆情监测方法设计,要顾及评论情感倾向和文本的主题观点,情感倾向帮助确定受众舆论倾向,对于舆论倾向偏消极的评论数据再进行主题抽取,挖掘出潜在危机因素,主题抽取可以反映出的具体危机因素。
二、情感·倾向
为了定位舆论危机主题在显数据中的核心位置,需要对显数据进行情感分析。情感可以被计算机理解计算。“对于人们的情感在某种程度上是可以定性和定量分析的。”[6]自麻省理工学院媒体实验室Picard教授1997年提出“情感计算”的概念以来,“如何赋予计算机识别、理解、表达和适应人的情感的能力”这一命题逐渐被人们丰富研究。[7]计算机对于情感的识别是其中一个基础问题,研究人员描述人类感知,并对人类情感建立起情感描述模型。中文语境中的“情感分类”主要指将情感“分为两类(正面或反面)或三类(正面、反面与中立)”,即积极喜欢的、消极反对的和没有偏向的三种立场。
“情绪分析”主要指“在现有粗粒度的情感分类基础上,多维度地描述人的情绪态度”,情绪分析比情感分析更加注重心理学视角,也更加复杂,研究人员构建了更加丰富的情绪模型,大致分为分类模型和连续模型①。
分类任务在人工智能研究中较为基础,对于情感的二分类任务,可以看作一个函数F(x)=0/1(消极/积极),x是指需要被情感分类的对象,在电影舆情分析中指的是单条文字评论。函数F(x)代表计算机对x的分类处理过程,也是一个非设计者们未打开的“黑箱”,这个黑箱中装配着很多参数,仿佛模拟人类的神经元,大多数情况下,设计者们使用人工标记好的训练数据对“黑箱”进行训练,相当于把知识喂给“黑箱”,监督其学习,使其具备对更多x情感二分类的能力。
这样的情感分析方法仍然存在着一些问题,使用到这些方法的计算机中的算法大多是在特定领域下研究,使用领域内特定的数据集对算法进行实验。当性能优良的算法被运用到电影舆情的分析中,往往需要适应电影领域特定的知识结构。借助情感词典是一种情感分析的方法,但是在不同领域中,一些词的表达并不一致,如“不可预测”在电影评论中是褒义的,表达票房潜力很大等,但在机械工程领域是贬义的,意味着会存在未知的风险。
不同的评论数据侧重的情感分析关注点不完全一样。短评论数据中的情感倾向更加简洁明确,一般不会出现多种不同的情感。对其直接进行积极/消极二分类是较好的办法;长评论数据中包含观众对于电影的多维情绪,故而需要设计更为复杂的情绪模型,对多维情绪进行概括,还有一种方法是对长评论数据进行分段处理,并分别分析各段的情绪,这样可以避免将一段长评论数据的分段处理混合在一起;讨论数据往往由多条短句构成,情感表现更加明显简洁,通过对一组讨论数据中所有的用户发言进行情感分析,一般会有三种结果:讨论中积极的情感显著多/差不多/显著少于消极的情感,分别代表着引发了好的共情/争吵/坏的共情。
通过对显数据的情感分析,人们可以粗略地区别出情感倾向为积极的和消极的评论数据,消极的评论数据中有影响电影票房口碑的潜在因素,需要对其进行主题抽取。情感倾向为积极的评论数据也不能忽视,其中包含可以帮助宣发团队加以营销的话题。
三、主题·挖掘
对显数据进行情感分析后,为了明白造成负面情感的舆论主题,需要对评论文本进行主题挖掘。评论的主题挖掘,需要同时考虑到两个角度:分析单个评论文本的时候进行主题提取或分类,分析全体评论文本的时候进行聚类分析。如果计算机想理解单个评论数据中的主题,需要对单个评论数据做主题分类。但是如果考虑到面向整体评论数据,哪些主题是关键的?哪些容易产生影响?需要对单个文本提取出的主题做整合,常常用到的方法为聚类。自然语言处理已经发展了主题分类、主题建模、文本相似度计算等具体任务,数据挖掘需要在此基础上融合各项子任务。
如果有一堆评论数据需要弄清楚其中含有哪些主题,需要进行主题建模,而如果已经知道电影舆论的主题可能有哪些,希望计算机对评论文本自动标注主题,这是主题分类。显然票房危机预警系统需要发掘的是潜在危机,即宣发阶段受舆论影响,是事先无法规避的情况。
主题建模在对评论的研究中被广泛运用,人们大多采用LDA(潜在狄利克雷分配)主题模型,这种方式假设每个文档都包含多个主题,而每个主题又由一组词语组成。通过分析文档中词语的分布,LDA模型可以推断出每个文档的主题分布以及每个主题中词语的分布。例如有一些评论数据:
【1.故事节奏太快了】
【2.女主演技太差了,电影色调和情感表达有冲突】
【3.男主的配音太跳戏了,我实在看不下去】
通过LDA主题模型计算,可以获得:
主题1:“故事”,“节奏”,“太快”
主题2:“女主”,“演技”,“太差”
主题3:“冲突”,“色调”,“情感”,“表达”
主题4:“男主”,“配音”,“跳戏”
每个主题中的主题词都来源于原有评论数据,LDA主题模型方法最终通过主题词表达主题。站在舆情监测使用者的角度,系统能够直接给出主要的潜在危机因素远比给出一个半成品数据需要使用者进一步分析更好。有时候,LDA方法得出的一个主题下的主题词并不能让人理解整体含义。
语言模型可以解决这样的事情。这句话可以被分为多个词如【“语言”“模型”“可以”“解决”“这样”“的”“事情”】,词之间有着语序上的联系,为了生成这句话,计算机需要计算第一个词是什么概率;在第一个词基础上,第二个词是什么概率;……在前面所有词的基础上,最后一个词是什么概率。这就是计算机生成语言的逻辑,语言模型需要解决的就是建构自然语言的概率分布。
采用这样的处理方式,计算机需要计算的参数量过大。所以语言模型的发展早期较为困难,随着算力的增强以及技术的突破,大语言模型随之诞生。如今,大语言模型可以根据提供的问题(提示词)作出接近人类语言的回答。机器对人类语言的理解和生成达到一个成熟的阶段。大语言模型可以轻松解决对文本的观点抽取、主题分析等等。
因此算法工程师将语言模型运用于主题模型中,提升机器对自然语言的理解能力,目前效果较好且常被人用于主题分析的方法就是BERTopic主题模型,它通过使用大语言模型将文本数据映射到高维向量空间,并在此空间中聚类相关文本,从而发现文本数据中的主题结构。这样的主题模型得到的围绕主题的关键词更加容易被理解。再使用大语言模型对主题词进行概括,得到容易被人们理解的话题句。
这样的算法对于电影舆情检测仍然存在着一些问题。其一是当前的处理方式并没有良好的在线性。主题模型的每次处理都是对整体数据的直接计算,意即若刚开始有5条评论数据,主题模型对5条评论数据进行主题分析,一段时间后有50条评论数据,主题模型分析的数据规模扩大了10倍。随着时间的变化,评论数据量越来越多,主题分析的每次处理都需要对全部数据进行一次计算。这会造成很大的冗余计算量,预警系统在电影发行中后期面临分析时间长的问题。其二是情感分析的准确度对主题分析有着很大的影响。不准确的情感分析会将积极的评论也认为是消极的,同样,将消极的评论认为是积极的并不参与负面因素提取的抽取。这一方面会使负面因素提取的结果中混入一些积极的评论主题,影响系统用户的理解,取代原有应该被挖掘出的负面危机;一方面一些蕴含着潜在危机的负面评论被情感认为是积极的,这样的潜在危机就很难再被发觉。
对不同评论数据的主题挖掘侧重点也不一样,短评数据观众的主题更加简洁明确,较为单一,但是语言容易口语化,引发机器理解上的偏颇,所以需要更加关注对评论的主题分析;长评论数据通常包含用户更多维度的评价和反馈,富含多元主题,观点表达更为详细全面,故而对评论数据的理解并不困难,反而需要认真对长评论文本进行切分,使观点和观点之间不会相互影响。例如情感分析中提到的,讨论数据大多由短句构成,观点较为明确,但是表达过于口语化,故对讨论中单个用户短评的分析类似于对短评数据的主题分析。除此之外需要做特殊处理,处理一个讨论中涉及的主要观点和次要观点,并分析影响力。
四、算法·算力
从设计发行期间电影票房危机预警系统,到分析舆情监测中需要分析情感和文本主题两大子问题,这一系列的步骤都在设计算法。算法一词并非局限于计算机科学领域,在哲学乃至认知科学领域,算法具有更广义的定义。算法是指解决特定问题或执行特定任务的一系列有序步骤的有限序列。这是一种面向解决问题的思维方式。
人工智能的算法主要经历了四个阶段:符号主义、统计方法、深度学习和大模型。①符号主义时期的算法依赖于明确的规则和逻辑进行推理和决策。这些规则通常由人类专家定义和编码,这一时期算法可解释性强,但对复杂问题和大规模数据处理能力有限,缺乏灵活性;统计方法使用概率论和统计学原理进行建模和推断,可以处理不确定性和随机问题,但模型的扩展性有限;进入深度学习时期,多层神经网络学习大规模数据,获得处理数据提取信息的能力,这个时候算法内部结构复杂,缺乏强可解释性,且对计算资源需求较高;随着算法和算力的提升,模型的参数可以包含数十亿甚至数千亿个参数,具有更强的涌现能力和处理能力,即所谓的大模型,算法训练和部署成本高,对数据和算力依赖较大。
根据对人工智能算法发展的分析,可以发现算力随着硬件性能的提升和计算方法的不断优化,以极快的速度不断变得更强大,可以辅助更大规模的问题处理;数据方面呈爆炸性增长,且数据更加多元化;算法可解决的问题越来越广,逐渐转向对更大规模和更多元数据进行处理,对算力的依赖也越来越强。强大的算力、更多的数据和智能的算法三者相互辅助又相互制约,共同建构当下的人工智能。
即使有着强算力、大数据和智能算法,对于院线电影发行期间的舆情研究,仍然存在着很多问题。“从大数据分析的数学原理来看,当前通过电影舆情数据挖掘进行风险控制其实是在以偏概全,这类分析目前能够做的是数据优化”[8]。诚然,至今国内电影舆情分析研究只能对宣发团队提供警醒,告诉宣发团队出现了哪些危机需要调整,并不能给他们提供建设性建议。如果需要帮助调整风险控制策略,需要帮助计算机学习营销管理相关的知识,并让计算机了解团队的宣发策略。“从电影数据的积累和运用来看,需要人工研判和机器分析相结合”[9]。电影舆论的影响因素种类多样,不好完全规避,至今计算机算法并不能做到百分之百可信。
从舆情分析技术层面看,仍然有很多不足和可展望之处。
(一)适应跨域研究,建立特色电影舆情分析体系
目前使用的人工智能算法在特定的研究领域下效果显著,但不代表在对国内电影舆情领域的分析就一定可以取得显著效果。一方面是大多数算法在处理英文的效果远比中文好,中文面临的自然语言处理问题更加困难,如中文分词在不同情况下容易造成歧义;另一方面是不同领域下,算法需要适应领域内知识,如LDA主题模型算法在处理书籍或者新闻文本数据的时候效果好,但在电影评论中效果就没那么显著。针对这类问题的解决方案就是建立专属电影舆情分析的方法,通过对中文自然语言处理方法进行优化,建立电影舆情分析专有的数据集和分析体系以及对纯算法研究中的算法进行本地化参数调整训练。
(二)情感分析转向情绪分析
更加细腻的情绪分析比情感分析能提供更丰富的情感维度,有助于更准确地捕捉观众的心理动态。除了建立起更加细化的情绪模型,还需要对不同情绪进行分析,哪些情绪可能在电影分析中造成不利的影响。此外,对监测观众情绪随时间的变化,识别情绪波动和转折点也很重要,可以根据趋势确定是否应该对某些因素进行规避。
(三)评估主题影响力和传播路径,识别传播节点和意见领袖
需要对主题分析建立更全面的影响力分析不仅需要识别主题,还需评估每个主题的影响力和传播路径,分析其对电影票房和口碑的潜在影响。首先,通过社交网络分析方法,追踪主题在网络中的传播路径,识别关键传播节点和意见领袖;其次,构建影响力评估模型,量化每个主题对电影票房和口碑的潜在影响,提供数据驱动的决策支持;同时,实时监测各主题的舆情热度,识别潜在的危机或机遇,及时调整宣传策略。
(四)适应大语言模型,获得更精确的预警结果
大语言模型具备更强的理解和生成能力,可以提升主题分析和情感识别的准确性。利用最新的大语言模型(如GPT-3、BERT等),对电影舆情数据进行训练和微调,以提高模型在特定领域的表现。通过增强模型的上下文感知能力,能够准确理解评论中的隐含信息和细微差别,从而提高情感和主题分析的准确性。基于大语言模型,还可以开发生成式预警系统,自动生成针对潜在危机的应对策略建议,从而提高预警的智能化水平。
结语
尽管当前的技术发展已经让舆情监测、自然语言处理和人工智能算法在许多领域表现出色,例如,通过推特和微博等社交媒体平台的大数据分析帮助企业和政府机构科学决策,这些技术的应用已经较大地改善了信息获取和处理的效率。然而,专用于电影行业的分析方法仍未被充分开发和应用。电影领域具有其特殊性,例如影评的情感倾向、观众反馈的多样性以及影响电影票房的复杂因素,这些都需要更加精细和定制化的工具来解读和预测。
此外,需要在监测过程中依据新媒体舆论的传播规律,深入理解信息如何在不同的社交网络和平台间传播,以及这些传播路径如何影响公众意见的形成和变化。这种理解对于预测电影舆论走向和市场反应至关重要。从传播学角度来看,新媒体舆论的形成需要经历信源发布与议题呈现、舆情扩散与意见整合和舆论效应消散等关键节点,其中新媒体舆论的传播规律也有着自己的特点,如次生舆情出现频度增加、意见领袖影响力增强等。[10]在大数据分析中对于这些传播要素的理解和运用可以帮助电影舆情监测更好地适应市场。
构建一个实时的票房危机预警系统,实时监控舆情变化和票房数据,及时提醒制片方和发行商做出实时调整是有必要的。通过引入先进的算法和模型,可以更好地理解和预测市场动态。这些数据及分析方法,对于分析预测市场受众喜好,选择下一部电影的题材有着更强的指引作用。希望通过这些探索和研究,推动电影舆情分析和票房预测技术的进一步发展,为电影产业的发展繁荣贡献新的力量。
参考文献:
[1]伍婷.大数据语境下动画电影评论典型意见挖掘分析[ J ].电影评介,2022(20):11-16.
[2]刘玲玉,邓燕燕.基于Python情感分析和批评隐喻的网络话语分析——以影片《流浪地球》中美德影评为例[ J ].
江苏大学学报:社会科学版,2022(03):76-88.
[3]王道平,宋雨情,主编.大数据分析[M].北京:北京大学出版社,2022:7.
[4][9]凌燕.新媒体时代的国产电影舆论生态[ J ].现代传播(中国传媒大学学报),2013(04):53-57.
[5][8]倪万.基于大数据的电影舆情数据挖掘与风险监控研究[ J ].当代电影,2016(02):71-76.
[6]林政,刘正宵,李江楠.情感分析进阶[M].北京:机械工业出版社,2022:3.
[7][美]罗莎琳德·皮卡德.情感计算[M].罗森林,译.北京:北京理工大学出版社,2005:13.
[10]宫承波,主编.新媒体概论[M].北京:中国广播影视出版社,2022:175-179.