APP下载

中国城市电影产业经济特征与票房的影响因素研究
——以一二三四线城市为例

2022-05-23马衍明

电影文学 2022年3期
关键词:电影票房神经网络变量

马衍明 袁 佳

(上海应用技术大学人文学院,上海 201418)

自2002年院线制改革以来,国内电影产业发展迅速,每年观影票房都屡创新高。即使在2020年新冠肺炎疫情全球大流行的背景下,国内电影行业依然展现了强健的生命力,市场恢复速度远在全球前列。截至2021年6月30日,2021年上半年度国内电影票房达到276亿元,产能达到2019年同期的95%,观众数量也达到同期的85%,给国内电影行业的整体复苏注入了强心剂。但不可否认的是,虽然国内电影产业持续蒸蒸日上、票房屡创新高,但在疫情冲击下逐渐暴露出了许多问题。伴随着全球经济增速放缓和在线网络消费模式的崛起,传统影院面临的竞争态势及生存状况愈发严峻,短视频和网剧、网综的在线冲击,以及电影窗口期的间隔缩短等都在迫切要求传统影院做出改变,传统影院的何去何从逐渐成为学术界日益讨论的话题。在此背景下,分析传统影院如何在逆境下提高收益,充分发挥影视产品的经济属性值得国内电影人持续探索。

一、研究背景与理论分析

近年来,国内新增影院持续保持着高速增长,影院下沉趋势不断显现。但高速增长的背后,带来的却是单影院平均票房、单银幕平均票房、单场次平均票房等连年下降(如表1)。截至2019年底,国内单银幕平均票房跌至85.14万元,单影院平均票房跌至218.82万元,单场次平均票房跌至511.32元,银幕增长速度与票房增速及观影人次增速并不相匹配。尤其在近些年影院不断下沉的三四线城市,票房增长活力愈发减弱,当地影院的生存经营面临着极大挑战。据《2020中国电影产业研究报告》统计,2019年三线以下的城市及乡镇影院新增银幕6142块,占到全年新增银幕的69.11%,但同时三线以下的城市及乡镇影院累计注销银幕733块,占到了全年注销银幕的66.94%。下线市场虽然影院建设尚有空间,但影院经营效率远不及其他城市,受制于经济发展水平和人均观影习惯等因素,各地电影产业发展水平极不均衡。

表1 2016—2020年电影产业数据统计情况(1) 数据来源于中国电影家协会和中国文联电影艺术中心编制的历年《中国电影产业研究报告》。

此外,伴随着国内电影产业的蓬勃发展,不同城市间的观影体量差别正在不断拉大,以2014年和2019年不同城市间的电影产业相关数据为例。2014年一线城市放映场次564.5万次,总票房68.37亿元,而2014年四线城市放映场次900.2万次,总票房仅35.39亿元。可看出早在2014年一线城市与四线城市在影院经营效率方面和场均观影人次就已经存在较大差异。到了2019年,一线城市放映场次为1543.5万次,累计票房达到122.35亿,而四线城市放映场次3331.6万次,票房却仅有112.81亿元,相比较之下,一线城市与四线城市之间的观影体量和人均消费趋势正在不断拉大。伴随着一二线城市人均观影量和市场需求的渐进饱和,开发下线市场和挖掘票房潜力已经是必然趋势。然而,下线城市影院建设速度虽然不断加快,但实质上票房并未显著增加,相反带来了一系列运营成本上升和影院经营压力不断增大的问题。因此,研究不同城市下电影产业的相关经济特征对当地影院电影票房产出的影响是当下非常迫切的问题,对于完善电影行业市场体系、加快电影行业供给侧改革和稳定电影市场发展具有重要意义。

二、研究设计

(一)数据来源

研究城市电影产业经济特征与电影票房的关系时,需要考虑到各个城市之间的经济发展水平和资源配置方面的差异,以及不同城市电影产业发展的实际状况。基于此,本文根据《中国城市统计年鉴(1980—2020)》中的城市相关指标进行筛选处理,以2020年《城市魅力商业排行榜》为依据,整理出各线城市产业经济发展指标。城市电影产业的相关数据来源于阿里巴巴公司旗下的灯塔专业版APP,票房、影院等相关数据主要来源于中国电影家协会和中国文联电影艺术中心编制的历年《中国电影产业研究报告》。本文以灯塔专业版APP中各线城市为横截面单元,选取2014—2019年共6年数据作为模型研究的主要对象。其中,不选取2020年数据主要是因为疫情影响导致2020年电影产业大幅度缩减,各线城市电影产业经济指标都大幅度下降,因此本文以2020年之前年份的数据为基准。此外,本文数据全部进行了SPSS Modeler软件中的数据审核处理,以此避免极端值和离群值的影响。

(二)变量选择

本文对于城市电影产业经济特征的变量选取主要包括各线城市的GDP、当地总人口、城市平均人口、人均消费能力、银幕数量、观影人次、上映的影片数量、影院放映场次、上座率、平均票价、平均一部影片产生的票房和场均观影人次等。参照2020年《城市魅力商业排行榜》,本文将一二三四线城市按照不同年度的生产总值进行加权平均处理,以此作为反映各线城市经济特征的度量指标。当地总人口以历年《中国城市统计年鉴》统计的年末户籍人口为基准,将各线城市人口加权求和,而城市平均人口则在此基础上将总人口除以各线城市的数量。GDP则定义为各线城市生产总值的平均值,数据来源于《中国城市统计年鉴》。此外,银幕数量、观影人次、上映的影片数量、影院放映场次、上座率、平均票价、平均一部影片产生的票房、场均观影人次等均以灯塔专业版APP和《中国电影产业研究报告》中提供的数据为准,这些变量能够较为精确地反映各个地域之间不同的观影特征和消费趋势,对于当地电影产业的发展和影院的日常经营提供了较为精确的衡量指标。

对2014—2019年城市经济指标与电影票房的总体数据进行描述性统计(如表2),国内电影票房的均值为124.8,最大值为297.6,最小值为35.4;城市GDP均值为11442.9,最大值为92887.8,最小值仅为475.8;当地影院放映场次最大值为5414,最小值为564.5,均值为2093。从中可以看出随着国内经济建设的蓬勃发展,各个变量在不同阶段发生了显著变化,2019年数据相比2014年数据发生了等比级数增长。并且不同城市之间的差别也在不断增大,一线城市无论是GDP、城市人口,还是平均票价,都远远超过任何时期的四线城市,不同城市之间的消费体量和观影差距正在不断拉大。

表2 主要变量的描述性统计

(续表)

(三)研究模型

神经网络是20世纪80年代以来人工智能领域兴起的研究热点,是从信息处理角度对人脑神经元网络进行模拟,通过构建运算模型,以大量节点(或称神经元)相互连接,每个连接都关联一个对应的权重,其模型学习过程就是连接权重的更新训练过程(如图1)。目前学术界对于神经网络的运用大多针对于训练神经网络模型的准确性,通过多种预测模型进行实验组与对照组进行比对,判断相同条件下不同模型的预测效果和解释程度。相比较其他行业,电影产业似乎显得更为特殊化和复杂化。对于电影产业而言,出于市场极大的风险性和不确定性,市面上的即时讯息通常很难被准确预测,同时就算投入再多的营销费用,也不一定会成为热门影片,票房产出似乎天生就伴随着“天时地利人和”的特征。

本文主要采用SPSS Modeler软件构建神经网络模型,分析不同城市下电影产业经济特征对票房不同作用的大小。神经网络不同于其他数据分析方法的特点在于神经网络模型会根据大量数据的迭代训练找出不同类别潜在的映射关系,也就是无论数据多么庞大,自变量有多少都能分析出数据背后潜藏的关系,因此用神经网络模型去预测分析电影产业的票房有一定的适用性。目前神经网络最主要的用法包括多层感知器(MLP)和径向基函数(RBF),其中径向基函数只含有一个隐藏层,学习速率相对较高,但是预测能力相对较低,而多层感知器系统是通过将多个因子变量集中投射到相对单一的输出数据中,再运用误差反转 BP 学习算法,具备较好的学习能力和预测能力。本文研究主题主要是分析国内各线城市电影产业发展要素对于票房的影响大小,比较注重模型的学习能力和预测能力,为此模型选用多层感知器(MLP)。如图1所示,MLP是含有输入层、隐藏层和输出层的三层感知器,其隐藏层和输出层的激活函数通常为Sigmoid函数,为分类型一般采用[0,1]阶跃函数,如下:

图1 多层感知器神经网络结构图

设样本输入向量为

x

=(

X

,

X

X

),隐藏层第j个节点输出为:

其中

w

表示第j个隐藏节点和第i个输入节点的权重,b为偏差项。输出层第k个节点关于x的网络输出为:

其中

V

表示第k个输出节点和第j个隐藏节点的权重,

b

为偏差项。为了判断神经网络学习过程是否终止,一般判定预测误差达到较小差,或者正确分类的样本已经达到一定比例即中止学习。本文主要是对影响电影票房的变量进行预测分析,所设置的中止规则是无法进一步降低误差,其隐藏层个数为系统自动模拟计算,根据不同城市下实际状况匹配最优的隐藏层个数。同时为了检验神经网络模型迭代更新的真实程度,本文通过神经网络模型得出的结果进行线性回归,检验不同变量对票房的实际作用大小,并结合主成分分析(PCA)简化所有作用因素,最后观察三者之间得出的结果是否一致。

三、实证分析

(一)神经网络模型结果分析

如表3所示,对国内所有城市进行统一汇总预测可得平均一部影片产生的票房、观影人次、城市平均人口、上映影片数量和GDP对票房的增长起到重要影响作用,要想促进国内电影票房体量的上升可从提高影片的质量、促进观影活动消费和扩大影院覆盖率出发。但是不同区域下的影院建设、当地人口数量和平均消费水平都有显著差异,因此需要对不同层级下的城市做进一步检验分析。对一二三四线城市分别做神经网络预测分析,结果发现各线城市影响票房的经济特征存在差异,基于城市的人口地貌、人均消费能力、城市影院建设程度等因素,影响当地电影票房产出的因素多种多样。

表3 神经网络模型预测结果(括号内为模型预测的变量重要性)

将一二三四线城市统计结果全部加权求和发现,观影人次、单部影片产生的票房、银幕数量、城市平均人口、单个银幕产生的票房、上映影片数量和当地总人口占比最高,与总体城市神经网络统计结果高度一致,验证了上文所有城市电影票房影响因素的结论。其中,一二三线城市的主要影响因素和四线城市有所区别。一二三线城市比较突出单部影片的票房、观影人次和上映影片数量,但四线城市却额外体现在城市平均人口、银幕数量和平均票价等方面,反映出四线城市相比一二三线城市在影院建设、观影成本和人均观影方面还有待提高。另外,影响一二三线城市电影票房的因素大多在于电影本身和影院运营效率方面,而四线城市的院线基础建设还未完全开发,当地居民出于价格、时长、地理位置等因素,对电影观影活动存在较多不确定性,观影活动并未成为刚需,此时要想提高当地观影体量,影院下沉、降低票价等手段值得尝试。

此外,为检验模型预测变量的准确性,本文采用SPSS Modeler中的分析节点,比较输出结果与输入结果的差别。如表4,五个神经网络模型残差结果都较为可观,其平均误差和标准差均在可接受的范围内,表明模型预测结果较为准确,与真实数据相比并未产生太大变化,可接受模型预测结果。

表4 神经网络模型残差分析

(二)普通最小二乘法(OLS)回归检验

为了验证以上神经网络模型预测变量的解释程度和准确度,本文利用普通最小二乘法建立多元回归模型,判定城市电影产业经济特征对电影票房的实际作用影响。基于本文篇幅以及检验方法的合理性,本文主要以神经网络对总体城市所预测的重要变量进行检验。假定计量模型为:

Box office=β+β×

X

其中,X(i=1、2、3、4)表示神经网络模型得出的影响总体城市票房最显著的四个变量,分别为AB平均一部影片产生的票房、AD观影人次、AU城市平均人口、QU上映影片数量,ε表示随机扰动项。为验证神经网络模型实际结果,本文将其余变量设置为调节变量,采用异方差稳健的标准误估计。如表5所示,模型1-4是分别对前四种显著变量进行回归分析,结果显示均与票房高度相关,验证了神经网络对城市电影产业经济特征的预测结果,并且系数全部都为正,说明以上因素对票房都有显著的正向影响作用。模型5和6显示,加入其余调节变量后,会单独影响个别变量的显著关系,但大体上回归系数没有明显改变,其结果认定为在1%和5%水平上通过显著性检验。同时模型回归后的拟合优度达到0.7以上,可认定为模型能够较好地解释因变量,具备较好的可信度。

表5 回归结果分析

(续表)

关于模型稳定性检验问题,本文通过分位数回归检验,观察不同分位数情况下模型回归系数的稳定性,设定置信区间为95%,分位数分别设定25%、50%和75%。如表6所示,四个变量的分位数回归系数比较贴合原回归系数大小,其正负号均未改变,说明模型回归结果较为可信,能够较为直观地反映出变量之间的相关性。但观察AB(平均一部影片产生的票房)在分位数50%和75%情况下未能拒绝显著性检验,分析背后原因可能是不同年份不同城市下所上映的影片数量大小不一,用平均一部影片产生的票房衡量一二三四线城市所有数据可能会存在异质性,同时分位数与普通最小二乘法目标算法也存在不一致,导致两者结果存在些许差异。

表6 主要变量分位数回归系数

(三)主成分分析(PCA)检验

通过上述神经网络模型和普通最小二乘法统计分析的结果显示,AB平均一部影片产生的票房、AD观影人次、AU城市平均人口和QU上映影片数量能够较好反映国内电影票房实际影响因素。但受制于神经网络、普通最小二乘法 (OLS)和分位数回归的不同目标算法,其个别变量并没有完全符合神经网络模型回归结果。因此本文在此基础上引入主成分分析方法,不牵涉函数具体算法,只是单在所有影响因素中进行降维处理,减少多余变量和不重要变量因素的影响,识别最原始变量之间的关联模式。

如图2和表7所示,前四个变量累计占到总方差的97.3%,后面特征值的贡献率越来越小,从第四个变量开始,其后的贡献率不超2%。因此选取前四个变量具有一定的合理性,表明存在四个变量能够较好地解释所有变量信息。同时也验证了神经网络模型预测的精确程度,间接对普通最小二乘法回归模型的不足之处进行一定的补充。

图2 碎石图

表7 主成分分析结果

(续表)

四、结论与建议

本文基于国内2014—2019年的各线城市电影产业数据,通过SPSS Modeler软件进行神经网络预测分析,在此基础上对预测结果进行普通最小二乘法(OLS)和主成分分析(PCA)的检验判定,结果显示可较好地接受神经网络模型的预测结果。具体有以下结论:(1)单部影片产生的票房、观影人次、城市平均人口和上映影片数量对国内电影票房有重大影响,尤其对于经济较为发达的一二三线城市,其影院覆盖率、居民观影习惯、物质消费能力等都达到了较高水平,此时影响电影票房的因素主要从外部因素出发。(2)四线城市和一二三线城市在经济发展水平、当地消费能力和院线基础建设方面存在差异,影响电影票房的因素大多集中在票价、银幕数量和城市平均人口方面,市场观影潜力仍未完全激发出来。尤其在近些年网络消费模式的崛起下,传统影院逐渐受到短视频、网络电影和网剧、网综等一系列线上视听产品的冲击,对于近些年不断加速下沉的新老影院日常经营都造成了重重压力。

基于本文的研究,为了推动国内电影产业的可持续发展,提出建议如下:(1)在市场布局方面,需要合理考虑不同区域间的实际差异,注重当地市场实际消费能力和市场增长空间,以各地区电影产业实际发展状况采取梯度化建设。对于经济较为发达、观影体量较大的一二三线城市可以考虑在原有观影活动的基础上提升影院附加价值,宏观上以院线整合带动相关产业链消费升级,开发电影产业链的多功能价值链条,以影院服务的上升、观影体验感的升级和相关产业链的整合消费作为当地影院的核心竞争优势,促进当地更多人走进影院,推动整体消费体量的上升。而对于四线以下的城市,一方面需要鼓励影院下沉,提高影院基础建设,另一方面必须培育下线城市的观影习惯,以市场营销为主,降低票价为辅,积极策划丰富的观影活动,把下线市场的人口优势转化为电影票房增长的动力来源。(2)在需求提升方面,需要不断提升精品化和类型化的优秀影片创作能力,影片的上映数量和单部电影产生的票房对国内电影票房的增长起到重要影响作用。同时,对于影院基础建设能力不足的四线城市,可在政策允许的范围内适当引入外资,利用外资新建电影院,加大院线放映终端的投入。(3)在政府引导方面,对一二三线城市需要统筹协调,以全产业链为核心布局,带动当地产业链的协同发展,弥补当地观影体量上升带来的消费活力未满足的现状。而对于四线城市除了鼓励新增影院下沉和培养下线市场观影爱好之外,更多方面需要从数量建设转向提质增效建设,合理布局下线城市影院,尤其在近些年“影视寒冬”情况下,影院建设更要提质减量,切忌盲目运营开发。

猜你喜欢

电影票房神经网络变量
抓住不变量解题
新年新气象,元旦来带头 2021年1月电影票房排行榜
打铁还需自身硬 2020年10月电影票房排行榜
意料之中,整体表现平淡 2020年9月电影票房排行榜
也谈分离变量
神经网络抑制无线通信干扰探究
暑期档继续“遇冷”2019年7月电影票房排行榜
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
SL(3,3n)和SU(3,3n)的第一Cartan不变量