APP下载

基于乘积季节模型的湖南卫视收视率的分析与预测

2016-04-08周双娇

湖北理工学院学报 2016年1期
关键词:收视率时间序列分析预测

周双娇

(南京财经大学 应用数学学院,江苏 南京 210046)



基于乘积季节模型的湖南卫视收视率的分析与预测

周双娇

(南京财经大学 应用数学学院,江苏 南京 210046)

摘要:以湖南卫视全天平均收视率为研究对象,考虑到收视率的周期性,引入ARIMA乘积季节模型对其进行分析与预测.对收视率序列做差分平稳化和消除季节性处理,再通过模型识别与定阶,确定选用ARIMA(4,1,1)×(3,1,1)7模型,建立模型并做参数估计.模型检验结果表明:该模型拟合效果好,预测值与真实值接近,误差较小.

关键词:收视率;乘积季节模型;时间序列分析;预测

电视收视率是指在一定时段内收看某电视频道或某电视节目的人数占总目标观众人数的比重,用百分比表示.在电视行业,收视率是最重要的量化指标之一.一方面,电视台通过收视率来了解观众的收视行为和偏好,以便在节目编排中提高传播的针对性和有效性;另一方面广告商也需要根据收视率,在广告投放决策上正确地进行时段价值评估和选择性购买,从而将有限的广告费用在刀刃上.因此,无论是电视台还是广告商,都要对电视台的已有收视率进行深入分析,并对未来的收视率作出预测,才能在销售和购买广告时段方面实现价值最大化.

鉴于收视率的重要性,收视率的分析受到广泛关注,收视率的预测方法和技术日益成为国内外学者的重点研究对象.早期主要是采用贝叶斯网络预测收视率[1]或通过决策树理论进行预测[2],但这2种方法都没有给出收视率的预测值;线性回归模型[3]是预测收视率较为简单的方法;文献[4]和文献[5]都选用了BP神经网络预测模型进行预测;此外,还有利用RBF神经网络[6]寻找最优参数进行预测的方法;文献[7]基于ARIMA模型进行预测,并没有考虑收视率的季节性;文献[8]基于收视率预测模型,分析收视率的主要影响因素、优化节目编排.

本研究在ARIMA模型的基础上考虑了收视率的季节性,即收视率有一定的周期性,且以星期为周期,选取2013年4月1日-2014年3月31日湖南卫视全天平均收视率数据,建立乘积季节模型ARIMA(4,1,1)×(3,1,1)7进行深入分析,并作出预测.

1乘积季节模型

时间序列分析可以将某一现象的发展变化规律或某一现象与其他现象之间的内在关系用数量刻画出来,还可以运用时序模型预测和控制现象的未来行为.

在许多实际问题中,涉及到的时间序列的变化通常包含周期性规律,并且这些规律一般是由季节(周期)变化所引起.处理这类包含季节性的时间序列,首先要对序列做季节差分消除其季节性,再建立合适的季节模型.而遇到的实际问题通常是季节性和趋势性同时存在的情况,因此必须先剔除序列趋势性再识别序列的季节性,不然序列季节性会被强趋势性掩盖,此类问题建模可以选用乘积季节模型.

ARIMA乘积季节模型[9]的一般形式如下:

(1)

其中:

Φ(B)=1-φ1B-φ2B2-…-φpBp;

Θ(B)=1-θ1B-θ2B2-…-θqBq;

U(BS)=1-u1BS-u2B2S-…-uPBPS;

V(BS)=1-v1BS-v2B2S-…-vQBQS.

2数据处理

2.1样本选取

本研究选取的数据为2013年4月1日-2014年3月31日湖南卫视全天平均收视率,共365个数据,这些数据来源于央视-索福瑞媒介研究(CSM).文中的平均收视率值是观众平均每分钟收看该节目的百分比,即先计算每分钟收视率再取平均值.

2.2数据处理

绘制湖南卫视全天平均收视率序列{HN}的折线图如图1所示,该图直观体现了收视率序列具有一定的增长趋势,且是周期性地重复这种变化趋势,故该序列应是非平稳且有季节性的波动.

2.2.1数据平稳化

为消除原序列的非平稳性,这里对序列作差分运算.对一阶差分后的新序列绘制序列{DHN}图如图2所示,由图2可以看出序列增长趋势已基本被消除,可以认为新序列基本上是平稳的.

为了进一步确认新序列已平稳,这里对序列{DHN}进行平稳性检验——ADF检验,得到的结果如表1所示.该检验的原假设为序列存在一个单位根,若检验结果拒绝原假设,则被检序列是平稳序列,否则非平稳.表1显示,该序列的t统计量值为-9.710 101,明显比1%显著水平下的临界值小,故一阶差分后的序列{DHN}可以通过平稳性检验.至此,已完成了原始数据的平稳化处理.

表1 序列{DHN}的ADF检验

2.2.2消除季节性

序列{DHN}的自相关和偏自相关分析图如图3所示,由图3可知,序列偏自相关系数在滞后期k>7时落入随机区间,并且出现截尾现象;自相关系数在滞后期k=7,14,21,28时显著不为0,其值均大大超出了随机区间的范围,可见序列的季节周期为7 d.

为了消除序列的季节性,对序列{DHN}做步长为7的季节差分,并用EViews7.2软件绘制新序列{SDHN}的自相关与偏自相关分析图如图4所示,由图4可以看出,经过季节差分后序列的自相关系数基本上全部在随机区间内,可见季节性已基本被消除.进一步对新序列{SDHN}进行单位根检验,结果如表2所示,序列t统计量值为-11.803 58,显然比1%显著水平下的临界值要小,故可以拒绝序列有1个单位根的原假设,也就是说序列{SDHN}是平稳的.

3模型建立

3.1模型识别与定阶

模型识别与定阶的最重要工具就是样本自相关和偏自相关分析图.由于序列先做一阶逐期差分,后做一阶七步季节差分,故可对原序列建立ARIMA(p,d,q)×(P,D,Q)S模型,这里d=1,D=1,S=7,即选用ARIMA(p,1,q)×(P,1,Q)7模型.由图4可知,非季节移动平均阶数选q=1或q=2比较合适,非季节自回归阶数选p=3或q=4比较合适,因此(p,q)可能的组合有(3,0),(3,1),(3,2),(4,0),(4,1),(4,2),(0,1),(0,2);观察当滞后阶数为7的倍数时的自相关系数与偏自相关系数可知,P=3,Q=1.运用EViews7.2建立模型,将这8个模型的几个关键指标值列入表3,比较这些模型的AIC值与SC值可知,ARIMA(4,1,1)×(3,1,1)7模型的AIC值和SC值都是最小的,分别为-12.126 34和-12.047 34,因此将该模型选为最佳模型.模型方程为:

(1-φ1B-φ2B2-φ3B3-φ4B4)(1-u1B7-u2B14-u3B21)▽▽7Xt=(1-v1B7)(1-θ1B)εt.

表3 各模型选择的参数值

3.2模型建立与参数估计

选择ARIMA(4,1,1)×(3,1,1)7作为最佳模型后,建立模型并进行参数估计[12].利用EViews7.2软件求解得到的ARIMA(4,1,1)×(3,1,1)7模型参数估计值如表4所示.

表4 ARIMA(4,1,1)×(3,1,1)7模型参数估计值

将表4中的参数估计值代入式(1)得:

(1-0.542641B-0.113981B4)(1+0.270009B7-0.786059B14-0.209891B21)▽▽7Xt=(1-0.961433B7)(1+0.996847B)εt.

3.3模型检验

残差分析是检验模型适合性的重要手段之一,通过对所用模型的残差序列进行白噪声检验,判断残差序列中是否存在有用的信息未被提取、模型是否包含了原序列的所有趋势,从而决定模型是否需要进一步改进.若残差序列{E1}不是白噪声序列,则模型需要进一步改进,否则模型是适应的.对下面乘积季节模型ARIMA(4,1,1)×(3,1,1)7进行残差分析,得到的结果如表5所示.

以上分析结果表明,残差序列的t统计量值为-18.673 11,小于显著性水平为1%的临界值,故残差序列是平稳的白噪声,因此所建立的模型是适应的.

表5 残差序列{E1}ADF检验

4预测

4.1模型预测

利用ARIMA(4,1,1)×(3,1,1)7模型,对2014年4月1日-2014年4月30日湖南卫视全天平均收视率进行了预测,并且计算相对误差:|实际值-预测值|/预测值;预测结果如表6所示,可见相对误差很小,因此模型预测效果较好.

表6 2014年4月1日-2014年4月30日湖南卫视全天平均收视率预测值

4.2模型拟合

将ARIMA(4,1,1)×(3,1,1)7模型得出的湖南卫视全天平均收视率的预测值与真实值进行比较,绘制模型拟合图如图5所示.由图5可知,该模型得到的预测值与收视率的真实值相当接近,因此预测精度较高.

5结论

本研究采用ARIMA乘积季节模型预测湖南卫视全天平均收视率,通过对模型的检验、预测值与实际值的比较可知,ARIMA(4,1,1)×(3,1,1)7模型对该收视率的拟合效果好,预测精度高,是一个有效模型.因此,无论是电视台还是广告商,在做销售和购买广告时间的决策之前,可以利用乘积季节模型对收视率进行分析和预测,为决策提供更可靠的依据,从而实现价值最大化.

参 考 文 献

[1]张晶,白冰,苏勇.基于贝叶斯网络的电视节目收视率预测研究[J].科学技术与工程,2007(19):5099-5102.

[2]涂娟娟,刘同明.基于决策树的电视节目收视率预测模型[J].微计算机信息,2007(27):251-252.

[3]陆海鹰.基于线性回归的电视节目收视率预测模型[J].当代电视,2012(11):55-57.

[4]邬丽云,曲洲青.基于BP神经网络的收视率预测[J].中国传媒大学学报(自然科学版),2011(3):59-62.

[5]汪洋,田钢,温淑鸿.基于BP神经网络的电视节目收视率预测模型[J].电视技术,2014(6):94-96.

[6]梁招娣,刘小龙.基于RBF神经网络的电视收视率预测[J].河南科学,2013(9):1428-1431.

[7]刘辉,杜秀华.基于ARMA模型的电视台收视率预测方法设计和实现[J].控制工程,2009(S1):9-11.

[8]高彧.基于收视率预测的电视节目编排优化研究[J].理论界,2014(6):195-197.

[9]王振龙.时间序列分析[M].北京:中国统计学出版社,2000:181-192.

[10]Bowerman B L,O' Connell R T.Forecasting and time series:an applied approach[M].Duxbury Press,1993:117-156.

[11]Box G E P,Jenkins G M.Time series analysis forecasting and control - Rev. ed.[J].Holden-Day series in time series analysis,1976,14(2):199-201.

[12]易丹辉.数据分析与EViews应用[M].北京:中国统计学出版社,2002:75-96.

(责任编辑高嵩)

Analysis and Forecast of Hunan Satellite TV Ratings Based on Multiplicative Seasonal Model

ZhouShuangjiao

(School of Applied Mathematics,Nanjing University of Finance and Economic,Nanjing Jiangsu 210046)

Abstract:Taking the periodicity of audience rating into consideration,this paper studied the all day average ratings of Hunan satellite TV based on ARIMA multiplicative seasonal model.The audience rating sequence was smoothed by using difference method and its seasonal characteristic was eliminated,the multiplicative seasonal model ARIMA (4,1,1)×(3,1,1)7 was chosen after making model identification and order determination,then this model was established and the parameter of the model was estimated.The test showed that this model had a desirable fitting effect and the forecasted value was close to the actual data while the relative error was small.

Key words:audience rating;multiplicative seasonal model;time series analysis;prediction

中图分类号:O212.1

文献标识码:A

文章编号:2095-4565(2016)01-0033-05

doi:10.3969/j.issn.2095-4565.2016.01.008

作者简介:周双娇,硕士生。

收稿日期:2015-08-12

猜你喜欢

收视率时间序列分析预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
不必预测未来,只需把握现在
大型活动策划与电视节目收视率的提升策略研究
如何利用微信平台拓展提高电视节目的收视率
基于R软件的金融时间序列的预测分析
从电视访谈节目看名记者的采访技巧
“犬儒主义”与收视率
微信公众号未来发展态势的实证预测