基于BP神经网络的收视率预测
2011-06-22邬丽云曲洲青
邬丽云,曲洲青
(1.中国传媒大学 理学院,北京 100024;2.中国传媒大学计算机学院,北京 100024)
基于BP神经网络的收视率预测
邬丽云1,曲洲青2
(1.中国传媒大学 理学院,北京 100024;2.中国传媒大学计算机学院,北京 100024)
目前行业内预测收视率的方法均没有考虑收视率自身的长期相对稳定的特点,导致预测结果精度不够。本文利用人工神经网络所具有的学习记忆功能及自适应、容错性好的特点,设计了电视收视率预测系统的指标体系,建立了基于BP神经网络的收视率预测模型。实验结果表明,应用BP神经网络预测模型预测的节目收视率数据精度较高。
收视率;预测;BP神经网络
1 引言
在当今信息社会,电视收视率不仅是电视节目的测评标准,更是电视台、制片商、广告代理机构和广告主在电视节目经营和广告投放方面的决策行为的重要参考指标。目前行业内对收视率预测有较多的研究,涉及的方法主要有多元线性回归模型、决策树理论及贝叶斯网络等。不过,这些预测的方法大多数没有考虑收视率数据自身的长期稳定性,因而预测的结果一般精度不够高。本文提出了一种新的预测收视率数据的方法,即运用人工神经网络数据挖掘工具对电视节目的收视情况进行预测,通过建立收视率指标体系的建立和预测模型,在电视节目播出之前利用相关的历史数据进行学习训练,找到合适的网络模型,对尚未播出的电视节目的收视数据做出预测性的输出。
2 收视率预测指标体系的建立
表1 收视率预测指标体系
影响观众收视情况的因素可谓众多且复杂,本文在参考大量文献的基础上,分析了影响收视率因素的逻辑结构,充分考虑了收视率面向观众、企业、电视台等提供服务信息的特点,在遵循全面性、系统性、可比性和科学性等指标设计原则基础上,建立了如表1的二级结构的收视率预测指标体系。
3 收视率预测系统模型的构建
3.1 预测模型的选取
人工神经网络作为一种并行的计算模型,因其具有自学习、自组织和良好的容错性和非线性映射能力,受到众多领域学者的关注和应用,目前主要应用于模式识别、数据分类、数据挖掘等方面。[3]而电视节目的收视率预测具有长期相对稳定的特点,可以根据观众的历史收视数据推测电视节目的收视情况。收视率与节目的所在频道、包装、播出时间、观众的特型等多种因素有紧密的关系,具有典型的非线性特征。[4]鉴于此,电视节目收视率的预测可以选用神经网络作为预测模型。
3.2 BP神经网络的计算过程
BP(Back-Proragation)神经网络是神经网络的一个典型模型,它是一种多层感知器结构,多年来受到各应用领域的广泛关注。BP神经网络的学习过程是一个反复迭代的过程,由信号的正向传播和误差的反向传播组成。BP算法的思想是,从输入层输入样本数据,经各隐层计算处理后,传向输出层,然后再根据网络输出层的误差,从输出层开始,反过来调整网络的权值和阀值,这样周而复始地调整权值的过程直到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。对大量的样本数据进行“学习”后,网络的各个权值便是网络通过自适应学习得到的正确的内部表示,再将待识别样本的特征数据输入到已经训练好的网络结构中,则神经网络就可以对样本的属性进行自动的推理和识别。[3]
3.3 收视率预测系统结构设计
根据收视率预测指标体系的结构,系统选用3层BP神经网络对收视率进行预测,网络结构如图1所示。从网络结构模型中可以看到输入层、隐含层和输出层各层之间的各个神经元实现全连接,而层内的神经元之间无连接。下面分层介绍该网络结构。
图1 收视率预测系统的网络模型
(1)输入层:根据指标体系表1,将最底层指标数作为输入层神经元数,即设置15个二级指标为网络输入层的15个神经元。
(2)隐含层:隐含层神经元数目的选取关系到整个BP神经网络的精确度和学习效率。隐含层结点数选择太少,会使得网络的非线性映射功能和容错性较差;而若隐含层结点数选择过多,又会导致学习时间增加,学习误差也不一定最佳,影响学习效率。所以隐含层的节点数需要网络在训练时确定。根据前人的经验定律[5]:隐含层结点数 =输出层结点数 +0.618(输入结点数-输出结点数),应用这条定律可以确定隐含层神经元数应该在20个左右。
(3)输出层:输出层是隐含层通过传递函数得到的结果,输出结果由这一层的神经元表示。该模型在输出层设置了6个神经元,分别对应5个一级指标的评价预测结果以及1个最后的收视率预测结果。
4 实例计算与分析
在对训练样本数据集的采集过程中,我们本着尽量使训练样本集覆盖各类的节目、覆盖各电视台、覆盖各个播出时间段的原则,使样本指标值具有多样性,这样系统才能具有广泛的适用性。对于每个样本数据,本文根据表1的评价体系把其对应于15个二级评价指标,且由于神经网络的输入是数值,所以还需要对各二级指标的模糊评价量化,根据文献对五个指标的影响程度的不同,本文采用人们日常所用的五分制。比如指标播放时段X51,本文设黄金时间18:30-20:30中播出的节目X51为5,时段20:30-22:30中播出的节目X51为4,次黄金时间12:00-13:15和17:30-18:30时段中播出的节目的X51为3,依次类推 。[4]
在对训练样本的数据进行网络训练时,考虑到网络的规模和学习时间,网络训练函数选用TRAINGDA函数,适应性学习函数选用LEARNGD函数;网络性能函数选用误差平方和MSE函数;网络输入层与隐含层以及隐含层与输出层之间分别采用Tansig和Logsig作为传递函数。将预先选好的样本数据输入BP神经网络模型,设训练次数为1000次,训练的目标为误差小于等于0.001,经过290次训练后,网络的目标误差达到要求,误差曲线如图2所示。BP神经网络训练完成,可以用于后续的预测。
在网络的训练完成后,本文选用2005年北京地区播出的10个电视节目作为测试对象,其中包括新闻、专题、体育、电视剧等各种节目类型,播出频道也涉及了中央台、北京台、地方台等主要电视台。经过对这10个节目进行二级指标体系的对照分类量化处理后,输入神经网络预测模型中进行测试,其结果如表2所示,误差如图3所示。通过误差分析,可以肯定本文建立的收视率预测系统模型能够满足电视台对节目收视率的预测需求,在误差允许的范围内可以对收视率进行有效预测。当然,因为电视节目是与时俱进的,所以该模型在日后还需要定期添加新的样本数据再训练才能保证预测结果的持续有效性。
图2 训练误差曲线
图3 测试节目的误差图
5 结论
本文采用基于BP神经网络的收视率预测系统模型,经过对系统模型训练和测试分析,预测的结果与实际收视率的误差在 ±0.2%之间,证明了BP神经网络在收视率预测中的应用是有效的。它可以为电视台工作人员等在创建频道和新节目上提供了很大的帮助,同时还能帮助电视台在广告时段预售时提供准确的报价参考,减少了由于收视率没有达到预期值的赔偿几率,更好地提高电视台的经济效益和企业信誉。
表2 10个测试节目的五个一级指标和收视率的预测值
[1]涂娟娟,刘同明.基于决策树的电视节目收视率预测模型[J].微计算机信息,2007,23(9-3):251-252.
[2]张晶,白冰,苏勇.基于贝叶斯网络的电视节目收视率预测研究[J].科学技术与工程,2007,7(19):5099-5102.
[3]Monic Adya,Fred Collopy.How Effective are Neural Network at Forecasting and Prediction?A Review and Evaluation[J].Journal of Forecasting,1998,17:481-495.
[4]刘燕南.电视收视率解析:调查、分析与应用;(第2版)[M].北京:中国传媒大学出版社,2006.
[5]朱顺泉,李一智.基于人工神经网络BP算法的公司债券财务质量评级[J].计算机工程与应用,2002,10:243-245.
The Prediction of Audience Rating Research Based on BP Networks
WU Li-yun1,QU Zhou-qing2
(1.College of Science,Communication University of China,Beijing 100024,China;2.Computer School,Communication University of China,Beijing 100024,China)
At present most prediction stradegies do not consider the characteristic of the rating of its own long-term stability,leading to lacking of accuracy.In view of the learning and memorizing function and the better self-adaptive feature of artificial neural network,we design a TV program audience rating predicting model based on artificial neural network.The experimental result shows that the BP neural network method have a higher precision than the others and is an effective predictive method.
audience rating;prediction;BP neural network.
TP389
A
1673-4793(2011)03-0059-04
2010-09-26
中国传媒大学理科基金(YNG0811)
邬丽云(1977-),女,山西人,中国传媒大学讲师.E-mail:wuliyun@cuc.edu.cn
(责任编辑
:王谦)