电视节目游字和挂角广告监测系统设计与实现
2017-05-28廖文华
廖文华
摘 要 近年来,为了逃避上级主管部门的监管,电视节目中的广告常常以游字和挂角的形式出现。文章针对电视广告监测的实际业务需求,结合电视节目中游字广告和挂角广告的实际特征,分别对这两类广告的检测方法进行了深入研究。在此基础上,构建了一套基于目标检测与文字识别的电视游字和挂角广告监测系统。应用效果表明,该方法检出准确率高,极大地提高了监测人员的工作效率,有助于实现广告监测的自动化与智能化。
关键词 游字广告;挂角广告;广告监测
中图分类号 TP391 文献标识码 A 文章编号 2096-0360(2017)08-0030-02
近年来,受到商业利益的驱动,某些电视台,尤其是地方电视台,试图以多种方式加大电视广告的投放力度。由于常规广告需要占用节目时间,而且监管部门的例行监管力度越来越大,因此为逃避监管,电视台常常采用在节目正常播出的过程中以插播的方式来投放广告,其中以游动字幕或挂角广告最为常见。
为了规范游字、挂角广告的播出情况,2009年9月10日,国家广电总局发布了《广播电视广告播出管理办法》,即61号令,对游动字幕广告和挂角广告的播出规范做出了两条严格规定[1],概括起来即为一是挂角广告的播出内容进行了限制,仅允许播出电影、电视剧剧场或者节(栏)幕冠名标示;二是为确保节目内容的完整性,禁止插播自行组织的游动字幕、叠加字幕、挂角广告等广告内容。
由此可见,为维护广电61号令的权威性,游字和挂角广告的监测必定是广告监测的一项重要内容。由于游字、挂角广告多属于自行插播方式,占屏范围小,播出时段规律难掌握,因此依赖传统的人工值守监看的方式,不仅费时费力,而且灵活性不够,重复性、稳定性差,且易受监测人员的主观影响,随着监测频道内容的增加、监测业务范围的推广,人工监测方式已无法满足广播电视监测行业的需求,迫切需要借助先进的计算机技术,自动完成违规游字、挂角广告的实时监测。
本文主要内容组织如下,首先对游字、挂角广告的显性特性进行阐述,然后讨论了相关检测技术的研究现状,最后结合电视广告监管的业务特点,本文实施搭建了一套基于视频目标检测与文字识别的游字与挂角广告监测系统,实际应用效果表明该系统极大地提高了游字与挂角广告监测的自动化程度。
1 游字与挂角广告的显性特征[2]
在电视节目中插播的游字或挂架广告,为保证播出效果,都有其较为显著的规则特征,如图1所示。
游字廣告的显性特征:
1)一般处于屏幕画面的特定区域,如最下方区域(有些电视台会将其放在屏幕的两侧边缘区域);2)游字广告内容在节目播出时持续滚动播出,但单条内容保持不变。
挂角广告的显性特征:
1)一般占用屏幕的固定区域,多处于屏幕画面的某个边角,如右上角、左下角或右下角;2)内容多为固定不变的静态广告图片,或者是有限变动的动态图片,持续时间通常为几分钟。
2 游字与挂角广告检测技术的研究现状[3-5]
电视视频节目内容中的游字与挂角广告的检测属于特定图像检测技术的范畴,其检测方法一般包括如下步骤:
1)抽取待检测视频中的关键帧序列;2)从关键帧序列中抽取视频图像中稳定区域;3)对所抽取的稳定区域进行跟踪,检测稳定区域在时序上的变化情况;4)根据时序变化情况的不同,确认并提取稳定区域中的游字或挂角广告。
对于游字广告,一般检测流程如下:
1)设定感兴趣的图像区域坐标范围,例如屏幕的下方;2)抽取关键帧序列,并检测关键帧序列中所设定区域中是否包括静态文字和动态文字;3)计算关键帧序列之间的运动向量信息,在该运动向量对应视频关键帧上再次进行文字检测,检测出的文字与前面时刻的视频关键帧文字进行交集检测和确认,并得到视频图像的滚动文字区域面积;4)对滚动文字区域信号进行平滑,从而判定滚动字幕出现的时段。
对于挂角广告,一般检测流程如下:
1)设定感兴趣的图像区域坐标范围,例如屏幕的左下角或右上角;2)提取关键帧序列,并对关键帧图像的固定区域进行像素值计算,且在时序上跟踪其变化情况,并转换成运动向量并进行中值平均,以过滤运动向量中的检测噪点;3)根据运动向量的信号序列分布情况,进一步判定挂角广告的位置以及出现时段。
上述方法虽然可以监测到是否出现游字或挂角广告,但对广告所属类别、广告内容无法进行提取。
3 基于目标检测与文字识别的电视游字和挂角广告检测方法
本文通过进一步收集、观察、分析游字和挂架广告的特点发现,无论游字还是挂角广告由于其所处位置占比电视屏幕较小,因此为更多传递广告信息多为静止或滚动的文字信息,基于此本文提出了一种融合目标检测与文字识别的电视游字和挂角广告检测方法,既可以判断是否有违规游字或挂角广告出现,又可以获取违规广告的内容,有助于进一步提升自动监管的程度,该方法的技术路线如图2所示。
与传统方法相比该方法不仅能够检测出电视节目中是否违规出现游字或挂角广告,同时能够对游字或挂角广告的内容进行识别转写成文字。为验证该方法的效果,我们收集了14个地方频道的包含游字或挂角广告的节目视频共计30小时,并对其中出现游字广告、挂角广告进行人工标注,其中游字广告违规播放143次,总字数2 536个;挂角广告广播违规播放52次,总字数248个。经过测试实验结果表明该方法检测识别的速度超过10倍实时(即10小时视频内容1小时检测完毕),游字广告、挂角广告检测判别准确度如表1所示,内容识别准确度如表2所示。
发现检测识别挂角广告多为背景与挂角广告对比度较低或其本身动态变化性较强,游字广告错误的原因多为广告播出时长较短,无法准确判定其是否具有滚动属性。
其中,挂角广告的识别率较游字广告识别略低的原因主要在于,挂角广告字体多变,且多为内容简短(不利于利用语言模型进行纠错)。