基于故事的新闻视频事件专题分析方法研究
2012-08-15文丨刘
文丨刘 宇
(东莞广播电视台,广东东莞 523000)
随着现代化网络信息技术的快速发展,在网络信息系统的积极辅助下,人们可以通过各种方式来获取新闻视频,而且获取的时间之快、数量之大是有目共睹的。这些新闻视频有多种语种,来自多个网站以及多个电台,虽然,在这样优越的传媒条件的辅助下,人们的信息更加通达和快捷,但是,人们所搜寻的新闻结果却总是含有太多的杂乱信息、大量的重复信息扰乱了人们的视线,在这样混乱的局面下,人们几乎不能迅速查明整个新闻事件的因果联系和其中重要的信息,隐含在事件之外的真实情报也会被忽略,但是如果以事件专题的形式对新闻故事加以分析、组织和管理是解决这个问题的最佳方法。
1 新闻事件专题的结构分析
在对新闻故事进行聚积分类以后,就形成了同一个新闻故事的聚类,然而这些聚积的故事却没有顺序可言,人们无法从中理出头绪,要想把所有的故事以专题的形式编制出来,就要对其进行规划形成有秩序的线索化的东西,就必须对故事之间的彼此依赖关系加以分析。
首先,故事的类似程度的衡量。通常情况下,一个新闻故事中,由于内容不同,它们的重要程度就有所不同。一般情况下,对一个事件会由两个新闻故事进行报道,在报道中难免会出现类似的电视画面,这类内容是相对比较重要的,而其他描述性的词汇因为数目过大,对事件的描述的方法也不尽相同和所侧重的角度不同等原因会导致所用词汇也会有所不同,这种内容就不具备较高的重要性,所以,要对一个故事单元中不同内容的不同特征进行处理,就能够更加准确地表达故事单元中的语意。
故事之间的相似程度可以从视觉和文本两个方面进行区分,也就是视觉相似度与文本相似度,参照这些其特征的重要程度给予不同的权重系数,来判断两个故事之间的相似程度。
那么如何生成新闻视频事件专题结构,是一个值得思考的问题,一般来说,由于新闻报道来路多种多样,不可避免地在一个事件的新闻中产生很多的重复与冗余的信息,所以,要对故事的冗余程度进行评价,因为他为事件的发展提供了指导。
2 新闻视频故事单元关联分析的任务
当下时代,大多数的新闻视频都是以一个故事为中心展开叙述的,对于新闻故事的研究大多数都集中在故事单元的分割技术,这当中关系到新闻镜头分割等内容,对于新闻事件的探究多数集中在以文本为主的媒体中,探究的主要目标是根据话题来查询组织和利用新闻信息。
根据客户的需要,客户需要的是对新闻视频进行跟踪并调查,他们通过先进的现代技术来获取演播稿件,这些技术包括:Automatic speech recognition自动语音识别技术和machine translation,MT 机器翻译技术,获得演播稿件后,再利用文本信息的话题识别与跟踪技术来实现新闻视频基于事件的组织。
当今时代,由于图像处理技术不断向前更新,很多研究都针对于故事单元的相似特征展开的,这种研究在视频信息的基础上结合其他方面的信息,利用新闻视频编辑中视觉的重复性来达到目标的。在这一过程中,达到了对故事单元之间的关系的分析,与传统的对文本进行探究的技术相比较,这一分析方法利用了更多种类的媒体特征,特别是视觉特征的应用,这一特征非常靠近实际应用中的各种可能的情况,大多数对新闻视频的故事单元的关联性分析都从以下任务着手。
故事单元的分割是故事单元关联分析的基础,要注意认识和辨别新闻视频中报道的类似事件的故事单元。在这一过程中,故事单元是根据新闻事件进行分类聚积的,但是,由于新闻视频从多种渠道得来的,就会具有多种视觉上的变化,或者语言上的不一致,以及新闻事件所关注重点变化所导致的目的差异,但是,以视觉与文本为基础的保守的分类与聚积方法很难完成任务,达到目标。
通过以上的分析,我们可以看出,新闻视频中的故事单元关联分析技术融入了文本探究中的事件探测技术与跟踪技术,以及现代化网络信息结构与内容分析技术的优势,而且与客户的真实需求非常相投。所以,新闻视频中的故事单元关联分析技术已经成为全世界新闻视频研究领域中的炙手可热的话题。
3 新闻视频故事单元关联与跟踪技术
首先,以文本相似程度为研究对象的关联分析法。新闻视频故事单元关联分析同文本的研究类似,所以,最开始的一部分研究任务是得到新闻视频中的文本资料,是通过自动语音识别技术来获取的,再对文本资源的故事单元分割以及相似程度进行分析,无论是在对故事进行分割的阶段还是在对故事之间的联系进行分析的阶段,这种关联分析法都仅仅利用了文本资源信息,把文本资源中的每个字句与新闻视频中的音频进行对比,进行核查,可以采用下面的方法对文本进行处理。
第一,从每一个故事单元的文本信息资源中提出对应的词语,或者词语组合;第二,抓住每个故事单元的关键词向量,例如:对一般的时间名词、地点名词等名词组合的获取进行分析。
这种以文本为基础的新闻视频故事单元关联分析法是对TDT技术最为直接的应用,它指出了故事单元关联分析的最根本的任务和过程,但是这一类方法在实际的研究和应用中存在很大的局限性。例如:如果新闻视频中含有很多种不同的语言,由于没有合适的语音识别系统也没有配备相应的机器翻译工具,这样从音频轨迹上得到的文本信息就不会很清晰,甚至无法收获有价值的文本信息。
4 总 结
本文说明了基于故事的新闻视频事件专题分析方法,第一要将新闻报道中的视觉特征与文本特征配合起来,将对一个事件的新闻故事集合起来,然后分析这个事件所含有的故事之间的相似性,形成故事之间彼此依存的关系,再根据这种关系产生新闻事件专题结构,这样才能把事件的来龙去脉呈现在观众面前。
[1]文军,吴玲达,曾璞,等.新闻视频中基于 “场景词汇”的故事单元相似度分析[J].国防科技大学学报,2009(3l).
[2]刘华咏.基于音视频特征和文字信息自动分段新闻故事[J].系统仿真学报,2004,16(11):2608—2610.
[3]张春林,张鹏林,胡瑞敏.新闻视频中基于主持人识别的新闻故事探测[J].计算机工程,2003,29(14):20-26.
[4]Allan J.Topic detection and tracking:event—based information retrieval[M].Norvell,MA,USA:Kluwer Academic Publishers,2002.
[5]贾自艳,何清,张海俊,等.一种基于动态进化模型的事件探测和追踪算法[J].计算机研究与发展,2004,41(17).
[6]李保利,俞士汶.话题识别与跟踪研究[J].计算机工程与应用,2003(17):7-10.
[7]于满泉,骆卫华,许洪波,等.话题识别与跟踪中的层次化话题识别技术研究口[J].计算机研究与发展,2006.