APP下载

基于相似性度量的视频信息检索算法

2018-02-27陈雁卿济民林必毅刘春秋

电子技术与软件工程 2018年19期

陈雁 卿济民 林必毅 刘春秋

摘要

近年来,随着视频监控技术的不断发展,视频监控几乎已经覆盖了我们生活的各个角落,视频监控技术的成熟给我们的生活安全带来了保障,但是同时我们也要注意到视频监控技术的发展产生了海量的监控数据,这些数据的检测和运算拄往只能通过人工来进行,如果无法实现海量视频数据的智能化检索,那么信息量越大所需要消耗的人力物力也就越多,因此本文就是基于这种背景提出了海量视频信息的检索算法。

【关键词】视频内容检索 相似性度量 视频信息检索算法

想要对海量的视频信息数据进行检索,就需要通过设计相应的计算机程序来实现计算机对视频信息的处理和分析,再通过数据筛选实现数字化建档,从而能够更加便捷地进行信息检索,这里面包含了很多技术领域,包括视频图像的转码,视频数据的识别和筛选,图像数字化对比和分析等。而信息检索的关键就是要对不同的圖像进行相似性度量,通过相似性度量来找出不同视频片段之间的区别和关联,从而能够为视频信息的数字化检索提供可能。

1 视频数据的相似性度量

1.1 视觉内容相似性

主要指两个视频片段在低层视觉特征(如颜色、纹理)上的相似程度,其相似度度量可以采用下面的两种匹配方法:第一种方法是分别对两个视频片段中的所有镜头进行关键帧提取后,计算关键帧的特征向量,然后求出两段视频中对应的关键帧的特征向量之间的相似距离,作为两段视频中每一对帧的相似距离,最后将这个相似距离的平均值作为两个视频片段的相似度。第二种方法是对两个视频片段分别提取出的镜头关键帧特征先作综合处理,比如一个镜头的特征由该镜头内的关键帧特征综合计算得到,一个场景的特征是由该场景内的镜头特征综合处理得到,然后通过求各层次结构相应的距离进而判断其相似性。

1.2 时间顺序相似性

时间顺序相似性主要是考虑到视频片段中多个镜头之间的出现位置关系,考虑到如果出现这种情况:两个视频片段中单个镜头视觉内容相似,但是所有镜头在视频片段中的位置关系不同,也就是说出现的顺序不同,那么在相似性视频查找的时候这类视频是否和顺序相同的视频片段具有同等的相似度。由于视频是沿时间轴上的一系列图片帧序列,图片在视频中出现的位置,会对视频的内容构成产生较大的影响,时间顺序相似性就是在视频片段进行相似性匹配时,把视频的这种时间特性考虑进去。严格来讲,如果视频M中的一个场景其中的镜头和视频N中的镜头相比,不满足这种约束关系,那么我们可以认为这个场景描述的是另外一个故事情节,和视频N中对应的场景不相似。但是考虑到内容的相似性,所以这种情况下的相似度比时间顺序相同的视频片段之间的相似度低,但是并不是相似度为零。

1.3 粒度的相似性

在视频检索中,相似视频的镜头一般会一对多、多对一、多对多地相似,这种情况会影响到最终的相似度度量。例如视频X和Y相比较,若与X多对一相似的Y中的每一个特征分量都应该通过权值调整被赋予较小的相似度。

2 视频信息检索的算法研究

2.1 主成分分析算法

首先,主成分分析算法是常用第一种数学算法。它是将数据中的很多变量先进行相关性变换,然后将变换后的这些变量进行排列,排列是按照它们变换之后的方差进行递减排序的,这样在数学变换之后的变量就从原来的相关变量变成了各自独立的变量。而在整个数学变换当中要保持整个系统的总方差不变,这样就使得排列中的第一个变量拥有了最大的方差,而第二个变量拥有二大的方差,以此类推,第一个变量也就是整个数据流中的主成分,而第二个变量就是第二主成分,通过这种变换可以将复杂的数据转换为较为简单的独立变量。

2.2 隐性语义索引算法

隐形语义检索,就是利用隐含语义进行索引的方法,这种方法也是近年来逐步兴起的一种数据索引方法,这种索引方法不同于传统的关键词索引,其索引的结果更加贴近于自然检索,而且这种检索方式也能够更加适应庞大的数据量检索需求。隐性语义顾名思义就是通过海量的信息处理找出这些信息和数据之间的关联性,在这个过程中计算机并不知道每个词的真正含义,但是知道它们之间的关联性强弱,因此就可以将索引结果进行关联。

2.3 典型性相关分析算法

典型性分析法是比较复杂的一种数学计算方法,这种算法涉及到了大量的矩阵计算,由于其比较复杂的计算过程,因此在数据处理的早期曾经受到了一定的限制。但是随着计算机技术的发展,复杂的计算量已经不在是限制人们开展模型计算的关键,所以这种方法又被人们所重新重视起来,典型性相关分析算法主要是研究不同变量组之间的相关性。

为了更好的研究两组变量的关系,首先要采用类似主成分分析法的办法来对两组变量X1,X2,…,Xp和Y1,Y2,…,Yq进行相关性检验,选取能够代表它们相关性的一些指标,在通过综合分析来判断两组变量之间的关联关系,这些能够代表其相关性的指标就是典型性变量,典型性相关分析算法就是要通过研究这些典型性变量从而反映出整体数据之间的相关性。

3 总结

目前视频监控技术已经被广泛的应用于各个行业领域,而复杂的视频的数据处理也耗费了大量的社会资本。而视频大数据检索技术能够将一个长时间的视频文件压缩成播放时间很短的视频,提取出视频的摘要进行快速浏览,从而分析出其中的异常事件或潜在危害,因此视频数据检索技术具有巨大的市场前景。

参考文献

[1]郭斌,蔡巍伟,王鹏.海量视频数据快速检索[J].中国公共安全,2013(06):109-111.