APP下载

一种HEVC压缩域的运动目标检测方法

2018-07-04商明将

小型微型计算机系统 2018年5期
关键词:矢量幅值滤波

杨 洋,滕 游,2,商明将,朱 威,2

1(浙江工业大学 信息工程学院,杭州 310023)2(浙江省嵌入式系统联合重点实验室,杭州 310023)

1 引 言

运动目标检测是智能视频分析中的一个重要环节,它可以在像素域或压缩域中实现检测[1],现有的检测方法如帧差法[2]、背景建模法等大多都是在像素域中处理,其中背景建模常用的方法主要有高斯混合模型(GMM)[3]以及视觉背景提取方法(VIBE)[4].文献[5]基于改进的Surendra背景模型,根据多帧灰度差设定两个门限值进行目标检测.文献[6]利用K均值算法对像素建立高斯混合模型,从背景中分离出前景目标.文献[7]在VIBE的基础上,利用三帧差分法自适应获取每个像素点的阈值,检测出了运动目标区域.这些方法都是在像素域中对小分辨率视频进行运动目标检测,处理过程中需要建立和更新复杂的模型.

随着视频信息技术的快速发展,高清、超高清视频正逐渐进入我们的工作和生活,视频图像的分辨率也越来越高.视频数据通常都是以压缩的格式传输和存储,基于像素域的运动目标检测方法需要将经压缩的视频码流解码到像素域后再检测,大幅增加了计算复杂度,而基于压缩域的检测方法由于可以利用视频码流中的运动矢量等编码信息来实现检测,可以有效降低计算复杂度.

现有压缩域中对运动特征的检测主要是利用以运动矢量[8]为主的编码信息进行检测.运动矢量信息由于是从编码器的角度中获取,存在一些噪声信息,这些噪声信息并不能表示真正运动的区域,所以在对运动区域检测之前需要对获取到的运动矢量进行预处理.其中文献[9]从AVS码流中码流中提取出了宏块与运动矢量信息得到运动目标轨迹,将背景帧与运动目标轨迹结合实现视频摘要的提取.文献[10]从H.264码流中提取出运动矢量,对运动矢量场进行空间滤波、Mean-Shift聚类等处理得到运动目标.文献[11]对视频流中提取的运动矢量进行规范化以及特征分析,实现高速运动目标的检测.国际标准化组织ITU-T的视频编码专家组(VCEG)和ISO/IEC的运动图像专家组(MPEG)于2013年共同推出了新一代的高效率视频编码标准(HEVC)[12].与上一代编码标准H.264相比,HEVC采用了更为灵活的块划分编码技术.目前针对HEVC压缩域的检测方法研究还比较少.文献[13]针对高分辨率视频,将HEVC编码得到的运动矢量进行权重值划分,利用相邻前景块的个数,检测出前景与背景.文献[14]从HEVC码流中获取块划分结构与运动矢量信息,先对运动矢量进行空域和时域的标签分类,再利用马尔可夫(MRF)模型对标签场进行运动一致性估计,从而得到运动目标.文献[13]与文献[14]的方法只利用了运动矢量与划分结构,尚未充分利用预测模式等编码信息,并且还存在整体检测效果不佳、计算复杂度较高等问题.

为了能够大幅降低检测计算复杂度的同时有效检测运动目标,本文提出了一种HEVC压缩域的运动目标检测方法.该方法利用HEVC编码过程中得到的划分结构、编码模式与运动矢量等信息,首先对运动矢量进行预处理,接着利用编码块的划分结构与编码模式在时域和空域上对运动矢量进行滤波、膨胀等处理,最后以4×4块为基本单位对图像进行运动检测,从而得到运动目标区域.

2 HEVC编码信息分析

为了灵活有效地编码视频图像,HEVC采用了新的处理单元划分机制,包括编码单元(CU)、预测单元(PU)和变换单元(TU).这种划分机制有利于编码器根据视频图像内容特点自适应选择最佳的划分方式.在HEVC中,一帧视频图像被划分成多个不同大小的正方形CU进行编码,其尺寸可以为64×64、32×32、16×16或8×8,每个CU又被进一步划分为一个或多个PU进行预测,其预测模式可以为帧内预测模式(Intra模式)或帧间预测模式(Inter模式).在Intra编码模式下,每个PU没有运动矢量;在Inter编码模式下,每个PU都有运动矢量.PU的帧间预测模式包括Skip、Merge、2N×2N、N×N、N×2N、2N×N、2N×nU、2N×nD、nL×2N和nR×2N[12],如图1所示.Skip模块的块划分方式同2N×2N,无需编码残差和运动矢量.

图1 PU预测模式划分Fig.1 Division of PU prediction mode

HEVC在帧间预测环节采用了运动估计技术,该技术对预测块在某个搜索范围内搜寻与其最相似的匹配块,匹配块到当前块的位移即为运动矢量,它能够反映出物体的运动信息.因此,可利用运动矢量信息来实现运动目标检测.图2为BasketballDrill序列经过编码后第5帧的中心区域,可以看出运动员所在区域CU的尺寸大多都为16×16或8×8,而背景部分大多都为64×64或32×32,即运动活跃性较大的区域CU尺寸相对较小,运动活跃性较小的区域CU尺寸相对较大.图2中有箭头的块表示该块存在运动矢量且箭头的方向为运动矢量的方向,运动员身上的运动矢量一致性较高,但运动员周围的背景部分存在不少的运动矢量噪声,需要将其滤除,否则会影响运动目标检测的精度.

图2 BasketballDrill序列编码后的运动矢量Fig.2 Motion vectors after the coding of basketballDrill sequence

图3 本文方法流程框图Fig.3 Flow chart of the proposed method

3 运动目标检测方法

根据HEVC编码信息的特征以及前一节对编码信息的分析,本节提出了一种运动目标检测方法,该方法的处理流程如图3所示.首先输入一帧编码信息,对运动矢量进行预处理,并判断当前帧是否有全局运动,若存在,则结束当前帧处理,否则对当前帧的运动矢量幅值进行空间中值滤波,从整体上对噪声进行滤除;接着进行基于块尺寸的幅值滤波、基于Skip模式的幅值滤波、以及更新Intra模式的运动矢量幅值,以达到局部上更精细的滤波;然后对运动区域进行膨胀,使空洞区域形成连通;完成空域上的处理之后,再进行时间域上的幅值滤波,最终实现运动目标的检测.

3.1 运动矢量预处理

本文方法先获取当前帧亮度分量的运动矢量、划分结构与编码模式信息,建立当前帧的运动矢量图与编码模式图.在HEVC编码过程中,最小的帧间PU尺寸为8×4和4×8,因此本文方法取运动矢量的基本粒度为4×4块.考虑到运动目标检测多应用于视频监控等低延时应用场景,较少使用双向预测的B帧,因此本文选用的帧类型为前向预测的P帧.

由于摄像机在拍摄视频的过程中可能存在全局的转动或者距离前景运动物体很近,导致视频画面存在全局运动或者运动范围很大,通过编码信息较难获取到真实运动的区域.本文方法主要是针对视频监控等背景基本静止的视频场景,为了能准确地检测出真正的运动区域,需要判断当前画面是否存在全局运动.首先对当前帧所有4×4块水平和垂直方向上的运动矢量分别进行排序,选取中值作为水平方向的全局运动矢量值GMVx和垂直方向的全局运动矢量值GMVy.接着用Tgmv表示全局运动矢量阈值,若GMVx与GMVy都位于[-Tgmv,Tgmv]之间,则认为视频图像没有全局运动,则对每个4×4块进行按照式(1)处理得到运动矢量幅值图,否则当前帧不处理:

MVamp=|MVx|+|MVy|

(1)

其中MVamp表示4×4块的运动矢量幅值,MVx与MVy分别表示水平与垂直方向上的运动矢量,由于HEVC是采用四分之一像素精度运动补偿,运动矢量幅值的单位为四分之一像素位移.Tgmv为全局运动矢量阈值,本文中取值为2,即全局运动矢量小于等于二分之一像素位移时判定当前帧没有全局运动.

3.2 空间中值滤波

由于采用率失真优化技术,HEVC编码后的视频图像在静止区域中会存在一些运动矢量噪声,这些噪声相对孤立,而真实运动的物体是以区域的形式在图像中表现,因此本小节利用相邻PU块的运动矢量信息,将在空域上孤立的运动矢量噪声滤除.

图4 参考块位置Fig.4 Position of reference blocks

选取当前PU中左上角4×4块的运动矢量幅值作为当前PU的运动矢量幅值,记作MVpu.根据当前帧最终的PU划分形式,以PU为单位对当前帧所有4×4块的运动矢量幅值进行空间中值滤波.若当前PU不在图像边界,则选取与当前PU中左上角4×4块左侧相邻和上侧相邻的4×4块,右上角4×4块右侧相邻的4×4块以及左下角4×4块下侧相邻的4×4块作为中值滤波参考块,参考方式如图4所示,并获取这四个参考块的MVamp.将这四个参考块的运动矢量幅值与MVpu一起进行排序,选取中值作为当前PU中所有4×4块的运动矢量幅值.若当前PU块位于图像的边界且非四个顶角处,则选取图4中存在的三个参考块,将这三个参考块的运动矢量幅值进行排序,选取中值作为当前PU中所有4×4块的运动矢量幅值.若当前PU块位于图像的顶角处,则选取图4中存在的两个参考块,将这两个参考块的运动矢量幅值与MVpu一起进行排序,选取中值作为当前PU中所有4×4块的运动矢量幅值.

3.3 基于块尺寸的幅值滤波

经过前面的中值滤波可以将周围运动矢量幅值为零的非零运动矢量噪声滤掉,但依然存在区域性幅值较小的运动矢量噪声,这些噪声也不能表示真实的运动目标.根据第2节的分析,运动活跃性较小的区域CU尺寸相对较大,因此本小节利用编码块的尺寸进行进一步的滤波.

利用每个PU所属CU的尺寸对每个PU的4×4块按式(2)进行基于块尺寸的运动矢量幅值滤波,式中CUsize表示所属CU的尺寸;T64、T32、T16、T8分别表示CUsize为64×64、32×32、16×16、8×8时的滤波阈值,三者关系需满足式(3).

(2)

T64≥T32≥T16≥T8

(3)

根据第2节的运动分析可知显著运动的前景目标其运动幅度大都不会小于一个像素,因此本文中T64、T32、T16、T8分别取值为4、2、1、0,即当CUsize为64×64、32×32、16×16时,小于等于一个像素、二分之一像素、四分之一像素的运动矢量幅值被认为是噪声.由于8×8是最小的CU划分,其运动活跃性相对较大,因此本文方法不对其进行滤波,保留其运动特征.

3.4 基于Skip模式的幅值滤波

在显著运动的区域中,PU预测方式大部分不会选择Skip模式,而当PU的预测模式为Skip模式时它会选取相邻已有的运动矢量来作为自身运动矢量,如果只对Skip模式自身的运动矢量进行处理,这样的区域也会被判定为运动区域.因此,本小节根据Skip模式的运动特性分析,利用相邻PU的预测模式对这部分噪声进行滤除,对于所有预测模式为Skip模式的PU进行运动矢量幅值滤波.

若当前PU不在图像边界,则先选取当前PU在图4中的四个4×4块作为Skip模式PU参考块,接着统计这四个参考块所属四个PU中编码模式为Skip模式的个数Numskip,最后对当前PU中所包含的4×4块按式(4)更新MVamp:

(4)

式中Tskip为基于Skip模式的幅值滤波阈值.由于运动区域也会存在较为平坦的部分,如人的头发、皮肤、颜色单一的衣服等相关区域,这些区域在小范围内运动时也会选择Skip预测模式,而这部分也应当成为运动区域.经实验分析,本文Tskip取值为4,以进行严格的Skip模式滤波,在滤除Skip模式运动矢量噪声的同时,保证运动区域的平坦部分不会被滤掉.若当前PU为图像边界PU,则将所包含4×4块的运动矢量幅值直接设为0,减少对运动目标检测的干扰.

3.5 更新Intra模式CU的运动矢量幅值

HEVC在进行编码预测时会根据率失真代价来选择最佳的编码模式,在一些帧间预测率失真代价较大的运动区域中,也会存在Intra模式的CU,而这部分CU同样需要成为运动区域的一部分.因此,本小节利用相邻4×4块的编码信息来判断每个Intra模式的CU是否位于运动区域.

首先将前一小节得到的滤波后运动矢量幅值图中所有的非零运动矢量幅值进行排序,取中值作为Intra模式CU的运动矢量幅值的参考值,记为MVIntra.对当前帧中的每个Intra模式CU,选取当前CU在图4中的存在的4×4块作为Intra模式CU参考块.统计这些参考块中运动矢量幅值大于Tamp的个数Tnum1,以及参考块中对应CU的编码模式为Intra模式的个数Tnum2,计算Tnum1与Tnum2的和,记为Tnum.本文中Tamp取值为4,即将周围块运动矢量幅值大于一个像素位移的当作真实的运动区域来统计.在当前CU为非边界CU时,若Tnum大于1,表示当前CU周围存在运动区域,则将当前CU下所有4×4块的MVamp设为MVIntra,否则设为0.在当前CU为边界CU时,若Tnum不为0,表示当前CU周围存在运动区域,则将当前CU下所有4×4块的MVamp设为MVIntra,否则设为0.

3.6 运动区域膨胀

由于运动矢量是基于PU块得出的,因此经过上面的处理之后运动区域的块可能被滤掉,导致运动目标的检测存在空洞.根据第2节的运动分析可知16×16、8×8的划分大小运动活跃性相对较高,本文采用5×5邻域膨胀的方法对由4×4块组成的运动区域进行膨胀,使得小于16×16像素的运动区域空洞形成连通.HEVC中最小的帧间PU尺寸为8×4和4×8,所以在5×5邻域内采用图5中灰色部分的间隔方式选择膨胀参考块,该方式与全选择的效果相同,所有情况均能覆盖,且能减少统计块个数.

图5 5×5邻域膨胀模板Fig.5 Expansion template of 5×5 neighborhood

对当前帧中每个4×4块,若其MVamp不为0,则该块的MVamp保持不变,否则根据图5选择存在的参考块,统计这些参考块中MVamp非0的个数NZnum1,若NZnum1为0,即当前块5×5邻域内没有运动区域,则膨胀之后的MVamp仍为0,否则先获取这些参考块中最小且非0的MVamp,记为MinMVamp,再将膨胀后的MVamp设置为MinMVamp.图6所示为BasketballDrill序列第23帧膨胀前后效果对比,可以看出图6(a)中运动员的身体以及球的中间存在空洞区域,而图6(b)中这些空洞区域实现连通,检测完整性得到了提升.

3.7 基于时间域的幅值滤波

运动矢量噪声在时域上是孤立存在的,而物体的运动是存在时域连续性,即当前帧的某一块区域存在运动,那么上一帧相应块的邻近区域也很有可能会存在着运动.因此本小节利用相邻帧在时域上的相关性进一步滤除运动矢量噪声.

图6 膨胀效果对比Fig.6 Comparison of expansion effect

在前一步获取到的当前帧膨胀后的运动矢量幅值图中,对每个4×4块,若其运动矢量幅值为0,则滤波之后的运动矢量幅值仍为0,否则先选取当前4×4块在前一帧膨胀后的运动矢量幅值图中相同位置4×4块,以及此位置8邻域中存在的4×4块组成时间域滤波参考块,接着统计参考块中运动矢量幅值非零的个数,记为NZnum2,最后对当前4×4块的运动矢量幅值按照式(5)进行更新.图7为BasketballDrill序列第17帧时间域滤波效果对比,可以看出图7(a)中左侧非运动区域存在较多的噪声,而图7(b)中经过时间域滤波后这些噪声被滤除掉了,并且运动员边缘部分的检测精度也得到了提升.

图7 时间域滤波效果对比Fig.7 Comparison of time domain filtering effect

(5)

4 实验结果与分析

本实验的开发环境为Visual Studio2012,HEVC编码参考软件为X265_1.8.测试的处理器为Intel Core i5-4590,主频3.30GHz.X265编码器的配置如下:帧率30fps,无B帧且I帧后面全是P帧,关闭WPP功能,开启AMP与Rect划分方式.实验选取了两个HEVC标准视频序列BasketballDrill和BQMall,以及一个本文录制的视频序列,这三个序列的背景均静止.BasketballDrill序列的分辨率为832×480,所在场景为篮球运动员训练场景,有多个运动目标、并且目标运动速度都较快.BQMall序列的分辨率也为832×480,所在场景为人物在商场走动的场景,有多个运动目标且运动目标较大,序列中存在没有运动的人以及人在玻璃上的倒影,这些不纳入到真实的前景运动目标中.本文录制的视频分辨率为1920×1080,所在场景为人物走动,只有一个较小的运动目标.

图8 BasketballDrill序列对比图Fig.8 Comparison chart of four methods for basketballdrill sequence

图8至图10分别给出了本文方法与三种经典的像素域运动目标检测方法在三个序列下的主观效果比较,其中真实前景groundtruth[13]均为手动标定.图8为BasketballDrill序列第29帧对比图,图8(a)为原始帧,图8(b)为groundtruth,图8(c)为三帧帧差法的检测结果,图8(d)为高斯混合模型GMM的检测结果,图8(e)为视觉背景提取方法VIBE的检测结果,图8(f)为本文方法的检测结果.从图8中可以看出三帧帧差法、GMM和VIBE在背景区域有较多的噪声.本文方法在背景区域没有噪声,是由于本文在时域和空域上对运动矢量进行了滤波,使得背景区域的噪声被滤掉.但由于球的运动速度过快导致球的边缘部分在时间域滤波操作时被滤掉了,未能完整地检测出.

图9 BQMall序列对比图Fig.9 Comparison chart of four methods for BQMall sequence

图9为BQMall序列第7帧对比图,从图中可以看到三帧帧差法与GMM对检测的目标存在较大空洞的问题,人物的完整性检测较差,这主要因为人身上存在颜色相近区域,运动时这些区域在小范围内变化不大,而本文采取了膨胀的方法使得空洞的部分连通,因此检测的完整性较好.由于场景中有较多的玻璃,人在走动的时候玻璃上的倒影也会运动,三帧帧差法与GMM在背景区域还存在不少噪声,本文方法也在当前帧的右边出现一些错误检测.

图10 本文录制序列对比图Fig.10 Comparison chart of four methods for our sequence

图10为录制序列第179帧对比图,由于人的腿部运动幅度不大,所以帧差法检测效果不明显.GMM对光照的变化较为敏感,因此在背景区域存在较多噪声,而且人的周围还存在“鬼影”的现象.VIBE在人的身上存在较多的空洞,对目标的完整性检测较差.由于本文方法采用了时域和空域上的滤波,因此背景区域没有噪声,且完整性较好.

为了比较四种方法在三个序列下的客观检测效果,本文采用检测精度Precision、召回率Recall和F-measure来衡量检测方法的客观性能[14-16].检测精度Precision是指检测到的真实像素点数占检测到的所有样本点数的比例,精度越高表示错误检测的点数越少.召回率Recall表示检测正确的像素点数占整个groundtruth的比例,召回率越高表示对运动目标的检测能力越强,F-measure是对Precision与Recall综合性能的一个比较,相关计算如式(6)、式(7)和式(8):

(6)

(7)

(8)

其中TP为正确检测样本像素点数,FP为错误检测样本像素点数,FN为错误检测的负样本像素点数.三个序列选取了连续的30帧典型片段进行统计,其中BasketballDrill序列为第15~44帧,BQMall序列为第6~35帧,录制序列为第149~178帧.

图11 BQMall序列曲线对比图Fig.11 Comparison curves of four methods for BQMall sequence

图11为BQMall序列三个客观指标的曲线对比图,由于该序列前面若干帧的运动目标存在较多颜色相近的区域且目标运动幅度不是很明显,可以看到GMM与三帧差的检测较差,而本文方法显示出了较强的检测稳定性,而且在损失较少的Precision下,Recall和F-measure均明显优于其它三种方法.表1为四种方法的比较结果,从表1中可以看出本文方法的平均Recall达到了93%,远高于其它三种方法;相比三帧帧差法、GMM和VIBE,平均F-measure分别提高了44%、8%和4%.由于本方法是基于编码块进行划分的,对运动物体的边缘处理不够精细,因此检测精度Precision稍低于其它三种方法.表2为四种方法对每帧的平均处理时间进行比较,每个序列统计的处理总帧数为200帧.从表2中可以看出本文方法每帧平均处理时间在832×480与1920×1080分辨率下分别为三帧帧差法时间的68%与85%、GMM时间的5%与8%、VIBE时间的17%与27%.上述比较分析说明本文方法在较小的精度损失下大幅地减少了检测时间,具有更好的实时性,并且提高了对目标的检测能力,综合性能也优于其它三种方法.

表1 四种方法Precision、Recall、F-measure比较Table 1 Comparison of Precision,Recall and F-measure for four methods

表2 四种方法平均处理时间(ms /帧)Table 2 Comparison of average processing time for four methods

5 结 论

本文利用HEVC压缩域中的编码信息,提出了一种运动目标检测方法.首先从HEVC压缩域中提取出运动矢量、划分结构以及编码模式等编码信息,通过运动矢量判断当前帧是否存在全局运动,并对当前帧的运动矢量求取幅值得到运动矢量幅值图;接着利用CU的尺寸、PU的划分信息和编码模式对运动矢量幅值进行滤波以及进行Intra编码块的处理;然后对运动矢量幅值图进行膨胀;最后利用相邻帧的相关性在时域上对运动矢量进行滤波,得到当前帧的运动目标区域.与传统的像素域检测方法三帧帧差法、GMM和VIBE方法相比,本文方法整体上对运动目标具有更好的检测效果,而且大幅的降低了计算复杂度,更加适合于对分辨率和实时性要求较高的应用场合.当然本文方法还存在一些问题,尤其是对快速运动目标和目标边缘的处理效果都还需要提升,我们将在后续的工作中进一步研究和完善.

[1] Qi B,Ghazal M,Amer A.Robust global motion estimation oriented to video object segmentation[J].IEEE Transactions on Image Processing,2008,17(6):958-967.

[2] Zhuang Y,Wu C,Zhang Y,et al.Realization of moving object detection and tracking algorithm based on frame difference method and particle filter algorithm[C].Chinese Control and Decision Conference,2017:161-166.

[3] Thangarajah A,Wu Q M J,Huo J.A unified threshold updating strategy for multivariate gaussian mixture based moving object detection [C].International Conference on High Performance Computing & Simulation,2016:570-574.

[4] Barnich Olivier,Van Droogenbroeck Marc.ViBe:a universal background subtraction algorithm for video sequences[J].IEEE Transactions on Image Processing,2011,20(6):1709-1724.

[5] Wang Kai,Wu Min,Yao Hui,et al.Moving target detection method based on multi-frame background subtraction and double threshold [J].Journal of Chinese Computer Systems,2017,38(1):179-183.

[6] Mushawwir L A,Supriana I.Gaussian mixture model and spatial-temporal evaluation for object detection and tracking in video surveillance system[C].IEEE International Conference on Information Technology Systems and Innovation,2016:1-7.

[7] He Zhi-hui,Huang Shan,Ran Geng.An improved visual background extractor model for moving object detection algorithm [J].Journal of Chinese Computer Systems,2015,36(11):2559-2562.

[8] Babu R V,Ramakrishnan K R,Srinivasan S H.Video object segmentation:a compressed domain approach[J].IEEE Transactions on Circuits & Systems for Video Technology,2004,14(4):462-474.

[9] Zhao Lei,Huang Hua.Compressed domain synopsis research in AVS surveillance profile[J].Computer Science,2016,43(7):46-50.

[10] Sun Le,Dai Ming,Li Gang,et al.An algorithm of mean-shift clustering-based moving object segmentation in H.264 compression domain[J].Journal of Optoelectronics Laser,2013,24(11):2205-2211.

[11] Mu Chun-di,Xie Jian-bin,Yan Wei,et al.Detecting high-speed moving targets in moving camera environments[J].Journal of Image and Graphics,2015,20(3):349-356.

[12] Sullivan G J,Ohm J,Han W J,et al.Overview of the high efficiency video coding(HEVC)standard[J].IEEE Transactions on Circuits & Systems for Video Technology,2012,22(12):1649-1668.

[13] Praeter J D,Vyver J V D,Kets N V,et al.Moving object detection in the HEVC compressed domain for ultra-high-resolution interactive video[C].IEEE International Conference on Consumer Electronics,2017:135-136.

[14] Niu Zhi-guo,Liang Jiu-zhen,Wu Qin.Moving object segmentation methord based on block in HEVC compressed domain[J].Computer Engineering and Applications,2016,52(14):202-208.

[15] Amit S N K B,Aoki Y.High precision road segmentation for cover level of forward view estimation via stereo camera[C].Asian Control Conference,2015:1-6.

[16] Zhou W,Song T,Lin L,et al.Multi-scale contrast-based saliency enhancement for salient object detection[J].Iet Computer Vision,2014,8(3):207-215.

附中文参考文献:

[5] 王 凯,吴 敏,姚 辉,等.多帧背景差与双门限结合的运动目标检测方法[J].小型微型计算机系统,2017,38(1):179-183.

[7] 何志辉,黄 山,冉 耕.一种改进视觉背景提取模型的运动目标检测算法[J].小型微型计算机系统,2015,36(11):2559-2562.

[9] 赵 磊,黄 华.AVS监控档视频的压缩域摘要研究[J].计算机科学,2016,43(7):46-50.

[10] 孙 乐,戴 明,李 刚,等.H.264压缩域中mean-shift聚类运动目标检测算法[J].光电子·激光,2013,24(11):2205-2211.

[11] 穆春迪,谢剑斌,闫 玮,等.面向动摄像机的高速运动目标检测[J].中国图象图形学报,2015,20(3):349-356.

[14] 牛志国,梁久祯,吴 秦.基于块划分的HEVC运动目标检测方法[J].计算机工程与应用,2016,52(14):202-208.

猜你喜欢

矢量幅值滤波
基于Duffing系统的微弱超声导波幅值检测方法研究
船岸通信技术下舰船导航信号非线性滤波
室温下7050铝合金循环变形研究
一种适用于高轨空间的GNSS矢量跟踪方案设计
矢量三角形法的应用
一种考虑GPS信号中断的导航滤波算法
高效LCL滤波电路的分析与设计
推力矢量对舰载机安全起降的意义
可靠性步进电机细分驱动技术研究
Prevention of aspiration of gastric contents during attempt in tracheal intubation in the semi-lateral and lateral positions