基于内容的智能视频监控文件系统
2015-03-07陈耀武
闫 彬,陈耀武
(浙江大学数字技术及仪器研究所,杭州 310027)
基于内容的智能视频监控文件系统
闫 彬,陈耀武
(浙江大学数字技术及仪器研究所,杭州 310027)
针对传统文件系统碎片化会严重影响存储性能的问题,结合视频监控具有的基于内容检索的特点,提出一种应用于智能视频监控的专用文件系统。基于Extent的逻辑卷索引结构,以特征录像段为单位进行特征内容的索引,采用B+树和位图提高索引效率。在索引策略中,基于数据簇回收最原始数据,实现循环存储。通过控制数据连续存储的时间,优化数据块的分配,保证数据的连续、顺序存储。测试结果表明,该文件系统索引策略对存储带宽的下降比例仅为2.4%,在1 Mb/s的典型视频码率下,存储带宽相比传统文件系统提高了24.5%,存储空间利用率达到了99%。
基于内容;文件系统;索引策略;Extent结构;碎片整理;智能视频监控
DO I:10.3969/j.issn.1000-3428.2015.10.047
1 概述
随着视频监控技术的日益成熟,网络视频监控系统在城市安防系统中发挥着越来越重要的作用,并快速地朝着智能化网络视频监控的方向发展[1-2]。要从视频监控的海量数据中快速定位到有效信息,依靠传统的录像回放及人工查找已无法满足需求;基于视频内容分析的视频摘要、目标轨迹跟踪等技术,使得信息检索中人力的解放和效率的提升成为可能,也使得视频监控存储技术在满足原有的高带宽、大容量、高可靠性等基本需求之外,要满足基于内容检索的需求。传统的基于内容图像检索的研究侧重于对图像集进行结构化处理、视频分割和图像特征提取[3-5],而存储方案则是视频监控智能化的另一个重要方面。如果用传统文件系统存储视频监控数据,其多级指针的索引结构会导致磁盘I/O开销较大,视频数据碎片化比较严重,存取效率也会因此逐步降低[6]。
针对传统文件系统的上述问题,本文提出一种基于内容的智能视频监控专用文件系统,并对视频
数据存储过程中索引结构的维护和整理进行阐述。
2 文件系统结构
本文设计的文件系统基于摄像机与存储资源(逻辑卷)一一对应的方案:依据摄像机的存储周期及码率信息,为摄像机分配相应大小的逻辑卷,将逻辑卷格式化为此文件系统结构,所有数据依此格式进行组织,到达存储周期后,回收最老录像的存储空间,实现循环存储。文件系统结构分为元数据区及数据区,如图1所示。
图1 文件系统结构
数据区中的数据簇是逻辑组织结构,被划分为数据块,对所有数据块进行连续编号,在其上存储视频数据;元数据区包含文件系统的超级块和索引区。
(1)超级块:文件的结构自描述,除了版本信息、创建时间、容量等基本信息外,还记录了各索引区域的起始位置和大小、数据区的起始位置、数据簇的大小和数量、数据块的大小等内容。超级块是文件系统的基准,在文件系统格式化时写入。
(2)索引区:基于区段(Extent)的索引和基于分配块的位图索引是文件系统的 2种索引实现方案[7-8]。该文件系统对数据块采用基于Extent[9-10]的索引方式,降低了索引的空间占用率。
视频数据以录像段为基本单位进行组织,每个录像段有唯一的ID;一个录像段包含多个Extent,其索引结构如图2所示。一个Extent记录某段录像在磁盘上的起始数据块号和连续存储的数据块数。录像段与其Extent数目的比例为1:4。
图2 录像段索引结构
索引区主要包括3个部分的索引:录像段,空闲Extent及特征录像段。(1)录像段索引区域记录了所有录像段的索引信息,以录像段的开始时间为键值,用B+树组织录像段索引,提升录像段的检索性能,索引区起始位置为 B+树的根节点;(2)空闲Extent索引区域提供对所有空闲数据块的索引,可看作节点为Extent的循环链表,每个节点记录一段空闲数据块的信息,所有Extent相邻存储;(3)特征录像段与特征Extent索引区域用于索引被标记的视频内容,可通过相应位图,基于特定录像段ID实现特征录像的快速定位。
3 基于内容的索引策略
循环存储之前录像的各索引结构如图3所示。文件系统格式化后,空闲Extent索引区域只包含一个Extent,索引整个数据区;初期存储产生的每个录像段也只有一个Extent;视频内容被标记时,以录像段的形式插入到特征录像段索引区中。录像段被标记的不连续片段被记录在特征录像段下不同的特征Extent中,特征位图被相应置位;应用层可基于录像段ID,通过特征录像位图快速索引到被标记的视频内容。
图3 循环存储前录像的索引结构
到达存储周期后需要进行空间回收,特征录像段通常需被保留,因此,回收空间出现不连续,新写入的录像段也会出现分段;此时一个录像段对应多个Extent,而空闲Extent索引链表也分裂为多个节点,故需要多种策略来维持文件系统的稳定与高效。
3.1 回收策略
回收过程即为清除或修改录像段和特征录像段索引区域,将新增的空间添加到空闲Extent区域的过程,应遵循2个原则:(1)一次至少回收一个数据簇,避免频繁回收;(2)如果回收造成某录像段剩余片段很短,则剩余片段一并回收。具体策略描述如下:
Step1 按时间索引到最老录像段,获得录像段ID;计算录像段的全部数据块数目减去1 024,其值如果未超过一个数据簇的数据块数目,则取出录像段的全部Extent索引;否则取出录像段所需回收的数据块数目对应的Extent索引。遍历取出的Extent索引ECur。
Step2 按录像段ID检索特征录像段位图,相应位若未被置位,则回收当前Extent,跳到Step5。
Step3 特征Extent若需保留,则回收ECur非保留部分;否则一并回收特征录像段和特征Extent的相应区域。
Step4 特征录像段的Extent区域中若因回收而出现空洞,则将后面的 Extent区域前移,保证Extent连续。
Step5 若录像段取出的Extent索引未完成遍历,则跳到Step2;若录像段已无Extent,则回收其录像段索引。
Step6 已回收数据块数目若不足一个数据簇,则跳到Step1。
3.2 写入策略
从磁盘存取数据的时间可以表示为[11]:
其中,Ts为磁头寻道时间为磁盘的旋转延迟为数据的传送时间(r表示磁盘转速,b表示要传送的字节数,N表示一个磁道中的字节数)。在视频数据存储过程中,尽量分配连续的数据块,避免了录像段分段过多,降低了 Ts,进而提高数据的存取效率。写入策略的2个基本原则:(1)空闲Extent区域是一个循环链表,数据存储如需申请空闲空间,均从头结点Extent申请,随着数据的循环写入和回收,其头结点也循环移动;(2)由于短的特征片段的存在,部分空闲Extent可能很小,若空闲Extent头结点是这样的Extent,则向后移动头结点,并再次尝试分配,直到空闲Extent大小满足需求。设BR为视频码率(M b/s),BS为数据块大小(KB),录像段连续存储时间至少为CST(s),所需数据块数目为DBN,则有:
空闲Extent的数据块数目若小于DBN,则被跳过。实际方案中,BS为16 KB,按照常用的1 M b/s码率进行存储时,设定连续存储时间应大于5 s,则空闲Extent至少包含40个数据块才可用于分配。设数据缓冲NBC个数据块后写入磁盘,空闲Extent至少包含EBC个数据块时才允许被分配(通常),则具体的写入策略如下:
Step1 索引空闲Extent头结点,其数据块数目若大于EBC,则取出相应大小的空间,并将取出的空间从头结点中删除,跳到Step3。
Step2 其索引的第一个空闲数据块的编号若与上一次最后写入的数据块号连续,则取出头结点索引的所有数据块,并后移头结点;否则后移头结点,并跳到Step1。
Step3 若录像段为新建,则在录像段索引区插入新的B+树结点。
Step4 要写入的数据块号若与上一个数据块号连续,则更新录像段对应的Extent索引;否则意味着写入空间分段,向录像段的Extent索引区插入新的Extent索引。
Step5 将视频数据写入申请到的数据块,如果已写数据块数目小于NBC,则跳到Step1。
依据此策略对图3所示逻辑卷区域进行回收并重新写入录像后,其索引结构如图 4所示,空闲Extent1和Extent2属于被跳过的空闲空间。
图4 循环存储后录像的索引结构
3.3 碎片整理策略
上述回收策略和写入策略会造成空闲索引区域的碎片化,如图4中空闲Extent已分裂为3个部分,需通过碎片整理来保证空闲空间连续。录像回收是导致空闲Extent碎片化的原因,故将碎片整理的时机分摊在每次空间回收后。设回收的区域为ER,碎片整理的过程就是将ER置入空闲Extent区域的过程。ER区域与某空闲Extent相邻时应进行合并,否则将ER作为新的空闲Extent插入到空闲索引中;插入位置依据当前存储位置进行评价,以保证录像整体上的顺序化。
设Extent的起始位置字段名称为SBN,数据块数目字段名称为 BC,数据区所有数据块数目为BTC,空闲Extent索引区名称为EF,以i为游标遍历EF,临时数据块号BTN,算法描述如下:
Step1 由头结点开始正向遍历空闲Extent索引区,计算:
如果BTN与ER.SBN相等,跳到Step2;否则,计算:
BTN=(ER.SBN+ER.BC+BTC)%BTC
如果BTN与EF[i].SBN相等,跳到Step3;如果空闲Extent索引区域已遍历结束,则跳到Step4。
Step2 向前合并,将ER合并到EF[i]的末端,计算:
如果BTN与EF[i+1].SBN相等,则说明EF[i]索引区域与EF[i+1]的索引区域变为连续,此时将EF[i+1]索引合并到EF[i],同时删除EF[i+1],EF[i+1]后面的所有Extent向前复制一个Extent的长度;算法结束。
Step3 向后合并,将ER合并到EF[i]的前端,算法结束。
Step4 将ER作为空闲Extent单独插入,下一个申请的空闲空间起始数据块为EF[0].SBN,各Extent到它的逻辑距离可表征这个Extent在时间上被分配的顺序,设Extent逻辑距离为LDis(E),则:
逆序遍历空闲Extent索引区,如果LDis(EF[i]>LDis(ER),则将EF[i]后移置EF[i+1];否则,将ER插入到EF[i+1]的位置,算法结束。
4 测试与结果分析
以浙江大学苏州工业研究院视频监控系统为测试平台,实现对文件系统相关策略的效率及有效性的验证。测试平台网络拓扑如图5所示。
图5 网络视频监控拓扑结构
事务中心服务器型号为Dell PowerEdge R210,2 GB内存,操作系统为CentOS6.0,负责设备管理和任务调度;摄像机均为IP摄像机,DM 368 432 MHz处理器,256 MB内存,Linux操作系统,内核版本2.6.27,负责视频数据的采集、编码及存储;IP SAN型号为DotHill R-Evolution 3920 Raidar,在IP SAN存储集群中为2个摄像机分配存储资源,Storm视频分析集群用于提供视频内容的实时分析。设计测试方案中构造短的特征录像段,以得出严重碎片化时的测试结果,方案描述如下:
选取摄像机A,B,采用视频监控典型的1 M b/s码率,配置存储周期2 h,IP SAN分配卷大小为1 GB;存储计划为早7点到晚6点,间隔1 h存储;将摄像机布置在停车场相邻位置对入口进行采样,数据提交到Storm集群进行车牌识别;摄像机A在存储时将非本市车牌的录像段标记为特征录像段,在每次回收特征录像段Extent时随机判断是否保留。存储一定时间后,可通过事务中心服务器对所有的特征录像段实现秒级检索。每次录像存满存储周期后,统计摄像机 A,B的数据存储总耗时,计算平均存储带宽,结果如图6所示。
图6 摄像机平均存储带宽
随着视频数据的不断存储与回收,摄像机A会进
行特征录像段索引建立和回收的操作,由图6可以得出,摄像机A平均存储带宽低于摄像机B,表明维护索引的操作会在一定程度上影响数据存储带宽;但由于:(1)文件系统索引区采用B+树和录像段位示图加快索引;(2)碎片整理操作的时间消耗被分摊到每次空间回收时;(3)这些操作仅多了内存中的简单逻辑判断和有限次的磁盘I/O操作,故对摄像机A的存储带宽影响不会很多。测试中最大带宽差距仅为0.37 M b/s,摄像机B的平均存储带宽为6.67 M b/s,摄像机A的平均存储带宽为6.51 Mb/s,相对B下降的比例仅为2.4%,表明特征录像的相关操作对数据存储效率的影响可以忽略不计。文献[12]对基于传统文件系统(Ext3)的存储效率做了类似实验,其在1 Mb/s的码率下平均存储带宽约为5.23 Mb/s,本文件系统的存储带宽比其提高了24.5%。
每次取样时对摄像机A的空闲Extent数、不可用碎片包含的数据块数目进行统计,得出表1所示结果。
表1 摄像机A碎片统计
统计结果显示,空闲Extent数目在2~7范围内波动,表明碎片整理策略有效地将空闲Extent数目控制在某个范围,碎片化程度不会加剧。不可用的数据块数目被控制在80以下,而逻辑卷数据区所含数据块数目约为 61 000,数据区空间利用率超过99%,存储空间被充分利用。依据不同特征场景,本文件系统方案可通过调整数据写入时对空闲Extent数据块数目的限制,达到对碎片化和存取效率的平衡。
5 结束语
本文根据网络视频监控的数据存储特点,提出一种基于内容的智能视频监控专用文件系统。该文件系统采用 B+树和位图来组织基于录像段和Extent的索引结构,并通过特征录像段实现了基于内容的索引策略;在此基础上优化了数据块的分配、回收及碎片整理方案。依托实际平台的测试结果表明,该文件系统实现了基于视频特征内容的索引;相比传统文件系统,存储带宽有了较大提升;各项策略维持了稳定的存储带宽和较高的磁盘利用率。由于视频监控系统存在经常断电的情况,如何在系统故障的情况下,保证文件系统的数据一致性将是下一步研究的重点。
[1] Haering N,Venetianer P L,Lipton A.The Evolution of Video Surveillance:An Overview[J].Machine Vision and Applications,2008,19(5):279-290.
[2] 潘国辉.安防天下2:智能高清视频监控原理精解与最佳实践[M].北京:清华大学出版社,2014.
[3] Das M,Liou S P.A New Hybrid Approach to Video Organization for Content-based Indexing[C]//Proceedings of IEEE Conference on Multimedia Computing and Systems.Washington D.C.,USA:IEEE Press,1998:96-100.
[4] 李向阳,庄越挺,潘云鹤.基于内容的图像检索技术与系统[J].计算机研究与发展,2001,38(3):344-354.
[5] 秦莉娟.基于内容的自动视频监控研究[D].杭州:浙江大学,2006.
[6] 陈 欢,范志华,熊 劲,等.影响文件系统性能的若干因素的实验[J].计算机工程,2007,33(8):74-76.
[7] Wikipedia.Extent(File Systems)[EB/OL].(2014-09-27). http://en.wikipedia.org/wiki/Extent-(file-systems).
[8] Bar M.Linux文件系统[M].天宏工作室,译.北京:清华大学出版社,2003.
[9] Microsoft TechNet.Optimizing NTFS[EB/OL].(2014-08-14).http://technet.microsoft.com/en-us/library/ cc76 7961.aspx.
[10] Mathur A,Cao Mingming,Dilger A.Ext4:The Next Generation of the Ext3 File System[J].USENIX Magazine,2007,32(3).
[11] Stallings W.操作系统:精髓与设计原理[M].陈向群,译.北京:机械工业出版社,2010.
[12] 汤家兴,陈耀武,蒋荣欣.一种网络视频监控系统的专用存储方案[J].计算机工程,2013,39(12):31-34.
编辑 顾逸斐
Intelligent Video Surveillance File System Based on Content
YAN Bin,CHEN Yaowu
(Institute of Digital Technology and Instrument,Zhejiang University,Hangzhou 310027,China)
Fragmentation of traditional file system seriously affects storage performance.Aiming at this drawback and combined with the characteristics of content-based retrieval in video surveillance,a dedicated file system for intelligent video surveillance is proposed.The proposed approach provides an Extent-based logical volume index structure,retrieves feature content based on feature video segments,and improves index efficiency by B+tree and bitmap.According to the index strategy proposed,recycle the oldest data based on data cluster,which realizes circular storage,optimize data block allocation policy by controlling the continuous storage time and evaluating allocated time of fragmentation,ensuring a continuous,sequential data storage.Test results show that the defragmentation impact to storage bandwidth is only 2.4%,compared with the traditional file system.It increases storage efficiency by 24.5%respectively on typical storage bit rate of 1 M b/s,while the storage space utilization is more than 99%.
content-based;file system;index strategy;Extent structure;defragmentation;intelligent video surveillance
闫 彬,陈耀武.基于内容的智能视频监控文件系统[J].计算机工程,2015,41(10):250-254.
英文引用格式:Yan Bin,Chen Yaowu.Intelligent Video Surveillance File System Based on Content[J].Computer Engineering,2015,41(10):250-254.
1000-3428(2015)10-0250-05
A
TP18
浙江省重点科技创新团队基金资助项目(2011R09021-02)。
闫 彬(1988-),男,硕士研究生,主研方向:视频监控,网络存储;陈耀武,教授、博士生导师。
2014-11-17
2014-12-09E-m ail:robin3yb@gmail.com