基于短视频分类和时长的信息隐藏方法
2021-09-10王婷婷王开西
王婷婷 王开西
摘要:为了充分利用短视频资源,提出了基于短视频分类和时长的无载体信息隐藏方法。该方法对短视频内容进行分类,设置特定类别作为取位标志;对短视频时长划分区间,分别用来映射秘密消息、代表传输开始和结束标志、代表用户的正常生活。分析结果表明,该方法具有5 bits/视频的高隐写容量、较高的隐蔽性和鲁棒性。
关键词:短视频;信息隐藏;无载体;隐蔽性
中图分类号:TP309.7
文献标志码:A
收稿日期:2020-10-09
基金项目:
国家自然科学基金(批准号:U1536113)资助。
通信作者:
王开西,男,博士,副教授,主要研究方向为信息隐藏等。E-mail: kxwang@qdu.edu.cn
信息隐藏是用来保护敏感信息的技术之一[1]。秘密消息可以隐藏在不同的载体中,如图像[2]、视频[3]、音频[4]和文本[5]等。基于上述载体的信息隐藏方法大多需要对载体进行修改[6],从而破坏了载体本身,而且由于存在修改的痕迹给攻击者提供了突破口。近年来,很多学者做了大量的无载体隐写方法的研究[7-8]。无载体隐写方法不对载体进行修改[9],从而提高了信息隐藏的安全性。因此,无载体隐写方法越来越受到重视。随着互联网的迅速发展,无载体隐写的应用场景也变得越来越广泛。在互联网环境下,许多学者利用赛博空间[10]来完成信息隐藏,主要体现在游戏软件和即时通信软件中。基于游戏软件的方法主要有基于第一人称射击游戏的方法[11]和基于《魔兽世界》的方法[12];基于即时通信软件的方法主要有基于微信朋友圈点赞行为的方法[13]和基于Twitter转发推文的方法[14]。但是,互联网带来的海量网络流量和数据资源却没有被研究者充分利用[15],尤其是短视频资源没有被充分利用。随着互联网时代的到来,人们的网络生活越来越丰富,互联网的广泛应用在给人们带来高度便利的同时也产生了海量的信息[16]。其中短视频自媒体成为信息交流的重要载体。短视频自媒体是以网络视频社交平台为载体,个人或组织发布时长20分钟以内的辨别度显著的短视频内容[17]。短视频自媒体与各个行业不断深入融合,应用场景不断广泛扩展。作为互联网时代的主流信息传播方式,短视频逐渐成为各种网络应用的基础,主要体现在网民娱乐的新方式、新闻报道的新载体、网络电商的新平台、文化旅游的新市场等方面。《第46次中国互联网络发展状况统计报告》显示,截至2020年6月,中国短视频用户规模为8.18亿,使用率高达87.0%[18]。短视频用户量之大、使用率之高都为信息嵌入提供了良好的应用环境。本文提出了高隐蔽性的无载体信息隐藏方法,其利用短视频分类和时长区间,设置特定类别作为取位标志,将时长分区间作为秘密消息映射区间、传输开始和结束标志区间、用户的正常生活区间。
1 方法介绍
对短视频内容分类时,以现有的短视频网站Bilibili的分类标准为例。在基于短视频分类和时长的信息隐藏方法中,短视频内容的类别用来做取位标志,短视频时长用来映射秘密消息、代表传输开始与结束标志、代表用户正常生活。取位标志是指需要设置几个特定类别,确定这些类别代表取位的方式和位数。取位方式和位数用于收发双方确定秘密消息的嵌入和提取方式。預处理短视频时长:首先,确定可发布的短视频最长时长,以确定一个短视频可以代表多少位的秘密消息;然后,对短视频的时长分区间,不同的时长区间可以用来代表秘密消息、传输开始和结束标志、用户的正常生活。
1.1 短视频分类
目前主流的短视频平台主要有:Bilibili、抖音、快手、火山小视频、最右、西瓜视频等。很多短视频平台都根据视频内容的不同对用户发布的视频进行了分类[19],以Bilibili为例对短视频内容分类进行说明。Bilibili内的视频分类有以下22个类别:动漫、游戏、电竞、鬼畜、时尚、音乐、科技、数码、知识、动物圈、美食、虚拟UP主、明星、舞蹈、生活、综艺、电影、电视剧、相声、特摄、体育和星海。现有的短视频平台内容分类基本相同,Bilibili的分类标准同样适用于其他短视频平台。
1.2 短视频时长
现有的短视频平台都有各自的视频上传时长限制。每个视频可以隐藏的二进制秘密消息长度上限LMmax=log2时长上限。以抖音为例,普通用户可以拍摄的时长上限为60 s。那么,普通用户的一个短视频可代表秘密消息的长度上限为5位。对短视频时长分区间,分别用来代表秘密消息、传输开始和结束标志、用户的正常生活。将用户最频繁的发布时长区间作为秘密消息映射区间,这里取时长10~41 s为秘密消息映射区间,以此代表十进制数[0,31]。将用户最不频繁的两个发布时长区间作为传输开始和结束标志区间、用户的正常生活区间。这里取时长1~9 s为秘密消息传输开始和结束标志区间,当第一次发布此时长区间内的视频时,代表秘密消息传输开始,当第二次发布此时长区间内的视频时,代表秘密消息传输结束;取时长42~60 s为用户正常生活区间,当发布此区间时长的视频时仅代表用户的正常生活,不代表秘密消息。
2 嵌入与提取过程
在秘密消息传输前,收发双方已经达成了可以保证秘密消息正常传输以及正确解码的共识。在基于短视频分类和时长的信息隐藏方法中,收发双方需要达成的共识包括:短视频内容的分类方式、设置类别所代表的取位方式和位数、短视频时长区间分类的方式及其代表的内容。嵌入过程和提取过程如图1所示。
2.1 嵌入过程
预处理:将秘密消息转化为ASCII码值;设置特定短视频类别集合C={C1,C2,C3,…,Cj,…,Cm},其中j和m均为整数,均代表多种短视频类别中的一个,如果当前视频类别属于C,依据双方共识确定当前视频代表取位方式及取几位;确定短视频可发布视频最长时长并根据C的取位数对其分区间,确定秘密消息映射区间、秘密消息传输开始与结束标志区间、用户正常生活区间。
Step 1 取秘密消息的ASCII码值,得到秘密消息的二进制字符串M,长度为 LM;
Step 2 确定当前隐写过程中会使用到的特定短视频类别C;
Step 3 对秘密消息进行分段,每段的长度由短视频平台可发布时长和C决定,段数n=LM/LCj确定的取位数。分段得到M分段={m1,m2,m3,…,mi,…,mn},其中mi为分段后的秘密消息片段,1≤i≤n且i为正整数,n为正整数;
Step 4 将分段后的秘密消息二进制字符串依次转为十进制序列M′={m′1,m′2,m′3,…,m′i,…,m′n},m′i为秘密消息片段mi的十进制序列,1≤i≤n且i为正整数,n为正整数。将m′i分别加上秘密消息映射区间的左端点数值,以确定发布视频的时长,得到秘密消息发布视频时长序列,M′,={m″1,m″2,m″3,…,m″i,…,m″n},其中M″为秘密消息片段映射后的视频发布时长集合,m″i为秘密消息片段mi在秘密消息映射区间相对应的发布视频时长,1≤i≤n且i为正整数,n为正整数;
Step 5 从秘密消息传输开始与结束标志区间选择一个或两个时长的视频作为秘密消息传输开始与结束的标志,并发布此时长视频以告知接收方传输开始;
Step 6 依据C和秘密消息映射区间的视频时长序列M″依次发布视频;
Step 7 秘密消息传输完毕后,发送方发布代表传输结束的视频以告知接收方传输结束。
2.2 提取过程
特定短视频类别集合C、映射区间、传输开始与结束标志为双方共享。
Step 1 接收方实时监测发送方的视频发布情况,当监测到传输开始标志时,按照时间发布顺序依次记录发送方发布的视频时长和视频内容类别;
Step 2 当监测到传输结束标志时,得到视频内容类别C和秘密消息发布视频时长序列M″={m″1,m″2,m″3,…,m″i,…,m″n};
Step 3 将M″中的每一项分别减去秘密消息映射区间的左端点数值,得到秘密消息的十进制序列M′={m′1,m′2,m′3,…,m′i,…,m′n};
Step 4 根据C的取位方式,将秘密消息的十进制序列M′转化为二进制比特序列,得到M分段={m1,m2,m3,…,mi,…,mn};
Step 5 得到秘密消息的二进制字符串,从而得到秘密消息。
3 具体实例
以短视频平台抖音为例,将抖音短视频按照内容分类。对于普通用户而言,抖音的可发布视频时长为60 s。假设发送方需要传输秘密消息“Qing Dao”给接收方,下面介绍嵌入过程和提取过程。
3.1 嵌入过程
预处理:将秘密消息转化为ASCII码值。设置当前选用的特定短视频类别集合Cj:C1=生活类,如果当前视频类别属于生活类,依据双方共识确定当前视频代表自左向右取5位;C2=体育类,如果当前视频类别属于体育类,依据双方共识确定当前视频代表自右向左取4位;C3=美食类,如果当前视频类别属于美食类,依据双方共识确定当前视频代表自右向左取3位;C4=动漫类,如果当前视频类别属于动漫类,依据双方共识确定当前视频代表自右向左取2位;C5=明星类,如果当前视频类别属于明星类,依据双方共识确定当前视频代表自右向左取1位。确定抖音可发布视频最长时长为60 s。对可发布时长分区间,确定秘密消息映射区间10~41s、秘密消息传输开始与结束标志区间1~9 s、用户正常生活区间42~60 s。
Step 1 对秘密消息“Qing Dao”进行预处理,取其ASCII码值,得到秘密消息的二进制字符串M=01010001 01101001 01101110 01100111 01000100 01100001 01101111,长度LM=56 bits;
Step 2 确定当前隐写过程中会使用到的特定短视频类别C1=生活类,C5=明星类;
Step 3 对秘密消息进行分段,段数n=LM/LCj确定的取位数=56/5=12,段长=log260=5 bits。分段得到M分段={01010,00101,10100,10110,11100,11001,11010,00100,01100,00101,10111,1};
Step 4 將分段后的秘密消息二进制字符串依次转为十进制序列M′={10,5,20,22,28,25,26,4,12,5,23,1}。将m′i分别加上秘密消息映射区间的左端点数值,以确定发布视频的时长,得到秘密消息发布视频时长序列,M″={20,15,30,32,38,35,36,14,22,15,33,11};
Step 5 从秘密消息传输开始与结束标志区间1~9 s中选择5 s和6 s时长的视频分别作为秘密消息传输开始与结束的标志,并发布5 s的视频告知接收方传输开始;
Step 6 依次发布时长为20 s,15 s,30 s,32 s,38 s,35 s,36 s,14 s,22 s,15 s,33 s,11 s的视频,其中最后一个视频内容为明星类,其余均为生活类;
Step 7 秘密消息传输完毕后,发送方发布6 s时长的视频告知接收方传输结束。
3.2 提取过程
当前选用的特定短视频类别集合Cj、映射区间、传输开始与结束标志为双方共享。
Step 1 接收方实时监测发送方的视频发布情况,当监测到5 s时长的视频时,按照时间发布顺序依次记录发送方发布的视频时长和视频内容类别;
Step 2 当监测到6 s时长的视频时,得到C1=生活类,C5=明星类和M″={20,15,30,32,38,35,36,14,22,15,33,11};
Step 3 将M″中的每一项分别减去秘密消息映射区间的左端点值10,得到秘密消息的十进制序列M′={10,5,20,22,28,25,26,4,12,5,23,1};
Step 4 根据C1和C2的取位方式,将秘密消息的十进制序列M′转化为二进制比特序列,得到M分段={01010,00101,10100,10110,1110,11001,11010,00100,01100,00101,10111,1};
Step 5 得到秘密消息的二进制字符串M=01010001 01101001 01101110 01100111 01000100 01100001 01101111,从而得到秘密消息“Qing Dao”。
4 性能分析
与现有的信息隐藏方法相同,从四个方面进行性能分析:隐写容量、隐蔽性、鲁棒性和方法对比。分析结果表明,基于短视频分类和时长的信息隐藏方法具有较高的隐写容量、较强的隐蔽性和鲁棒性。
4.1 隐写容量
隐写容量Capcity定义为单个视频可以携带的最长秘密消息位数。基于短视频分类和时长的信息隐藏方法的隐写容量取决于短视频平台可发布视频的最长时长Lmax,Capcity=log2Lmax。短视频平台可发布视频的最长时长是由平台本身确定的,对普通用户而言,抖音、快手、火山小视频等可发布的最长时长分别为60 s、5 min、60 s等,可发布视频时长越长,隐写容量越大。当Lmax=60 s时,隐写容量取得最小值Capcitymin=log260=5 bits/视频。
4.2 隐蔽性
短视频平台数量不断增加,视频内容不断丰富,活跃用户日趋增多。在海量的短视频资源中进行信息隐藏,攻击者不易检测异常。正是由于短视频的海量性特征,使用短视频分类和时长的信息隐藏方法才具有更高的隐蔽性。在信息隐藏的过程中,秘密消息根据C进行分段和确定进制间的转换,可以在发送过程中通过规则性的变换C来增加分段以及进制转换的多样性,以此来达到更好的隐蔽效果。比如,可設置一些视频类别代表自右向左取位或借鉴二分查找的思想设置取位方式。
4.3 鲁棒性
基于短视频分类和时长的信息隐藏更多地依赖于短视频平台的健壮性,如果短视频平台出现异常,那么秘密消息传输就很难成功。如果攻击者企图篡改短视频内容和时长从而影响秘密消息的传输,那么,首先要攻击短视频平台,但是,现存的短视频平台已经相当成熟,不易攻击。随着技术的发展,以后可能会出现的其他短视频平台的健壮性也不会存在问题。因此,基于短视频分类和时长的方法具有良好的鲁棒性。
4.4 方法对比
本文从上述三个方面与其他方法进行了性能对比,结果如表1所示。基于微信朋友圈点赞行为的方法[13]和基于Twitter转发推文的方法[14]分别利用了时下流行的高稳健性社交软件隐藏秘密消息,这使得上述两种方法具有高度的鲁棒性。微信产生了海量的朋友圈资源,推特产生了海量的推文资源,点赞朋友圈与转发推文均是用户的高频操作,这使得上述两种方法均具有高度的隐蔽性。对比可知,基于短视频分类和时长的信息隐藏方法具有较高的隐写容量、高隐蔽性和强鲁棒性。
5 结论
对发布的短视频时长划分区间,分别用来映射秘密消息、代表传输开始和结束标志、代表用户正常生活。对短视频的内容进行分类,从而作为秘密消息取位方式和位数。利用短视频的分类和时长实现了隐藏容量高、隐蔽性和鲁棒性强的无载体信息隐藏方法,弥补了短视频信息隐藏领域的空缺。基于本研究的成果,为进一步提高隐写容量,可以选取发布时长更长的短视频平台实施信息隐藏,也可以结合不同的短视频平台对其进行编码。为了进一步增强隐蔽性,可以在隐写过程中穿插代表用于正常生活的视频来躲避窃密者的攻击。
参考文献
[1]WANG Z H, CHANG C C, KIEU T D, et al. Emoticon-based text steganography in chat[C]// 2009 Asia-Pacific Conference on Computational Intelligence and Industrial Applications (PACIIA). Wuhan, 2009: 457-460.
[2]陈嘉勇, 王超, 张卫明,等.安全的密文域图像隐写术[J].电子与信息学报, 2012,34(7):1721-1726.
[3]胡洋, 张春田, 苏育挺.基于H.264/AVC的视频信息隐藏算法[J].电子学报, 2008,36(4):690-694.
[4]杨婉霞, 孙东红, 黄永峰.基于语音编码中自适应码本的隐藏信息方法[J].计算机工程与设计, 2013, 34(8):2656-2661.
[5]甘灿, 孙星明, 刘玉玲,等.一种改进的基于同义词替换的中文文本信息隐藏方法[J].东南大学学报(自然科学版),2007(S1):137-140.
[6]张建军.基于文本集常见词的无载体信息隐藏技术研究[D].长沙:湖南大学,2018.
[7]于翔美,王开西.基于汉字笔画编码矩阵的文本隐写方法[J].青岛大学学报(自然科学版),2019,32(2):43-47+54.
[8]王建业,郭振波,王开西.基于汉字数学表达式的无载体文本隐写方法[J].青岛大学学报(自然科学版),2019,32(1):81-86.
[9]周志立, 曹燚, 孙星明.基于图像Bag-of-Words模型的无载体信息隐藏[J]. 应用科学学报, 2016,34(5):527-536.
[10] 张新鹏,钱振兴,李晟.信息隐藏研究展望[J].应用科学学报, 2016, 34(5): 475-489.
[11] SEBASTIAN Z, ARMITAGE G, BRANCH P. Covert channels in multiplayer first person shooter online games[C]// 33rd Annual IEEE Conference on Local Computer Networks. Montreal, 2008:204-211.
[12] ROWE B, DARYL J. A behavior-based covert channel in a MMO[C]//The 2014 International Conference on Security and Management. Las Vegas ,2014.
[13] ZHANG X P. Behavior steganography in social network[C]// 12th International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP). Taiwan, 2016: 21-23.
[14] LI S, ANTHONY T S H, WANG Z, et al. Lost in the digital wild: Hiding information in digital activities[C]// MPS '18: Proceedings of the 2nd International Workshop on Multimedia Privacy and Security. Qingdao, 2018:27-37.
[15] 張平, 崔琪楣, 侯延昭, 等.移动大数据时代:无线网络的挑战与机遇[J]. Science Bulletin, 2015, 60(5):433-438.
[16] 顾亚奇.社交媒体时代短视频的多重文化图景[J].中国人民大学学报, 2020, 34(3):142-150.
[17] 孙小燕, 朱伯玉. 短视频自媒体的发展现状与趋势[J].青年记者, 2020, 20(52):92-93.
[18] 中国互联网络信息中心.《第46次中国互联网络发展状况统计报告》[R].北京,2020.
[19] 宋刚. 基于多种特征的视频分类研究[D].重庆:西南大学,2010.
Method of Information Hiding Based on Short Videos′
Classification and Lengths
WANG Ting-ting, WANG Kai-xi
(College of Computer Science & Technology, Qingdao University, Qingdao 266071, China)
Abstract:
In order to make full use of these resources, a carrier-free information hiding method based on short video classification and lengths was proposed. Short videos′ content is classified and some specific categories is set as the flag of taking bits; Short videos′ lengths are divided into intervals, which are used to map secret messages, represent the start and end of transmission marks, and represent the normal life of users. The analysis results show that this method has high capacity(5bits/video), high concealment and robustness.
Keywords:
short videos; information hiding; carrier-free; concealment