音频数字水印在电视播出互动中的应用

2020-09-27胡尔西旦

写真地理 2020年25期

胡尔西旦

摘要：随着科技的不断进步，音频产品快速发展，人们开始关注音频产品版权的保护，数字音频水印技术成为了当前比较活跃的研究领域。音频水印具备以下优点：用户体验感好、快速准确、方便移动端采集。使用音频水印技术，通过在节目播出实时信号或离线素材中嵌入音频水印，在电视节目播放时，观众可通过手机等移动终端的麦克风采集声音并识别水印信息，根据结果跳转到对应互动界面参与节目互动。如何实现屏幕的扩展，将“大屏幕”的视觉效果和现场感与“小屏幕”的优势相结合，延伸电视互动应用场景，成为了新媒体行业的热门研究方向。

关键词：音频水印;水印嵌入;水印检测;电视节目互动

【中图分类号】P301.6 【文献标识码】B 【DOI】10.12215/j.issn.1674-3733.2020.25.179

引言：如何保护数字内容的安全性已成为近年来法律界和信息产业界的热点问题。针对这些问题，传统的解决方式是采用密码学技术。但是，多媒体产品数据比较特殊，仅依靠传统密码学技术无法解决多媒体信息产生的安全问题。基于传统密码学技术的多媒体信息安全保护具有局限性。这种背景下，能够解决版权问题的数字水印应运而生。

1 电视播出互动中的应用中音频水印的技术特点

（1）适于空气传播，在电视互动场景中，观众使用手机等移动终端设备识别电视节目声音中的音频水印，访问互动内容，声音在电视播放过程中通过空气传播至手机麦克风，距离、背景声等周围环境多种多样，因此需要考虑到音频水印的抗干扰能力。

（2）鲁棒性高：由于电视信号从电视台播出一直到用户机顶盒的传输链路复杂，特别是上星播出的节目，中间会经历多次编解码、信号格式转换、音频变换等处理，因此在电视节目中嵌入的水印需具有较高的鲁棒性，避免水印在传输链路中被干扰破坏，影响终端设备的正常识别。

（3）检测程序性能，考虑到市场上的手机档次不一，音频水印检测算法不能占用太高的手机资源，基本设计目标是占用CPU不超过中档手机的20%。

2 数字音频水印的评价标准

2.1 不可感知性评价标准

2.1.1 主观标准

主观评价一个水印算法透明性的过程中，通常应用平均观点分（MeanOpinionScore，MOS），即由测试者对含水印的音频进行打分。其主要根据音频的音质进行打分，通常使用5分制规则，MOS越靠近5，说明算法的透明性越好。由于此标准常常因参加测试人员的个人因素或者测试的环境的不同，导致测试结果存在差异，且会浪费大量人力，因此通常不被采用。

2.1.2 客观标准

评价透明性时，使用较多的是信噪比和峰值信噪比（PeakSignaltoNoiseRatio，PSNR），可以定量评价算法。虽然音频发生的一些较小改变在主观上听不出任何差异，但是会对SNR或者PSNR的数值造成一定影响。

2.2 水印容量评价标准

水印容量通常指保证音频产品具有不可感知性的前提条件下，单位时间内嵌入到宿主音频产品中的水印大小，单位是bps（bitspersecond）。bps值越大，说明嵌入的水印越多;反之，说明嵌入的水印较少。对于不同的应用域，嵌入水印序列大小的要求不尽相同，通常要求音频产品够针对不同的场景，嵌入相应大小的水印序列。

3 音频水印互动系统中的关键技术

3.1 音频水印嵌入

3.1.1 音频分帧处理

设原始音频信号分段时每帧音频信号的长度为M，M的取值對算法性能的好坏有一定的影响。为了提高算法的感知透明性，使嵌入水印后的音频信号在听觉上不被感知，可以说M的取值越大越好。本算法中取每帧M=1024，嵌入水印的音频信号与原始音频信号相比在听觉上差异不明显。

对每一个窗口进行帧结构处理：分帧处理，对于48kHz采样频率的音频信号，每1024个时间采样点分为1帧，每一个完整的水印窗口为32帧，对这32帧在时域进行汉明窗口函数重叠滚降，在这时间T内要完成16bit信息的嵌入。

3.1.2 嵌入过程

将一个二值随机序列wm作为待嵌入的信息位，这里记同步码与信息位之和共N位，选取一段原始音频作为掩护音频F，其长度为L。

选取两段不同的m序列：m1和m2作为扩频序列，其中m1作为对同步码的扩频序列，m2作为对水印信息的扩频序列，对水印序列S进行扩频，选择的m序列可作为密钥。扩频序列的长度M，扩频后的序列为VS，长度为“N×M”。

3.2 音频水印检测

3.2.1 初始化同步搜索

同步信息是4位的同步头，嵌入时采用与水印信息不同的扩频码序列。具体序列的选择由密钥唯一确定，而密钥在嵌入与检测两端都是相同的。

概述来说，解码时，首先用已经知道的同步扩频码序列提取同步头，当解码得到同步头时，用整个码本所有的扩频序列分别去做相关，得到相关最大的码序列即为同步所使用的扩频码序列;进一步精细搜索，用这个同步扩频码序列在这个位置的周围滑动提取相关值，得到相关值最大的位置确定为同步信号的嵌入位置。

3.2.2 置信度处理

根据嵌入端在特定子带嵌入的规则，在检测端可以单独对某些子带进行处理，比如取前10个相关检测峰值最高的子带视为有效信息，其他子带信息丢弃，对10个最优检测相关值进行综合判定。为可信度量提供充分的数据支持。对于解码得到的水印数据，为了确认可信度较高的水印信息，同时丢弃可信度较低的水印信息。

基于冗余嵌入设计了可信度度量方法。假设水印信息在传输过程中没有受到任何的干扰，则从两组水印中解码得到的水印应该具有相同的符号，即使用两个扩频序列解码并重新排列恢复后得到的水印数据应该完全相同。随着干扰的不断增加，两组水印数据中的不全部相同的位数开始增加，因此两组水印数据中不全部相同的位数已在一定程度上反映出水印信号的被干扰情况。此外，同步码由于进行了四倍的冗余，在一定程序上也提供了受干扰程度的反馈，可以作为置信度的一个参考。

结语：当前，数字音频水印虽然取得了一些进展，但也存在这一些问题。一些算法设计时没有考虑同步问题，该问题也是目前音频水印技术中所要考虑的问题之一。目前关于能够同时进行版权及内容认证的算法需求越来越多，因此进行双水印方案的研究很有必要。

参考文献

[1] 何茜，赵景惠.数字水印算法研究[J].信息与电脑（理论版），2017，（7）：82-83.

[2] 甘蓉.数字视频水印技术浅析[J].电子测试，2018，390（9）：126，128.

[3] 万旭光，刘凡.军事通信中基于DCT域直流分量的音频数字水印技术研究[J].现代电子技术，2017，40（13）：6-8.

写真地理

2020年25期

音频数字水印在电视播出互动中的应用

杂志排行

写真地理的其它文章