一种基于多重散射的光学Hash 函数*

2021-03-11何文奇陈嘉誉张莲彬卢大江廖美华彭翔

物理学报 2021年5期

何文奇陈嘉誉张莲彬卢大江廖美华彭翔

(深圳大学物理与光电工程学院，光电子器件与系统教育部/广东省重点实验室, 深圳 518060)

本文提出了一种基于光与多重散射介质相互作用的光学Hash 函数构造方法.该方法创新性地利用多重散射介质对相干调制光的天然随机散射作用, 实现了对调制光的“混淆”和“扩散”, 从而满足了Hash 函数的核心功能要求: 高安全强度的单向编码/加密.所设计的光电混合系统能有效地模拟Hash 函数中的“压缩函数”, 结合具有特征提取功能的Sobel 滤波器, 能实现将任意长度的输入数据压缩并加密为固定长度为256 bit的输出(即Hash 值).一系列仿真结果表明: 该方法所构造的光学Hash 函数具有良好的“雪崩效应”和“抗碰撞性”, 其安全性能可比拟当前最为广泛使用的传统Hash 函数(MD5 和SHA-1).

1 引言

随着信息技术和互联网的发展, 人类进入了“信息爆炸”的时代.信息的爆炸式增长促进了人类社会的发展, 但是, 伴随而来的信息安全问题也引起了人们的广泛关注, 如何保证信息的安全性也成为了一个持续的研究热点.目前, 信息安全技术通常可分为两大类, 一类是基于数学运算的传统信息安全技术; 另一类是基于非数学运算的新型信息安全技术, 主要包括: 量子加密、生物特征识别和光学信息安全[1]等.其中, 得益于“光学信息处理”具有并行处理以及多维运算的能力, 光学加密技术近年来吸引了不少学者们的关注.自Refregier 和Javidi[2]于1995 年提出基于4f 光学相关器的双随机相位编码技术以来, 研究者们在此基础上发展出了一系列相关的衍生技术[3−5].但是, 由于双随机相位编码系统具有线性以及对称性, 导致其存在一定的安全隐患, 这一点已经被多种密码分析方案所证实[6−8].为了解决这一问题, 各国的研究者们陆续在此基础上提出了多种安全性增强型的光学加密方案[9,10], 甚至是加、解密钥不同的光学非对称密码系统[11−16].

众所周知, 在信息安全领域中, 除了“加密”技术之外, 各类安全认证技术也同等重要, 其中,Hash 函数便是一种能够高效地实现“数据完整性认证”的核心技术, 同时, Hash 函数也在数字签名、数据检索以及身份认证等众多领域扮演着非常重要的角色[1].通常, 我们将Hash 函数视为一个单向加密系统, 它能将任意长度的输入消息M 映射为固定长度的输出h, 即h = H(M).为了保证其安全性, Hash 函数需满足以下三个条件: 1) 对于给定的M, 易于计算出其对应的Hash 值h; 2) 对于给定的h, 难以计算出M; 3) 对于给定的M, 难以找到另一个消息M', 使得H(M)= H(M'), 即抗碰撞性[1].在传统信息安全领域, 自MD4[17]算法在1990 年被提出以来, Hash 函数已取得了长足的进步.目前, 应用最广泛的Hash 函数有两大系列,即MD 系列[17]以及SHA 系列[18], 其中, MD5 和SHA1 是国际上通行的两大Hash 函数.值得指出的是: 这两种主流Hash 函数都是基于某种数学难题和复杂的数学运算而设计的.近年来, 在光学信息安全领域, 几种基于光学思想和理论的Hash 函数也相继被提出, 如2010 年, He 等[19,20]首次提出了一种基于级联切相傅里叶变换的光学Hash 函数, 从理论上探索了用光电混合系统构建Hash 函数的可能性.随后, Lai 等[21]又提出了一种基于双光束干涉的光学Hash 函数, 并对其安全性能进行了系统分析.然而, 上述两种方法的核心部件—压缩函数, 其本质上都是一个线性过程, 尽管均引入了非线性操作, 但其理论上的安全隐患仍然存在.

本文将提出一种基于光与多重散射介质相互作用的光学Hash 函数.在该方法中, 以多重散射介质来构造核心部件—光学压缩函数, 创新性地利用多重散射介质与相干调制光的相互作用, 进行天然而充分地随机“扰乱”, 实现对调制光的“混淆”和“扩散”.文中将详细描述所提光学Hash 函数的设计过程, 并给出相应的数值仿真实验和结果分析.

2 Hash 函数的一般结构

Hash 函数的一般结构如图1 所示, 它是一种基于消息预编码的迭代结构, 通过级联调用一个压缩函数, 每次处理一个固定长度的消息分组, 最终输出一个固定长度的Hash 值.可以看出, 其核心是压缩函数f, 它以某一个消息分组Mi(i = 1, 2,3, ···, t)和上一个压缩函数的输出Hi(i = 2, 3, ···,t)为输入, 输出为Ht+1.Hash 函数算法还需要一个初始值H1以及变换函数g, 其中, 变换函数g 的作用是将压缩函数的最终输出Ht+1转化成固定长度的Hash 值.用数学形式可将整个Hash 算法表示为:

图1 Hash 函数的结构Fig.1.Schematic diagram of the Hash function.

3 基于多重散射的光学压缩函数

如上所述, 压缩函数是Hash 函数的核心单元,因此, 它的实现方式在很大程度上决定了Hash 函数的性能优劣.本文利用多重散射介质对相干调制光的天然而变幻莫测的“扰动效应”, 选择以“多重散射介质”作为压缩函数的核心部件来构造光学Hash 函数.拟用于实现基于多重散射的光学压缩函数的光电系统结构如图2 所示, 其中, SF 表示空间滤波器; L 表示准直透镜; SLM1和SLM2分别表示振幅型空间光调制器和纯相位型空间光调制器, 用于加载待处理的消息分组(复振幅分布);MSM(multiple scattering medium)表示多重散射介质; D 表示孔径光阑.受SLM 调制的光经过多重散射介质时将以不可预知的方向随机散射, 因此, 携带调制消息的光波将由于光的多重散射效应而被多次“混淆”和“扩散”.

图2 实现基于多重散射的光学压缩函数的光电系统结构示意图Fig.2.Schematic diagram of optoelectronic architecture for realizing the optical compression function based on multiple scattering.

该光学压缩函数的具体工作原理和流程如下:1) Mi(i = 1, 2, 3, ···, t)以及Hi(i = 1, 2, 3, ···,t)被编码为8 位量化精度、大小为16 × 16 像素的图像, 并分别以振幅和相位的形式加载在SLM1和SLM2上; 2) 用相干光照射SLM1和SLM2, 经过SLM1和SLM2调制的相干光衍射传播至多重散射介质, 被其扰乱后, 在CCD (charge coupled device)上形成随机散斑场; 3) 利用Sobel滤波器提取散斑的特征, 得到一个16 × 16 的特征矩阵,将其作为压缩函数的输出.

4 基于多重散射的光学Hash 函数的构造

基于多重散射介质的光学Hash 函数的构造过程主要可分为三个步骤: 消息预处理、数据压缩以及输出变换.

4.1 消息预处理

在进行数据压缩之前, 需要对原始消息进行预处理.预处理操作如下: 1) 将消息数据长度用64 bit二进制数表示, 并作为附加信息添加到消息末尾;2) 将1)中的数据划分为固定长度的子块数据, 若最后一个子块数据的长度未达到所要求的固定长度, 则需要在其末尾进行数据填充, 一般做法是在末尾直接填充0 或1[10].预处理的步骤1)一般被称为MD 强化, 其目的是为了增强算法的抗碰撞性.假设有两则不同数据长度的消息A 和B, A 满足分组要求无需进行填充, 而B 需要在其末尾全部填充0 或者1.消息B 经过填充之后, 其数据分布可能与消息A 相同, 因此, 经过同样的Hash 函数之后得到相同的Hash 值, 这就意味着产生了碰撞, 这将是一个严重的安全漏洞.通过引入MD 强化, 由于不同的消息其数据长度不同, 因此可避免碰撞的发生.在步骤2)的消息分组中, 本方案将原始消息划分为长度为2048 bit 的数据块, 并将每一数据块编码成8 bit 量化精度的16 × 16 的图像(M1, M2, ···, Mt).此外, 压缩函数还需要一个初始输入H1, 本方案以原始消息长度作为种子, 利用伪随机数生成器生成2048 bit 二进制伪随机数, 并将其编码成8 bit 量化精度的16 × 16 的图像H1, 其生成过程如图3 所示.

4.2 数据压缩

经过消息预处理操作后, 得到了光学Hash 函数的初始输入H1以及多个消息子图(M1, M2, ···,Mt), 随后即可利用光学压缩函数对各消息子图(分组消息)进行压缩, 其流程图如图4 所示.步骤描述如下:

1) 用PC 分别将M1和H1以纯振幅和纯相位的形式写入SLM1和SLM2, 则光波的复振幅可表示为

图3 初始伪随机图像的生成Fig.3.Flowchart for creating initial pseudo-random image.

图4 级联压缩流程图Fig.4.Flowchart of cascade compression.

2) 经过SLM1和SLM2调制后的相干光传输至MSM 并与其相互作用, 最终在CCD 上形成散斑图样, 散斑图样的强度表示为

其中

h1(x,y,u) 和 h2(x,y,v) 分别对应衍射距离为 u 和v的菲涅耳衍射的点扩散函数; u 和 v 分别表示SLM2与MSM 之间的距离以及MSM 与CCD 之间的距离; P 代表MSM 的函数; *代表卷积运算符;

3) 利用Sobel 滤波器提取散斑图样的特征, 得到量化精度为8 bit 的16 × 16 图像H2:

式中 e xtr(·) 代表特征提取操作.步骤2)和3)可用压缩函数f (·) 合并表示为

4) 将M2,, H2分别写入SLM1和SLM2, 并重复步骤2)和3), 得到下一个特征矩阵H3:

5) 同理, 对其他子图像重复步骤1) — 3), 最终得到特征矩阵Ht+1.整个消息级联压缩过程如图5 所示.

图5 级联压缩过程Fig.5.Procedure of cascaded compression.

4.3 输出变换

在输出最终的Hash 值之前, 还需要对压缩函数的最终输出Ht+1做输出变换.本方案以Ht+1的均值作为阈值, 将Ht+1中大于或等于均值的像素灰度值设置为1, 小于均值的像素灰度值设置为0,最后以逐行串接的形式将Ht+1中的值串联, 得到256 bit 的Hash 值.

5 仿真结果与分析

雪崩效应是评价Hash 函数安全性能的重要指标[17], 其表明当输入消息产生微小变化时, 比如反转一个二进制位, 输出的Hash 值将发生很大变化,且依据严格雪崩准则, 当任何一个输入位发生变化时, 一个性能良好的Hash 函数的Hash 值至少有一半的位数发生变化[22].为了评估雪崩效应以及所提出光学Hash 函数的稳定性, 拟采用以下几个参数[17,18]:

(10)式中, hi和分别表示原始消息和将原始消息轻微改动后所对应的Hash 函数; L 和k 分别表示Hash 值的总长度和比特位序数; A EC(i)表示第 i 次测试的雪崩系数.(11)式中, AEC 和N 分别表示平均雪崩系数以及测试的总次数.显然, 当AEC(i)和 AEC 的值越大时, 说明Hash 函数的雪崩效应越强, 同时, 当标准差 ∆ B 越小时, 说明Hash 算法的稳定性越好.

数值仿真测试步骤如下: 1) 用所提出的光学Hash 函数计算任意一个原始消息对应的Hash 值;2) 任意选取原始消息中的一位数据并对其进行修改, 计算消息被修改后的Hash 值.消息的具体修改过程如图6 所示.首先, 随机地选取图像中的任一像素, 如图6 黑色圆圈所示; 随后提取该像素的像素值, 并通过二值化操作, 将该像素的像素值以二进制数的形式表示; 最后任意地选取这一像素值(二进制表示)的某一位执行数据的修改操作:若该位的数据值为“1”, 则将其修改为“0”, 类似地,若其值为“0”, 则将其修改为“1”; 3) 利用(10)式计算雪崩效应系数.

图6 轻微修改原始消息的过程Fig.6.Flowchart of modifying the bit of message.

值得指出的是, 为了表征多重散射介质对于相干光(振幅和相位)的双重“混淆”和“扩散”作用,仿真时选取10 层相互间隔一定距离的随机相位掩模来表征多重散射介质, 间隔设置为 z =10 mm ,如图7 所示.

图7 多重散射介质仿真模型Fig.7.Simulation model of the MSM.

重复上述步骤2)和步骤3)共10000 次, 通过计算得到多个 A EC(i)值, 再结合(11)式以及(12)式可计算平均雪崩系数 AEC 及标准差 ∆ B ,利用这些参数可以评判一个Hash 函数的性能优劣.在仿真实验中, 分别对随机生成的10, 100 和1000 kbit 的原始消息进行测试, 测试结果如图8所示.根据(11)式和(12)式计算平均雪崩系数AEC 及标准差 ∆ B , 结果如表1 所列.为了进一步验证所提出的光学多重散射Hash 函数的性能, 比较了本方案与传统的MD5 和SHA-1 的平均雪崩系数和稳定性数值, 相应的数值结果如表2 所列.

测试结果表明, 对三组不同数据长度的消息而言, 在10000 次的测试中, 任意改变原始消息中的某一位, 其对应的Hash 值与原始消息的Hash 值相比几乎一半的位数发生改变, 说明所提出的光学Hash 函数具有良好的雪崩效应.同时, 在测试结果中, 三组数各自的 ∆ B 分别是0.0770, 0.0647,0.0636, 表明所提出的光学Hash 函数具有较好的稳定性.在测试过程中, 分别对三组不同长度的消息测试10000 次, 并未出现一次碰撞, 即 A EC(i)=0, 表明该Hash 函数具有优秀的抗碰撞性.进一步地, 通过对比可知, 本方法的雪崩效应系数与传统Hash 函数(MD5 和SHA-1)相当(如表2).

表1 雪崩效应测试结果Table 1.Results of testing avalanche effect.

表2 与MD5 和SHA-1 算法的比较Table 2.Comparison with MD5 and SHA-1.

图8 10000 次测试下的 A EC 分布, 消息长度为 (a) 10 kbit,(b) 100 kbit, (c) 1000 kbitFig.8.Distribution of AEC values in tests for the messages with (a) 10 kbit, (b) 100 kbit, and (c) 1000 kbit.

6 总结

本文提出了一种基于光与多重散射介质相互作用的光学Hash 函数构造方法, 该光学Hash 函数以多重散射介质为核心部件, 利用多重散射介质对调制光进行天然而随机的散射, 实现对输入信息的混淆和扩散作用, 同时, 结合Sobel 滤波器进一步完成散射信号的特征提取, 最终实现了将任意长度的输入消息压缩为固定长度的输出(Hash 值)的目的.相比于已报道的光学Hash 函数, 该方法利用了散射介质对输入信号所具有的天然置乱特性, 提高了其光电混合实现的可行性.数值仿真结果表明, 所设计的光学Hash 函数具有优秀的雪崩效应以及抗碰撞性, 与传统Hash 函数的安全性能相当.