APP下载

RO PUF硬件物理指纹性能评估*

2021-05-31杰2

电讯技术 2021年5期
关键词:汉明随机性指纹

陈 洁,钟 杰2,郑 力**2,胡 勇

(1.四川大学 网络空间安全学院,成都 610065;2.中物院成都科学技术发展中心,成都 610200)

0 引 言

在工业互联网、物联网等网络环境中,入网设备的身份认证是其能安全地与其他入网设备或中心服务器交换信息的基础。身份认证过程中,凭据信息的存储和传输是必须解决的问题。物理不可克隆函数(Physical Unclonable Function,PUF)能避免因将身份凭证存储在非易失性存储器后,存储器受到侵入性攻击而导致的身份凭据信息和其他消息泄露[1]。PUF能提取集成电路制造过程引入的随机差异,使不同芯片对同样的输入(激励)有不同的输出(响应)。激励-响应对是硬件确定的,是硬件物理指纹,不用事先存储,因其具有一定的可靠性、唯一性、随机性而作为设备的身份凭据。基于PUF实现设备的身份认证、密钥生成,具有硬件资源占用率低、身份凭证信息不易泄露、被捕获后身份凭据难以复制的特点,大大提高了设备身份认证的安全性,尤其适用于无人值守的环境。

自2001年Pappu首次提出PUF以来,国内外研究人员对PUF实现与提取开展了大量的研究,提出了基于光学、环形振荡器、仲裁器、静态随机存取存储器(Static Random Access Memory,SRAM)等多种PUF结构[2]。尽管PUF研究已获得了显著的成果,但是并未有系统化的产品出现。PUF技术的产品化实现更重要的是基于工程应用的PUF性能评估体系建设。在PUF性能评估领域,目前已开展的工作更多的是对PUF的部分性能进行独立特征分析,典型的分析包括芯片被误认率和认证失败率[1]、可靠性和唯一性[3]、均匀性和比特混叠[4]、错误接受率(False Acceptance Rate,FAR)和错误拒绝率(False Rejection Rate,FRR)[5]、PUF抗机器学习建模攻击[6]、熵[7]、空间自相关分析(Spatial Autocorrelation Analysis,SPACA)[8],对于PUF的性能评估大部分是在PUF结构实现研究工作中进行的一个辅助分析,并未系统化开展研究。

PUF主要应用于设备认证和密钥生成,从应用角度看,如何实现PUF性能标准化的评估是PUF技术与传统可信认证体系融合的关键。可靠性和唯一性是PUF应用于认证和加密的基础特性,随机性和开销是PUF应用的通用问题,从目前国内的研究来看,涉及PUF性能的研究工作集中在这些方向,但是更多的工程应用需求没有在研究中进行响应。不同研究人员关注的指标侧重点不同,所以选择的指标也不同。这导致工程实现时缺乏统一的标准比较多个PUF结构,无法判断哪一个PUF结构更适合。其次,随着PUF与其他多学科结合(比如与机器学习算法结合的抗机器学习建模攻击指标等),未来可能有更多的指标被提出用于评估PUF性能。基于上述原因,PUF需要一个完备的、合理的评估体系,该体系既能把所有PUF结构放在相同标准上比较,也有合理的机制接纳新指标,成为PUF设计和PUF工程应用的桥梁。

本文从工程应用的角度出发,分析PUF各指标的意义及场景的适用性,建立PUF性能分层指标体系,将指标分为必须检验的必要指标、应该检验的重要指标和按照应用场景选用的应用指标,进一步提出PUF性能综合评估方案,供PUF设计人员或PUF应用选型参考。由于环形振荡器PUF(Ring Oscillator PUF,RO PUF)能选择若干反向器首尾相连构成正反馈环路,输出与随机路径延迟直接相关的毛刺脉冲,无需对称性设计,可产生大量的物理指纹,易于实现,资源消耗低,本研究采用环形振荡器产生所需的硬件物理指纹进行实验。本文性能评估方案也可推广至其他生成激励响应对的PUF结构上。

1 PUF性能指标体系设计

PUF的实现关键在于提取芯片生产过程中固有的深亚微米工艺变化导致的随机特性,如互连线的线宽和蚀刻深度、氧化层厚度、金属厚度等。由于涉及到材料、工艺、加工制造等多学科专业知识,这些因素如何导致PUF性能的具体差异,目前缺乏全面有效的理论分析,PUF指标的分析更多在于PUF在工程实践中体现的各种特性。

根据PUF性能指标的含义和用途,将指标分为三类:必要指标——唯一性和可靠性,必须检验;重要指标——随机性、比特混叠、开销,应该检验;应用指标——FAR、FRR、抗机器学习攻击、熵、空间自相关分析,应该按需求检验。如果有新指标提出,可加入到应用指标。该指标体系的评估指标分层如图1所示。

图1 PUF评估指标分层示意图

此外,研究人员还曾经提出过正确性、耐热性、均匀性等指标。经过分析,耐热性指标属于可靠性,正确性是可靠性的另一种表述,初期部分文献中提到的随机性、可预测性实际指均匀性,而随机性检验中频率检测本质也是检测响应中1的个数。因此,只考虑随机性,不考虑均匀性。指标实际意义被包含或者相同时,将使用意义更广或者认可度更高的指标纳入指标体系。

将指标分为三层的主要划分准则是指标的重要性和指标的应用广泛性。必要指标是指标体系的基础;重要指标是指标体系的主体,是指标体系的重要组成部分;应用指标是指标体系中与应用结合最紧密、最具有自身特点的部分。

1.1 必要指标

类比生物指纹,PUF作为身份凭据必须具有的唯一性与可靠性,这也是PUF性能指标体系中的基础性能。

唯一性是PUF能作为身份凭据在网络安全领域应用的重要原因。唯一性在50%附近最佳。唯一性好,说明不同设备区分度高,在认证时服务器才能区分不同设备,而唯一性差则可能导致误报或身份混淆,因此唯一性在指标体系中必不可少。

可靠性被看作对设备长期运行稳定性的预测。在运行过程中,气候、温度变化,设备老化,供电电压波动等,都可能导致可靠性降低。可靠性接近100%为最优。高可靠性是设备长久运行的保障,而可靠性低将导致认证结果不可靠,进而导致一系列不良后果。

综合上述两点,可靠性和唯一性是PUF评估指标体系中的基础指标,是最重要的必要指标。

1.2 重要指标

重要指标是对所有应用都适用的指标,具有广泛性,是评估体系的主体。随机性衡量PUF生成物理指纹的规律性,是密码学的核心。随机性低,说明密钥或认证凭据具有规律性,容易被猜测,降低安全性。检测随机性常用美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)随机数检测方法。

开销包括逻辑资源开销和时间开销,实际开销和激励响应位数有关,如果太大,可能会影响设备的其他功能。开销承受能力与应用相关。在低功耗传感器或射频识别(Radio Frequency Identification,RFID)的应用上,由于资源受限,开销必须保持很低;在其他普通设备或安全性更重要的设备上,开销的重要性降低。

比特混叠衡量响应每一位出现0和1概率是否相同,如果比特混叠过高或过低,会导致某些位固定,即响应实际可用位数变小,意味部分开销被浪费,因此比特混叠维持在50%附近很重要。

综上所述,随机性、比特混叠和开销是重要指标,在任何应用场景下都应当检测。

1.3 应用指标

应用指标指是在某些应用下有重要作用的指标,即只适用于部分应用的指标。

FRR和FAR是可靠性和唯一性的衍生指标,能有效衡量认证过程中有效输入被错误拒绝或无效输入被错误接受的可能性。

熵是衡量PUF结构能提取的设备固有随机物理特征的标准,密钥生成和随机数生成应用中,熵有重要作用。

抗机器学习建模攻击指PUF抵抗机器学习建模方法准确预测响应的能力。常用的机器学习建模方法包括逻辑回归,支持向量机、CMA-ES等,在明文发送激励响应对的强PUF应用场景下很重要。

空间自相关分析近期也用于评估PUF性能,反映不同芯片及芯片不同位置之间响应潜在的相互依赖性。

根据上述分析可以看出,评估体系中不仅包含作为身份凭证的基础指标可靠性和唯一性,还应包含密码学中很重要的随机性、比特混叠,工程应用上很重要的开销,在认证或密钥生成上有重要作用的FAR等指标,具有完备性,能充分在各个应用下反映PUF性能的优劣。此外,评估指标体系具备包容性,一种新的、能应用到某个领域的指标可以被加入到指标体系的应用指标部分;当该指标被认为能对所有应用都有重要作用时,可以加入重要指标。

2 评估实施方案

本节将根据PUF性能指标体系,提出适用的评估方案,并且将评估结果反馈给PUF设计人员,以改进和优化PUF的实现结构。

本文以设备与服务器端认证为例,说明评估方案和指标选取原则。具体认证过程如下:认证服务器在固定时间认证终端,提取认证终端的激励响应对的激励发给终端。终端计算出响应后,返回给认证服务器。认证服务器计算数据库中响应和收到响应汉明距离(汉明距离指两个响应异或结果中1的数量,表示数据库中响应和收到的响应有多少位不同),若汉明距离小于或等于阈值A,判断认证通过,否则不通过。

具体实施评估方案前,需根据经验明确表1中参考阈值和初始权重,理想值为可能出现的最优值;参考阈值为系统可以正常运行的极限值,该值过高会导致过度筛选,过低会导致系统性能变差;初始权重为该指标对最终评估结果的影响程度,和为100。表1中的数据为笔者根据目前PUF研究现状及上述认证场景提出的参考阈值和初始权重,后期应通过迭代测试及Delphi法有效、可靠地收集专家意见,更加准确地评估PUF的优劣。

表1 指标要求及权重参考

评估各个指标后,最终结果的分值计算如式(1)所示,即综合评估结果为

(1)

式中:Indexi、Ideali、Thresholdi、Weighti分别表示各指标实际值、理想值、参考阈值和初始权重。

评估方案流程如图2所示,下面重点介绍PUF评估过程。

图2 评估方案流程

(1)必要指标、重要指标评估

评估可靠性、唯一性、随机性、比特混叠、开销,其中可靠性分为温度可靠性和老化可靠性,随机测试包含频率检验、块内频数检验、游程检验。

(2)应用指标选择

认证过程中,信道不安全,第三方若收到足够多消息后可预测下一条响应就能仿冒设备,导致认证协议失效。同时,身份认证要求最小化FAR、FRR。因此,需要选择应用指标中的FAR、FRR指标和抗机器学习建模攻击。其中抗机器学习建模攻击需要评估每一位响应的准确度,计算预测响应和实际响应的汉明距离能更加简明地表现机器学习建模能否仿冒芯片。

(3)综合评估

需先根据参考阈值判断PUF各指标计算结果是否超出参考阈值,若未超出,根据式(1)计算出各项指标得分之和为综合评估结果,以计算结果评估PUF优劣,分值最高者为最佳,否则直接出评估报告。因此,评估多个PUF结构时,必须根据具体应用场景确定表1,不同的标准可能得到不同的结果。

3 实验分析

3.1 实验准备

为增强响应数据可靠性,本文设计了一款PUF指纹采集软件,用于采集芯片中响应位(bit)抖动概率低于阈值的激励响应对,即芯片物理指纹。

该采集软件工作原理如下:指纹采集软件生成随机的激励数据(或从已有的指纹库中提取激励数据);向芯片发送多次(本实验中为100次)激励数据,接收到响应数据后,采集软件将同一条激励产生的响应中出现次数最多的存入采集数据;该响应次数/总次数(该响应出现频率)≥指定概率门限的激励响应对,即为一条指纹,存入指纹库。

3.2 测试项目

本实验采用芯片为XILINX公司ARTIX-7系列XC7A100T-2FGG484,该芯片具有7 925个可配置逻辑块(Configurable Logic Block,CLB),逻辑元件数为101 440,满足实验要求;有1路USB转232串口,便于计算机与FPGA开发板的激励响应数据交换。本文采用了两块同型号的开发板进行实验。在测试PUF可靠性实验中,选用型号为sm-8-8200的高低温交变试验箱(后文简称温箱)提供稳定的高温、低温及温变环境。

实验过程:在常温下采集、指纹,以及将开发板放在温箱中,在高温、低温、升温、降温环境下采集指纹。采集指纹参数设置为每条激励发送100次,每条激励间隔50 ms,指定概率门限为95%。具体的测试项目及获得的测试数据如表2所示,其中,数据编号第一位表示芯片,第二位为1时表示使用随机激励采集的指纹库,其他表示用指纹库中特定激励获得的采集数据。

表2 测试项目及数据

3.3 实验结果分析

实验依照指标体系依次评估必要指标、重要指标、应用指标,并根据评估结果给出简要评论。

3.3.1 必要指标评估

本节通过计算片内汉明距离和片间汉明距离得到可靠性和唯一性。汉明距离分布如图3和图4所示,图3为同一芯片相同激励产生的响应汉明距离分布图,图4为不同芯片相同激励产生的响应汉明距离分布图,其中横坐标为汉明距离,纵坐标为各汉明距离出现的次数/测试总次数。

图3 片内汉明距离分布

图4 片间汉明距离分布

具体过程如下:

Step1 使用将指纹库21和采集数据23、24、25、26中相同激励对应的响应计算,得到温度可靠性均值为98.59%,计算如式(2)所示:

(2)

式中:n为比特长度,k为非正常采集次数,HD(Rs,Rs,t)为片内汉明距离,分布如图3所示。

Step2 使用指纹库21和采集数据27中相同激励对应的响应计算,得到3个月的老化可靠性均值为99.66%。

Step3 使用指纹库11和采集数据22中相同激励的响应计算,计算如式(3)所示:

(3)

式中:l为总芯片数,HD(Rs,Rv)为片间汉明距离,分布如图4所示。得到唯一性均值为51.96%。

可靠性大于98%,唯一性接近50%,作为评估指标中的基础,符合要求。

3.3.2 重要指标评估

本节计算随机性、比特混叠和开销,具体过程如下:

Step1 将指纹库21中的激励响应数据一起放入NIST评估软件,结果为通过,说明该PUF结构的随机性较好。

Step2 对指纹库21中的响应数据分别进行频率检验、块内频数检验、游程检验,检测结果如表3所示,可见大部分响应数据都通过了全部检测,随机性较好。

表3 部分随机检验结果

Step3 对指纹库21中的响应数据计算每一位1占的比例,即比特混叠,结果如图5所示,横坐标表示响应的第几位,纵坐标表示这一位上1的比例。计算如式(4)所示:

(4)

式中:rj,i为第j个响应的第i位,c表示响应数。

由图5可以看出,只有少部分位在50%附近,比特混叠性能较差,需要改进。

图5 比特混叠结果

Step4 激励位数为64位,响应位数为64位,占用FPGA芯片的CLB块资源为3%。占用资源较少,若后续扩充到更长的激励响应对所需的FPGA芯片逻辑资源是足够的。

3.3.3 应用指标评估

本节评估FAR、FRR和抗机器学习建模攻击能力,具体过程如下:

Step1 计算不同认证阈值A下的FAR和FRR值。计算如式(5)和式(6)所示,结果如图6所示,横坐标表示阈值的选取,纵坐标表示阈值为横坐标时的FAR和FRR。

图6 FAR与FRR示意图

(5)

(6)

Step2 使用指纹库21中的激励响应对,其中一半作为训练集,一半作为测试集,使用逻辑回归计算每一位预测准确率,结果如图7所示,横坐标表示响应的第几位,纵坐标表示该位的准确率。大部分位的准确率接近100%,只有少数在70%左右,说明抗机器学习建模攻击能力较差。

图7 预测准确率

Step3 使用上一步测试结果与实际响应计算汉明距离,得到汉明距离分布如图8所示,横坐标表示机器学习和原始数据的汉明距离,纵坐标表示汉明距离出现的次数/测试总次数。预测响应和实际响应的汉明距离在0附近,说明该PUF可以被仿冒。

图8 预测响应与实际响应汉明距离

3.3.4 综合评估

根据式(1)计算评估结果,其中随机数检验取每种检验通过的平均值,比特混叠取50%差值的平均值加50,FAR、FRR取最小值(A=5),预测准确率取每一位的平均值,得到评估结果为75.81。

4 结 论

本文提出了一种分层的PUF性能指标体系,将常用指标分为必须检测的必要指标、应该检测的重要指标和按照应用场景选用的应用指标,并进一步提出硬件物理指纹性能评估方案,最后针对RO PUF实施了该方案,实验结果证明了该方案的可用性。本文中PUF激励与响应的长度分别为64位,指纹共128位,可以采用更长的激励响应对(如512位的激励),但需要消耗更多的FPGA芯片逻辑资源。

本文提出的PUF性能评估指标体系和评估实施方案可实现在一个标准下评估多个PUF结构,能为PUF应用提供选型参考,作为PUF设计和PUF工程应用的桥梁,具有相当的工程实用价值。

猜你喜欢

汉明随机性指纹
像侦探一样提取指纹
为什么每个人的指纹都不一样
浅析电网规划中的模糊可靠性评估方法
媳妇管钱
基于自适应稀疏变换的指纹图像压缩
考虑负荷与分布式电源随机性的配电网无功优化
适用于随机性电源即插即用的模块化储能电池柜设计
可疑的指纹
汉明距离矩阵的研究
基于游程数的非参数随机性检验