具有预测功能的云冈石窟空鼓病害太赫兹无损检测研究
2021-07-23孟田华卢玉和任建光刘红梅王浩航
孟田华,卢玉和*,任建光,刘红梅,黄 荣,王浩航
(1.山西大同大学物理与电子科学学院,山西 大同 037009;2.云冈研究院,山西 大同 037004)
在石质文物病害的诸多类型中,空鼓病害是非常典型的病害之一(图1)。主要表现为石层中间出现空气层,导致一完整的石壁变成了由前壁石层(露天)—空气层(空鼓)—背底岩石三者构成的空鼓病害结构。当空鼓厚度达到一定的程度,在温度变化较大或者受力不均匀时,前壁石层很容易产生裂缝而自然脱落,危害性极强。因此,对空鼓病害的情况进行及时评估,防止进一步劣化是非常重要的。[1,2]文物不可再生的特性,决定了其保护修复前对病害探查分析技术必须是无损的。文物领域的无损检测有其特定的含义,泛指一切不给所测文物带来任何宏观物理变化和潜在危害的分析检测技术。文物保护科学家根据电磁波谱各个频段的优势和检测需求几乎应用了所有频段,例如,利用超声波对文物浅层病害的无损检测[3];利用微波段的探地雷达探寻地下文物或遗迹[4];利用傅里叶红外光谱仪对可以微量采样文物物质的识别[5];基于光化学反应原理使用紫外光对有机染料和油漆进行检测[5];X射线荧光光谱仪和X射线衍射方法对矿物颜料元素的分析[6]。尽管整个电磁波谱中被称为亚毫米波和远红外射线的太赫兹(THz)波,在文物检测方面还未得到充分利用,但高分辨率、强稳定性、强穿透力和强抗干扰的THz技术已被认可作为一种新的无损检测方法来填补这一空白,THz技术在诸多无损检测方法中脱颖而出,其潜在的高效检测手段和更加细致可靠的评价方法为文物检测领域注入了新的活力。[7]
THz技术进入文物保护领域最早可以追溯到1998年,Koch等人首次提出根据材料性质的不同,对THz射线所产生的时间延迟、吸收强度等光学参数的差异,将THz成像方法用在树木的断代研究中。[8]之后的近十年,相对于超声波、红外和微波等技术所取得的大量成果,THz技术在文物检测方面的研究成果和数据非常少,主要受限于有效THz源和灵敏探测器,当时的THz系统复杂且昂贵,还未出现使用便捷的THz系统,无法满足对那些易碎、精致、及体积大难以移动类文物的检测,所以,形成了一个“THz波段检测间隙”。随着超快光电子技术与低尺度半导体技术的飞速发展,为THz波段提供了合适的宽带稳定光源和高灵敏度探测器,很快让THz技术成为了一种准常规技术,并在国际范围内掀起一股THz研究热潮。自2006年开始,THz技术登上了文物无损检测的舞台,早期Jackson,Abrsham,Adam等研究者将THz光谱技术应用到各种绘画类文物检测研究中,如壁画不同颜料和粘合剂的THz光谱识别[9]、隐藏于绘画作品下层图画的THz图像显现[10]、油画隐藏层分析、架上绘画隐藏肖像等的重现。[11]特别是日本的Fukunaga研究小组,利用THz光谱技术分别对中世纪后期蛋彩画、版画、壁画的常见病害及绘画层、古花瓶等做了大量极具参考价值的研究工作。[12-14]近年来,此技术逐渐扩展到绘画以外的古代木构建筑、石雕等研究中,例如德国Krügener小组利用THz技术对汉诺威的下萨克森州国家博物馆一个石质圆形浮雕内部裂隙进行了探测,通过THz时间延迟差精确测量了5 mm-7 mm的隐藏裂隙,并利用成像方法对特里尔大教堂一个破裂窗台的修复状况进行了评估,[15]还有效检测了16世纪釉面陶土层下的缺陷。[16]Skryl利用类似的方法对一幅19世纪的俄罗斯木质圣像画隐藏缺陷进行了检测。[17]Öhrström则对留存的木乃伊进行THz成像,结果显示骨头和周围的其它物质有明显的区别。[18]THz系统的发展为这个领域开辟了一个令人兴奋的可能性检测波段,尽管仍处于探索阶段,但已经可以对体积大、精致、易碎等无法移动的艺术品和文物进行现场检测了。例如对3500年前密封的埃及陶罐内部物质的检测[19]、教堂壁画隐藏于石膏层下艺术品的探测,[20]富有挑战性的是对壁画所包含的支撑结构、地仗层、颜料层等多层不平整结构下古绘画的研究。[21]国内THz技术在文物方面的研究较少,代表性研究团队有首都师范大学张振伟组对故宫博物院收藏的现代油画、古代矿物颜料,艺术品等进行了THz层析成像及颜料的成分分析研究。[22,23]陕西省文物保护研究院周萍组在2013年至2016年间主要针对壁画类文物开展了THz无损检测及成像研究。[24]华中科技大学王可嘉组分别对平面油画作品的内部破损和底层素描信息,及卷轴型字画类艺术品进行了THz图像研究。[25]山西大同大学卢玉和组自2009年起,开展THz技术在石质文物风化病害检测方面的相关研究,先后对云冈石窟风化物的THz光谱、风化等级测定、空鼓病害检测等进行了系统研究。[26]
总之,从具体方法看,THz成像法主要用于对各种文物内部特征及形貌的直观研究,而THz光谱法则多用于文物材料成分识别及缺陷/病害的量化表征;从研究对象看,绝大多数研究对象为各种绘画类文物,而对石质类文物鲜有报道。尽管基于THz技术的文物无损检测在近年来已经成为一个新的研究热点,但是,THz石质文物检测中对于空鼓病害的检测仍然是一项艰巨的挑战,可以归因于以下原因:(1)石质文物在THz波段没有指纹谱,石质空鼓病害也就不能直接用THz特征谱技术直接表征。(2)缺乏普适性的理论模型,这极大地限制了THz技术在多种文化遗产病害检测领域的广泛应用。因此,需要推广THz检测技术,采用更具普适性的理论模型,将其应用范围扩展到所有的石质文物,而不是只适用于一种或几种有限的理论模型。但是,由于被测样品的数量有限(文物必须要求无损检测),在一般情况下,很难进行多点或线测试,所以由少量的实验样本和数据推导出普遍性理论模型需要机器学习的帮助来验证其正确性和普适性。与其他类型的机器学习相比,支持向量机(SVM)具有处理小样本、非线性和处理高维问题的优点,克服了神经网络的局部极小问题。更重要的是,据报道,基于Vapnike Chervonenkis(VC)维数理论和统计学习理论[27]的最小化结构风险原理,建立的SVM空鼓病害预测模型能有效提高THz检测的通用性。利用病害的THz光谱数据作为SVM预测模型的训练和测试样本,所建立的SVM病害预测模型具有良好鲁棒性是迫切需要解决的问题。所以,对于石质文物的病害检测,有必要寻求新的思路和方法,特别是需要进一步通过机器学习的理论来构建具有普适性的石质文物THz检测理论。希望在检测砂岩石文物空鼓病害时,无论何种样品,无论其形状如何,无论它们来自物体的哪个部分,仅通过测量其THz反射光谱信息就可以预测其劣化程度。此外,THz检测技术借助于SVM病害预测模型,可以在文物病害的实际检测中更加快速、高效、节约成本。
本研究对典型露天石质文物云冈石窟的砂岩空鼓病害进行了实验和理论研究。根据空鼓样品中三个THz反射脉冲的相对时间延迟与样本空鼓厚度的关系,[28-31]利用最小二乘支持向量机(Least Squares Support Vector Machine,LS-SVM)建立基于SVM的石质文物空鼓病害预测模型(SVM-HDPM)。利用该模型,将空鼓病害的THz数据输入SVM-HDPM,可以准确预测石质文物的空鼓病害状况,实验结果证明该模型具有较高的准确性和有效性。
一、空鼓样品及太赫兹光谱检测
(一)空鼓样品制备
云冈石窟大多空鼓病害的前壁石层厚度在2 mm左右,因此我们把从云冈石窟景区采集到的砂岩切割为2 mm厚度(d_1)的平行石片,为了尽可能模拟真实空鼓病害,避免其他因素的干扰,同时制备了厚度(d_3)为6 mm的背地岩石后壁,这两个石片的中间空气层厚度即为空鼓厚度(d_2),不同的d_2值对应不同劣化程度的空鼓病害样品,空鼓样品示意图及实验模型实物图,如图1所示。补充一点说明,虽然空鼓样品的粗糙表面会引起THz波的散射和漫反射,能量被周围介质吸收或直接耗散到空气中,但这种耗散的效果对所有空鼓样品是相同的。因此,表面粗糙度不会影响THz波时间延迟值与空鼓厚度(d_2)间的变化规律。此外,本研究采用的是单点检测法,THz波的束腰直径为2 mm,也表明样品的表面粗糙度影响可以忽略不计。
图1 空鼓病害示意图和实验模型实物图
(二)太赫兹无损检测分析
利用太赫兹时域光谱系统(THz-TDS 1008)对40个空鼓厚度d_2介于0.1-4 mm,间隔为0.1 mm的空鼓样品进行THz无损检测。THz-TDS系统[32]相关参数为:激光中心波长800 nm,脉冲时间100 fs,THz光谱扫描范围340-420 ps,步长0.02 ps。为了尽可能模拟云冈石窟景区实际环境,设置检测环境为温度293 K,相对湿度30%。
为了深入了解砂岩在THz波段的光学特征,首先利用透射式THz-TDS对厚度分别为1.5 mm和2.0 mm的两片砂岩进行检测。图2a和b分别为THz参考光谱和透过片状砂岩的THz脉冲光谱。THz脉冲通过砂岩片时,由于材料对THz光的吸收和散射引起时域光谱的延迟及强度降低,对应频域谱中的衰减和振幅降低。接着通过两片砂岩的THz透射率谱研究其穿透性,如图2c所示,结果表明:在保持较高信噪比(S/N)的情况下,当厚度从1.5 mm增加到2.0 mm时,THz光仍能有效穿过岩片,表明利用THz信号检测空鼓样品的可行性,即THz光穿过空鼓的前壁石层,通过空气层到达空鼓的背底岩石后,THz信号被反射回来。50%的THz信号透射率保证了THz-TDS系统的正常运行,并保持其自身的高信噪比检测性能。此外,值得注意的是,砂岩片的折射率在THz波段非常稳定,如图2d所示。因此,在后续的分析中,根据其稳定的折射率和互相平行的前后表面,可以近似地将砂岩片视为各向同性介质。利用T.D.Dorney[33]提出的太赫兹时域光谱法提取材料光学常数的模型对数据进行处理:
图2 空鼓样品片状石材在太赫兹波段的光学性能
其中n(ω)为样品在一定频率下的折射率,φ(ω)为THz光通过样品的相位延迟,d为样品厚度。
其中10个空鼓样品的THz时域信号如图3所示。图3右侧THz时域信号的时间间隔为370-400 ps。同时由图1a可以看到,在空鼓样品中有三个明显的THz反射脉冲信号(除了当d_2=0 mm时,即没有空鼓病害)。第一个脉冲信号是由于THz脉冲从空鼓样品前壁石片的前表面反射而产生的,同样,空鼓样品的前壁石片后表面和后壁石层前表面分别产生第二次和第三次反射脉冲信号。由于所有检测的空鼓样品的d_1保持不变,使得第一和第二个反射脉冲信号出现的峰值位置是一样的,而d_2的不同会导致第二和第三个反射脉冲信号之间的时间延迟随d_2的增大而逐渐增加。此外,据相关文献介绍,[28,31,34]在时域光谱中,由于样品和光学元件的标准具效应引起光谱中出现振荡,导致了样品的位移峰和在主THz峰后存在子峰。
对应的空鼓样品参数为:d_1=2 mm,d_2=0~4 mm,d_3=6 mm.
通过以上分析,THz信号可以作为指纹识别技术来识别空鼓样品,我们的目标是建立一个关于空鼓厚度(d_2)和第三个THz反射脉冲信号时间延迟位置相关的函数关系。然而,样品的THz时域信号会受到背景噪声、系统噪声、样品散射以及THz脉冲的色散拉伸等因素的影响,导致THz信号包含相位脉冲的部分重叠和移位。这些因素显著阻碍了正确结论的确定,因此在检测到的THz信号中,需要采用传统的反褶积去噪方法来消除噪声干扰的影响并将其分离出来。[34,35]首先,用空鼓样品的THz时域信号数据减去参考THz时域信号数据(当d_2=0 mm时),即可以消除第一反射脉冲和环境因素的影响。然而,这种数据处理方法可能不适用于d_2较小的情况,因为它很难区分紧密分布的THz脉冲第二和第三个脉冲信号,如图3所示。其次,利用第一步的结果数据减去20个d_2在2.1~4.0 mm之间的空鼓样品信号中第二个THz脉冲数据的平均值。然后得到只有第三个THz反射脉冲的空鼓样品的THz时域信号数据。对只包含第三个脉冲信息的THz时域信号进行常规去噪处理,得到第三个脉冲信号随空鼓厚度变化而出时间延迟现象,如图4所示。
图3 空鼓样品的THz时域信号
图4 只包含样品的第三个脉冲信息的空鼓样品的THz时域信号
二、SVM空鼓病害回归预测模型
(一)最小二乘支持向量机
LS-SVM使用最小二乘线性系统代替传统支持向量机的二次规划方法作为损失函数,因此比传统SVM更简单。损失函数[27]可以用拉格朗日法求解,得到的分类判别函数为:
其中ai为拉格朗日系数,b为分类阈值,为核函数。核函数的构造是支持向量机的关键步骤。线性核,多项式核,径向基函数核是常见的核函数。因此,分别利用上述三个核函数可以建立三种SVM空鼓病害预测模型。通过留一交叉验证(LOOCV)方法确定最优模型参数,获得最优预测结果。最优模型参数包括控制经验风险的惩罚系数(c),控制误差边界的不敏感参数(ε),以及控制支持向量机对输入变量变化的敏感性的径向基系数(γ)。[36]
(二)SVM空鼓病害预测模型(SVM-HDPM)
从图3和图4可以看出,空鼓样品第三个THz反射脉冲信号的位置与d_2厚度近似呈线性相关关系。因此,可以将空鼓样品时域信号中第三个反射脉冲的延迟时间和d_2设置为SVM预测模型分析的向量。为了建立具有任意d_2厚度的SVM空鼓病害预测模型,选取了同一d_1厚度下40个不同d_2厚度的空鼓样品的THz时域信号。从空鼓样品时域信号中提取反射波波谷的时间位置,与d_2构成特征向量,然后将特征向量转换为SVMlight样本格式。[36]接着从总数据集中随机选取30组特征向量数据作为训练样本,剩下的10组数据作为检验样本,采用LOOCV找出SVM空鼓病害预测模型的最佳参数。LOOCV的过程是这样的:从这30个数据集中选取29个作为训练集,剩下的1个作为测试集,然后循环选取下一个数据作为测试集,剩下的29个数据作为训练集,以此类推直至每个数据都作为测试集,这样就可以利用LSSVM不断优化SVM-HDPM的参数。剩下的10组检验样本用于验证所构建SVM-HDPM的可靠性。
为了定量比较三种预测模型的差异,选择了主要的建模和评价参数,包括c,ε,γ和均方误差(MSE)。三种预测模型的相关参数如表1所示。由表1可见,使用线性核函数的SVM-HDPM的MSE最低,仅为3.303 E-4,这表明在三种模型中,SVMHDPM的预测精度最高,优于冯等[37]报道的MSE为0.998的传统曲线拟合方法。因此,具有线性核函数的SVM-HDPM在预测空鼓厚度方面是最准确的。RBF核函数的SVM-HDPM的预测精度排名第二,多项式核函数的SVM-HDPM的预测精度最低。因此,可以认为线性核函数建立的模型是最适合开发空鼓病害预测模型的方法。在实际应用中,向SVMHDPM输入时间参数可以预测d_2值,时间参数是空鼓样本的THz时域信号中第三个脉冲信息的数据。显然,SVM-HDPM能为文物的及时修复和维护提供有效的参考数据。
表1 不同核函数的三种SVM模型相关参数
三、空鼓病害预测模型的应用
实际上,砂岩文物空鼓病害的前壁石层厚度很少是精确等于2 mm。因此,为了满足现场测试的需求,进行数据预处理是保证数据质量和适用范围的必要步骤。以厚度为1.5 mm的前壁石层为例。在我们的回归预测模型(SVM-HDPM)中,第二个反射脉冲是由空鼓样品前壁石层的后表面产生,即第二个反射脉冲的时间延迟可以表征前壁石层的厚度(d_1)。因此,前壁石层的厚度变化是两个空鼓样品THz信号中第二个反射脉冲的时间差(Δt)函数。如图5所示,插图中的光谱是主图像中所选THz光谱对应的范围,并利用loess(局部加权回归)方法对其进行了去噪和平滑处理,可以清楚地看到Δt是厚度分别为2 mm和1.5 mm两个前壁石层的时间延迟差值。因而,将前壁石层厚度为1.5 mm空鼓样品第三个反射脉冲的时间延迟值加Δt后的数值即可应用已建立好的前壁石层厚度为2 mm空鼓样品SVM-HDPM进行病害预测。所以,我们将处理后的THz数据转换为SVMlight样本格式数据输入到SVM-HDPM中,通过SVMHDPM的输出值便可以得到空鼓病害厚度的预测值了,具体流程示意图如图6所示。对将前壁石层厚度(d_1)为1.5 mm的5个不同d_2空鼓样品进行了THz-TDS检测,并利用SVM-HDPM预测获得的d_2值与实际值吻合较好,其MSE值为4.46 E-4,这表明SVM_HDPM在空鼓前壁石层厚度较复杂的情况下仍具有良好的适用性和较高预测精度。所以,SVMHDPM可以广泛应用于石质文物空鼓病害的检测工程中。
图5 空鼓样品中前壁厚度(d_1)分别在1.5 mm和2 mm下的太赫兹时域信号
图6 SVM-HDPM在空鼓检测应用中的流程示意图
结论
选取合适的核函数后,以从石质文物空鼓病害的THz光谱中提取出的特征值作为模型样本数据,通过LOOCV确定最优参数的LS-SVM回归算法,在此基础上,建立了最优的空鼓病害回归预测模型(SVM-HDPM)。我们所建立的回归预测模型仅需输入THz无损检测所获得的特征光谱数据,就能准确地预测该处空鼓病害劣化情况。与其他传统的接触和侵入式检测方法相比,基于THz的无损检测具有非接触、无损、结构简单、操作快速、稳定性高、可重复性好等优点。具有预测功能的空鼓病害太赫兹无损检测技术不仅为石质文物的无损检测提供了一种新的方法,而且具有良好的实际应用前景和发展前景。