APP下载

NMF在古书画混合颜料光谱分析中的应用

2019-07-10尹琴丽李丹彤

自然与文化遗产研究 2019年6期
关键词:矿物分量颜料

尹琴丽,王 笑,耿 丹,李丹彤

(建设综合勘察研究设计院有限公司,北京 100007)

1 研究背景

随着时间的流逝,古书画由于环境气候改变、人为损坏等因素的影响会出现发霉、污损、破损、褪色等情况。为了更好地留存和展示古书画作品的价值,往往需要对其进行颜色修复和复制,浓墨重彩的中国画在绘制过程中往往是几种矿物颜料混合调配使用,因而混合颜料种类分析一直是文物保护和修复中的重要环节。

目前有很多技术手段可用于古书画颜料类别的鉴定,如激光拉曼光谱[1-2]、X射线荧光[3],但因受仪器试样尺寸大小、样品表面平整度等因素的限制,加上一定量的取样分析,使得古书画颜料分析面临严峻的挑战。光谱分析技术由于具有快速、无损等特点,被广泛应用在古书画颜料分析中。

王丽琴等[4]利用光导纤维反射光谱法对彩绘文物中的表面颜料进行了研究,总结了常见的纯净颜料的反射光谱特性,并将其一阶导数峰作为鉴定颜料种类的依据。补雅晶等[5]通过光谱辐射度计采集敦煌壁画的光谱,然后与敦煌典型色彩光谱样本集中的颜料进行相似度判别,识别壁画颜料信息。武望婷等[6]通过将采集的古画颜料波谱曲线与标准波谱库进行匹配,结合拉曼、荧光等测试结果,分析得出红色、黑色、黄色和蓝色的主要成分分别是朱砂、炭黑、雄黄以及群青。武锋强等[7]利用拉曼与高光谱特征拟合方法识别古画颜料成分,结果表明受混合像元的影响,颜料的光谱曲线与标准曲线相差甚大,直接与标准波谱库(USGS)相匹配,识别精度较低。

事实上,混合颜料的鉴定比单一颜料的鉴定更为复杂,考虑到实际绘画过程中多种颜料混合使用的情况[8],若将采集的颜料光谱视为纯净颜料直接与光谱库中的光谱进行匹配,而没有考虑混合颜料对光谱的影响,则难以实现准确的颜料识别效果。

本文将混合光谱看作是多源混合信号,把混合光谱中端元提取的问题转换成统计信号的分离问题,从而提出了一种基于NMF的混合颜料光谱分析算法。该算法在端元光谱未知的情况下,首先使用NMF对混合颜料光谱直接进行分离,得到构成混合颜料光谱的端元光谱,然后将分离得到的端元光谱与颜料光谱库进行对比分析,最终确定混合颜料的组成成分。该算法在模拟仿真数据和实测混合颜料样本数据中进行了验证,实验结果表明:该算法能够对混合颜料光谱的组成成分进行准确的分析。

2 基于NMF的混合颜料光谱分析算法

2.1 混合颜料光谱模型

矿物之间的混合可分为线性混合和非线性混合,区分这两种作用类型的标准就在于入射光子与矿物间是否发生多次折射或反射等情况[9]。若矿物之间混合非常紧密,可认为是非线性混合,其他则可以视为是线性混合。王润生等[10]通过研究不同矿物组合对应的混合光谱特征结果表明,混合矿物的光谱反射率近似为混合单矿物光谱反射率的线性混合。古书画中使用的矿物颜料本质上是矿物,遵循矿物混合的规律。因此在对混合颜料光谱数据进行分析时,可以将其视为线性混合模型来处理。线性混合模型可表示为:

式中:X∈R^(l×n)表示混合颜料光谱矩阵;A∈R^(l×m)表示端元光谱矩阵;S∈R^(m×n)为端元光谱的丰度矩阵。l,m,n分别表示光谱波段数,组成混合颜料光谱的端元个数,混合颜料光谱的采集数量。Q∈R^(l×n)为误差矩阵。根据光谱数据的实际物理意义,端元光谱矩阵需要满足非负性的约束条件(a_ij≥0,a_ij∈A),丰度矩阵则需要同时满足非负性以及和为1 的约束条件(s_ij≥0,∑_(i=1)^m〖s_ij=1〗,s_ij∈S)。

2.2 非负矩阵分解算法

NMF是在矩阵中所有元素均为非负数的约束条件之下的矩阵分解方法,能够将一个非负矩阵两个低秩非负矩阵相乘的形式。NMF的数学模型为:已知V为一个非负矩阵,寻找两个非负矩阵W和H,使其满足

式中:V∈R^(l×n);W∈R^(l×m);H∈R^(m×n);E∈R^(l×n)。矩阵V可以看作是一个由采集到的样本列向量组成的观测数据集合,矩阵W由构成样本列向量的基向量组成,矩阵H表示每个基向量在样本列向量所占的权重系数,E为误差矩阵。

若不考虑误差的情况下,NMF的数学模型可简化为:

在已知矩阵V需要求解矩阵W和H时,可以将其视为一个优化问题,通过定义目标函数和选择合适的优化方法来求解矩阵W和H。常用目标函数为最小化欧式距离:

对目标函数使用梯度下降法进行迭代求解,使目标函数最小化,就可求得矩阵W和H。

混合颜料光谱的线性混合模型与NMF的数学模型一致,从而可以将NMF应用于混合光谱数据分离。纯净颜料的光谱就是一组基向量,使用NMF求解出这组基向量,就可以得到了构成混合光谱的端元光谱。

3 实验

为了验证基于NMF的混合颜料光谱分析算法的有效性,算法会在模拟仿真数据和实测混合颜料样本数据中进行验证。实验首先将利用NMF算法对混合光谱进行分离,得到分离出来的分量光谱,通过计算分量光谱与标准波谱库中光谱的相似性来确定颜料的种类。光谱相似性评价的指标有相关系数、均方根误差等,其中相关系数为:

均方根误差为:

式中:A和B为进行相似性比较的光谱;n为波段数。相关系数越大,代表两条光谱之间相似度越高;均方根误差越小,表示两条光谱之间的距离越接近,偏离越小,相似度越高。

3.1 模拟仿真数据

为研究不同浓度的差异对分离结果的影响,采用美国地质勘探局矿物波谱库中的朱砂和石青为端元光谱进行模拟实验(图1)。按照端元丰度非负和端元丰度之和为1的约束条件,模拟生成5条丰度不同的混合光谱(图2)。

模拟混合光谱经过算法分离后进行光谱归一化的结果表明,不同丰度的光谱确实能够引起分离出的端元光谱的变化,主要表现在随着丰度的不断变化,分离出来的光谱在波谱的吸收深度、吸收峰面积等参数上有不同之处,经过归一化处理后差异较小,从整体的波形来看走向几乎一致,具有良好的稳定性(图3)。

判断分离质量的优劣,稳定性是一个重要的指标,其次还需要衡量分离出来的分量与端元光谱之间的相似程度。以75%朱砂、25%石青和25%朱砂、75%石青的混合光谱为例,计算了分离出来的分量与端元光谱之间的相关系数(图4)。

从图4的结果来看,分离出来的分量与端元光谱的相似性较高,其中分量NMF2与石青相关系数高达0.999,朱砂与分量NMF1的相关系数也达到了0.971。从模拟数据的分离结果来看,在不考虑误差的情况下,NMF算法的稳定性好,重复性高,分离出来的分量的精度也相对较高,能够适用于混合光谱分离的需要。

3.2 实测混合颜料样本数据

为了研究非负矩阵分解算法在实际矿物颜料混合光谱分离的效果,进一步验证算法的有效性、实用性,制作了石青与石黄的混合颜料样本,将其按照一定的比例相混合,得到5条丰度不同的混合光谱(表1)。

表1 混合颜料丰度值

将矿物颜料石青和石黄粉末,通过钵体研磨过筛之后,利用千分位0.001 g精密分析电子天平进行精准称量。然后将所称量的颜料加入等量的胶液绘制于4 cm×4 cm宣纸上,模拟实际绘画环境。采集光谱数据所用的仪器是地物波谱仪(ASD),光谱范围为350 ~ 2 500 nm,光谱分辨率可在350 ~ 1 000 nm波段之间为3 nm,在1 000~2 500 nm波段之间为8 nm(图5、图6)。

以制备的5种丰度不同混合颜料光谱的实测数据作为原始输入光谱数据,图7给出了石青与石黄的混合颜料光谱经过NMF算法分离出来的结果。为了更客观地评价该算法的分离效果,分别计算了分离出来的分量1和分量2与实测端元光谱的相关系数和均方根误差(表2)。

表2 NMF算法分离效果评价结果

从匹配结果来看(图7),实测的混合颜料光谱的分离出来的分量光谱与端元光谱相似度较高,光谱形状基本一致,相关系数均较高,而且从分离出来的分量的精度、重现性以及稳定性来看,NMF算法较好实现了混合光谱的分离,分离的结果能够满足颜料识别的要求。

4 结束语

混合颜料分离是混合颜料分析的基础,本文通过采集混合颜料的光谱,利用非负矩阵分解算法对光谱进行分离,将分离得到的结果作为构成混合颜料光谱的端元光谱,突破了端元未知对混合颜料光谱分离的限制,进而通过分离出来的端元光谱与颜料光谱库的光谱进行匹配,确定颜料的种类,为古书画混合颜料的分析提供了一种更为高效、无损的分析方法。但由于NMF算法采用的目标函数非凸性的特点,具有多个极值点,计算得到的结果可能不是全局最优解,后续将研究如何选择更合适的初值矩阵,以获得更好的分离效果。

猜你喜欢

矿物分量颜料
金石可食,金石有声
打翻了颜料瓶
认识矿物的性质(部级优课)
在颜料中乘风破浪
尹小晨作品
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
颜料抹在了脸上