基于卷积神经网络的古陶瓷窑口甄别

2024-02-05孙合杨黎思佳闫灵通冯向前

光谱学与光谱分析 2024年2期

孙合杨, 周越, 2, 黎思佳, 2, 李丽, 闫灵通, 冯向前*

1. 中国科学院高能物理研究所, 北京 100049 2. 中国科学院大学, 北京 100049

引言

中国古陶瓷一直以来都被视为是实用器与艺术的完美结合, 作为中国古代灿烂文化的载体, 具有极高的艺术价值和经济价值。不仅在中国历朝历代受到追捧, 经由丝绸之路和海上丝绸之路被销往海外各国后, 更是享誉全世界。贸易的繁荣使得中国各窑厂生产的陶瓷在全世界范围内流通。纵观中国古陶瓷史, 各个窑场并不是孤立存在, 他们彼此之间或多或少会在烧制工艺以及产品风格类型上互相影响, 从古至今出于各种目的对于一些典型名窑的模仿更是从未停止过。这些原因使得对流传至今的古陶瓷溯源、断代极为困难。在中国古陶瓷研究飞速发展的这几十年间, 除了烧制工艺[1]、呈色机理[2-4]以及微观结构[5-7]等方面的研究外, 不同窑口产品对比、同一窑口不同年代产品特征对比等产地溯源和年代甄别方面的研究一直都是重点[8-9]。由于古代窑场在制瓷时大多就地取材, 不同地域窑场所获取当地原料中各种元素的所占比例存在差异, 制瓷工艺的不同尤其是对于原料的处理不同也会造成陶瓷原料中元素含量的差异, 这些最终体现在烧制完成的古陶瓷中各种元素的含量不同, 基于此元素分析被广泛应用于不同窑口古陶瓷的甄别中。在几种能元素定量分析的方法中, X射线荧光(XRF)由于其快速无损的特点被广泛应用于古陶瓷的产地窑口甄别中。此外古陶瓷微观特征对于分类是否能够在溯源分类中起到作用一直以来也是人们关注的问题。近年来光谱技术的发展使得紫外-可见-近红外光谱技术也开始逐渐应用于陶瓷分析中, 尤其是釉中不同价态金属元素对各个波段光的吸收研究, 而将其应用于古陶瓷甄别的相关研究也有进展[10]。各种机器学习方法的成熟, 也使得处理大量数据、提取不同特征、准确分类成为可能[11]。目前关于古陶瓷窑口甄别的研究多为通过改进算法来提高准确率。本文以四个窑所生产的青釉瓷为研究对象, 将卷积神经网络应用于古陶瓷窑口甄别, 探索将古陶瓷紫外-可见-近红外光谱、数码显微镜等可无损获取的古陶瓷特征应用于古陶瓷甄别的可行性, 并将其与XRF测得的成分数据融合, 建立多特征古陶瓷甄别模型, 来提高准确率。

1 实验部分

1.1 样品和数据采集

选取来自耀州窑、龙泉枫洞岩窑、寺龙口窑、后司岙窑四个窑址所出土的106个古陶瓷样品(典型代表样品如图1, 样品信息如表1), 其中寺龙口窑、后司岙窑同属越窑直线距离约3 km。样品化学成分在美国EDAX 所生产的Eagle Ⅲ型能量色散X射线荧光(EDXRF)光谱仪上完成测量, 共采集光谱106条, 典型光谱图如图2(a)。所有样品的测量均在相同的实验条件下进行, 电压为40 kV, 电流为100 mA, 初级X射线束斑为1 mm。所有古陶瓷样品的紫外-可见-近红外光谱数据均在Agilent Cary5000分光光度计上完成测量, 测量波长范围是200～2 500 nm, 间隔为1 nm, 扫描速度为600 nm·min-1, 共采集光谱126条。采用Dino-lite AM4113便携式数码显微镜以约215倍的放大倍数对古陶瓷微观气泡特征进行图像采集, 每个样品不同位置采集4张图像, 来自龙泉枫洞岩窑典型代表样品釉中气泡的微观图像如图2(b)。

表1 样品信息表

图1 越窑后司岙(a)、龙泉枫洞岩窑(b)、耀州窑(c)以及越窑寺龙口窑(d)典型代表样品

图2 典型样品的XRF光谱图和气泡特征图

1.2 数据预处理

由于古陶瓷釉属于玻璃基质, 而玻璃在紫外-可见-近红外光谱曲线中的紫外波段吸收强烈, 信号受到的干扰因素多, 因此如图3(a)所示曲线平滑性差, 存在剧烈跳变, 噪声多等现象。根据紫外波段光谱特点采用临近点比较法设置合理阈值对剧烈跳变点进行处理, 并结合临近点比较法设置宽度为15的窗口对紫外波段进行平滑以降低噪声提高信噪比, 并采用标准正态变换(SNV)来进一步消除由光程变化以及表面散射等因素带来的影响, 处理后的光谱如图3(b)所示, 噪声得到明显抑制, 将处理后的光谱数据作为模型训练的变量。

图3 典型样品紫外可见近红外光谱图

对于X射线荧光光谱而言, 光谱中各元素特征峰的净峰面积与含量存在明确的对应关系, 以实验室研制的古陶瓷标准样为参考, 对仪器进行古陶瓷成分分析精准定量的标定, 并以此为基础解出古陶瓷中各种成分(Al2O3, SiO2, P2O5, K2O, CaO, TiO2, MnO, Fe2O3, Rb2O, SrO)的含量作为输入模型的变量。对数码显微镜采集的古陶瓷微观图像中气泡的尺寸进行测量, 由于采集图像的放大倍数有所差别(主要集中于210～220倍), 图像所代表的实际面积并不相同, 对小气泡(半径小于0.1 mm)数量影响较大因此将不同尺寸区间(如0.05～0.06 mm)气泡数占总气泡数量的百分比作为特征, 而大气泡(半径大于0.1 mm)数量受放大倍数影响小, 因此将其在不同尺寸区间(如0.1～0.125 mm)内的数量作为特征进行模型训练。

1.3 样品集划分和建立模型

建模方法采用的是卷积神经网络(CNN), CNN是一种带有卷积计算的深度神经网络, 通过局部感受野、权值共享、池化层等来减少网络的参数个数, 缓解模型的过拟合问题。将样品数据按照7∶3的比例划分为训练集和验证集对模型结构和参数进行优化, 对不同单一特征以及多特征模型进行了30次不同随机训练集和验证集划分的模型训练, 最后以五折交叉验证法对模型预测具体类别的效果进行评估, 其中模型的搭建、训练与评估都是基于Python 3.7实现的。

2 结果与讨论

2.1 古陶瓷单一特征CNN模型

以气泡特征为基础的卷积神经网络模型30次训练结果如表2, 训练集平均精准度为75.0%, 验证集平均精准度为70.4%, 图4(a)是其中一次的训练结果, 训练集与验证集均收敛, 这说明古陶瓷微观气泡尺寸分布特征是一个有效的分类特征, 但是有效性不强。五折交叉验证的混淆矩阵如图5(a)所示对于邻近窑址的寺龙口和后司岙样品错分比例较高。

表2 卷积神经网络30次训练准确率

图4 古陶瓷单一特征模型

图5 古陶瓷单一特征模型混淆矩阵

基于紫外-可见-近红外光谱数据的CNN模型30次训练平均准确率为89.2%验证集平均准确率为82.5%, 其中一次的训练结果如图4(b)所示, 与气泡特征相比紫外-可见-近红外光谱特征对分类准确率更高, 五折交叉验证的结果[图5(b)]也表明模型对于不同窑的分类准确率都有提升, 但对于邻近窑的后司岙和寺龙口样品分类错误率也是较高。

基于古陶瓷釉成分的CNN模型30次训练平均准确率达到了92.1%, 验证集平均准确率也达到了90.6%, 训练集与验证集的分类精准度相差更小。具体一次的训练结果[图4(c)]较前两种模型收敛更迅速, 综合来看单一化学成分特征对古陶瓷分类最为有效, 五折交叉验证结果[图5(c)]中对于邻近窑样品的分类精准度有提升。

2.2 古陶瓷多特征CNN模型

以训练好的气泡特征、光谱特征、成分特征模型为基础进行融合, 将模型对应参数导入, 冻结相应部分, 添加分类层进行再训练。气泡尺寸分布与紫外可见近红外光谱两种特征的模型进行融合时, 分类精准度达到了93.7%, 验证集精准度也达到了91.4%, 这比精准最高的单一成分特征模型效果更优。将气泡、紫外可见近红外光谱以及成分这三种特征的模型融合时, 训练集与验证集平均准确率高达97.4%与94.2%, 如图6所示由于融合模型是在原有训练好的模型基础上再训练, 因此收敛迅速, 图7多特征融合模型混淆矩阵对比单一特征模型混淆矩阵, 总体分类准确率有明显提升, 对邻近窑址的样品也能达到精准溯源分类的水平。

图7 多特征融合模型混淆矩阵

3 结论

基于不同的古陶瓷特征建立了卷积神经网络分类模型, 结果表明: (1)古陶瓷气泡尺寸分布特征、紫外可见近红外光谱特征、成分特征均是有效特征, 但是基于不同特征的模型分类准确率方面: 成分特征>紫外可见近红外光谱特征>气泡尺寸分布特征; (2)多种有效特征融合能有效提升分类精度, 分类特征越多准确率越高。综合来看, 探索和量化更多的古陶瓷特征结合卷积神经网络建立分类模型对于实现古陶瓷精准溯源是可行的, 尤其是对于同一地区近邻窑址样品的区分, 这对沉船打捞或墓葬出土古陶瓷的产地精准溯源有重要意义。