APP下载

基于机器学习分类算法的玻璃文物鉴定

2023-09-14惠姣姣曹红宝

现代信息科技 2023年13期
关键词:支持向量机人工神经网络

惠姣姣 曹红宝

摘  要:近年来,玻璃文物受到的关注度越来越高。为了鉴定玻璃文物的类型、分析玻璃文物中的主要化学成分,该文基于高钾、铅钡玻璃的14种化学成分和表面风化情况,构建基于支持向量机(SVM)、人工神经网络(ANN)和Logistic回归(LR)的玻璃文物鉴定算法,对63种玻璃文物进行分类鉴定。结果显示:算法的预测精度均高于95%,可以将其应用到玻璃文物的实际鉴定中。

关键词:玻璃文物鉴定;支持向量机;人工神经网络;Logistic回归

中图分类号:TP18;G124      文献标识码:A  文章编号:2096-4706(2023)13-0101-04

Identification of Glass Cultural Relics Based on Machine Learning

Classification Algorithm

HUI Jiaojiao, CAO Hongbao

(School of Mathematics and Information Science, Baoji University of Arts and Sciences, Baoji  721013, China)

Abstract: In recent years, glass cultural relics have received more and more attention. In order to identify the types of glass cultural relics and analyze the main chemical components in glass cultural relics, based on 14 chemical components and surface weathering situation of high potassium and lead barium glass, this paper constructs a glass cultural relics identification algorithm based on Support Vector Machine (SVM), Artificial Neural Network (ANN) and Logistic Regression (LR), and classifies and identifies the 63 types of glass cultural relics. The results show that the prediction accuracy of the algorithm is higher than 95%, which can be applied to the actual identification of glass cultural relics.

Keywords: identification of glass cultural relics; Support Vector Machine; Artificial Neural Network; Logistic Regression

0  引  言

玻璃是人类最早发明的人造材料之一,它的出现与使用在人类生活中已有几千年历史。如今,随着科学技术的高速发展,它们被广泛应用于建筑、通信、交通、生命健康、新能源、航空航天、艺术等领域,是日常生活和高技术领域十分重要的材料,在人类文明和科技发明史上占据着重要地位[1]。

我国古代出土的玻璃中有很大一部分是含钾量高的玻璃和铅钡型玻璃,即高钾玻璃和铅钡玻璃,这两类玻璃的储存环境完全不同。为了使不同类型的古代玻璃在储存中完好保存且不被腐蚀,对高钾、铅钡玻璃的分类显得尤为重要。然而,古代玻璃极易受埋藏环境的影响而风化,在风化过程中,内部元素与环境元素进行大量交换,导致其化学成分比例发生改变,从而影响对其类别的正确判断。为了解决这一问题,考古和科研人员在玻璃文物鉴定方面做了大量工作。薛吕从物理和化学角度分析了玻璃文物衰变损毁的主要原因,并阐述了玻璃文物保护与修复的原则[2]。侯志力对秦皇岛市玻璃博物馆内部分文物的具体年代进行考证,并阐述了隋唐宋玻璃文物的演变历程与发展趋势[3]。王宜飞等利用光谱分析技术对湖南省博物馆馆藏部分玻璃文物进行无损检测,并对其化学成分进行分析[4]。殷宇龙建立了文物风化与玻璃类型、纹饰、颜色之间的关系模型,并依照风化点的检测数据对风化前后玻璃制品的化学成分含量进行分析[5]。王祉皓等通过K-means聚类建立分类模型,对铅钡玻璃和高钾玻璃进行分类鉴定[6]。

以上研究成果体现了玻璃文物在我国受到了较高的关注度。然而,目前对高钾、铅钡玻璃的分类大多只是通过外观判断,通过构建模型定量地对玻璃文物进行分类鉴定的研究成果相对较少,这导致玻璃文物鉴定准确性不高。为了提高高钾、鉛钡玻璃分类的准确率,本文设计机器学习分类算法对高钾、铅钡玻璃的分类规律进行研究,以实现玻璃文物的精准分类。

1  玻璃文物鉴定指标体系

由于高钾玻璃是以含钾量高的物质(如草木灰)作为助熔剂烧制而成的;而铅钡玻璃在制作过程中加入铅矿石作为助熔剂,其氧化铅(PbO)的含量较高。这两类玻璃在其他化学成分上也存在显著差异[7]。因此,本文选取影响高钾、铅钡玻璃鉴定的14种化学成分和表面风化情况构建玻璃文物鉴定指标体系,设14种化学成分含量和表面风化情况分别对应15个变量,并依次记为X1,X2,…,X15,具体变量名称如表1所示。

在表1中,X1~X14为数值型变量,代表玻璃中15种化学成分含量;X15为属性变量,取值分为两类,A表示风化,B表示未风化。下面,基于这15个变量,利用机器学习分类算法对高钾、铅钡玻璃文物进行鉴定。

2  基于机器学习分类算法的高钾、铅钡玻璃鉴定

为了对高钾、铅钡两种类型的玻璃进行鉴定,从考古资源库获取63个玻璃文物样本(其中18个高钾玻璃样本,45个铅钡玻璃样本)的14种化学成分数据、表面风化情况及其对应类型。为方便建模,将玻璃类型记为Y,取值包括高钾、铅钡两类。本文利用机器学习分类算法,构建基于支持向量机(Support Vector Machine, SVM)、人工神经网络(Artificial Neural Network, ANN)、逻辑回归(Logistic Regression, LR)的高钾、铅钡玻璃分类算法,借此对高钾、铅钡玻璃的分类规律进行训练,从而实现两类玻璃的精准鉴定。

2.1  基于SVM的高钾、铅钡玻璃分类算法

支持向量机(Support Vector Machine, SVM)是一种按监督学习方式对数据进行二分类的广义线性分类器,其决策边界是求解学习样本的最大边距超平面,并将问题化为一个求解凸二次规划的问题[8]。在分类过程中,通过算法不断迭代、优化,寻找最优惩罚参数和核函数。

本文在构建SVM分类模型时,自变量为玻璃文物鉴定指标体系中的15个变量(即14种化学成分含量与表面风化情况),因变量为玻璃类型(即高钾、铅钡两类);核函数分别采用径向基(radial)核函数[9]、线性(linear)核函数、多项式(polynomial)核函数和神经网络(sigmoid)核函数,基于此,针对玻璃文物的样本数据训练SVM分类模型。基于四种核函数的SVM分类模型的混淆矩阵如表2至表5所示。

2.1.1  基于径向基核函数的SVM分类模型

惩罚参数选择为0.735,支持向量个数为62,混淆矩阵如表2所示。

即基于径向基核函数的SVM分类模型的准确率为98.41%。

2.1.2  基于线性核函数的SVM分类模型

惩罚参数选择为1,支持向量个数为60,混淆矩阵如表3所示。

即基于线性核函数的SVM分类模型的准确率为95.24%。

2.1.3  基于多项式核函数的SVM分类模型

惩罚因子选择为1,支持向量个数为63,混淆矩阵如表4所示。

即基于多项式核函数的SVM分类模型的准确率为100%。

2.1.4  基于神经网络核函数的SVM分类模型

惩罚因子选择为1,支持向量个数为63,混淆矩阵如表5所示。

即基于多项式核函数的SVM分类模型的准确率为100%。

为了明显看出四种核函数的优势与差异,将基于径向基核函数、线性核函数、多项式核函数和神经网络核函数的SVM分类模型的分类结果总结如表6所示,其中高钾、铅钡玻璃样本数为18、45。

显然,在训练SVM分类模型时,基于多项式核函数和神经网络核函数的SVM分类算法的分类正确率均为100%;虽然基于径向基核函数、线性核函数的SVM分类算法存在一定的错误率,但其正确率依然大于95%,也可以较为精准地对玻璃文物进行分类鉴定。

2.2  基于ANN的高钾、铅钡玻璃分类算法

人工神经网络(artificial neural networks, ANN)综合评价方法是由Rumelhart和McCelland等于1986年提出的一种交互式评价方法,它能够客观地进行多指标综合评价,是目前应用最广泛的评价方法之一[10]。它通过一个或者多个神经元将输入层、隐藏层和输出层连接起来,并对其赋予相关的权重,训练算法会在迭代过程中不断调整这些权重,从而使得预测误差最小化。通过设置网络的训练条件,控制训练的停止条件以及网络结构,让算法自动选择最优的网络结构[11]。

在训练基于ANN的高钾、铅钡玻璃分类算法时,首先随机选取47个样本作为训练集、16个样本作为测试集。本文设计的ANN分类算法中,输入层包含15个变量(即14種化学成分含量与表面风化情况),中间层为隐藏层,输出层为玻璃类型(即高钾、铅钡两类)。首先,基于训练集中的47个样本训练ANN分类模型。

训练出的ANN分类模型中,输入层到隐藏层的激活函数为双曲正切函数:

隐藏层到输出层的激活函数为Softmax函数:

然后,利用训练的ANN分类模型对测试集中的16个样本进行分类,得到ANN分类模型的混淆矩阵如表7所示。

由表7可以看出,基于ANN的高钾、铅钡玻璃分类算法的分类正确率为100%,算法精确度非常高,因此,可以用该算法对高钾、铅钡玻璃进行分类。

2.3  基于Logistic回归的高钾、铅钡玻璃分类算法

逻辑回归(Logistic Regression, LR)是一种广义的线性回归分析模型,通常用来解决因变量不是连续变量的问题[12]。目前更多适用于对二分类因变量的分析。本文在R语言软件中,设计基于Logistic回归的高钾、铅钡玻璃分类算法,对玻璃文物进行分类鉴定,算法结果如表8所示。

显然,基于Logistic回归的高钾、铅钡玻璃分类算法的分类正确率为100%,模型精确度非常高。因此,可以用该模型对高钾、铅钡玻璃进行分类。

综上所述,基于SVM、ANN、Logistic回归的玻璃文物鉴定算法的预测精度较高,可以将三种分类算法应用到玻璃文物类型鉴定的实际应用中。

为了明确本文构建的基于机器学习分类算法的高钾、铅钡玻璃鉴定方法,绘制模型流程图如图1所示。

3  结  论

为了使不同类型的古代玻璃在长久储存中不易被腐蚀,对高钾、铅钡玻璃的分类显得尤为重要。本文设计了基于SVM、ANN和Logistic回归的高钾、铅钡玻璃分类算法,并利用三种算法对高钾、铅钡玻璃的分类规律进行训练,借此实现玻璃文物的精准鉴定。三种算法的分类准确率都高于95%,这说明文章所做的研究、设计的算法、得到的结果具有较高的普适性,可将其应用到玻璃文物的实际鉴别中。

参考文献:

[1] 周静.中国铅钡玻璃艺术执念之通观 [J].美术大观,2021(3):184-186.

[2] 薛吕.玻璃文物保护与修复 [C]//中国文物保护技术协会第七次学术年会论文集,中国江苏镇江:科学出版社,2012:89-92.

[3] 侯志力.秦皇岛市玻璃博物馆唐宋玻璃文物具体年代考证——浅谈隋唐宋玻璃文物的演变与发展 [J].大众文艺,2015(13):47.

[4] 王宜飞,刘亮,李园.湖南省博物馆藏玻璃器无损分析检测及产地初步研究[J].湖南省博物馆馆刊,2017:592-599.

[5] 殷宇龙.通过关联预测对古代玻璃制品成分分析 [J].当代化工研究,2023(1):122-126.

[6] 王祉皓,赵芗溦,李智群,等.基于机器学习的风化硅酸盐玻璃原成分预测及亚分类方法 [J].硅酸盐学报,2023,51(2):416-426.

[7] 赵志强.湖南里耶麦茶战国墓地出土玻璃制品的检测与分析 [J].湖南考古辑刊,2020:288-301.

[8] 刘玉菲,陈素根.改进的最小二乘孪生支持向量机聚类 [J].安庆师范大学学报:自然科学版,2022,28(3):12-19.

[9] 刘路民根.支持向量机径向基核参数优化研究 [J].科学技术创新,2018(26):48-49.

[10] 程显毅.R语言 [M].北京:清华大学出版社,2019:73-91.

[11] 王力宾.多元统计分析:模型、案例及SPSS应用 [M].北京:经济科学出版社,2010:66-71.

[12] 孙红卫.基于截尾的稳健惩罚Logistic回归和稳健惩罚Cox回归及在组学数据分析中的应用 [D].太原:山西医科大学,2020.

作者简介:惠姣姣(1995—),女,汉族,陕西西安人,助教,硕士,研究方向:函数型数据分析。

收稿日期:2023-02-25

基金项目:陕西省教育厅自然科学研究项目(202310592)

猜你喜欢

支持向量机人工神经网络
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
基于声发射和人工神经网络的混凝土损伤程度识别
波信号的解调和人工神经网络的损伤识别算法