FDA 与BP神经网络在缅甸翡翠产地鉴别中的应用

2021-03-25滕亚君刘汗青祖恩东

软件导刊 2021年3期

雷蕾，滕亚君，刘汗青，闵红，祖恩东

（1.昆明理工大学材料科学与工程学院，云南昆明 650093；2.昆明海关技术中心，云南昆明 650228；3.上海出入境检验检疫局工业品与原材料检测技术中心，上海 200135）

0 引言

翡翠被誉为“玉石之王”，具有独特的文化魅力和经济价值。国际珠宝市场宝石级翡翠主要产自缅甸、俄罗斯、危地马拉、哈萨克斯坦以及日本。缅甸一直是宝石级翡翠最主要的产出国，全球98% 的翡翠都产自于缅甸［1］。缅甸按行政区和地理位置将翡翠矿床划分为8 大场区，从方向上分为3 个矿带，其中位于最西北部的后江—雷打矿带为帝王绿翡翠主要产区；中部的帕敢—道茂矿带既有原生矿又有次生矿，是缅甸最重要的翡翠产区。

翡翠产地相关研究有：张智宇等［2］利用偏光显微镜、电子探针对危地马拉硬玉矿区的硬玉岩、硬玉化绿辉岩进行测试研究，阐述危地马拉硬玉岩成因；Mitrani 等［3］通过无损光谱和微离子束分析技术对危地马拉翡翠进行鉴别分析，阐述该产地翡翠物相特征；郑亭［4］利用阴极发光、X 射线粉晶衍射、紫外可见光光谱法对危地马拉翡翠进行测试分析，得到该产地翡翠的宝石学特征以及颜色成因和谱学特征；赵玥［5］利用偏光显微镜、傅里叶红外光谱仪等仪器对俄罗斯翡翠的矿物学特征进行研究，探讨俄罗斯翡翠成矿过程以及次生矿物对翡翠品质的影响；邹妤等［6］利用电子探针对缅甸、俄罗斯、哈萨克斯坦翡翠的结构特征及成矿过程进行对比研究；陈慕雨［7］利用傅里叶红外光谱仪、X 射线粉晶衍射仪和激光共焦显微拉曼光谱仪对3 种不同组分的硬玉岩进行分析，得到硬玉岩显示硬玉的红外光谱图，绿辉—硬玉岩显示类似的硬玉红外光谱图，当类质同相替代中置换的阳离子半径小于Na+、Al3+时，红外光谱图中部分波段的吸收峰和谱带会向低频方向偏移；王亚军等［8］利用电子探针和傅里叶红外光谱仪对缅甸不同化学成分的翡翠红外光谱特征进行分析，鉴别在低波数区域的红外吸收峰波数＜422.75cm-1、＜574.5cm-1、＜658.7cm-1为绿辉石质翡翠，反之则为硬玉质翡翠；刑莹莹［9］利用电子探针及傅里叶红外光谱仪等仪器分析得出合成翡翠红外光谱的指纹区、v（M/Cr-O）伸缩振动和vas（M-OH）伸缩振动导致的吸收谱带与天然翡翠存在很大差异。

目前对翡翠产地鉴定技术系统性研究较少，主要使用电子探针、X 射线粉晶衍射仪、红外光谱测试等方法，这类鉴别方法不能直接得到准确的分析结果，后期需大量的人力分析，且样品前处理方法繁琐，分析检测时间长，不能实现对大批量样品的快速检测鉴别。PCA-Fisher 判别分析法（FDA）和PCA-BP 神经网络模型以其高效、快速、良好的自学性等优势广泛应用于食品、经济、医药、矿井安全评价等行业，但在宝玉石产地鉴别方面应用较少。本文以缅甸4 个主要场口隆肯、帕敢、达木坎、雷打翡翠为研究对象，建立基于PCA-Fisher 分析（FDA）和PCA-BP 神经网络的翡翠产地判别模型，将不同模型鉴别效果进行对比，为海关检验监管提供一种高效方法。

1 模型理论

1.1 Fisher 判别分析

Fisher 判别分析为一种线性判别方法，主要将K组P维数据投影在某个方向，尽可能使数据投影组与组之间分开，以方差分析思想构造判别式。方式为将新样品X的P个指标代入判别式得到y值，将其与判别分界点比较后进行判别归类［10-13］。

设模型总体为G1,G2,…,Gk，其协方差矩阵为S1,S2…,Sk，均值向量为M1,M2…,Mk。考虑X∈Gi(i=1,2,…,m)，其线性函数为：

根据随机变量的线性组合方差和均值性质，可得Y在Gi中的方差与均值为：

令Y在Gi中均值yi的离差平方和为b，方差之和为e，则：

b为方差分析中的组间差，可反映均值yi间的离散程度，e为组内差，反映Y在类中方差之和，离散程度b越大或方差之和e越小，G1,G2,…,Gk就越能分开。根据方差分析思想，选择使的u为判别函数Y的系数向量，得到(E-1B) 最大特征值λ对应的特征向量u，即可建立判别函数Y=uT x。

1.2 BP 神经网络模型

BP 神经网络即多层前馈人工神经网络，也称为误差反向传播神经网络。BP 神经网络有很好的学习、非线性映射及自学习功能，具有输入信号正向传播，误差反向传播特点。输入信号参数从输入层输入经隐藏层处理，由输出层输出信号完成前向传播，当输出信号不能满足输出要求则转向误差逆向传播［14-17］。BP 神经网络不受非线性模型限制，有很强的非线性映射能力，能很好解决信息少、数据少、不确定性问题，应用十分广泛。BP 神经网络主要由输入层、隐含层、输出层3 层神经元组成，其中隐含层可以有多层，其训练步骤如下：

（1）网络初始化。模型输入层输出层隐含层各神经元之间连接权值Wij、Wjk，隐含层输出层阈值a、b，设定神经元激励函数与学习速率。

（2）隐含层神经元输出。计算如下：

（3）输出层输出。计算如下：

（4）误差计算。当达到输出要求立即结束训练，不满足则继续下一步。

（5）更新网络结构阈值和权值。不断修正权值和阈值，直到满足期望输出要求。

2 实验方法与结果

本文选取缅甸市场上流行的4 个场口翡翠，即隆肯、帕敢、达木坎、雷打。

（1）模型变量选择。以不同场口翡翠电子探针成分结果（见表1）为变量，总共包含30 个样品。本文采用主成分分析法实现数据的降维处理，提取其中主成分，从而提高模型的效率和稳定性。

Table 1 Chemical composition of jadeite samples表1 翡翠样品化学成分

（2）电子探针测试。实验仪器型号：EPMA-1600 电子探针分析仪。测试条件：加速电压为20KV，电流为1×10-8A，出射角为52.5°，分析方法为波谱分析，修正方法为ZAF。

2.1 基于翡翠成分元素的主成分分析

为探索电子探针成分结果对不同产地翡翠的判别效率，对其进行PCA 分析。主成分分析法在分析处理高维数据时主要采用降维思想，将能代表整体数据样本的多个变量指标通过投影提取转化为极少数变量指标，使用极少数变量指标就能反应整个原始样本数据大量信息，所有主成分即原始标量指标的线性组合。在分析复杂变量数据时，提取其主成分进行分析，从而达到简化分析模型的目的［18-20］。表2 为前3 个主成分变量累计贡献率。由此可知，不同产地翡翠样品的主要化学成分基本相似，但是化学成分含量有一定差异。主成分分析提取的主成分按照其贡献率大小排序，前3 个主成分的累计方差贡献率达到78.681%，表明前3 个主成分基本可以反映总体数据信息。第一主成分贡献率44.192%，第二主成分贡献率为18.754%，第三主成分贡献率为15.735%。确定好主成分个数及贡献率后，即可通过PCA 方法降低翡翠成分元素数据的维数。

Table 2 Cumulative contribution rate of principal components表2 主成分累计贡献率

2.2 基于不同模型分析方法的判别结果

本研究在主成分分析基础上，对不同场口的翡翠采用Fisher 判别分析、BP 神经网络模型分析方法，分别建立判别模型。

2.2.1 Fisher 判别分析

通过对不同产地翡翠的化学成分PCA 分析结果可以得出，仅利用主成分分析对翡翠产地进行判别不可行，因此建立PCA-Fisher 判别模型对不同场口翡翠进行判别预测。

达木坎、帕敢、隆肯、雷打翡翠的判别模型分别如下：

利用该模型对不同场口翡翠样品进行判别分析，结果如表3 所示。由表3 可知，PCA-Fisher 判别模型对达木坎、帕敢、隆肯、雷打翡翠的正确判别率分别为71.4%、55.6%、50%、50%。所有样品的综合正确率为56.75%，正确率较低，表明该判别模型整体可靠性较低，仅对达木坎产地样品具有较好的预测判别效果，对帕敢、隆肯、雷打场口的翡翠误判概率较大。

Table 3 Identification results of jadeite origin表3 翡翠产地鉴别结果

2.2.2 BP 判别分析

在BP 神经网络模型中，将主成分分析提取的3 个主成分作为BP 神经网络模型的输入数据，因此输入层节点为3；将翡翠不同场口作为输出数据，因此输出层节点为4；隐藏层含3 个节点。选择双曲正切函数作为隐藏层激活函数，Softmax 作为输出层激活函数，最终建立3∶3∶4 的3 层BP 神经网络模型。训练组样本为原始样本，共计30个，另在达木坎、帕敢、隆肯、雷打的原始样本中按每个场口选取3 个样本作为检验组样本共计12 个。

实验结果如表4 所示。训练组中，PCA-BP 神经网络模型对7 个达木坎样品进行判别，将1 个达木坎场口样品分别误判为帕敢场口，鉴别准确率为85.7%。该模型对9个帕敢样品进行判别，将两个帕敢场口样品误判为隆肯、雷打场口，鉴别准确率为77.7%。该模型对8 个隆肯场口样品进行判别，将2 个隆肯场口样品误判为帕敢场口，鉴别准确率为75%。该模型对6 个雷打场口翡翠进行判别，将1 个雷打场口样品误判为达木坎场口，鉴别准确率为83.3%。训练组综合准确判别率为80.4%。检验组总样品判别正确率100%，表明PCA-BP 神经网络模型对不同场口翡翠判别准确率、可靠性高。BP 神经网络模型较强的映射和自学特点，结合主成分分析方法减少参数之间的关联性，利用自学能力不断通过数据优化修正模型，使鉴别精度相对PCA-FAD 模型大大提高［21-23］。

Table 4 Identification results of jadeite origin表4 翡翠产地鉴别结果

3 结语

本文采用PCA-Fisher 判别法和PCA-BP 神经网络分析方法对不同产地翡翠矿物化学成分进行鉴别分类实验。

（1）在PCA-Fisher 判别模型下，达木坎、帕敢、隆肯、雷打场口翡翠的正确判别率分别为71.4%、55.6%、50%、50%，总样品正确判别率为56.75%，准确率低，表明该模型鉴别预测效果不理想。

（2）在PCA-BP 神经网络模型下，训练组达木坎、帕敢、隆肯、雷打场口翡翠准确判别率分别为85.7%、77.7%、75%、83.3%，训练组综合判别准确率为80.4%，检验组正确率均为100%，表明该模型应用于翡翠产地快速鉴别可行，具有很好的鉴别预测效果和应用前景。

（3）PCA-BP 神经网络判别方法与传统宝石学鉴定相比，执行效率高，操作简便，移植性强，能满足翡翠产地鉴别工作。为提高模型预测精度和应用广泛性，在后续工作中，需要收集更多产地翡翠的矿物化学成分数据资料，对模型进行不断扩充与优化，提高模型鉴别可靠度。后续将建立系统化模型标准，为翡翠产地鉴别提供高效可靠的新方法。