矿石体重回归分析在新疆乌宗布拉克矿区的应用研究
2021-06-29毛红伟
毛红伟
(中国冶金地质总局新疆地质勘查院,乌鲁木齐 830063)
0 引言
在多金属矿床的资源储量评价工作中,矿石的小体重是储量计算的重要参数之一[1-3]。能否准确地预测矿石小体重对矿床评价和资源储量预测非常重要。在资源储量计算时,如果不考虑构成矿石体重的影响因素(即矿体在空间分布上的不均一性),直接将测定的小体重算术平均值代入公式来计算矿体的资源储量,难免会影响到资源储量计算结果的可靠程度;同时,由于矿床勘探在时间、经费等方面都具有一定的限制,如若对每个块段逐一去测定矿石小体重,势必会严重影响矿床勘探进程和矿山生产建设。对已知的新疆火烧云铅锌矿[6]、青海多才玛铅锌银矿[7]及其他多金属矿[8-11]对比分析发现,这些矿床的矿石特征具有较多相似之处,矿石由多种金属矿物组成,且2个或2个以上元素达到工业品位,矿石的小体重与矿石中的元素质量分数具有显著的相关性。多元线性回归分析[4-5]的方法较多,但计算过程和步骤通常较为复杂,利用目前普遍使用的Excel软件,可以避免程序开发和数学求解过程,快速、便捷地建立多元线性回归函数。为了既能节省人力、物力和财力,又能使资源储量计算数据尽量符合矿体的实际情况,作者利用Excel软件中数据分析的回归分析功能模块,对新疆吐鲁番市乌宗布拉克矿区的多金属矿石小体重与矿石品位进行数学模拟,得出矿石小体重与品位的二元数学模型,利用该数学模型计算每一个块段的小体重值参与资源储量的计算,从而很大程度上提高了资源储量评价的可靠性。
1 原始数据及分析
1.1 数据准备
小体重采样均来自新疆乌宗布拉克矿区,矿石中金属矿物主要为闪锌矿、方铅矿,矿石构造主要为致密块状、浸染状、角砾状构造。采样部位为主矿体不同勘查线、不同高程的坑道、钻孔等工程,样品具有代表性;共采集小体重样品40件。
从表1所列的33个原始小体重值可以看出,矿石锌品位的分布范围w(Zn)=1.32%~30.97%,铅品位的分布范围w(Pb)=0.31%~38.54%;铅、锌品位较为集中且比较连续;与之相对应的体重数值的波动幅度在2.65~3.79之间。
表1 小体重样测试结果
利用Excel软件进行铅、锌的质量分数、矿石小体重二元线性回归方程的计算,得出二元线性回归方程,利用二元线性回归方程计算每个小体重校正后的体重值,发现有7件样品的回归体重与实测体重相差较大(相对误差大于5%)[7],从而进行了剔除,以保证回归分析的准确性;重复上一步操作再次进行了铅、锌质量分数的二元线性回归方程的计算,相对误差均小于5%。
由此建立二元回归方程
y=a0+a1x1+a2x2
式中,x1为铅的质量分数w(Pb);x2为锌的质量分数w(Zn);置信度为默认的95%。
图1a显示,铅、锌质量分数之间的相关系数r=-0.272,表明二者不存在相关性。从图1b和图1c可见,铅、锌质量分数与小体重之间存在线性关系,相关系数(r)分别为0.893和0.110,满足进行二元回归分析的前提条件[6-13]。
图1 矿石铅锌质量分数与小体重(Q)的相关性图解
1.2 二元回归计算步骤
(1)对小体重样品的原始数据进行统计(表1)。
(2)将表1中的数据输入Excel工作簿。
(3)Excel 2010版本中的“数据”选项有“数据分析”工具[15-16],若没有,可以点左上角“文件”按钮→选项→加载项→分析工具库,点“转到”按钮,弹出“加载宏”,点“分析工具库”确定安装。
(4)在菜单栏“数据”点击“数据分析”命令,弹出“数据分析”对话框,选择“回归”命令(图2),开始二元回归计算。
图2 数据分析窗口
(5)图3中“y值输入区域”,将表1中“小体重”列的数据作为应变量;在“x值输入区域”,选中铅和锌数据作为自变量数据。然后点击“确定”按钮,Excel便自动启动回归模型进行二元回归计算,并输出相应的计算结果(表2—表4)。
图3 回归分析工具对话窗口
(6)在回归结果分析报告中,用鼠标点取回归系数和截距常数,代入预测变量进行预测,同时分析R检验、F检验和t检验的显著性情况。二元线性回归分析输出结果包括回归统计结果(表2)、方差分析结果(表3)和线性回归截距分析结果(表4)。
表4 线性回归截距分析结果
1.3 Excel线性回归结果分析
(1)在表2中,复相关系数(Multiple R)是测量1个因变量与2个自变量之间线性相关程度的指标,其值越大,表明变量之间的线性相关程度越密切。表2中复相关系数(r)为0.9658,表示小体重值与铅、锌质量分数之间的关系呈正线性相关。复测定系数R2(RSquare)是测定2个变量间相关关系密切程度的统计分析指标,也是反映2个自变量对因变量的综合影响程度,其值越接近1,则表示模型的拟合效果越好。表2中的复测定系数R2=0.9328,表明用自变量可解释因变量变差的93.28%。
调整后的复测定系数R2(AdjustedRSquare)在二元回归分析中用于衡量加入独立变量后模型的拟合程度;标准误差用来衡量拟合程度的大小,也用于计算与回归相关的其他统计量,此值越小,说明拟合程度越好。表2中的该值为0.9283,说明自变量x能说明因变量y的92.83%,因变量y的7.17%要由其他因素来解释。
表2 线性回归统计结果
标准误差用来衡量拟合程度的大小,也用于计算与回归相关的其他统计量,此值越小,说明拟合程度越好。
(2)方差分析的主要作用是通过F检验来判断回归模型的回归效果。表3中显著性统计量(F)的P值为2.54×10-18,远小于显著性水平0.05,所以说该回归方程回归效果显著,方程中至少有一个回归系数显著不为0。
表3 方差分析结果
(3)在表4中,截距常数和回归系数(Coefficients),检验值(t)、P值(P)反映各回归系数的显著性。值得注意的是:其中a1、a2的回归系数t统计量的P值为4.56×10-19和1.16×10-8,远小于显著性水平0.05,因此该两项的自变量x与因变量y相关。
因此矿区的二元线性回归方程为:
y=2.6207+0.0313x1+0.0141x2。
3 用回归体重值校正矿石量
经过以上的计算和分析,不仅证明原始地质资料中所用的平均体重存在一些问题,同时也证明用二元回归分析求得的回归体重值是可靠的。为进一步查明加权平均体重造成的矿石量误差,我们以原来各地质块段的平均品位,求出与之相应的回归体重值,重新对矿石量进行了修正计算。
(1)在原来的109个地质块段中,矿石量减少的块段数为108个,占块段总数的99%;矿石量增加的块段为1个,仅占块段总数的1%。从而证实了加权平均体重有偏大的趋势。
(2)重新估算矿石量,在抵销1个增加矿石量块段的增加部分后,仍较原来的矿石量减少了5.6%。虽然其相对误差不大,但绝对数值仍较可观。尤其是在体重偏小的块段相对集中时,将造成矿石量较大的负误差,这显然对矿山开采是有不利影响的。
由此看出,矿区以回归体重值校正加权平均体重所造成的误差是必要的。
4 结语
(1)在进行回归分析之前,首先要了解矿石的小体重与各元素的质量分数之间是否存在线性关系,可以通过散点图和参与回归分析的元素与小体重之间的相关系数来判断,存在显著的相关性才能进行多元线性回归分析。
(2)通过以上一系列的计算和分析,可见二元回归分析是计算多金属矿石体重的一种理想的方法,它较其他方法有更多的优点,而且它不仅适用于多金属矿的体重计算,也适用于其他任何矿石品位与体重有相关关系的矿床。由于本文仅涉及两个矿种,因此只进行了二元回归分析,如果是有两种以上组分共生,而且均与体重有相关关系的矿床,则需经过较为复杂的二元以上的回归分析计算,但仍可以获得理想的结果。
(3)本文依据有关矿石小体重的原始数据,利用二元回归分析法,基于Excel快速、便捷地建立了矿石小体重与 Pb、Zn质量分数之间的二元线性回归函数,利用回归方程法计算小体重比其他方法更精确、更科学,且随着样品数量的增加,拟合的程度就越高,相对误差平均值就越小。多元回归方程法是一种计算小体重很好的方法,可为资源储量计算提供更精确、更合理的参数,应当在更多的多金属矿床的资源储量估算中推广应用。
(4)实践证明:用建立多元回归方程的方法预测矿石体重具有较大的优越性。采样数量可大量减少,矿石体重的预测可在短时间内完成,使工作效率和经济效益大大提高,也为整理矿石体重与矿石品位的关系和矿床成因规律、赋存状态的研究提供了依据。
致谢:本文撰稿缘于新疆某铅锌矿储量核实报告及某多金属矿详查报告得到启示,在成文过程中得到教授级高工唐小东的热情指导、教授级高工王战华的大力支持与帮助,在此表示衷心的感谢。