高维宽谱检测分析应用系统的研究
2020-07-22马增
摘要:本文针对稀土元素检测、国土资源等领域的高维光谱分析。基于人工智能技术,提出了高维宽谱系统总体结构、组成以及各个组成部分的内容、主要技术关键点、需要解决的技
术问题和实现的目标等。
关键词:高维宽谱;人工智能;谱线轮廓;自适应;谱图匹配;谱线识别;大数据
中图分类号:TP183 文献标识码:A 文章编号:1007-9416(2020)06-0000-00
1系统目标
1.1 总体目标
系统是以原子物理学、量子力学、原子发射光谱理论、原子发射光谱干扰理论、化学计量学等理论等作指导;以计算机科学、统计学、仪器分析、化学分析、现代数字信号处理、工程数学、矩阵理论等为工具;以元素谱线基础信息、谱线干扰信息库为标准数据源;以高维谱线轮廓模型为拟合标准;以化学计量学各种算法、高维谱图基线确定、高维谱图平滑、高维去卷积分、高维二阶差分寻峰、高维谱线拟合、谱图匹配、谱线识别等做为关键技术;以CCD器件为数据采集器件;以稀土元素检测、有色金属、国土资源、地质勘探、农业遥感、科研院所、数字医疗、环境保护等领域为服务对象,构建在这些领域的大数据分析的战略支撑。具体目标为:
(1)建立高维谱图大数据的快速应急处理及高维谱图的可视化体系;
(2)建立高维谱图的专家系统应用体系;
(3)建立高维谱图深度处理体系;
(4)建立标准谱线峰型轮廓的谱线标准体系;
(5)建立强大的痕量检测体系;
(6)建立元素多线-多段-多时段分析体系;
(7)建立智能评价系统。
1.2 主要技术
(1)大数据高维谱的数据采集、数据传输、数据存储及数据实时处理;
(2)高维谱图的可视化及深度处理、图像锐化、像元加强突出、边缘检测计算;
(3)高维谱的自适应基线确定、高维谱自适应去燥平滑、高维谱自适应寻峰、高维谱自适应谱峰拟合;
(4)高维谱图匹配和谱线识别。
2系统构架
高维宽谱检测分析应用系统的系统框架如图1所示:
本系统包括四大部分:
2.1使用对象
包括光谱领域专家、技术工程师、元素分析用户,通过系统接口来使用。
2.2系统接口
系统接口就是系统的一些为光谱领域专家、技术工程师、分析用户使用的应用程序界面。其包括:高维谱图可视化(1D/2D/3D)显示、样品分析、系统测试和其他工具。
2.3智能库及核心技术库
这是系统的核心,包括两大部分人工智能库和核心技术库。
2.3.1智能库
人工智能库包括光谱分析领域的知识库、知识获取机构、推理机、解释机构和深度学习机构五大部分[1]。
2.3.2核心技术库
核心技术库包括化学计量学算法库和数字信号处理核心库二部分。
化学计量学算法库主要有:回归分析、多元校正、主成分分析、方差分析、人工神经网络等。
数字信号处理主要包括:高维谱图的平滑与滤波、高维谱图的基线确定、高维谱图的峰位识别及峰区确定、高维谱图的拟合等。
2.3.3人工智能技术库
包括谱图识别、谱线识别和系统智能评价等。
2.4综合数据库
综合数据库它是分析元素过程中符号或数据的集合,用于存储光谱分析的原始事实、推导过程中得到的中间信息(数据)、推理的中间假设、中间结论、目标结果、推理过程的信息。
数据库管理系统负责对数据库中的数据进行增、删、改以及维护工作,以保证数据表示方法与知识表示方法的一致性。
3需要解决的技术问题
本系统需要解决以下技术问题[2]:
3.1 实时大数据处理问题
分析设备提供高维的谱数据,数据量大(650/s~1.0G),分析设备的大数据包含多维背景、噪音以及有用的谱峰,特别是在低统计值的高维谱数据中提取有用信息,而且是实时的提取是本系统要面对的大问题。
3.2 系统1D/2D/3D可视化问题
对从分析设备大数据中提取的有用信息,要实时的2D,3D显示、渲染,给予分析人员交互、对谱图进行更进一步的深度分析如:谱图图像图像锐化、边缘检测、浮雕处理、运动模糊、谱图像元加强突出等的分析。
3.3 病态系统求解问题
由于在解析仪器大数据分析模型中,公式(4.65)、(4.66)是个超定方程组,这个方程没有唯一解,只有最优解。为了得到更优的解,需要正则化方法来求解。
3.4 包含极小噪声而引起的大的测量结果误差问题
通过正则化,可以得到最优解。但正则化有很多种方法,为了减少由于噪声而引起的大的测量结果误差问题,采取正定矩阵,这样保证测量结果误差更小。除此之外,噪声引起的误差不能引起系统的稳健性。也就是说保证系统的收敛。
3.5 由于计算精度产生的截断误差引起的测量结果误差问题
我们知道,在求解正则化的求解过程中,都是一些浮点数的计算,计算机的位数限制肯定在浮点数的加减乘除运算肯定会引起四舍五入和截断计算误差,特别是积累的误差会对最终结果产生很大的影响。
3.6 谱图高分辨率问题
高维谱图的正确的分辨率是重要的问题。谱图的寻峰过程中,特别是对低统计谱数据及高维谱来说更重要。不能因为漏峰而影响谱图的最终结果的解析。
3.7 迭代的收敛速度
收敛速度是决定系统的重要指标,在分析设备的大数据处理过程中要求快速的得到分析结果。由于在计算过程中系统采取迭代方法,迭代算法的优劣决定收敛的迭代次数,迭代次数决定算法的优劣。
4系统社会经济效益
4.1提升国防保障能力
在稀土元素检测领域,稀土元素是工业的味精,少量的稀土元素对材料的性能有重大的影响。特别是对航空、航天发动机来说,加入微量的稀土元素,提高发动机熔点,大大改善提高发动机的性能,对国防工业有着重要的意义。
4.2提高行业分析水平
在国土资源领域,原《国土资源部十三五国土资源普查规划》中指出,在国家地质化学填图1:20万、1:25万的基礎上,即将开展1:1万、新1:5万全国性的地球资源普查系统,为国家的大政方针提供战略数据支撑。
4.3具有环保作用
对有色领域来说,由于分析精度高,尤其是对贵金属金、银、镍、铬以及高纯氧化物来说,精度增加一位,则经济效益呈几何级数增长。二是再加上分析时间短,使合格产品冶炼时间大大缩短。对冶炼来说,时间就意味着能量的消耗和污染物的排放,缩短时间就意味着节能和减排。
对生产企业来说,分析精度高、数据准确性提高意味着提高劳动生产率,减少员工劳动强度,减少分析样品的能耗,可以更好的保护环境,减少环境污染。
4.4促进行业技术进步
目前,国内还没有成熟的基于人工智能的高维光谱谱图应用分析系统,该系统必将促进国内的光谱仪器行业的发展,核心技术势必促进国内该行业的技术进步。
参考文献
[1]俞汝勤,梁逸曾,吴海龙.分析化学手册第三版(化学计量学分册)[M].化学工业出版社, 2016.
[2]Sophisticated algorithms of analysis of spectroscopic data 2008 Miroslav Morhá?.
收稿日期:2020-05-08
作者简介:马增(1966—),男,天津人,本科,工程师,研究方向:基于人工智能的高维宽谱分析检测。