深度学习在大学物理实验数据分析中的应用探索尝试
2020-07-04李大明汪丽莉刘烨李伟豪郭博研
李大明 汪丽莉 刘烨 李伟豪 郭博研
0.引言
作为一个快速发展的研究方向,近十年来深度学习受到了研究者以及普通大众越来越多的关注,其在特征提取和其他方面都具有较传统的浅层模型有明显的优势。作为新型的人工智能方法,它克服了在过去的人工智能中被认为是难以解决的一些问题。此外,由于现代人工智能学习的训练集数据集的数量上发生了显著增长,以及半导体芯片工艺的逐步提升,计算能力的不断加强,因此,深度学习在目标检测、计算机视觉、自然语言处理等各方面领域中发挥了越来越多的重要作用。深度学习的各类应用,极大地方便了人们的学习与生活,在为基础设施、解决方案和服务提供动力、网络安全、医疗、会计和金融科技等等各方面、各领域中有了更丰富的性能使用和效率提升,正因如此,也一直是各行各业研究的对象。在大学研究和学习生活中,有很多场景,如各类的实验都会涉用到最基础的数据处理,其处理对象大多为线性为非线性的不同曲线类型。以往,学生需要利用最小二乘法处理数据,需要我们把数据录入,再然后选择曲线的类型,最后拟合出最终结果。
1.研究过程
为了训练神经网络,我们首先以线性函数 和二次(非线性)函数 表达式为基础,创建随机数据集。考虑到实验数据都会有一定的偏差值出现,而偏差值的随机性可能会很小,但也可能偶尔出现较大的偏差结果。为了能够体现真实数据的各种情况及其影响,我们预先在线性线和非线性函数的标准数值范围基础上引入生成一定范围的随机误差值,分别取为Sigma= 0.01、0.02、0.03、0.04、0.05的偏差,可以理解为其对应实验的数据点与理想数值偏差分别为2%,4%,6%,8%和10%的数据图对应的函数。此外,为了能够更详细分析不同数据密度对数据结果的影响,我们采用了采样点No=11、21和31个点的三种情况,分别构建并生成一系列数据图像,其中线性数据为 ,非线性为 。考虑到利用不同总量圖片数据库对机器学习的训练影响,此研究工作中分别采用了四种图片数据库数量分别各包含Pic=1000、2000、5000张、10000张图片分别进行了计算分析。 如图1所示,这是Sigma= 0.01、No=11的两种实验数据生成的抽样数据图片,图中由于线性函数 ,非线性函数的二次项系数 =1,因此从图中可以看出,得到的线性图和非线性图的图像区别不大。
为了能够获得高精度机器学习结果,我们首先对数据进行了差分处理, 如下图2所示。图2为随机抽取的数据集中(取Sigma=0.01,No=11)的线性数据差分图(图2-a)和非线性函数的差分图(图2-b)。数学上可以理解对于线性函数其差分 数值上应该是一次项系数 ,是一条常数为1的水平线,而为非线性函数曲线的差分曲线 数值上应该是一个数值约等于1的直线方程, 它与直线差分的最大区别在于其是一个斜率是 的斜线,但是从图中可以看出,由于引入Sigma作用导致数值并不是完全线性但是基本肉眼可辨。这种差分方法的引入已经能初步使我们对线性和非线性数据进行简单的判断。但是当误差值Sigma逐渐增大和间隔点过多的情况下,这种差分方法也会变得不易区分。
同样的我们列举如下差分图对所得到的图集进行简要分析。从下图3可以看到,随着间隔点逐步增大,Sigma =0.01时,由图库图片中随机抽样得到的图像数据仍然有一定的区分度,从总体上来看还能够看出对于直线和曲线来说由一次差分后得到的数据图形的区别,例如,左图3(a)个数据点是线性数据的一次差分图像而右边是抛物线进行一次差分后得到的图像,当间隔点数保持为31个,但是数据误差值变为0.05后,我们可以很清楚的看到在下图4中对于(a)和(b)图片的区别,由于误差偏差值已经高达10%会导致水平直线与斜线趋势区分度很低,我们是否可以通过神经网络来进行识别且对以上判断的准确度进行了定性研究。
初步分析以上三组进行过一次差分后的两种不同类型曲线的数据图片。
2.结果分析
我们的识别对象本应是线性与二次非线性函数的差分数据图像。通过上述方法差分方法提高了识别精度,我们进一步对该方法下的数据图进行了数据库大小的处理,这样试图能够探究影响神经网络输出精度的影响因素,我们设定了三个影响输出结果的参数,分别是原始数据图像误差值Sigma,原始图像间隔点数No和训练集数Pic。
在图像间隔点No分别为11、21、31三种情况下,通过Matlab画图得到误差值Sigma、训练集图片数Pic、与识别精度的三维图像如图5所示,从三张图像可以看出,随着误差值的减小与训练集数目的增多,神经网络识别精度均升高,最终在图像数据误差值最低及训练集数目最多的情况下,神经网络训练的识别精度都能够基本达到100%。
3.总结
我们将当前热门的卷积神经网络与数据分析相结合,对数据分析过程进行了合理的优化,利用卷积神经网络识别不同函数类型的图像,通过差分方法提高了识别精度,从三个影响输出结果的参数,误差值Sigma,数据数No和训练集数Pic进行了研究,通过分析发现在数据训练足够多时对线性和非线性图像的识别度非常理想。这种让机器代替人眼来判断曲线特征的方法设计,能够让数据分析脱离人工输入数据这样一个枯燥繁琐的工作,今后如果学生拿着实验报告画出的点图让照相机扫描就能得出分析结果,尝试学习这个过程中的设计问题使其能够极大的减少学生的分析工作难度,也进一步提高学生深入学习理论基础和数据分析的兴趣。
[基金项目]本文系上海市大学生创新项目“深度学习在大学物理实验中的应用探索”(项目编号cs1921002)和上海工程技术大学课程建设项目“物理创新思维与竞赛探究”(项目编号X202021001)资助的研究工作。
作者简介:
李大明 1998.02 男,汉族,山西省忻州市人,上海工程技术大学(本科在读),主要研究方向为:材料科学与工程
汪丽莉(1981.09-),女,汉族,湖北省武汉市人,武汉大学物理科学与技术学院 2004 级博士生,上海工程技术大学,讲师,主要研究方向为:新型能源转换功能材料研究 为本文通讯作者
刘烨(1980.05-),男,汉族,山东省济宁市人,清华大学物理系 2003级硕士生,上海工程技术大学,讲师,主要研究方向为:实验教学
李伟豪 (1999.03-),男,汉族,山西省吕梁市人,上海工程技术大学(本科在读),主要研究方向为:交通运输
郭博研(1997.12-),男,汉族,山西省太原市人,上海工程技术大学(本科在读),主要研究方向为:交通工程。